Category

码到成功

Category Feed

码到成功 · 文章列表

sparksql的常见用法
sparksql的常见用法

Spark SQL 是 Spark 体系里最常用的一层能力。 很多团队用 Spark 做数据处理,并不直接写大量 RDD 代码,而是更多使用SQL的方式

Read
CrossEntropy-->>交叉熵
CrossEntropy-->>交叉熵

交叉熵是机器学习里最常见的损失函数之一,只要你接触过分类模型,几乎一定会遇到它。

Read
spark rdd快速上手
spark rdd快速上手

RDD,全称 Resilient Distributed Dataset,是 Spark 中最基础的分布式数据抽象。虽然现在很多项目更常用 DataFrame 和 Dataset,但理解 RDD 仍然很有价值。

Read
spark安装与部署
spark安装与部署

Apache Spark 是大数据领域里最常见的分布式计算框架之一。 很多人第一次接触 Spark,最先卡住的不是算子,也不是作业提交,而是安装过程:

Read
sql的插入、更新、合并插入更新的常用操作和常见问题
sql的插入、更新、合并插入更新的常用操作和常见问题

写 SQL Server 的时候,`SELECT` 往往是最容易上手的,真正容易写出事故的反而是 `INSERT`、`UPDATE` 和 `MERGE INTO`

Read
sql的四大分析函数
sql的四大分析函数

在 SQL Server 里,窗口函数是处理“分组内排序、排名、分页、Top N、分桶分析”最顺手的工具之一。其中最常用的 4 个排名相关函数是: ROW_NUMBER() RANK() DENSE_RANK() NTILE()

Read
redis技术分享——(2)
redis技术分享——(2)

Redis Sentinel 是 Redis 官方提供的高可用方案。它主要用于监控 Redis 主从集群,并在主节点故障时自动完成故障转移,把某个从节点提升为新的主节点。

Read
redis技术分享——(1)
redis技术分享——(1)

很多人刚开始使用 Redis 时,只把它当作简单的 `key-value` 缓存。实际上,Redis 真正强大的地方在于它提供了多种数据结构。不同的数据结构适合不同的业务场景,选对结构往往比单纯记住命令更重要。

Read