Spark_匠果

大数据入门指南

本书面向初学者介绍了常用大数据框架的使用。

Spark Streaming 整合 Kafka

2021年11月17日

Spark Streaming 整合 Flume

2021年11月17日 Apache Flume 是一个分布式，高可用的数据收集系统，可以从不同的数据源收集数据，经过聚合后发送到分布式计算框架或者存储系统中。Spark Straming 提供了以下两种方式用于 Flume 的整合。

Spark Streaming 基本操作

2021年11月17日

Spark Streaming 简介

2021年11月17日

Spark SQL JOIN 操作

2021年11月17日

Spark SQL 常用聚合函数

2021年11月17日

Spark SQL 外部数据源

2021年11月17日

Spark SQL 的 DataFrame和Dataset

2021年11月17日

Spark SQL

2021年11月17日 Spark SQL 是 Spark 中的一个子模块，主要用于操作结构化数据。

Spark 累加器与广播变量

2021年11月17日在 Spark 中，提供了两种类型的共享变量：累加器 (accumulator) 与广播变量 (broadcast variable)。

Spark部署模式与作业提交

2021年11月17日

Transformation 和 Action 常用算子

2021年11月17日

大数据面试题

Hadoop、Zookeeper、Hive、HBase、Flume、Kafka、Spark等。

Spark面试题（八）

2021年12月14日

Spark面试题（七）

2021年12月14日

Spark面试题（六）

2021年12月14日

Spark面试题（五）

2021年12月14日

Spark面试题（四）

2021年12月13日

Spark面试题（三）

2021年12月13日

Spark面试题（二）

2021年12月13日

Spark面试题（一）

2021年12月13日

前一页后一页