首页
作品
资讯
专题
果动
登录
注册
首页
作品
Spark 编程指南
Spark 编程指南
Spark 官方
Spark
大数据
开始阅读
取消订阅
现在订阅
简介
本文翻译自 Spark 官方文档 1.2.1
目录
第一章:快速上手
1.1. 使用 Spark Shell
1.2. 独立应用程序
1.3. 开始翻滚吧!
第二章:编程指南
2.1. 引入 Spark
2.2. 初始化 Spark
2.3. Spark RDDs
2.4. Transformations
2.5. Actions
2.6. RDD 持久化
2.7. 共享变量
2.8. 从这里开始
第三章:Spark Streaming
3.1. 一个快速的例子
3.2. 关联
3.3. 初始化StreamingContext
3.4. 离散流(DStreams)
3.5. 输入DStreams和receivers
3.6. DStream中的转换
3.7. DStreams上的输出操作
3.8. 缓存或持久化
3.9. Checkpointing
3.10. 部署应用程序
3.11. 监控应用程序
3.12. 性能调优
3.13. 容错语义
第四章:Spark SQL
4.1. 开始
4.2. 数据源 - RDDs
4.3. 数据源 - Parquet文件
4.4. 数据源 - JSON数据集
4.5. Hive表
4.6. 性能调优
4.7. 其它SQL接口
4.8. 编写语言集成的相关查询
4.9. Spark SQL数据类型
第五章:GraphX编程指南
5.1. 简介
5.2. 属性图
5.3. 图操作符1
5.3. 图操作符2
5.4. 图操作符3
5.5. Pregel API
5.6. 图构造者
5.7. 顶点和边RDDs
5.8. 图算法
5.9. 例子
第六章:部署
6.1. 提交应用程序
6.2. Spark独立部署模式
6.3. 在YARN上运行Spark
第七章:更多
7.1. Spark配置
7.2. Spark的属性1
7.3. Spark属性2
7.4. 环境变量