本书面向初学者介绍了常用大数据框架的使用。
2021年11月17日
2021年11月17日 Apache Flume 是一个分布式,高可用的数据收集系统,可以从不同的数据源收集数据,经过聚合后发送到分布式计算框架或者存储系统中。Spark Straming 提供了以下两种方式用于 Flume 的整合。
2021年11月17日
2021年11月17日
2021年11月17日
2021年11月17日
2021年11月17日
2021年11月17日
2021年11月17日 Spark SQL 是 Spark 中的一个子模块,主要用于操作结构化数据。
2021年11月17日 在 Spark 中,提供了两种类型的共享变量:累加器 (accumulator) 与广播变量 (broadcast variable)。
2021年11月17日
2021年11月17日
Hadoop、Zookeeper、Hive、HBase、Flume、Kafka、Spark等。
2021年12月14日
2021年12月14日
2021年12月14日
2021年12月14日
2021年12月13日
2021年12月13日
2021年12月13日
2021年12月13日
前一页
后一页