Spark
2016-09-19 19:58:35 0 举报
Spark是一个开源的大数据处理框架,它提供了一个快速、通用和易于使用的数据处理引擎。Spark可以处理大规模的数据集,支持多种数据源,包括Hadoop Distributed File System(HDFS)、Cassandra、HBase等。Spark的核心是弹性分布式数据集(RDD),它是一个容错的、并行的数据结构,可以让用户在大规模数据集上执行复杂的计算任务。Spark还提供了丰富的库,包括机器学习库(MLlib)、图处理库(GraphX)等,以满足各种数据处理需求。Spark的设计目标是让大数据处理更加简单、高效和易用。
作者其他创作
大纲/内容
JobGenerator
JobScheduler
start()
StreamingContext
launchReceivers()
DStreamGraph
ReceiverTracker
EventLoop.start()
0 条评论
下一页