spark
2016-06-28 14:38:29 0 举报
Spark是一个开源的大数据处理框架,它提供了一个快速、通用和易于使用的数据处理引擎。Spark的核心是弹性分布式数据集(RDD),它是一个容错的、并行的数据结构,可以让用户在大规模数据集上执行各种计算任务。Spark支持多种编程语言,包括Java、Scala、Python和R,并且可以与Hadoop生态系统无缝集成。Spark的主要特点包括速度快、易用性高、灵活性强和可扩展性好。它可以用于批处理、流处理、机器学习和图计算等多种应用场景。Spark已经成为大数据领域的主流技术之一,被广泛应用于各行各业。
作者其他创作
大纲/内容
TASK
Executor
ExecutorRunner
CoarseGrainedExecutorBackend
Master
Master Node
Work Node
Woker
Driverapplication.main()
0 条评论
下一页