rdds

2016-11-11 12:13:56 0 举报
仅支持查看
rdds
RDDs(Resilient Distributed Datasets)是Apache Spark中的一个核心概念,它是一个容错的、并行的数据结构,用于处理大数据。RDD是不可变的,这意味着一旦创建,就不能更改其内容。它们可以从HDFS、HBase等数据源中创建,也可以通过对其他RDD执行转换操作来生成。RDD支持两种类型的操作:转换操作和行动操作。转换操作创建一个新的RDD,而行动操作返回一个值给驱动程序或写入外部存储系统。RDDs在Spark中提供了高度的灵活性和可扩展性,使得在大数据处理任务中可以轻松地实现复杂的算法和模型。
作者其他创作
大纲/内容
评论
0 条评论
回复 删除
取消
回复
下一页