sparkWorkflow
2015-12-10 02:30:37 1 举报
SparkWorkflow是一个基于Apache Spark的工作流程管理系统,它提供了一种简单而强大的方法来定义、执行和管理复杂的数据处理任务。通过使用SparkWorkflow,用户可以轻松地创建和调度各种类型的工作流,包括数据清洗、转换、分析等。此外,SparkWorkflow还支持多种数据源和目标,包括Hadoop HDFS、Amazon S3、MySQL等,使得用户可以在不同的环境中灵活地部署和使用工作流。总之,SparkWorkflow是一个功能丰富、易于使用的工作流程管理工具,可以帮助用户更高效地处理大规模数据。
作者其他创作
大纲/内容
spark广播变量
行为数据
外力信息
......
计算分区
模型数据
ReduceByKey
节点数据集
杆件数据集
分区
RDD缓存
0 条评论
下一页
为你推荐
查看更多