kepler dataflow
2017-02-28 18:40:35 0 举报
Kepler Dataflow是一种基于Apache Flink的大规模数据处理平台,它提供了一种高效、可扩展和容错的方式来处理实时数据流。Kepler Dataflow支持多种数据源和目标,包括Kafka、Hadoop、HBase等,并提供了丰富的数据处理功能,如窗口操作、状态管理、事件时间处理等。此外,Kepler Dataflow还具有可视化的编程界面,使得用户可以方便地设计和调试数据处理流程。总之,Kepler Dataflow是一个强大而灵活的数据处理工具,适用于各种规模的实时数据处理需求。
作者其他创作
大纲/内容
transform rule
Model
KeplerTopologyBuilder
transform executor
drop聚合
入口
SourceTargetMMMRMMapOnly
Mapper Bolt
Yes
Jstorm Cluster
drop emit
StormTopology
drop拆分
Rebuild
filter Executor
data sync rule
NewTxLauncher
aggregation
data sync
MetaServiceImp
analysis executor
output table
input table
MetaServiceFatory
Column MapingType inferring
drop过滤
drop转换
drop增量更新
Meta Generator
dim/stream join rule
No
dim/stream join
transform
Reducer.isSkip
aggregation rule
Reducer Bolt
Merger Bolt
Source Spout
aggregator Executor
Storage Bolt
Delta Executor
0 条评论
下一页