离线实时数仓模型
2023-05-19 00:41:01 21 举报
离线实时数仓模型
作者其他创作
大纲/内容
HDFS
ODS
Flume
DWD
kafka
实时离线一体化
BI
业务日志
Hive
DIM
传统数仓架构
Maxwell
DWS
Kafka
离线数仓
业务数据库
Flink
Redis
OLAP/KV/RDS
业务数据
CDC
CK
Kafak
ADS
Hbase
Datax
1.开发流程冗余2.数据链路冗余3.数据口径不一致
缺点因为所有数据的ODS到DWD都是实时计算资源消耗更多
优点解决1.开发流程冗余2.数据链路冗余3.数据口径不一致4.节省了离线数仓中ODS的资源
大宽
打宽
维度退化&打宽
实时数仓
0 条评论
回复 删除
下一页