大数据系统数据流程设计
2023-07-16 20:05:37 33 举报
登录查看完整内容
大数据系统的数据流程设计主要包括数据采集、数据预处理、数据存储、数据处理和数据分析五个步骤。首先,通过各种方式如日志收集、API接口等采集数据;然后,对采集到的原始数据进行清洗、转换等预处理操作,以便于后续处理;接着,将处理后的数据存储在分布式文件系统或数据库中,以实现高并发、高可用的数据访问;之后,根据业务需求对数据进行统计分析、机器学习等处理,生成有价值的信息;最后,通过数据可视化工具将分析结果以图表等形式展示出来,供决策者参考。整个流程需要考虑到数据的完整性、准确性和安全性,以确保大数据系统的稳定运行和高效性能。
作者其他创作
大纲/内容
数据类型
Hive:数据分析
DataX
DIM维度描述
过滤
ADS:数据展示 结果
NGINX
MySQL集群 或者 Hbase库
Flume集群
埋点数据/行为数据
业务数据
ODS原始数据
同步到
HDFS
BI展示
Mysql集群
通过
数据采集
聚合
存到
DWS数据的重复利用
DWD数据明细层业务数据:建模埋点数据:过滤 / 清洗继成
0 条评论
回复 删除
下一页