数仓体系
2017-03-01 08:14:52 0 举报
AI智能生成
数仓体系,又称为数据仓库体系,是一套用于存储、管理和分析大量数据的系统。它包括多个层次,从原始数据源到最终的分析结果,每个层次都有不同的功能和特点。原始数据层负责收集和存储各种类型的数据,如结构化数据和非结构化数据;清洗转换层则对这些数据进行清洗、转换和整合,以便后续的分析;集成层将不同来源的数据进行集成,形成统一的数据视图;存储层则负责长期存储和管理这些数据;最后,分析层通过各种工具和技术对数据进行深入挖掘和分析,为企业决策提供支持。总之,数仓体系是一个复杂而完整的数据处理系统,能够帮助企业更好地利用数据资源,提高决策效率和准确性。
作者其他创作
大纲/内容
数据开发
负责人: 卢健锋
刘金生, 冯永
1. 数据仓库建设
监控
速度监控
能快速定位运行慢的Job
易定位
出现问题时, 能快速定位到发生问题的Job, 甚至原因
可视化
运行状态一目了然
E-T-L(数仓)
可回溯
数据状态变化有记录可查
易用性
交付的结果面向分析人员要足够友好
全流程
每一步都有记录, 事后可查
准确性
数据一定要保证准确, 不准确不上
完备性
文档齐全, 注释充分详细
数据建模文档
数据流向文档
数据维度完整
粒度可控
通用性
尽可能采用组件, 避免重复编码
调度系统
易于增, 删, 改
底层逻辑清晰, 方便操作
可视化
页面操作, 避免误操作
数据交换平台
规范性
接口化
数据中台
2. 报表系统开发
监控
开发速度
运行速度
计算速度
展示速度
富展现
多种图表
上下钻
3. 大数据平台
Hadoop
实时运算能力
4. 辅助系统开发
数据应用
陈宗妍
指标体系
企业指标参考文档, 只记录已经确定的指标
清晰, 无歧义, 附上计算SQL
周期报告
专题分析
数据挖掘+机器学习
0 条评论
下一页