数据标准梳理工作清单
2024-03-19 19:45:09 0 举报
AI智能生成
登录查看完整内容
数据标准梳理工作清单
作者其他创作
大纲/内容
示例:table001(需要规则)
标准代码
示例:ODS层XX业务系统来源表规范
标准名称
示例:ODS层表规范
标准集
示例:《数仓分层规范》
依据标准
基本属性
示例:table1
表名称
示例:用户表
表注释
批量同步
实时同步
示例:批量同步
同步类型
示例: hive
存储类型
示例:textfile
存储格式
示例:/root/xxsystem/table1
存储路径
技术属性
表中文名称
示例:系统用户维护主表
表业务含义
示例:XX业务系统
表系统来源
用来存储业务事实数据,通常包含各种度量值,比如销售额、数量、金额等。事实表通常与维度表进行关联,用来支持数据分析和报表生成等业务需求。
事实表(Fact Table)
用来描述事实表中的数据,提供上下文信息。比如,产品维度表可以包含产品的名称、类别、品牌等信息,时间维度表可以包含日期、年份、季度等时间相关信息。
维度表(Dimension Table)
用来存储固定的参照数据,比如国家代码、省市区信息等。参照表通常被其他表引用,用来确保数据的准确性和一致性。
参照表(Lookup Table)
用来存储代码值与对应的含义,比如状态码表、类型码表等。代码表可以帮助对数据进行分类和理解。
代码表(Code Table)
用来建立不同数据元素之间的映射关系,比如产品与分类的映射关系表、员工与部门的映射关系表等。
映射表(Mapping Table)
用来存储数据变更的历史记录,比如订单状态的变更记录、客户信息的变更记录等。历史表可以帮助跟踪数据的变化历史。
历史表(History Table)
其他表(Other Table)
来源表类型
示例:医疗行业
业务域
示例:就诊主题
一级主题
示例:患者主体
二级主题
示例:挂号环节、就诊环节、开药环节、缴费环节
三级主题
业务属性
示例:XXX医院
数据来源单位
示例:XXX医共体
归口管理单位
示例:coop
数据实施单位
管理属性
示例1:ODS/XX业务系统
示例2:DWD/医疗行业/就诊主题/患者主体/挂号环节
资产分层路径:
示例1:ODS_XxSys_*
示例2:DWD_YL_JZ_HZ_GH_*
资产表命名规范
资产属性
示例:是
是否允许预览数据
是否允许提供服务
示例:AES
服务传输加密算法
安全属性
数据表标准
示例:Col001(需要规则)
艾滋病患者标志
示例:就诊主题患者
示例:《WST 363.11—2023卫生健康信息数据元目录第11部分:医学评估》
azb
字段名称
布尔型(boolean)
字段类型
字段长度
双精度长度
字段备注
例如:DE05.10.003.00
数据元标识符
例如:艾滋病患者标志
数据元名称
例如:标识患者是否已经发展成为艾滋病患者
定义
主题分类
大类
小类
例如:L
数据元值的数据类型
例如:T/F
表示格式
—(急性,慢性等枚举)
数据元允许值
V 1.1
版 本
国家卫生健康委员会卫生健康信息标准专业委员会
注册机构
卫生健康信息
相关环境
分类法
分类模式
国家卫生健康委统计信息中心
主管机构
标准状态
注册状态
提交机构
是/否
不允许为空
需要保持唯一
50
长度规范
{ref}<50
条目规范
{ref}>10 and {ref}<1000
数字范围
{ref}>{lastMonth-lastDay} and {ref}<{thisMonth-lastDay}
日期范围
枚举范围
疫苗名称代码
代码字典
电话号码正则表达式
字符规范
质量属性
绝密/保密/秘密/公开
安全级别
是
是否脱敏
第一个字符*替换
脱敏规则
数据项标准
元数据类
数仓分层规范
业务域,主题,业务主体,业务环节梳理/梳理办法
...
数仓基本规范
建表规范
全量
增量
T+1
实时
ETL规范
数仓实施规范
国标文档规范
客户定制规范
文档类
字典梳理录入
词根梳理录入
字典类
数据标准梳理工作清单
0 条评论
回复 删除
下一页