成熟工具
数据资产管理相关的工具:比较成熟的工具有数据标准管理工具、数据模型管理工具、元数据管理工具、主数据管理工具、数据质量管理工具、数据安全管理工具和数据生命周期管理工具等七类工具
在大数据能力构建中,一般还要利用“数据集成工具”、“数据共享交换平台”等
8个对应工具的具体功能
1. 数据标准管理工具<br>数据标准制定及维护工具可以规范数据资产格式、命名的准确性和口径的一致性,该工具针对数据标准管理职能而开发,需具备以下基础功能:<br> 标准生成:可按照业务领域、业务主题、信息分类、信息项等生成标准细则;<br> 标准映射:可以将制定的标准与实际数据进行关联映射,即实现数据标准的落地执行,维护标准与元数据之间<br>的落地映射关系,包括元数据与数据标准的映射、元数据与数据质量的映射,以及数据标准和数据质量的映射,能提供在<br>线的手工映射配置功能,并能对映射结果做页面展示;<br> 变更查询:是查询发布或废止的标准的变更轨迹;<br> 映射查询:是查询标准项与元数据之间的落地情况并提供下载功能;<br> 维护标准:是指对标准状态进行管理,包括增删改、审核、定版、发布、废止等;<br> 标准版本查询:是指对发布状态的标准进行版本管理;<br> 标准导出:是指按照当前系统中发布的最新标准或者选择版本来下载标准信息;<br> 标准文档管理:指对标准相关说明文档或手册的管理,包括创建、修改、链接查询等。
2. 数据模型管理工具<br>针对企业在不同业务发展阶段建设的一个个竖井式系统,最大的挑战莫过于系统集成过程中数据模型的不一致,解决这个问题的唯一方法就是从全局入手,设计标准化数据模型,构建统一的数据模型管控体系,数据模型管理工具负责对企业数据模型的管理、比对、分析、展示提供技术支撑,需要提供统一、多系统、基于多团队并行协作的数据模型管理。解决企业数据模型管理分散,无统一的企业数据模型视图、数据模型无有效的管控过程,数据模型标准设计无法有效落地、数据模型设计与系统实现出现偏差等多种问题。该工具针对数据模型管理职能而开发,需具备以下基础功能:<br> 数据模型设计:支持对于新建系统的正向建模能力,还应支持对原有系统的逆向工程能力,通过对数据模型进行<br>标准化设计,能够将数据模型与整个企业架构保持一致,从源头上提高企业数据的一致性;<br> 模型差异稽核:提供数据模型与应用数据库之间自动数据模型审核、稽核对比能力,解决数据模型设计与实现<br>不一致而产生的“两张皮”现象,针对数据库表结构、关系等差别形成差异报告,辅助数据模型管理人员监控数据模型质量问题;提升数据模型设计和实施质量;<br> 数据模型变更管控:支持数据模型变更管控过程,提供数据模型从设计、提交、评审、发布、实施到消亡的在<br>线、全过程、流程化变更管理。同时,实现各系统数据模型版本化管理,自动生成版本号、版本变更明细信息,可以辅助<br>数据模型管理人员管理不同版本的数据模型。通过工具可以简单回溯任意时间点的数据模型设计状态以及数据模型设计<br>变更的需求来由,实现各系统数据模型的有效管控和管治,强化用户对其数据模型的掌控能力;<br> 模型可视化:支持将管理的数据模型 E-R 图(实体关系图)转换为图片、数据建模脚本(DDL)等可视化展示<br>形式,方便数据模型管理人员以全局视角监控系统中各类数据实体结构及实体间关系。
3. 元数据管理工具<br>元数据管理工具可以了解数据资产分布及产生过程,该工具针对元数据管理职能而开发,需具备以下基础功能:<br> 元数据采集:能够适应异构环境,支持从传统关系型数据库和大数据平台中采集从数据产生系统到数据加工处<br>理系统到数据应用报表系统的全量元数据,包括过程中的数据实体(系统、库、表、字段的描述)以及数据实体加工处理过程中的逻辑,也可通过自动化的方式完成元数据采集,比如用户维护好数据源连接信息后,可以根据数据源的更新频<br>率,设定元数据同步周期,元数据管理会根据数据源的连接信息、同步周期以及开始时间,定时自动解析、获取、并更新<br>元数据信息,保证平台元数据信息的及时有效;<br> 元数据识别:能够从本身不包含元数据信息的数据(比如非结构化数据)中提取特征,并以此识别元数据;<br> 元数据分类:能够根据业务特点和管理需要,动态分类元数据,包括技术元数据、业务元数据和管理元数据等;<br> 元数据展示:能够根据类别、类型等信息展示各个数据实体的信息及其分布情况,展示数据实体间的组合、依<br>赖关系,以及数据实体加工处理上下游的逻辑关系;<br> 元数据应用:能够利用元数据发现数据之间的关联性,一般包括数据地图、数据血缘分析、影响分析、全链分析、热度分析等;<br> 元数据搜索:可根据数据源库、类型等搜索元数据信息。
4. 主数据管理工具<br>数据管理工具用来定义、管理和共享企业主数据信息,可通过数据整合工具(如 ETL)或专门的主数据管理工具来实施主数据管理,具有企业级主数据存储、整合、清洗、监管以及分发等五大功能,并保证这些主数据在各个信息系统间的准确性、一致性、完整性。简单说来,存储、整合是数据的“入口”,分发为数据的“出口”,而中间的<br>清洗与监管将担负起数据质量提升的重要任务。该工具针对主数据管理职能而开发,需具备以下基础功能:<br> 主数据存储、整合:实现主数据整合、清洗、校验、合并等功能,根据企业业务规则和企业数据质量标准对收集<br>到的主数据进行加工和处理,用于提取分散在各个支撑系统中的主数据集中到主数据存储库,合并和维护唯一、完整、<br>准确的主数据信息;<br> 主数据管理:支持对企业主数据的操作维护,包括主数据申请与校验、审批、变更、冻结/解冻、发布、归档等全生命周期管理;<br> 主数据分析:实现对主数据的变更情况监控,为主数据系统管理员提供对主数据进行分析、优化、统计、比较等功能;<br> 主数据分发与共享:实现主数据对外查询和分发服务,前者用于在其它系统发出针对主数据实时响应类查询请求时,返回所需数据,后者则用于提供批量数据分发服务,一般采用企业服务总线(ESB 工具)实现方式。
5. 数据质量管理工具<br>数据质量管理工具从数据使用角度监控管理数据资产的质量,针对数据质量管理职能而开发,需具备以下基础功能:<br> 质量需求管理:对数据使用过程中产生的问题进行收集、存储、分类并提供查询检索功能,为质量规则的制定提供依据;<br> 规则设置:能够提供稽核规则设置功能,用于设置一个稽核规则应用于哪类数据;<br> 规则校验:能够对所关注的数据执行数据质量规则的校验任务;<br> 任务管理:能够提供稽核任务调度功能,指定稽核任务周期执行;<br> 监控分析:对规则校验的结果进行监控和分析,校验结果能够定位到原始数据项;<br> 质量报警:能够对质量问题及时进行报警,避免数据污染的发生,造成成本或业务损失;<br> 报告生成:能够对校验结果的质量问题进行记录,积累形成问题知识库,并生成报告,在此基础上,能够根据检核结果,生成对问题数据的质量提高建议,并可直接操作修改数据。
6. 数据安全管理工具<br>数据安全管理工具是结合信息安全的技术手段保证数据资产使用和交换共享过程中的安全。数据管理人员开展数据安全管理,是指执行数据安全政策和措施,为数据和信息提供适当的认证、授权、访问和审计,以防范可能的数据安全隐患。需具备以下基础功能:<br> 数据获取安全:能够支持数据获取需要经过申请与审批流程,保障数据获取安全;<br> 数据脱敏:能够支持数据脱敏规则、脱敏算法及脱敏任务的管理及应用,一般情况下,脱敏方式有动态脱敏和静态脱敏两种;<br> 统一认证:定义数据安全策略,定义用户组设立和密码标准等;<br> 租户隔离:管理用户,密码,用户组和权限;<br> 角色授权:划分信息等级,使用密级分类模式,对企业数据和信息产品进行分类;<br> 日志审计:审计数据安全,监控用户身份认证和访问行为,支持经常性分析;<br> 异常监控:指对账号异常行为的监控,如同一账号异地登录、同时多 IP 登录、多次重复登录等;<br> 数据分类分级:能够支持对数据资产安全进行敏感分级管理,并支持根据各级别生成对应的数据安全策略。
7. 数据价值管理工具<br>数据价值管理通过对数据内在价值的评估、数据成本和收益的管理,实现数据资产化管理,需具备以下基础功能:<br> 数据需求分析:通过数据库或者数据平台的各种数据分布分析和访问状态分析,协助数据管理人员对数据生命<br>周期管理策略,有效发现和挖掘当前数据平台或者数据库中历史数据增长最快的关键数据,同时,为管理业务部门需求,<br>满足业务部门对数据使用的要求提供有效的数据化支撑;<br> 数据价值评估:依据数据需求分析,建立合适的数据价值评估模型,主要包括数据成本和收益的评估方法、评估指标等,并支持对数据价值评估方法与各项指标的动态更新;<br> 数据成本管理:能够完成数据成本(主要包括存储成本和计算成本等)的优化,并给出影响成本的分析报告(如包含重复计算、代码质量差等);<br> 数据收益管理:能够动态调整数据收益评价指标,依据指标对数据应用进行全流程管理,增加数据收益;<br> 数据服务:通过构建服务目录、授权数据服务等有效完整的记录数据服务信息,并最终生成数据服务报告,展示数据服务的价值;<br> 数据资产价值统计:能够可视化展示数据资产的一段时间内的统计视图,展现数据使用和成本的变动。
8. 数据服务管理工具<br>数据服务管理是指在数据管理平台上提供数据或数据分析结果的服务,包括企业内部数据共享和外部数据流通,通过构建服务目录、授权数据服务等有效完整的记录数据服务信息,最终生成数据服务报<br>告,展示数据服务的价值,需具备以下基础功能和辅助功能:<br> 服务目录:能够精确的展示各目录下能够提供的数据服务类型、服务流程、数据资产目录等,其实数据资产目录能够按照业务要求和企业标准,自定义构建数据资产目录层级,并描述数据资产相关属性,包括表级属性(如表名、目录、更新周期、业务类别等)和字段结构(如字段名称、字段类型、字段长度等);<br> 服务目录版本管理:能够记录数据资产目录变更版本信息,包括具体变更情况;其中数据资产目录可以通过元数据关联导入,在元数据有变更时,自动同步;<br> 数据资产共享和流通:提供数据资产下载、共享、流通及服务接口等,支持按共享属性(如无条件共享、有条件共享、不共享等)对资源目录下的数据资产进行分类,支持直接提供数据和数据分析结果;<br> 其他功能:数据服务可以通过“数据超市”的形式开展,用户通过订阅具体服务获取和使用数据。