《标签类目体系》读书笔记
2022-02-09 16:10:45 8 举报
AI智能生成
数据资产设计的落地方法论:标签类目体系,让数据资产不再是空中楼阁
作者其他创作
大纲/内容
前言
“<font color="#ff0000">用</font>”数据而非“<font color="#ff0000">管</font>”数据
以<font color="#ff0000">技术</font>来驱动<font color="#ff0000">数据中台</font>建设,也许从方向上就错了!
数据资产是什么?
数据资产能给<font color="#ff0000">业务</font>带来<font color="#ff0000">经济价值</font>的<font color="#ff0000">数据资源</font>
数据中台的价值是什么?
数据中台的价值在于<font color="#ff0000">让业务快速试错</font>,在千百次的试验中<font color="#ff0000">找到并发挥数据的商业价值</font>
由来篇:因何产生,为何需要
第1章 因:6大数据困局
数据孤岛,无法打通
烟囱式建设,重复造轮子
各说各话,没有统一口径
鸡同鸭讲,无法穿透业务层
数据人员的梦魇,数据治理永远没有尽头
数据部门的尴尬,被命运扼住咽喉的成本中心
第2章 源:6段由来过程
第3章 义:3点产生必要
数据资产<font color="#ff0000">可复用</font>
标签类目体系是中台概念的<font color="#ff0000">核心落地点</font>
前台、中台、后台三者之间的关系
前台:直接面向业务
后台:底层支撑系统和服务
中台:承接、消弭前台和后台之间的差异
把后台中<font color="#ff0000">常用</font>的数据资源<font color="#ff0000">沉淀</font>在中台,并<font color="#ff0000">快速响应</font>前台的业务调用
标签的适用范围
必须考虑可复用性
一定不是用来解决单一场景问题的
数据资产化的必经之路
让业务人员能<font color="#ff0000">阅读、理解、方便</font>地使用数据
业务人员查看数据资产就像<font color="#ff0000">逛淘宝</font>一样
面向业务<font color="#ff0000">可理解</font>
需要<font color="#ff0000">更具价值</font>的数据资产
好的数据资产<font color="#ff0000">设计</font>办法
数据资产必然走向<font color="#ff0000">业务导向</font>
数据价值<font color="#ff0000">可衡量</font>
标签是数据商品化的最佳载体
理论篇:基础原理与演绎推导
第4章 道:4个核心原理
根、枝干、叶子
根:决定这是一颗什么树
“根”对应的数据粒度为“对象”
“对象”分两大类型
实体对象(人、物)
关系对象(强关系、弱关系)
枝干:标签分类
叶子:标签
对象的各种属性,即标签
动态标签 vs 静态标签
标签取值是否经常变化
<font color="#ff0000">标签类目体系</font>实质上是对“对象”<font color="#ff0000">属性</font>的模式<font color="#ff0000">设计</font>
打标签 vs 标签设计
打标签:标签赋值
标签设计:标签定义
能量、养分和凋零
能量
<font color="#ff0000">实体树</font>之间通过<font color="#ff0000">关系树</font>连接
<font color="#ff0000">关系树</font>向<font color="#ff0000">实体树</font>赋予能量
每<font color="#ff0000">新增</font>一种动作、行为、连接,即<font color="#ff0000">关系树</font>,就会在<font color="#ff0000">实体树</font>上映射转化出一片新类型的<font color="#ff0000">叶子</font>
养分
<font color="#ff0000">业务使用</font>是对标签树的养分供给
凋零
将没有使用的<font color="#ff0000">标签下线</font>是必须考虑的标签生命周期过程
最终梳理出<font color="#ff0000">一片森林</font>,而非<font color="#ff0000">一颗树</font>
森林,就是某个具体场景
分形结构与资产树栽种模式
标签类目树形态是<font color="#ff0000">适应业务发展</font>生长的结果
建设资产树的两种模式
完整规划,由浅入深
优点:全面规划,面向未来,可以指导企业在数据端的全面布局
缺点:建设周期长,见效慢,建设过程会遇到的阻力很大
纵深打穿,从局部直接截取
优点:标签直接作用于业务,可以快速得到业务滋养并呈现数据价值,受到的质疑与阻力小
缺点:当业务、标签不断变化调整时,整个类目结构可能会有较大的变动,甚至重构,影响较大
资产树使用模式推演
数据资产库
资产清单
通过资产目录/门户/集市界面,清晰明了地看到所有对象的标签类目体系
资产实体
在设计好的标签类目树模式下的具体个体实例,即每个对象个体
标签类目体系的<font color="#ff0000">三种常见的数据服务</font>
查询服务:OLTP
标签在线查询
个人画像查询
分析服务:OLAP
人群画像洞察分析
离线分析
圈选服务
离线圈选人群
第5章 法:完整的设计方法
3个构建前提
统一的数据思维
数据认知
数据在哪?
数据价值在哪?
数据怎么用?
数据架构
业务数据化
将各业务系统中的数据进行清洗、交换,并最终汇总到企业的数据中心
数据资产化
将原始数据<font color="#ff0000">梳理、加工</font>成可供<font color="#ff0000">业务理解、查看、使用</font>的数据资产
数据资产存放在资产管理工具中
不断的治理优化
资产服务化
在资产中心中,经过标准化组织和梳理的数据资产,经筛选后被灌入<font color="#ff0000">服务组件</font>中
业务人员、产品经理、应用开发人员只需<font color="#ff0000">快速配置</font>即可<font color="#ff0000">创建数据服务</font>(API)
在服务中心中,可以对所有数据服务的调用、运行等情况进行<font color="#ff0000">计量</font>、<font color="#ff0000">全局监控</font>和<font color="#ff0000">调度配置</font>
服务业务化
创建好的数据服务(API)可以<font color="#ff0000">直接对接现有的业务系统</font>或者<font color="#ff0000">封装成带交互界面的数据应用产品</font>
最终支撑业务解决问题或者提升业务执行效率,产生商业价值
执行保障
领导层:进行相应的组织架构支持
管理层:制定以数据为导向的具体作战计划和考核指标
执行层:努力工作
价值驱动
以数据资产价值的实现为最根本目标
场景能力
具有<font color="#ff0000">复用价值</font>的数据资产项和数据服务能力可以沉淀在<font color="#ff0000">数据中台</font>中
当业务<font color="#ff0000">场景发生变化</font>时,可以从<font color="#ff0000">数据中台</font>中<font color="#ff0000">快速抽取</font>所需数据资产项和数据服务能力,耦合在一起,供场景所用
充分的前期调研
<font color="#ff0000">业务场景</font>调研
需求<font color="#ff0000">痛点</font>调研
<font color="#ff0000">数据摸底</font>调研
正确的落地思路
根据<font color="#000000">业务</font><font color="#ff0000">流程</font>梳理<font color="#ff0000">数据</font><font color="#000000">类目</font>体系
根据业务<font color="#ff0000">需求</font>梳理<font color="#ff0000">标签</font>类目体系
6个设计步骤
识别对象
先研究“对象”(树根)
人、物、关系
同一对象数据打通
ID-Mapping技术
解决某一对象多源数据打通问题
ID与ID间的关联运算,要考虑<font color="#ff0000">准确率</font>
One-ID
企业内容统一的<font color="#ff0000">主ID</font>
4种级别的ID
第一级别ID
<font color="#ff0000">强身份</font>属性的ID
身份证、护照、驾驶证、人脸ID、指纹ID等等
第二级别ID
<font color="#ff0000">设备</font>相关的ID
手机号、手机IMEI、IDFA、MAC、邮箱地址等等
第三级别ID
<font color="#ff0000">注册账号</font>相关的ID
支付宝账号、微信账号、淘宝账号、QQ号等等
第四级别ID
<font color="#ff0000">临时记录</font>相关的ID
Cookie、IP地址、GPS定位、操作行为等等
数据化的事物表达(<font color="#ff0000">数据映射</font>)
将现实世界的所有事物都<font color="#ff0000">映射</font>为“人”、“物”、“关系”三类<font color="#ff0000">对象</font>
系统性地向下梳理各个对象全维度的<font color="#ff0000">标签</font>,以及标签下的具体<font color="#ff0000">标签值</font>
现实世界 -> 对象 -> 标签 -> 标签值
注意:这里没有类目(树枝),只有对象(树根)和标签(叶子)
构建<font color="#ff0000">数据</font>类目体系
“数据类目体系”中的“<font color="#ff0000">数据</font>”特指企业<font color="#ff0000">初始化</font>存储的<font color="#ff0000">系统数据</font>
类目梳理(树枝)
数据库、数据表、数据字段的组织方式 相应转化为 数据类目
注意:这里说是构建,其实更多的是熟悉现状
构建<font color="#ff0000">标签</font>类目体系
什么是标签?
标签是指从<font color="#ff0000">原始数据</font>清洗<font color="#ff0000">加工</font>而来,能够<font color="#ff0000">为业务</font>所用并<font color="#ff0000">产生价值</font>的数据资源
标签一般都需要结构化到<font color="#ff0000">字段</font>粒度,保障服务化使用
标签设计的两大前提
数据可行性(有数据)
业务上需要
标签类目体系设计的建议
类目体系<font color="#ff0000">一般不超过三级</font>,分级层数不宜过多
如果标签数量较多时,可以将类目深度转化为类目广度
三级分类结构,每级分类不超过10个,即总类目数不超过1000个
<font color="#ff0000">前后台</font>标签类目体系
前台类目(业务标签树)
侧重于对业务场景的响应,随着业务场景变化而变化,是灵活可配置的
场景化、不稳定,更贴近业务需求
负责人:业务产品经理
后台类目(数据基础标签树)
与业务场景松耦合,保持对人、物、关系各类对象的全局、稳定的标签定义
可复用、稳定,有广泛价值
负责人:数据资产设计师
第6章 术:使用技法与重要问题
标签规范
标签化
将数据提炼转化为标签的过程称为<font color="#ff0000">“标签化”</font>,需要考虑两个因素
需要考虑两个因素
是否具有<font color="#ff0000">数据可行性</font>
是否能体现<font color="#ff0000">业务价值</font>
元标签(标签元数据)
元标签是对标签对象的属性描述,旨在采用业务化的术语,帮助前端业务更好地理解标签
元标签分为
业务元标签:偏向业务理解
技术元标签:偏向技术方向
重要的元标签
标签所属根目录(查询主键key)
标签所属类目(标签分类)
标签名(中英文名)
标签命令规范
同一个标签应该只有一个标签名
统计类标签:使用同类语句结构
标签名 = 时间维度 + 渠道维度 + 品类 + 原子标签
算法类标签:名称中增加“<font color="#ff0000">预测</font>”
标签描述
标签加工类型
原始类标签
原始数据库表中<font color="#ff0000">存在的字段</font>,经过<font color="#ff0000">简单规范</font>后成为标签
一般是<font color="#ff0000">基础属性</font>类标签
统计类标签
原始数据经过<font color="#ff0000">ETL</font>加工成为标签
一般是<font color="#ff0000">行为习惯</font>类标签
算法类标签
原始数据经过<font color="#ff0000">算法模型</font>计算后的<font color="#ff0000">深加工</font>类标签
一般是<font color="#ff0000">高级抽象</font>类标签
标签逻辑
值字典
枚举值
范围值
取值类型
数值型
文本型(字符型)
日期型
键值型
示例
更新周期
安全等级
L1:公开标签
可对外公开,安全等级最低
L2:内部标签
在企业内部可直接使用,安全等级较低
L3:保密标签
在企业内部需要申请授权后使用,安全等级较高
L4:机密标签
在企业内部只有少数人可使用,且不可传播,安全等级最高
标签对应的物理存储信息
手工登记填写
系统映射自动填写
标签负责人
标签更新时间
组合标签
面向<font color="#ff0000">业务人员</font>,可通过<font color="#ff0000">标签组合工具</font>在<font color="#ff0000">交互界面</font>上对现有标签进行<font color="#ff0000">自由组合</font>配置,<font color="#ff0000">实现新标签</font>的设计和使用
可视化、零代码、自助实现
标签使用
数据服务
数据服务是指通过<font color="#ff0000">API形式</font>提供某种数据功能,以满足业务系统调用所需
多个接口API,使用灵活
数据应用
数据应用是指面向业务侧提供<font color="#ff0000">带交互界面</font>的数据功能组合,是数据应用结果的系统呈现
数据服务 + 可视化组件 = 数据应用
端到端、零代码、一站式
缺点:对于非常见、定制较多的功能和呈现方式是无法支持的
标签的<font color="#ff0000">全生命周期</font>运营
标签设计
标签开发
标签上架
上架后的标签,才能使用
标签使用
数据同步
数据服务+数据应用
标签治理
血缘信息
元标签
质量管理
安全管理
标签营销
推广宣传
标签质量
数据<font color="#ff0000">来源</font>类相关指标
数据源安全性
数据源准确性
数据源稳定性
数据源时效性
数据源全面性
标签<font color="#ff0000">加工</font>过程相关指标
标签测试准确率
标签产出稳定性
标签生成时效性
标签取值覆盖量
标签完善度
标签规范性
标签值离散度
标签<font color="#ff0000">使用</font>过程相关指标
标签使用准确率
标签调用量
标签受众热度
标签调用成功率
标签故障率
标签关注热度
标签持续优化度
标签持续使用度
标签成本性价比
标签成本
标签数据源采集与存储成本
标签设计与加工成本
标签使用与营销成本
标签价值
市场价值
企业内部经营管理优化:降本增效
通过标签分析发现<font color="#ff0000">高成本</font>环节
通过标签决策发现<font color="#ff0000">低效率</font>环节
企业对外的数据业务赋能
合规的数据交易产业
社会价值
普惠民生的社会价值
标签方法论与数仓建模的异同
标签方法论:面向业务端的数据资产复用
数仓建模:偏重数据治理、数据规范、按领域建模
实践篇:商业实战中的价值涌现
第7章 器:标签工具和经典模板
标签工具
<font color="#ff0000">标签工具</font>是一种从业务建模、数据同步、资产加工到服务应用的<font color="#ff0000">标签全生命周期</font>集成运营<font color="#ff0000">平台</font>
标签方法论:对象--类目--标签的树状方式组织数据
标签工具的<font color="#ff0000">核心模块</font>
标签体系设计(标签树设计)
对象设计
类目设计
标签设计
标签同步加工
标签加工:标签开发
标签同步:标签值同步到目的存储系统中
标签管理(元数据)
标签维护:上架、下架、解绑、审核、修改等操作
标签标准:对标签类目的命名、取值、格式等的一致约定
标签质量:对标签全生命周期中的质量问题进行识别、度量、监控、预警
标签价值:通过标签调用量、标签活性、标签热度、场景贡献、业务好评率等多方面因素反映
标签安全
标签门户
标签集市
收藏标签
申请标签使用
标签使用
数据查询(在线点查)
群体洞察(圈人、分析)
群体圈选
群体分析
微观画像(个人画像,比较敏感)
4个经典模板
用户标签类目体系模板
用户标签一般适用于<font color="#ff0000">面向C端</font>的业务场景
例如:个体画像、精准营销、个性化推荐等
商品标签类目体系模板
商品标签一般适用于商品研究分析、商品商机上下游撮合、商品生产库存风险预警、商品个性化推荐、商品舆情评论、商品溯源监控等数据应用场景
企业标签类目体系模板(加盟商)
工商注册的法人主体或者社会机构
员工标签类目体系模板(企业内部)
员工标签适用于企业内部人力资源管理、人才培养优化、绩效考核薪酬制定,企业外猎头推荐撮合、仁财筛选影响力评价等业务场景
第8章 践:从标签到应用的5个最佳实践
银行业卡业务<font color="#ff0000">精准营销</font>场景
汽车业整车厂商<font color="#ff0000">可视化大屏</font>场景
制造业B2B平台<font color="#ff0000">供应链</font>金融场景
零售业电商<font color="#ff0000">千人千面推荐</font>场景
地产业<font color="#000000">物管</font><font color="#ff0000">效能分析</font>场景
第9章 果:价值、案例、经验分享
标签的7点价值总结
串联
数据标签化的成果体现在对<font color="#ff0000">数据和业务</font>、<font color="#ff0000">资源与价值</font>的串联上
业务友好
标签化的数据资产具备<font color="#ff0000">可阅读</font>、<font color="#ff0000">易理解</font>、<font color="#ff0000">好使用</font>、<font color="#ff0000">有价值</font>的特征
全息刻画
通过标签类目体系可以实现<font color="#ff0000">对象</font>的全息刻画
可复用
标签以其良好的组织形式,实际上完成了对<font color="#ff0000">数据资产</font>的<font color="#ff0000">工程化</font>封装
可管理
生命周期管理
治理类管理
价值链路管理
可运营
<font color="#ff0000">数据资产</font>的走向顺应<font color="#ff0000">业务价值</font>的流向
运营模式的内在动力不再是强制手段,而是自发的价值驱动
创新场景
0 条评论
下一页