数据分析理论+实战
2022-03-31 10:01:04 2 举报
AI智能生成
登录查看完整内容
为你推荐
查看更多
数据分析驱动互联网运营
作者其他创作
大纲/内容
数据使用的能力组成
数据使用的能力模型
课程价值
对当前业务有参考价值的统计数据
什么是数据指标
自然日
DAU
单纯将日活累加而不去重是无价值的
MAU≠当月个日DAU之和
MAU
基于事件上报统计
有事件上报=该用户活跃
存在维护成本和沟通成本
业务上报的定义:关键事件
Active
给每位客户一个专属ID
只适合强注册/登录环境,未登录的用户会被漏掉
认人
无法对应设备背后的用户
用户数=访问过服务的设备数
在网页cookie中埋下一段长随机字符串,作为设备的唯一标识符
认设备
无账号体系:认设备
业务场景强依赖登录:认人+认设备
NO:认人+认设备
YES :认设备
不登录的用户对业务是否有价值:
关于认人or认设备
user
DAU/MAU
存量
渠道
点击
首页
注册
。。。(完成该流程)
合适的节点,定义”增“
基于设备
基于账号关联
用适当方法,定义”新“
定义
新增用户
增量
以日为单位衡量这个渠道来的用户当下&接下来的行为
了解某一渠道的质量-日留存
以周、月为单位
观察整个大盘-周留存/月留存
二者对比
留存率
健康程度
渠道来源
从哪来
用户数据
pv:页面浏览量-次数-不去重
uv:独立访问数-人数-去重
pv/pv;uv/uv:流程转化
pv/uv:不涉及流程转化
用户对某些关键行为的访问次数
将网站内容/功能分成几个层级,以用户本次访问过最深的一层计算
访问深度
pv、uv、转化率、访问深度
PV/UV、访问深度
次数/频率
转化率
路径走通程度
页面打开时长
web时代
前台驻留时间
app时代
眼动仪,瞳孔与注意识别
如何统计
记录暂停/关闭页面时进度条的位置
统计视频被消费程度,评价内容质量
通过统计特殊事件,支持业务需求
为何统计
访问时长
做了多久
用户来了只访问一个页面立马就走了,访问1个以上页面再走的人不算
整个网站产生的所有会话的弹出率,不是针对页面的
弹出率
质量
行为数据
GMV、访问时长
总量
ARPU/ARPPU、人均访问时长
人均
付费人数/播放人数
人数
付费率、付费频次、观看率
SKU视角、被消费内容视角
被消费对象
业务数据
常用的数据指标有哪些,如何定义的
如何搞大/搞频繁(手段)
有什么困难,我要通过什么特色方法来解决(工具)
常见的拆解角度
从业务的最终目标出发梳理业务模块
效率
工具模块
质&量
内容浏览模块
交易模块
活跃
社区模块
根据省/杀时间、产品本身给用户带来价值/链接其他资源产生价值
判断业务模块所属的类型
累积量,投入程度
使用量
是否正常运转
目标达成率
能不能让用户养成习惯
频次
工具类
核心场景转化效率
详情页转化率
总的交易金额
金额
单个用户价值
客单价
收入的持久度
复购率
交易类
累计量
浏览数
覆盖内容库存情况
浏览广度
占据用户多少时间
浏览时长
用户对内容的情感
内容互动
内容浏览
用户创作的内容数量
发布量
用户与用户之间互动的次数
互动量
用户与用户之间的关系
关系密度
社区/社交类模块
根据业务模块所属类型选择数据指标
选好数据指标的通用方法论
指标建模
通过代码与脚本统计日志
通过BI工具进行基本分析
计数与统计工具
用户基本信息
同一个来源有不同的媒介
用户从哪来
用户行为流
用户来了干什么
有没有达成目标
流量导向
单个用户的信息轨迹
来了干什么
单个行为对留存的影响
会不会再来
用户漏斗
在哪流失的
用户属性列表,用户画像
用户都是什么样的
通过“屏幕录像”和行为序列观察,优势:从用户视角描述单个用户的行为轨迹
优势
解决问题
用户导向
流程是否顺畅
规模、频次如何
问题/原因何在
解决的问题
商业逻辑上还原整个业务流程,从线上到线下
业务导向
哪些资源被消费
被消费的情况如何
内容表现质量如何
内容导向
数据工具
要啥数据
有啥属性
困境一:自己理不清
前端or后端采集?
跨越前-后端取值?
困境二:RD听不懂
埋点需求
埋点实施过程中的细节
DRD 数据需求文档
埋点
总金额
产品自身的指标建模
入口点击率
来源渠道
业务部门的分析需求
归纳需求
某个用户在某个时间、某个地方以某种方式解决了某个问题
WWWHW
唯一的身份标识
who
哪个节点的时间
哪个时区的时间
when
GPS
IP
自主填写(用户希望在哪)
where
设备、浏览器、版本、4g/wifi、哪个页面跳转的
how
购买、搜索、注册、投诉、退货
what
选择适当的埋点属性
公共属性(统一取值、维护)
明确埋点需求
只能在前端发生就埋前端,否则建议后端采集
某些属性前端没有
改动依赖产品发版
事件上报时机尴尬
前端埋点的弊端
查关联表
前端送来的数据
技术数据
后端
调用API
取页面上的值
行为统计
前端
抓包or后台查看
手段
DRD逐个对比
方法
意义:数据不具备回溯性,信息损失,后续再补不回来
校验
是否在线
上线/下线时间
修改属性
埋点文档的维护
埋点位置选取
用户内容印象
各个内容的CTR
各个内容类型的曝光和点击需要能够分开查看
评论数和点赞数是否对阅读产生影响
产品自身指标建模
每个卡片配“不感兴趣”按钮
用户主动刷新/加载
主动滚到底部加载新内容次数
点击不感兴趣的次数何原因
业务部门分析需求
明确需求
指标
埋点时间确定
数据检验
数据采集实战
全埋点
无埋点
其他类型数据采集
限制:非浏览和点击事件无法采集,无法采集到what/how类的信息
分析需求简单(只统计pv和点击)
开发限制因素多
业务流程简单
技巧:通过本来在一页的数据拆成多个页面进行采集
使用场景
物流信息
客服跟进信息
电商
到课率
线下招生的客户信息
教育
地推、短信发送的客户(与新注册用户对比,验证推广效果)
金融
线下(第三方系统)数据采集(跨越物理界限采集数据)
明确目的
竞品数据采集
埋点:一小段上报事件的代码
借助drd文档
产品指标建模
业务部门需求
掌握常见的数据分析套路
需求
事件触发的时机
埋点属性的设计
总结
数据采集
导入文本文档
直接按照固定宽度、符号分列
简单分列
找出每种异常情况规范化处理后再分列
复杂分列
分列
筛选
排序
去重
数据清洗
VLOOKUP
数据的二次处理
数据透视表
快速呈现
折线图
柱状图、柱状堆积图
饼图
堆叠折线图
表不如图:EXCEL常见图表
RAWGraphs
高德地图
数据可视化
核心指标发送日报分享给团队
邮件日报
重点指标异常自动提醒
指标预警
数据异常原因可以团队共享
数据注释
GA
两个基础指标之间的加减乘除得到更直接的指标
自定义指标
神策
兴趣分布
访客属性
百度统计
数据工具特色功能演示
数据处理
不易得知问题的严重程度
本身具备价值的数字
绝对值
易收到极端值影响
在具体环境中看比例才具备对比价值
比例值
比什么
last period
与当前时间范围相邻的上个时间范围对比
对短期具备连续性的数据进行分析
相邻时间范围数字对当前指标的影响
环比
same period
与当前时间范围上层时间范围的前一范围中同样位置数据的对比
观察更为长期的数据集
观察周期内有更多干扰,希望可以消除
同比
怎么比
时间维度
不同业务线
过往经验
和自己比
跌的少
涨的多
自身因素/行业趋势
和行业比
和谁比
对比分析
城市
用户设备
拆解维度
发现异常
确定问题
确定原因
针对性解决问题
执行
应用标准流程
活动影响/对应活动页面即对应动作的数据波动,观察活动是否具有地域属性
版本发布/版本号为维度
渠道投放/查看渠道来源变化
策略调整/策略上线节点,区别前后关键指标波动
服务故障/明确故障时间,按时间为维度进行小时/分钟进行分析
常见假设
可叠加分析
分栏目的播放量
新老用户
单一指标的构成、比例
不同渠道的浏览、购买转化率
不同省份的参与活动漏斗
针对流程进行拆解分析
打赏主播的等级、性别、频道
是否在wifi或4g环境下
还原行为发生时的场景
不同视角去拆分、观察
多维度拆解
安装
阅读产品说明
选择产品
支付
一连串向后影响的用户行为
前一步影响后一步
运作原理
对用户心智影响短期内有效
按天
业务复杂/决策成本高/多日才能完成
按周
决策周期更长
按月
根据业务实际情况选择对应的事件窗口
漏斗一定是有时间窗口的
完整的漏斗不能跳着看
漏斗一定是有严格顺序的
更关心整个业务流程的推动
何时基于用户
关心某一步具体的转化率
问题:无法获知事件流转的真实情况
何时基于事件
漏斗的计数单位可以基于 用户、事件
自查:是否只有这一个漏斗能达到最终目标
结果指标的数据不符合预期
坑
有明确的业务流程和业务目标
适用
没有明确的业务流程,跳转流程复杂
不适用
适用场景
漏斗观察
从某个事件在不同维度中的分布来观察
事件频率
一天内的时间分布
消费金额区间
常见的群体划分
已经知道一群用户完成了指定事件,继续按不同维度和价值对群体进行细分为不同躯体,分别维护
已经知道单个事件的完成次数,按照次数拆分到不同维度的分布情况,更清晰的了解该事件的完成情况
分布情况
日留存
了解某个渠道的质量
周/月留存
观察整个大盘
为什么要看留存
过滤进行过指定行为的用户ID,再计算
将用户分为不同群体观察
精准留存
某段时间的用户ID与另一段时间的用户ID做交叉去重
产品运营技术每个环节都会产生影响
一般的计算方式
用户留存
年龄、性别、生日、星座、身高、收入、职业
基础属性
是否有子公司、交友圈子等
社会关系
基本行为:注册时间、来源渠道等
业务行为:买过优惠商品、曾经优秀学员
行为特征
下单率、收藏商品、倾向产品品类、用户公司是做什么的等
业务相关
标签
直接填写(问卷调查、个人资料填写等)
做活动
简单的个性化运营
业务分析(拆解)
用户研究(准备)
通过用户自己已有特征推得
距离相近
协同过滤,找到行为相似的用户
行为相似
通过用户身边的人判断
标签来源
市场营销
个性化运营
业务分析
用户研究
对用户各类特征进行标识,贴上各类标签,分为不同群体,分别进行产品/运营动作
用户画像
将事件拆解,并根据业务性质确定影响事件完成的关键部分
将目标达成分拆到各个模块,方便统计贡献
获悉达成当前指标的因素,指导业务提升
对业务目标明确的进行归因
转化路径短,事件关联性强
末次归因
转化路径长,非目标事件差异不大,没有完全主导的
递减归因
强流量依赖,拉人比后续所有事都重要
首次归因
归因查找
流入流出
希望观察场景之后发生了什么
有明确的起始场景
希望观察用户如何到达
有明确的结果目标
运作原理:逐级展开事件的前一级,观察流向
行为事件
路径挖掘
评估用户对产品的兴趣和依赖程度
运作原理:单一用户的所有行为以时间线的形式排列
观察掩盖在统计信息之下更细致的信息,还原用户具体的使用场景
通过观察具体的行为特征,找到提升产品价值的机会点
行为序列
9种数据分析方法
问题是否严重(周/月同比)
服务器原因(产生断崖式下跌/按小时查看)
关键词投放
渠道问题(某个渠道远低于平时流量/渠道维度拆解)
缺货问题(某地区销量减少/当地动作相关)
跌(采取动作,减缓趋势)
综合判断/具备“假设”能力、资深经验,业务洞察能力
涨(弄清原因,并放大)
案例(数据涨跌)
数据涨跌异动如何处理?
百度
头条
线下
。。。
具体的流量实体
来源
SEM
自然搜索结果
banner
推广中承载推广的实体
媒介
营销活动名称
广告关键词
其他参数
常见的渠道划分方式
选取反应你产品目标人群会做的行为的数据
1.选择关键事件
2.查看选择关键事件的用户来源
渠道质量跟踪
渠道评估
如何评估渠道质量,确定投放优先级?
转化关系复杂时
借助用户分群对比
转化关系明确
借助漏斗分析对比
上线后价值明确
精准留存对比
上线后关注其对产品价值的提升
从对使用情况的促进作用来观察(产品核心功能使用频次)
占据用户一日时间段角度(使用场景,如时间端的分布)
分布分析
上线以探索更长期的产品潜力
评估价值
功能/内容上线后如何评估短期、长期价值、未来潜力?
从现有用户中找到“真正用户(高留存、核心行为频次、完成率高)”
是谁(倒推地域、消费能力)
从哪来(电话访谈、调查)
找到“真正用户”特征
按此特征,找到类似用户
高质量拉新
出台推送的规则
精细化用户分群运营
理想:每个标签推不同的内容
人口统计学:性别、地域、年龄
业务相关:年级、BMI
运营位
现实:在ROI上找个平衡点,选择出容易出成绩的
千人?面
运营资源盘活
向我说话
由我触发
与我有关
推送内容与用户有关
精准运营推送
谁--用户画像
在什么情况下--行为序列的属性
干什么&遇到什么问题--行为序列或屏幕录像
设计决策
注:不要套数据!!!寻找真正的用户场景
辅助产品设计
案例:如何了解数字背后的用户
了解数字背后的用户,以高质量拉新、精准运营、辅助产品设计
异常高且无理由的流量
工作人员观察
人工举报
发现数据异常
找到1
刷量
薅羊毛
spam
明确其目的
机刷
人肉刷
多:显著与普通用户相异的动作,如通过上商家变现,发布特定内容
少:留存低,非核心业务(如帮助页面)几乎不访问
观察其特征
找到模式
RD(技术)爬取并人工审核
找到N
封:封禁、屏蔽、定向屏蔽
前:注册7天后方可发帖
中:减少存在bug的商品的库存
后:提高提现的审核力度/周期
提高关键成本
不做处理
一网打尽
抓作弊方法
羊毛党盛行,如何找出?
5类常见业务场景
业务洞察
数据分析
观测数据
流程
数据分析理论+实战
0 条评论
回复 删除
下一页