《数据化决策》读书笔记
2022-05-20 15:36:01 68 举报
AI智能生成
登录查看完整内容
《数据化决策》图解||管理大师德鲁克与戴明的智慧共识:无量化、无管理;先量化,后决策||应用信息经济学之父精心力作
作者其他创作
大纲/内容
找出并分解不确定事物,使之可以用确定事物计算
对事物的哪部分不确定
回顾已有研究,二次研究
该事物或者分解部分该如何量化
怎样观测分解后的各部分
怎样把已经确定为“可观测的事物”一步步导向量化
考虑之前计算出的当前不确定状态、阈值和信息价值
量化这一问题我们需要什么
思考量化是如何产生误差的
误差的来源是什么
基于以上回答选择测量设备
我们该选择什么设备
帮助确定量化方法类别的问题
仪器的6个优点
控制方法,抵消特殊误差的方法
4种量化假设
广义的测量仪器=测量方法
分解一个不可量化的变量,是量化的重要步骤,有时本身就会极大减少不确定性。
将不可量化之物分解为可量化之物
搜索技巧
通过互联网获取方法
寻找量化线索的4个方法
寻找、观测、跟踪相关线索
无需海量,只需适量
系统误差
可以用概率计算随机误差的变化
随机误差
量化的可靠性和一致性
信度
量化逼近真值的程度
效度
反映量化的系统误差大小
准确度
反映量化的随机误差大小
精度
所有量化都有误差.
恰当使用随机抽样
期望偏差(期望效应)
选择偏差
观测偏差(霍桑效应)
3类大的偏差需要控制
对误差的控制
准确度≠精确度
对问题进行分解,进而可以通过其他量化方法来估计
进行二次研究,重新考虑你的问题
将分解后的变量用一种或多种方法量化
始终牢记“够用就好”的理念
考虑如何减少量化误差
如何确定
工作到有结果为止
逐步量化
考虑多种方法
不必继续量化下去的判断依据是什么
尽管去做
提示
确定测量仪器(测量方法)
【第8章】选择和设计量化方法
练习提高估计样本范围的直觉力
凭直觉估计数值范围
t分布
z分数和正态分布
t统计量法:只需要一个小样本
统计显著性:结果是真还是假?
t统计量
正态分布的z统计量
具有某种分布特征的统计
参数统计
先假设要估计的值符合正态分布
平均值收敛
幂律分布
如何处理异常值?
无需数学运算的90%置信区间估计法
不用计算估计出平均值
抓与重抓就能算出湖里有多少鱼
总体均衡抽样
定点抽样
整群抽样
分层抽样
连续抽样
两次独立抽样
寻找阈值:在哪个点上作决定
对照组实验:当事件还未发生时
回归模型
变量的相关程度:风马牛之间有多大关系?
什么时候才使用假设检验?
【第9章】随机抽样:窥一斑而知全豹
处理的是概率和条件概率的关系问题
条件概率
贝叶斯反演
贝叶斯定理:若A发生,则B发生的可能性多大?
本能的贝叶斯方法
依据不偏不倚的判断
使用盲测
单独评估
校正贝叶斯式的结果
把控
天生的贝叶斯本能:用新信息更新旧信息
与被测事物不同但有关的事物作为基准,以此更新先验信息的方法。
异构标杆法:类比评估
贝叶斯反演法:如果X为真,如何看到这一点?
二项分布
函数应用
区间范围的贝叶斯反演法:每种结果出现的概率是多少?
贝叶斯法教会我们什么?
【第10章】贝叶斯方法:利用已知估算未知
陈述偏好
显示偏好
观测偏好
李克特量表
多项选择
排序
开放式问题
问卷设计
问题简短精确
避免使用过多术语
避免引导性问题
避免复合问题
将问题反转,以避免定向的反应偏向
消除或控制“反应偏向”
分区依赖
观测人们的意见、价值观和幸福感
“艺术品购买”难题
统计生命价值法
支付意愿法:通过讨价还价估算生命价值
投资边界模型
投资边界曲线对决策的影响
投资边界曲线:量化风险承受能力
明确界定“绩效”和“质量”
货币等值法
效用曲线:选鱼还是选熊掌?
搞清楚要量化什么
绩效量化:一切都可归结为利润
【第11章】量化人们的偏好和态度
锚定
光环/喇叭效应
从众效应
新兴偏好
认知偏差
把工作条理化
人类的心理如何影响决策?
加权评分法
令人惊讶的简单线性模型
拉希模型
不变比较原则:将任何估值都标准化
基于专家判断
透镜模型的过程
透镜模型:消除评估过程中的不一致
AHP
两种不适用的量化方法
z值法
主观加权评分法
层次分析法
透镜模型
客观模型
各种评估方法价值比较
【第12章】人的判断和测量仪器哪个更准?
GPS:革命性的量化工具
爬虫
用屏幕抓取软件和混搭法挖掘网络信息
关键调查系统
通过电子邮件就可量化顾客满意度
请大众来预测,求平均值
“预测市场”
预测市场:苹果公司何时倒闭
【第13章】新型测量方法和仪器
三、用量化方法解决问题
选择和设计量化内容和量化方法
忽略了先验信息
传统统计学方法
与先验信息相关的统计
贝叶斯方法
在量化中具体用到的统计方法
量化抽象事物的方法
第4章:厘清待量化事物与决策的关系
步骤1:定义决策和确定相关变量
第5章:校准训练:修正你的判断
第6章:蒙特卡洛模型:评估风险大小
步骤2:用这些变量对当前的不确定状态进行建模
校准训练
第7章:一条减少不确定性的信息价值多少
步骤3:计算附加信息的价值
第8章:选择和设计量化方法
第13章:新型测量方法和仪器
步骤4:量化高价值信息的不确定因素
第11章:量化人们的偏好和态度
步骤5:在不确定性适当减少后,制定风险回报决策
量化的通用框架和一般步骤
对当前的不确定状态建模,使用经过校准的90%置信区间
计算附加信息的价值。确定测量什么以及在测量上花多少工夫
测量信息价值高的变量,用量化方法减少不确定性
优化决策。使用决策者的数量化风险/决策边界确定哪个决策更好
做访谈和二次分析,理解量化难题本质。
初始研究
确定专家
工作室计划
阶段0:前期准备
定义量化难题
列出所有在决策中比较重要、需要分析的因素。
决策模型的细节
对专家进行校准训练,并对决策模型中的各个变量赋值。值除非确切,否则都以90%置信区间或其他概率分布表示。
初步的校准估计
阶段1:决策建模
计算得到决策中的每一个不确定的变量的信息价值和阈值。
分析信息价值VIA
找出较高信息价值的变量,根据这些信息选择量化方法。量化重点在于减少相关阈值的不确定性。
初步设计量化方法
减少上一步所确定的待量化变量的不确定性。分解、随机抽样、主观贝叶斯、控制实验、透镜模型以及各种组合方法。
量化方法
根据量化中的发现更改决策模型中的变量值。
更新决策模型
只要VIA显示信息价值高于量化成本,量化就可以继续,以上4步可以重复进行。
信息分析的最终价值
阶段2:计算信息价值
最后用蒙特卡洛模型计算各种可能结果的概率,作决策时要站在整个组织的高度比较风险和收益。
完全的风险/收益分析
跟踪低价值信息变量,用以修正量化行为。
确定后续指标
制定减少风险的战略,或者修正投资,或者用假设前提的分析法来提高回报。
决策优化
包括决策模型概述、VIA分析结果、使用的量化手段、投资边界和未来行动,以及进一步决策的任何建议或分析。
最终的报告和陈述
阶段3:决策优化和最终报告
案例实操
质量
过程、部门或功能
创新
信息可用性
灵活性
期权理论的灵活性
一些虽未讨论但可能出现的量化难题
【第14章】通用的量化方法:应用信息经济学
四、应用信息经济学
【先导】一些看似不可能量化的量化分析案例
量化是“减少不确定性”,而且没有必要完全消除不确定性。
量化的定义
【第1章】无形之物有法可测
【第2章】不同时代、不同领域的量化大师
概念
目标
方法
认为不能被量化
误解
经济成本巨大
对统计学的用处和意义不认可
认为某些量化不道德
认为不应该被量化
如果没有报告无差,也没有采用抽样和实验等实证方法,就认为数字是完全精确的,不是真正的量化。
量化不需要彻底消除不确定性。只要进行量化工作的花费远少于因此而带来的收益,量化就是值得的。
真正的量化过程不需要无限精确
在分类量表中没有次序之分,数字不表示相对大小,仅表示某个事物是否属于某个集合而已。
量化是用数量描述的
量化是对被量化食物和数字的映射(Mapping)
对传统量化定义的挑战
确定真正要量化什么,是几乎所有科学研究的起点。某些事物看起来完全无形无影,只是因为你还给所谈论的事物下定义。
一旦管理者弄清楚要量化什么以及被量化的事物为什么重要,就会发现事物显现出更多可量化的方面。
澄清链就是把某物想象为无形之物再到有形之物的一系列短的链接过程。
思想实验
量化方法隐藏在量化目标中
统计学小样本
5人法则:只需要很小的样本就可以减少不确定性
可以转化为和其他领域没什么不同的量化问题
假设1:你的难题并非你想的那么独特
假设2:你拥有的数据,比你认为的要多
假设3:你需要的数据,比你认为的要少
即使是最简单的量化方法,都可以在一定程度上减少不确定性。
假设4:要获得适量的新数据,比你想象的更容易
4个假设让量化看上去很简单
量化的方法可以很简单
计算信息的经济价值
应用经济信息学
哪怕部分减少不确定性所带来的价值都是巨大
从经济角度支持量化
可以相信统计数字吗?
对人的相对价值的量化看似不道德
高度不确定的决策更不道德
步骤1:定义需要决策的问题和相关的不确定因素
步骤2:确定你现在知道了什么
第9章:随机抽样:窥一斑而知全豹
第10章:贝叶斯方法:利用已知估算未知
第12章:人的判断和测量仪器哪个更准
步骤4:将有关量化方法用于高价值的量化中
步骤5:作出决策并采取行动
量化的5大步骤
【第3章】为什么有人认为无形之物不可量化
一、一切皆可量化
该量化要支持什么决策?
需量化事物的定义是什么?
该事物和要支持的决策有怎样精确的关系?
比如人们不知道的真实的输出/结果/状态/价值
缺乏完全的确定性,存在超过一种可能
不确定性
为结果集合中的各种可能结果赋上相应的概率
不确定性的量化
该状态包括出现亏损、崩溃或其他不希望结果的可能性
不确定性的一种状态
风险
可能性的一个集合,每种可能性都有相应的发生概率和损失量。
风险的量化
清晰定义“不确定性”和“风险”
置信区间
重复和反馈
等价赌博测试
提出赞成和反对意见
避免锚定
逆向锚定
反向锚定法
校准练习:让“估计”变得更准确
你的估值范围=你的认知程度
90%的信心意味着90%的概率
90%置信区间
把概率当成对不确定性或可信度的一种表达
校准除了能提高对不确定性的主观评估外,还会消除决策过程中对概率分析的反对意见。
经过校准训练的人往往预测得更准确
【第5章】校准训练:修正你的判断
减少风险是计算量化价值的基础,也是选择量化什么以及如何量化的基础。
分清“感觉很好”与“真的很好”
产生大量基于概率的情境作为输入,每个情境内的每一个未知变量会随机产生一个特定值,然后将这些值用在一个公式中计算该情境的输出值。
常被用在不完全清楚成本和收益是多少的情况下,计算投资回报。
任何项目的投资风险最终可用一个方法表达,那就是风险和收益的范围以及可能对它们产生影响的其他时间的发生概率。
蒙特卡洛模型:范围也能进行加减乘除?
置信区间、标准差、正态分布
简单看到样本的亏损概率
蒙特卡洛清单
生成随机数
均匀分布、二项分布(伯努利分布)
更多的分布
相关性
马尔可夫模拟
基于代理的模型
蒙特卡洛模拟法的附加概念
决策偏好
寻找盈亏平衡点
主要是SAS和SPSS
蒙特卡洛模型工具
【第6章】蒙特卡洛模型:评估风险大小
OL机会损失=错误方案花费的成本or放弃方案的收益
EOL预期机会损失=出错概率xOL
EVPI完全信息的期望值=EOL量化前(如果信息完全,量化后的EOL就是0)
EVI信息的期望值=量化前EOL-量化后EOL=EOL减少值
预期机会损失:出错的机会和成本
BB最好边界和WB最坏边界
RT阈值
EOLF预期机会损失因子
消除所有不确定性的价值EVPI计算
EVII不完全信息的期望值
EVSI抽样信息的期望值
需要知道的是EVI
期望≈概率的加权平均
ECI信息的期望成本=期望为减少不确定性的信息支付的金额=所有可能结果的成本和不确定减少的加权平均
不确定性越高,需要的信息越少
顿悟方程
量化倒置:最重要的常常被忽视
计算所量化的事物的价值
进行多次量化
计算信息价值的注意事项
分清有价值和无价值的量化
【第7章】计算减少不确定性的信息价值
二、设置和定义量化问题
进行量化前
量化不确定性并校准概率
用量化数据理解风险,计算风险和信息的价值,确定量化目标
数据化决策
0 条评论
回复 删除
下一页