数据分析师数据处理
2021-03-08 15:35:05 1 举报
AI智能生成
数据处理方法
作者其他创作
大纲/内容
因子分析
基本概念
什么是因子分析?
正交因子模型
第一部分
第二部分
第三部分
因子载荷矩阵
将其看做是对因子进行线性组合时的系数
因子载荷矩阵L还可以看作是p维空间的一组单位正交向量
算法解析
因子载荷矩阵的估计
因子载荷矩阵的估计方法
因子载荷矩阵的估计方法2<br>
因子载荷矩阵的估计方法3<br>
因子载荷矩阵的旋转变换
因子轴的正交旋转
根据正交矩阵的性质,正交旋转后的因子轴能保持原有的夹角不变
因子载荷矩阵<br>
分类分析
相关性检验
列联表和卡方检验
经典列联表
卡方统计
逻辑回归<br>
Wald检验
似然比检验
比分检验
混淆矩阵——灵敏度和特异度
混淆矩阵图例
混淆矩阵解释
ROC曲线
ROC图例
ROC解释
时间序列
趋势分解法
长期趋势变动
季节变动
循环变动
不规则变动
趋势分解法图例
解释
加法模型
乘法模型
混合模型
可预测依据<br>
ARMA模型(平稳序列)
自回归模型AR(n)
移动平均模型MA(n)
自回归移动平均模型
平稳时间序列的模型识别<br>
根据自相关函数与偏自相关函数定阶
根据样本自相关函数和样本偏自相关函数定阶一般要求样本长度大于50,才能后一定的精确程度。
自相关函数和样本偏自相关函数定阶的准则
ARIMA模型
差分运算
差分方式的选择
一般步骤:
(1)平稳性检验。
(2)对于平稳的序列
注意
(3)模型识别。
(4)参数估计。
(5)模型检验。
主成分分析
主成分分析的具体方法
什么是正交
主成分分析算法解析
投影变换
投影长度
主成分分析应用
对数据做综合打分
降维以便对数据进行描述
为聚类或回归等分析提供变量压缩
回归分析
线性回归模型
回归分析的基本假设
多元线性回归的基本假设
假设1
假设2
假设3
假设4
假设5
假设6
线性关系假设--线性关系检验
提出假设
线性关系不显著
计算检验统计量
确定临界值
做出决策
线性关系检验——回归系数检验
回归系数检验的原假设<br>
假设失效的影响
假设失效的解决办法
期望为0的假设
假设检验方法
假设失效的影响
假设失效解决办法
同方差假设
假设检验方法
假设失效的影响
假设失效解决办法
正态性假设
假设检验方法<br>
假设失效的影响
假设失效解决办法
注意
横截面和时间序列数据在回归建模上的差异
参数估计
多元线性回归的参数估计
判定系数
判定系数内容
聚类分析
层次聚类法
距离的计算
最短距离法
最短距离法图例
中间距离法
中间距离法图例
类平均法
类平均法图例<br>
重心法
重心法图例<br>
离差平方和法
快速聚类-Kmeans聚类
快速聚类图例
两步聚类法
聚类的实际应用
0 条评论
下一页