社会统计学 知识点期末总结
2023-12-22 12:34:33 0 举报
AI智能生成
社会统计学一书的期末总结思维导图
作者其他创作
大纲/内容
二.描述统计<br>
变量
分类
定性(类别)变量<br>
定类变量
定序变量
定量(尺度)变量
定距变量<br>
定比变量
离散型变量
连续型变量
特征
完备性
互斥性
单变量的描述统计分析
描述方法<br>
频次分布:(<span class="equation-text" data-index="0" data-equation="x_i,n_1"><span></span><span></span></span>)
频率分布:(<span class="equation-text" data-index="0" data-equation="x_i" contenteditable="false"><span></span><span></span></span>,<span class="equation-text" contenteditable="false" data-index="1" data-equation="{n_i\over n}"><span></span><span></span></span>)
累计频率分布:(<span class="equation-text" contenteditable="false" data-index="0" data-equation="x_i,{{n_1+n_2+...+n_i} \over n}"><span></span><span></span></span>)<br>
表现方法
图表
统计表
统计图
类别变量:条形图、饼图、折线图
尺度变量:直方图、折线图
数值
集中趋势
众数
内涵:出现频次最多的变量取值
众数组的组中值:<span class="equation-text" contenteditable="false" data-index="0" data-equation="{{组上限+组下限} \over 2}"><span></span><span></span></span><br>
中位数
偶数中位数:<span class="equation-text" data-index="0" data-equation="M_e=\cfrac{x_{n \over2} +x_{n+1 \over2}}n " contenteditable="false"><span></span><span></span></span><br>
分组中位数:<span class="equation-text" data-index="0" data-equation="M_e=L+\cfrac{{N \over2} -Cf\uparrow}n h" contenteditable="false"><span></span><span></span></span>
算数平均值
<span class="equation-text" data-index="0" data-equation="\bar{x}={\sum_{i=1}^n x_i \over n}" contenteditable="false"><span></span><span></span></span>
<span class="equation-text" data-index="0" data-equation="\bar{x}={\sum_{i=1}^k n_ix_i \over \sum_{i=1}^k n_i}" contenteditable="false"><span></span><span></span></span>
分组算数平均值:<span class="equation-text" data-index="0" data-equation="\bar{x}={\sum_{i=1}^k n_ib_i \over \sum_{i=1}^k n_i}" contenteditable="false"><span></span><span></span></span>(<span class="equation-text" contenteditable="false" data-index="1" data-equation="b_i"><span></span><span></span></span>为组中值)<br>
离散趋势
异众比率
<span class="equation-text" data-index="0" data-equation="\gamma={{N-f_m} \over N}" contenteditable="false"><span></span><span></span></span>
内涵:表明众数代表性,异众比率越小,众数代表性越高<br>
极差
内涵:变量的取值范围
R=最大值-最小值<br>
四分位差
<span class="equation-text" contenteditable="false" data-index="0" data-equation="未分组:Q=Q_75-Q_25"><span></span><span></span></span>
分组:<br>
下四分位数:<span class="equation-text" contenteditable="false" data-index="0" data-equation="L+\cfrac{{N \over4} -Cf\uparrow}n h"><span></span><span></span></span>
上四分位数:<span class="equation-text" contenteditable="false" data-index="0" data-equation="L+\cfrac{{3N \over4} -Cf\uparrow}n h"><span></span><span></span></span><br>
平均差
内涵:离差绝对值的平均值
<span class="equation-text" data-index="0" data-equation="D={ \sum_{i=1}^n |x_i-\bar{x}|\over n}" contenteditable="false"><span></span><span></span></span>
方差
<span class="equation-text" data-index="0" data-equation="原始数据计算:\sigma^2={ \sum_{i=1}^n {(x_i-\bar{x})}^2\over n}" contenteditable="false"><span></span><span></span></span><br>
<span class="equation-text" data-index="0" data-equation="频次数据计算:\sigma^2={ \sum_{i=1}^k {(x_i-\bar{x})}^2n_i\over \sum_{i=1}^k n_i}" contenteditable="false"><span></span><span></span></span>
标准差
<span class="equation-text" data-index="0" data-equation="原始数据计算:\sigma=\sqrt{{ \sum_{i=1}^n {(x_i-\bar{x})}^2\over n}}" contenteditable="false"><span></span><span></span></span>
<span class="equation-text" data-index="0" data-equation="频次数据计算:\sigma=\sqrt{{ \sum_{i=1}^k {(x_i-\bar{x})}^2n_i\over \sum_{i=1}^k n_i}}" contenteditable="false"><span></span><span></span></span>
两个类别变量关系的描述统计
图表
列联表
分类图
列联相关系数(两个无序类别变量)
理论基础:消减误差比例的统计思想
<span class="equation-text" contenteditable="false" data-index="0" data-equation="\lambda系数"><span></span><span></span></span>
<br>
古德曼-克鲁斯卡尔<span class="equation-text" contenteditable="false" data-index="0" data-equation="\tau系数"><span></span><span></span></span>
<br>
等级相关系数(两个有序类别变量)
斯皮尔曼等级相关系数
<span class="equation-text" data-index="0" data-equation="r_s=1-{ 6\sum_{i=1}^n d_i^2\over n(n^2-1)}" contenteditable="false"><span></span><span></span></span>
Gamma等级相关系数
<br>
<span class="equation-text" contenteditable="false" data-index="0" data-equation="G={{n_s-n_d} \over {n_s+n_d}}"><span></span><span></span></span>
肯德尔<span class="equation-text" contenteditable="false" data-index="0" data-equation="\tau"><span></span><span></span></span>函数<br>
<span class="equation-text" data-index="0" data-equation="\tau={{n_s-n_d} \over {{1 \over2}n^2({m-1 \over m})}}" contenteditable="false"><span></span><span></span></span><br>
Somer‘s d系数<br>
<br>
两个尺度变量关系的描述统计
相关分析
相关:一个变量变化时另一个变量随之变化
描述方式<br>
相关散点图
皮尔逊相关系数
<br>
回归分析
回归的思想:拟合一个函数,将非确定性关系转化为确定关系进行研究
线性回归
一般表达式
<span class="equation-text" data-index="0" data-equation="\hat{y}=b_0+b_x (b_0=\bar{y}-b_1\bar{x};b_1={{\sum_{i=1}^N (x_i-\bar{x})(y_i-\bar{y})} \over\sum_{i=1}^n (x_i-\bar{x})^2})" contenteditable="false"><span></span><span></span></span>
拟合优度<br>
<span class="equation-text" data-index="0" data-equation="R^2={[{\sum_{i=1}^N (x_i-\bar{x})(y_i-\bar{y})]^2} \over\sum_{i=1}^n (x_i-\bar{x})^2\sum_{i=1}^n (y_i-\bar{y})^2}" contenteditable="false"><span></span><span></span></span>
非线性回归<br>
<span class="equation-text" data-index="0" data-equation="\hat{y}=b_0+b_1x+b_2x^2" contenteditable="false"><span></span><span></span></span><br>
类别变量与尺度变量的描述统计
平均值比较分析<br>
统计思想:比较类别变量不同取值时,尺度变量均值是否有差异
图表
相关比率<br>
<br>
三.概率论
基础概率
随机变量
多个取值,随机变化
随机事件
随机变量的任意取值或取值的集合
概率:随机事件在一次实验或者观察中出现的可能性
频率<br>
计算
古典概型
加法公式
乘法公式
随机变量的描述统计
随机变量的分布函数
离散型随机变量的分布特征
两点分布<br>
二项分布
超几何分布
连续型随机变量分布的特征
正态分布
标准正态分布<br>
<span class="equation-text" contenteditable="false" data-index="0" data-equation="\chi_2分布"><span></span><span></span></span><br>
t分布<br>
F分布<br>
集中趋势和离散趋势
数学期望
方差和标准差
矩,偏态与峰态
大数定律
贝努利大数定律<br>
相互独立且服从(0.1)二项分布<br>
<br>
切贝谢夫大数定律
相互独立,方差存在且有界
<br>
中心极限定理
抽样分布
样本均值的抽样分布<br>
样本方差的抽样分布
一.导论
1.统计学与社会学研究
统计学的定义:统计学是一套获取与分析数据的方法。
社会统计学:是指将统计方法应用于对社会环境中人类行为的研究。
联系
<ul><li>社会学研究科学性的标志;</li></ul>
<ul><li>发现与描述社会现象规律的方法</li></ul>
<ul><li>大量应用,贯穿社会学研究始终</li></ul>
2.统计分析的基本方法
描述统计:对现有数据的总结概括,提炼数据中存在的规律
适用范围:基本适用<br>
推论统计:用数理逻辑的推理从样本结论推测总体
适用范围:随机抽样
过程<br>
总体:全部研究对象的集合
参数:某一总体特征的数量概括
抽样:从全部研究对象中抽取部分样本的过程
样本:从总体中抽出的部分子集
统计量:某一样本的特征的数量概括
四.推论统计
1.参数统计
总体特征值的点估计
<br>
评价估计量的标准
无偏性<br>
有效性
一致性
总体特征值的区间估计
单个总体特征值的区间估计
两个总体特征值的区间估计
2.假设检验<br>
原理
小概率原理
假设检验逻辑
假设推测正确→计算概率→概率大,推测正确
应用条件:随机抽样
基本方法
使用样本均值的假设检验
使用Z假设检验
使用p假设检验
类型
双侧检验
单侧检验
左单侧检验
右单侧检验
两类错误
弃真
纳伪
参数检验
总体均值与方差的假设检验
单个总体的检验
总体均值的检验
大样本
小样本
总体频率的检验
总体方差的检验
两个总体的检验
均值的检验
方差的检验<br>
配对样本的t检验
两个类别变量的假设检验<br>
<span class="equation-text" contenteditable="false" data-index="0" data-equation="\chi_2检验"><span></span><span></span></span>
等级相关系数的检验
斯皮尔曼等级相关系数的检验
Gamma等级相关系数的检验
<span class="equation-text" contenteditable="false" data-index="0" data-equation="\tau系数和Somer’s d系数的检验"><span></span><span></span></span>
两个尺度变量的建设检验
一元线性回归方法的检验
一元线性回归关系假定
整体检验
回归系数检验<br>
用回归方差进行预测
相关系数的检验
类别与尺度变量关系的假设检验-一元方差分析
原理
组间离差平方和
组内离差平方和
使用条件
方差相等
正态分布
方法
1.确定原假设(尺度变量均值相等)备择假设(至少有一个不相等)
2.确定统计量
3.确定临界值,接受域与拒绝域
4.确定是否拒绝原假设(比较<span class="equation-text" contenteditable="false" data-index="0" data-equation="F"><span></span><span></span></span>与<span class="equation-text" data-index="1" data-equation="F_\alpha" contenteditable="false"><span></span><span></span></span>)
非参数检验
单个总体分布特征的检验
类别变量-卡方检验
尺度变量-累计频率检验
两个总体分布一致性的检验-两个独立样本的检验
秩和检验
游程检验
累计频率检验
两个总体分布一致性的检验-两个相关样本的检验
符号检验
符号秩检验
多个总体分布一致性的检验-多个独立样本的检验
单项方差秩检验
中位数检验
多个总体分布一致性的检验-多个相关样本的检验
双向方差秩检验
Kendall’sW检验<br>
3.抽样
误差
来源
工作性误差
抽样误差
影响因素
个体抽取方法<br>
放回抽样<br>
不放回抽样
样本整体抽取方法
简单随机抽样
分层抽样
等距抽样
整群抽样
样本容量的确定
根据尺度变量确定
根据类别变量确定
最终确定
4.时间序列分析
时间序列概述<br>
概念:按时间顺序排列的序列<br>
类型
时期数据
时点数据
构成因素
长期趋势
季节性波动
循环波动
随机波动
描述方法
图表
增长率
环比增长率<br>
定基增长率
平均增长率
预测方法
平滑法<br>
简单平均法
指数平滑法
简单移动平均法
趋势外推法
线性
非线性
季节指数法
分解法
收藏
收藏
0 条评论
下一页