非参思维导图模板_ProcessOn思维导图、流程图

分类数据（变量之间的关联分析）

卡方独立性检验

适用条件

检验变量之间是否独立

公式

原理

假设：pij = pi.*p.j

卡方齐性检验

原理

强调列变量比例分布在各个区组之间是否一致

假设：pi1 = pir = pi.

自由主题

适用条件

公式

Fisher精确性检验

适用条件

原理

与brown-mood类似

也是列个2*2的表  但是表里面只是正常数据而已不是大于中位数那些

计算公式& 统计量

记住区别brown——mood 他是根号n-1 这里是根号n

优缺点

Mantel-Haenszel检验

适用条件

需要分层的时候 比如不同医院；城市和农村

原理

先按层计算差异，再将各层差异综合比较，从而做出综合判断

计算公式& 统计量

就是分别求层最后加总再和卡方比较

优缺点

Ridit检验

适用条件

对某个抽象数进行测量

原理

取一个样本数多的组或将几组数据汇总成参照组根据参照组的样本结构 将原来各组响应数变换为参照得分，利用ridit得分进行各处理之间强弱的公平比较

使用的是累积概率得分表示各顺序真实的强弱顺序

注意假设：H0：A1，A2....Ar之间没有强弱顺序 H1：至少存在一对Ai，Aj使得Ai!=Aj

计算公式& 公式

计算复杂大概率不考

优缺点

定量or定序的样本的关联分析

Sperman秩相关检验

适用条件

可用于非线性；不需要正态假定；不受均值（极端值）影响

两变量

原理

分别算出x和y的秩，如果x，y具有同步性，则它们的秩也会有同步性

公式

n是x或者y的个数反正它们一一对应都一样 R是x的秩 Q是y的秩

原始公式：只是把x和y换成它们对应的秩还有秩平均

和pearson的区别

Pearson需要正态假定还有系数基于均值易受极端值影响

公式

kendall t检验

适用条件

两变量

原理

从变量协同的角度说明是否相关

使用数对（x,y）的乘积判断

对x先排序但是求Nc和Nd的时候看的是y的秩比当时位置y大的个数就是Nc；比他小的就是Nd

计算公式

其实算t的时候就知道它们的关系了；还要算Z是为了保障显著，就是检验可靠性的意味

子主题

多变量Kendall协和系数检验

适用条件

多变量

判断几个变量之间是否存在相关关系

原理

H0假定下各变量之间没有相关性； 所以是按变量（区组）排序的！！！

然后对每个处理（标题行不是变量的）求秩和

后计算协同系数w（0~1）

公式

k是变量个数！！！！

公式全都记一记到时候看数据来用

子主题

Kappa一致性检验

适用条件

对同一对象进行多组/不同方法的评判

评分是分类或者顺序变量

原理

注意假设：H0两个方法不一致 H1两个方法一致

实际期望p0 一致性期望pe

算出K之后还要算Z来保障不显著来确保有效性

公式

简单来说就是p0是对角线元素相加

其他的是除了对角线元素外对应元素相乘之和

检验是否显著！！！

不解的点

kappa和M-H检验的区别是？kappa不也可以分层吗？ 不同的方法不同的医生不也是分层吗？？？

题型

选择5*2'

填空5*2’

简答4*5'

计算4*15'

非参检验和参数检验的区别

参数

对分布有假定

针对参数做的假设

只能用于等距数据和比例数据

数检验要利用到总体的信息（总体分布、总体的一些参数特征如方差） ，以总体分布和样本信息对总体参数作出推断

非参数

对分布无假定

针对总体分布情况做的假设

主要用于记数数据。也可用于等距和比例数据，但精确性就会降低。

不需要利用总体的信息（总体分布、总体的一些参数特征如方差）， 以样本信息对总体分布作出推断

单一样本检验

中心位置推断

符号检验

使用条件

思想

中位数！！！  大于中位数s+；小于中位数s-

一定要注意双侧or单侧！！！

只考虑了方向

计算公式 or统计量

一般算p值

大样本近似

一定要记得修正！！！！

coxstaut趋势检验

使用条件

思想

直接考虑趋势问题，考虑生成一些数对，数对的间隔相同，数对的间隔c由样本量n决定

计算公式or 统计量

算到c后算d = 前面的数-后面的数 然后s+为正的数目；s-为负的数目 之后算法和符号检验同算p

大样本

与符号检验一致该修正的时候记得一定要修正

游程检验

适用条件

0/1二元序列检验是否随机or是否与顺序无关

思想

若0/1出现规律性不强则为随机性；不可忽略序列长度和0/1个数，因此有R游程长度

计算公式or 统计量

因为不能太分散and太密集所以一定是双边检验！！！！

小样本：直接查表

大样本

记公式！！！！！n1+n0=n

也可以检验两样本问题 两样本是否有随机

两个样本混合排好秩

然后定义：如样本一全为1 样本二全为0

分位数检验

将符号检验的中位数（样本分位数为0.5）换成样本的分位数就是分位数检验

秩和检验

wilcoxon符号秩检验

适用条件

检验对称中心！！！但要要明白的是中位数！=对称中心 一定用的是中位数！！！（或许有坑他给了平均数）

对称中心

左右两边数目相同

左右数据对称分布

思想

找到中位数之后，个数和他相减的绝对值排序（注意相同秩取平均值），然后用相减后但没取绝对值的正负来加总s+（正数的秩和）

考虑方向和大小（体现在秩和）

计算公式or 统计量

大样本

记得还是要修正！！！！w大于or小于Ew都修正（大于修正0.5；小于修正-0.5）

正态计分检验

只是把wilcoxon的秩和检验换成正态分位点检验

分布检验

卡方拟合优度检验

注意这是样本的卡方检验后面第五章是变量的卡方检验

适用条件

样本

思想

实际值（频数）与期望值（频数）的平方除以期望值，

统计量

不足缺点

只能检验离散数据或者把连续数据化成离散数据再检验（这样做精度不高）

K-S正态性检验

连续型数据的检验

适用条件

思想

算出经验分布，并且和理论分布作差，最大的距离如果通过检验则说明通过（查表的）

统计量

D = max|Fn(x)-F(x)|

不足

lilefor正态性检验

KS检验的拓展

拓展的地方在于用样本均值和样本方差代替总体的~

两样本检验

位置检验

Brown-mood

适用条件

思想

符号检验的两样本推广 

只检验方向

混合秩排序后与混合之后的中位数比较

计算公式or 统计量

精确分布的话算p值

算p的时候用超几何分布

不懂得点

一般还是算大样本吧

大样本

Mann-whitney检验

适用条件

样本独立

数据至少为定序的

两样本有类似的分布

不一定对称

思想

wilcoxon检验的两样本推广

方向+大小

也是混合秩

计算公式or 统计量

算Wy的时候要注意

这个公式有点怪做练习的时候先按单样本Wilcoxon那样先把+的（>中位数的）加起来

记得这个Wy要算多几遍  多做一些习题

大样本

尺度检验

Mood

适用条件

两样本的均值相等

思想

构造出M统计量是秩与秩的期望的平方加总

类似方差

混合秩

计算公式 or统计量

样本量m+n<30的时候考虑修正

子主题

Mose

适用条件

没有限制

思想

随机分组

分组原则：每组里面的观测值要相同 组数可以不同

求每组的离差平方和

这一步方差的思想体现出来

将求出来的离差平方和混合求秩

每组样本(设第一组有m1样本)分别求在混合秩里面的和S 再计算TM =S-[m1(m1+1)]/2

相当于对离差平方和做W-M-W检验

计算公式or 统计量

子主题

多组样本数据位置推断

完全随机设计CRD

单因素方差分析

K-W检验 （H检验）

适用条件

数据分布连续

分布相似

原理

混合排秩然后按各自样本组求和

若差异过大则两组数据中心样本位置差异大

计算公式& 统计量

优缺点

Dunn两比较检验

适用条件

拒绝K-W检验后要知道是哪两个总体位置差异大

原理

两组样品的平均秩相减的绝对值/两组样本的标准误SE

计算公式& 统计量

Dij~N(0,1) 但α* = α/n(n-1)

子主题

J-T检验（趋势问题）

适用条件

如果可以先判断趋势的就直接用J-T检验不用K-S

原理

两样本wilcoxon的推广

计算公式& 统计量

完全随机区组设计CBD （加入了实验材料的异质性）

Friedman秩方差检验

适用条件

原理

区组间排序

区组间不具有可比性

公式

b是区组 k是处理

求的是处理的秩和因为区组内排序，区组的秩和是一致的

记住统计量

优缺点

Hollander-Wolfe检验

适用条件

当Friedman拒绝时要知道是哪两个总体有差异时用

原理

和Dunn类似

计算公式& 统计量

方差公式一定要记得！！！

Dij~N(0,1) 但α* = α/n(n-1)

子主题

随机区组的调整秩和检验（H-L检验）

适用条件

区组数很大处理很小的时候  b>2k

原理

去除区组效应

用区组的均值或者中位数作为区组效应的估计值 后用观测值和估计值相减来反映差异 化成无区组情况的时候就用回K-S检验

公式

优缺点

Cochran检验

适用条件

处理0/1等二元数据

原理

利用和计算不排序了

且因为样本是二项分布所以样本的处理组和为二项分布

公式

这个公式里面  列和是处理行和是区组

优缺点

均衡不完全随机区组设计

Durbin检验

适用条件

适用于列联表里面出现缺失数据

原理

k是处理但r是列联表里面除了缺失剩下来的处理数（每行/列） b是区组但t是列联表里面除了缺失剩下来的区组数（每行/列）

计算的时候是按处理求秩和

公式

优缺点

人生目标

人生愿景\目标

记住！要去头部券商工作！！

卡方齐性和卡方独立性的缺点是： 观测数不能很少