非参
2021-12-24 09:08:42 0 举报
AI智能生成
登录查看完整内容
非参数检验
作者其他创作
大纲/内容
检验变量之间是否独立
适用条件
公式
假设:pij = pi.*p.j
原理
卡方独立性检验
假设:pi1 = pir = pi.
强调列变量比例分布在各个区组之间是否一致
自由主题
卡方齐性检验
也是列个2*2的表 但是表里面只是正常数据而已 不是大于中位数那些
与brown-mood类似
记住区别brown——mood 他是根号n-1 这里是根号n
计算公式&统计量
优缺点
Fisher精确性检验
需要分层的时候比如不同医院;城市和农村
先按层计算差异,再将各层差异综合比较,从而做出综合判断
就是分别求层 最后加总再和卡方比较
Mantel-Haenszel检验
对某个抽象数进行测量
取一个样本数多的组或将几组数据汇总成参照组 根据参照组的样本结构将原来各组响应数变换为参照得分,利用ridit得分进行各处理之间强弱的公平比较
使用的是累积概率得分表示各顺序真实的强弱顺序
注意假设:H0:A1,A2....Ar之间没有强弱顺序H1:至少存在一对Ai,Aj使得Ai!=Aj
计算复杂大概率不考
计算公式&公式
Ridit检验
分类数据(变量之间的关联分析)
可用于非线性;不需要正态假定;不受均值(极端值)影响
两变量
分别算出x和y的秩,如果x,y具有同步性,则它们的秩也会有同步性
n是x或者y的个数 反正它们一一对应都一样 R是x的秩 Q是y的秩
原始公式:只是把x和y换成它们对应的秩还有秩平均
Pearson需要正态假定还有系数基于均值易受极端值影响
和pearson的区别
Sperman秩相关检验
从变量协同的角度说明是否相关
对x先排序 但是求Nc和Nd的时候看的是y的秩 比当时位置y大的个数就是Nc;比他小的就是Nd
其实算t的时候就知道它们的关系了;还要算Z是为了保障显著,就是检验可靠性的意味
计算公式
子主题
kendall t检验
多变量
判断几个变量之间是否存在相关关系
H0假定下各变量之间没有相关性;所以是按变量(区组)排序的!!!
然后对每个处理(标题行不是变量的)求秩和
后计算协同系数w(0~1)
k是变量个数!!!!
公式全都记一记 到时候看数据来用
多变量Kendall协和系数检验
对同一对象进行多组/不同方法的评判
评分是分类或者顺序变量
注意假设:H0两个方法不一致H1两个方法一致
实际期望p0 一致性期望pe
算出K之后还要算Z来保障不显著来确保有效性
简单来说就是p0是对角线元素相加
其他的是除了对角线元素外对应元素相乘之和
检验是否显著!!!
kappa和M-H检验的区别是?kappa不也可以分层吗?不同的方法不同的医生不也是分层吗???
不解的点
Kappa一致性检验
定量or定序的样本的关联分析
选择5*2'
填空5*2’
简答4*5'
计算4*15'
题型
对分布有假定
针对参数做的假设
只能用于等距数据和比例数据
数检验要利用到总体的信息(总体分布、总体的一些参数特征如方差),以总体分布和样本信息对总体参数作出推断
参数
对分布无假定
针对总体分布情况做的假设
主要用于记数数据。也可用于等距和比例数据,但精确性就会降低。
不需要利用总体的信息(总体分布、总体的一些参数特征如方差),以样本信息对总体分布作出推断
非参数
非参检验和参数检验的区别
使用条件
中位数!!! 大于中位数s+;小于中位数s-
一定要注意双侧or单侧!!!
只考虑了方向
思想
一般算p值
计算公式or统计量
一定要记得修正!!!!
大样本近似
符号检验
直接考虑趋势问题,考虑生成一些数对,数对的间隔相同,数对的间隔c由样本量n决定
算到c后 算d = 前面的数-后面的数然后s+为正的数目;s-为负的数目之后算法和符号检验同 算p
与符号检验一致 该修正的时候记得一定要修正
大样本
coxstaut趋势检验
0/1二元序列 检验是否随机or是否与顺序无关
若0/1出现规律性不强则为随机性;不可忽略序列长度和0/1个数,因此有R游程长度
因为不能太分散and太密集 所以一定是双边检验!!!!
小样本:直接查表
记公式!!!!!n1+n0=n
两个样本混合排好秩
然后定义:如样本一全为1 样本二全为0
也可以检验两样本问题 两样本是否有随机
游程检验
将符号检验的中位数(样本分位数为0.5)换成样本的分位数 就是分位数检验
分位数检验
左右两边数目相同
左右数据对称分布
对称中心
检验对称中心!!!但要要明白的是中位数!=对称中心一定用的是中位数!!!(或许有坑他给了平均数)
找到中位数之后,个数和他相减的绝对值排序(注意相同秩取平均值),然后用相减后但没取绝对值的正负来加总s+(正数的秩和)
考虑方向和大小(体现在秩和)
记得还是要修正!!!!w大于or小于Ew都修正(大于修正0.5;小于修正-0.5)
wilcoxon符号秩检验
只是把wilcoxon的秩和检验换成正态分位点检验
正态计分检验
秩和检验
中心位置推断
样本
实际值(频数)与期望值(频数)的平方除以期望值,
统计量
只能检验离散数据 或者把连续数据化成离散数据再检验(这样做精度不高)
不足缺点
注意这是样本的卡方检验 后面第五章是变量的卡方检验
卡方拟合优度检验
算出经验分布,并且和理论分布作差,最大的距离如果通过检验 则说明通过(查表的)
D = max|Fn(x)-F(x)|
不足
连续型数据的检验
K-S正态性检验
拓展的地方在于用样本均值和样本方差代替总体的~
KS检验的拓展
lilefor正态性检验
分布检验
单一样本检验
只检验方向
符号检验的两样本推广
混合秩排序 后与混合之后的中位数比较
不懂得点
算p的时候用超几何分布
精确分布的话算p值
一般还是算大样本吧
Brown-mood
样本独立
数据至少为定序的
不一定对称
两样本有类似的分布
方向+大小
wilcoxon检验的两样本推广
也是混合秩
这个公式有点怪 做练习的时候先按单样本Wilcoxon那样先把+的(>中位数的)加起来
算Wy的时候要注意
记得这个Wy要算多几遍 多做一些习题
Mann-whitney检验
位置检验
两样本的均值相等
类似方差
构造出M统计量 是秩与秩的期望的平方加总
混合秩
样本量m+n<30的时候考虑修正
Mood
没有限制
分组原则:每组里面的观测值要相同组数可以不同
随机分组
这一步方差的思想体现出来
求每组的离差平方和
将求出来的离差平方和混合求秩
相当于对离差平方和做W-M-W检验
每组样本(设第一组有m1样本)分别求在混合秩里面的和S再计算TM =S-[m1(m1+1)]/2
Mose
尺度检验
两样本检验
数据分布连续
分布相似
混合排秩 然后按各自样本组求和
若差异过大 则两组数据中心样本位置差异大
K-W检验(H检验)
拒绝K-W检验后要知道是哪两个总体位置差异大
两组样品的平均秩相减的绝对值/两组样本的标准误SE
Dunn两比较检验
如果可以先判断趋势的 就直接用J-T检验不用K-S
两样本wilcoxon的推广
J-T检验(趋势问题)
单因素方差分析
完全随机设计CRD
区组间不具有可比性
区组间排序
b是区组 k是处理
求的是处理的秩和 因为区组内排序,区组的秩和是一致的
记住统计量
Friedman秩方差检验
当Friedman拒绝时 要知道是哪两个总体有差异时用
和Dunn类似
方差公式一定要记得!!!
Hollander-Wolfe检验
区组数很大处理很小的时候 b>2k
去除区组效应
用区组的均值或者中位数作为区组效应的估计值 后用观测值和估计值相减来反映差异化成无区组情况的时候就用回K-S检验
随机区组的调整秩和检验(H-L检验)
处理0/1等二元数据
且因为样本是二项分布 所以样本的处理组和为二项分布
利用和计算 不排序了
这个公式里面 列和是处理 行和是区组
Cochran检验
完全随机区组设计CBD(加入了实验材料的异质性)
适用于列联表里面出现缺失数据
k是处理 但r是列联表里面除了缺失剩下来的处理数(每行/列)b是区组 但t是列联表里面除了缺失剩下来的区组数(每行/列)
计算的时候是按处理求秩和
Durbin检验
均衡不完全随机区组设计
多组样本数据位置推断
记住!要去头部券商工作!!
人生愿景\\目标
人生目标
卡方齐性和卡方独立性的缺点是:观测数不能很少
非参
0 条评论
回复 删除
下一页