测验的信度
2016-09-06 15:27:32 0 举报
AI智能生成
测验的信度指的是测量工具的一致性和稳定性。如果一个测验在多次测试中得出的结果相似,那么这个测验就具有较高的信度。相反,如果结果差异较大,则说明该测验缺乏一致性和稳定性。因此,高信度的测验可以更准确地反映被测者的真实水平,而低信度的测验则可能会导致误差和不准确的结果。在进行测验时,需要注意选择具有较高信度的测量工具,以确保测试结果的准确性和可靠性。同时,还需要注意控制测试环境、时间等因素对测试结果的影响,以提高测验的信度。
作者其他创作
大纲/内容
信度
也称可靠性、稳定性,是指同一受测者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一直程度
只受随机误差影响
测验结果受机遇影响的程度
指标
信度系数rxx
√rxx
测量标准误
SE=Sx√1-rxx
SE:标准误
Sx:分数的标准差
rxx:信度系数
信度越高,标准误越小;信度越低,标准误越大
影响因素
样本团体异质性
同质团体:相关低、信度低
异质团体:相关高、信度高
样本团体平均能力水平
能力高:相关低、信度低
能力低:相关低、信度低
能力中:相关高、信度高
测验长度
一般来说,在一个测验中增加同质的题目,可使信度提高
测验越长
测验的测题取样或内容取样就越具有代表性
受测者的猜测因素影响就越小
需要注意的是,增加测验长度的效果应遵循报酬递减率原则,测验过长有事会引起受测者的疲劳和反感
测验难度
与信度没有简单的对应关系
通常难度的平均水平为中等(0.50)较好
时间间隔
只对重测信度和重测复本信度有影响
测验时间间隔和信度系数成反比关系
特殊问题
速度测验
分半信度不能按题目的奇偶项划分,而应按测验时间划分成想等的两部分
分测验
因为信度与测验长度有关,必须查看每一个分测验的信度估计
信度评估
重测信度
又称稳定性系数,用重测法计算
使用同一测验,在同样条件下对同一组受测者前后施测两次,求两次得分间的相关系数
时间间隔2-4周较宜,最好不超过6个月
重测信度的误差主要是时间误差
复本信度
又称等值性系数
以两个等值但题目不同的测验来测量同一群体,然后求得受测者在两个测验上得分的相关系数
如果两个复本的施测相隔一段时间,则称重测复本信度或稳定与等值系数
复本信度的高低主要受内容误差的影响;重测复本信度的高低既受时间误差影响,又受内容误差影响
内部一致性信度
反应题目之间的关系,表示测验能够测量相同内容或特质的程度
分半信度
在测验实施后分半
按项目编号的奇数、偶数分为等值的两半,求出这两半分数的相关系数
会低估信度
同质性信度
测验内部所有题目间的一致性
正相关时为同质
负相关时为异质
评分者信度
随机抽取若干分测验卷,由两位评分者按评分标准分别给分,再根据每份测验卷的两个分数计算相关
要求在成对受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的
当多个评分者评定多个对象,并以等级发计分时,可采用特定公式去估计评分者信度
主要用于测量不同评分者之间的误差
信度解释
解释真实分数与实得分数的相关
总的方差=真实分数的方差+测验的误差
总的方差中有多少比例是有真实的方差决定的
0.00<=rxx<=1.00
测验在某种特定条件下对某种特定样本所得的测量误差1-rxx
确定信度可以接受的水平
一般能力测验和成就测验的信度系数>=0.90
人格测验、兴趣、态度、价值观等测验的信度在0.80~0.85之间
一般原则
rxx<0.70,测验不可用
0.70<=rxx<0.85,可用于团体比较
rxx>=0.85,能用来鉴别或预测个人成绩或作为
解释个人分数的意义
估计真实分数的范围
了解实得分数再测时可能的变化情形
标准误SE=Sx√1-rxx
子主题
置信区间为X-1.96SE<XT<=X+1.96SE
5%的可能性落在范围之外
比较不同测验分数的差异
差异分标准误SEd=S√2-rxx-ryy
两个测验的标准差要求相同
SEd*1.96>15,才能达到0.05的显著水平差异程度(即误差概率低于5%)
0 条评论
下一页