【心理与教育测量】17 测量理论与应用的新发展
2025-09-02 10:06:03 0 举报
AI智能生成
【心理与教育测量】《心理与教育测量》(第4版),戴海琦主编,暨南大学出版社,2018年;
作者其他创作
大纲/内容
项目反应理论简介
经典测量理论的局限
经典测量理论:任何一个测验成绩可以看作真分数和测量误差的和。假定实得分数 (X) 与真分数(T)之间是一种线性关系,只相差一个随机误差(E) 。即X = T+ E
局限性:
1.对信度的估计精度不高。
2.误差指标笼统单一、不精细。
3.各种参数的估计,对样本的依赖性太大。
4.参数指标之间的配套性较差。
1.对信度的估计精度不高。
2.误差指标笼统单一、不精细。
3.各种参数的估计,对样本的依赖性太大。
4.参数指标之间的配套性较差。
项目反应理论基础知识
潜在特质理论简介
心理特质/潜在特质 (latent trait) : 通过对项目 (item)的反应而表现出来对项目的作答反应进行分析,可以估计出被试的能力水平
潜在特质空间:对某一特殊行为起作用的所有潜在特质的集合
题目一总分回归与项目特征曲线
题目正确作答率对测验卷面总分的回归曲线: 随着总分的由低到高,题目正确作答概率由小到大的变化,形成了一条从低分到高分的不降曲线。
项目特征曲线(简称ICC): 显示受试者在项目上的正确反应率与其能力值 (或潜在特质)之间的函数关系。其表现形式是一条回归曲线,有斜率和截距
项目特征曲线(简称ICC): 显示受试者在项目上的正确反应率与其能力值 (或潜在特质)之间的函数关系。其表现形式是一条回归曲线,有斜率和截距
P(θ)潜在特质值为θ的被试在该试题上正确作答(分)率
a——项目区分度 (拐点处切线斜率)
C——伪机遇水平(猜测参数)
b-题目难度(曲线拐点横坐标)
项目反应理论数学模型中所含参数的意义
项目参数只有难度b;
一个被试答对某道题的概率,与自身能力、题目难度有关。
一个被试答对某道题的概率,与自身能力、题目难度有关。
模型参数的估计
方法一: 施测题目参数已知的测验,根据被试的作答反应矩阵,估计所有被试的潜在特质水平0.
方法二:施测新编测验,根据被试的作答反应矩阵,同时估计所有被试的潜在特质水平0和所有项目参数。
方法二:施测新编测验,根据被试的作答反应矩阵,同时估计所有被试的潜在特质水平0和所有项目参数。
项目反应理论的优良性质
- 题目参数的跨样本不变性
- 潜在特质量表的可选择性
- 参数设计的科学性
- 信息函数概念的引进与信息函数的可加性(项目信息函数)
项目反应理论的应用
- 题库建设
- 常模参照测验的编制
- 目标参照测验的编制
- 计算机化自适应测验编制
- 认知诊断测量模型发展
项目反应理论展望
- 单维特质空间一多维特质空间
- 双歧评分试题测试一多级评分试题测试
- 认知特质测试一非认知特质测试
- 纸笔形式测试一计算机测试
- 个别测试一团体测试
对比
概化理论简介
概化理论的基本思想
(一)分数方差的测量学意义再认识
使用实验设计和应用方差分析的统计学技术,将误差变异分解为多个成分,每一个成分对应一个特定的误差来源。
概化理论的测验情境关系说
测验情境关系: 由一个测量目标和若干个测量侧面构成测量目标:测量者希望通过测量用数据描绘的那些实体。 (个体的心理品质)
测量侧面: 误差来源
一个测量侧面就是某一个方面的测量条件。
一个测量侧面可以有不同的水平。
测量侧面有随机侧面和固定侧面之分。
测量侧面: 误差来源
一个测量侧面就是某一个方面的测量条件。
一个测量侧面可以有不同的水平。
测量侧面有随机侧面和固定侧面之分。
测验设计的模型与种类
测验设计内容包括: 目标界定,侧面选择,各侧面水平确定。
测试数据采集
√全交叉采集(交叉设计) : 所有测量目标在所有测量侧面的所有水平上均被测量。
√ 相互套采集(嵌套设计): 某个侧面的各个水平分别被包含在另一个侧面的各个水平之中施测。
√ 交叉与嵌套混合采集《混合设计) : 上述两种方法兼有,用于有多个测量侧面的情况
√ 相互套采集(嵌套设计): 某个侧面的各个水平分别被包含在另一个侧面的各个水平之中施测。
√ 交叉与嵌套混合采集《混合设计) : 上述两种方法兼有,用于有多个测量侧面的情况
常用测验设计
单侧面交又设计、双侧面交又设计、双侧面嵌套设计
三侧面交又设计、三侧面嵌套设计、三侧面混合设计
三侧面交又设计、三侧面嵌套设计、三侧面混合设计
(四)G 研究(Generalizability)
概化研究目的是定量估出测量目标的方差,以及各个测量面所产生的测量误差方差
测量目标主效应方差
测量面的主效应方差
各种交互效应方差
测量面的主效应方差
各种交互效应方差
基本步骤
- 明确测量目标
- 选择测量侧面确定观察全域
- 设计测验方法
- 收集样本资料
- 方差分析
D研究(Decision 决策研究)
利用G研究的结果数据,s在原设计的测验情境关系范围之内,分析比较各种可能的测验方案测验工作者可以根据分析结果,结合可能的实施条件优选实际测验方案。
2个精度指标
1.概化系数 (G系数):是测量目标效应方差与测量目标效应方差加相对误差方差之和的比,是对常模参照测验的稳定性程度的度量。
2.可靠性指数 (θ系数): 是测量目标效应方差与总效应方差之比,是对目标参照测验的稳定性和一致性两种程度的度量。
2.可靠性指数 (θ系数): 是测量目标效应方差与总效应方差之比,是对目标参照测验的稳定性和一致性两种程度的度量。
概化理论简评
从统计本质来说,概化理论是随机抽取误差分析模型,分析基础是样本数据
为保证研究结果的可靠性,不仅要保证样本资料的代表性,并且必须对施测条件进行一定的有效控制;
如果测量面过多,施测会困难,模型设计和数据处理会出现困难
为保证研究结果的可靠性,不仅要保证样本资料的代表性,并且必须对施测条件进行一定的有效控制;
如果测量面过多,施测会困难,模型设计和数据处理会出现困难
新一代测验理论与认知诊断简介
对比
标准测验理论
侧重点
只关注被试宏观能力的测量即评估
研究范式
能力水平研究范式
主要理论
经典测量理论
概化理论
项目反应理论
概化理论
项目反应理论
认知诊断理论
侧重点
关注被试宏观能力的测量即评估,更关注个体内部微观心理加工过程的测量及评估
研究范式
能力水平+认知水平
主要理论
认知诊断理论
定义
广义
用某种方法建立起观察分数和被试的内部认知特征之间的关系。
应用:心理学理论建构教育领域
狭义
仅指认知诊断在教育领域中的应用

收藏

收藏
0 条评论
下一页