三种常用DIF检测方法的比较研究
董圣鸿
江西师范大学 教育科学学院
马世晔
教育部 考试中心
【内容提要】本研究在对DIF作出新的更为严格的界定、对三种常用的DIF检测方法进行详细介绍的基础上,以1999年高考英语试卷75道选择题为研究材料,对三种常用的DIF检测方法进行了实证研究。结果表明:MH方法与SIBTEST方法检测的敏感性较STND方法高;MH方法与SIBTEST方法检出的一致性很高;SIBTEST方法具有较好的性能,在实际应用中可以作为首选的方法;在进行DIF检测时,样本容量在1000左右为宜。
【英文摘要】This study based in the response to the 75 optional item of English paper A of 1999 Collage Entrance Examination to compare the three usual detect procedure of DIF(SIBTEST,MH,STND).Through the procedure-cotrast research,results show that the procedure of SIBTEST has the best function and should be the first choice in practice.
【关 键 词】项目功能差异/MH方法/STND方法/SIBTEST方法Differential Item Functioning/MH Procedure/STND procedure/SIBTEST procedure
【正 文】
DIF是Differential Item Functioning的简称,常被译为项目功能差异。我国对DIF的研究起步较晚,针对国外已经开发出的众多的DIF检测方法,我们应该加以借鉴和吸收,使我们的研究与工作少走弯路。
1 DIF的定义
DIF定义为:对于某个特定项目,如果在来自同一目标特质的两批平行被试组中,显现出不同的统计特性,那么该项目就存在功能差异。
这里所讲的“同一目标特质的两批平行被试组”是指在测验打算测查的能力(目标特质)上,两组被试具有相同的水平。在DIF的实际研究中,常会人为地把被试分为两组,分别称为参照组和目标组。划分被试依据一般有:性别、地域、民族、职业、年级、社会经济地位等[1]。衡量参照组与目标组的被试是否具有相同能力水平的变量就称为匹配变量。匹配变量既可以是观察分数,一般是测验的总分;也可以是潜在能力值,一般是用IRT模型估计出的θ值或经典测验理论的真分数t。因此,根据匹配变量的不同,DIF在数学上的定义就有三个[2]。
2 检测DIF的常用方法
在众多的DIF检测方法中,常用的方法主要有MH方法、STND方法与SIBTEST方法[3]。
2.1 MH方法(Mantel-Haenszel Procedure)
MH方法由Mantel和Haenszel(1959)首先提出,Holand(1985)以及Holland和THayer(1988)把这种方法用于检测项目功能差异[4]。现在已经成为检测DIF应用最为广泛的一种方法。MH法用于侦查两级记分项目的DIF,以测验总分作为匹配变量。MH方法统计量的计算建立在一张S×2×2的列联表中,其中S是测验总分的水平数,对于其中的任一水平K,可构成一个来自于两子群体在项目上得、失分数的2×2列联次数表。
根据样本数据完成上述的S×2×2列联表,即可按表中数据计算αMH,公式如下:
附图{图}
其中f[,1rk]、f[,0rk]分别是在第K个能力水平组中,参照组答对项目的人数和答错项目的人数:f[,1fk]、f[,0fk]则是目标组答对的人数和答错的人数。
α[,MH]的取值介于0至正无穷之间。αMH=1.0时,表示该研究项目无DIF;αMH<1.0时,表示研究项目对目标组有较低难度;αMH>1.0时,表示所研究项目对参照组有较低难度。
但是由于αMH的计算来自于样本数据,因此对其值是否等于1.0必须进行统计检验。检验统计量是MHx[2],其计算公式为[5]:
附图{图}
MHx[2]被认为是服从自由度为1的x[2]分布的,如果经检验MHx[2]值处于显著性水平,则认为所研究项目存在DIF。美国ETS公司对αMH又作了一个变换,以与他们的Δ量表相配,转换公式如下:
附图{图}
ETS公司根据MH方法计算的结果,把项目分成三种等级[6],即:可直接用于测验、应修改、应删除。
- 相关文章
- [研究方法]社交恐怖症患者的父母教养方式的研11-26
- [研究方法]攻击性儿童心理咨询个案报告11-26
- [研究方法]心理健康结构维度的研究概述及理论11-26
- [研究方法]成绩反馈对不同成就动机取向的学生11-26
- [研究方法]小学优生与差生完成系列回忆任务错11-26
- [研究方法]中小学生学业成就与非智力因素的相11-26
- [研究方法]高中生测验焦虑与测验时间相关研究11-26
- [研究方法]大学好学生与一般学生的能力结构差11-26
- 热门文章
- [研究方法]心理学研究方法06-19
- [研究方法]大学生从众现象心理探析09-03
- [研究方法]攻击性儿童心理咨询个案报告11-26
- [研究方法]个案研究法06-12
- [研究方法]探寻儿童游戏意义的新视野11-11
- [研究方法]男女大学生自尊获得方式及其受损后11-26
- [研究方法]流行漫画的心理治疗意义11-25
- [研究方法]中小学生学业成就与非智力因素的相11-26
- [研究方法]驾驶员反应时的比较研究11-25
- [研究方法]儿童同情心发展研究11-26
