APP下载

多维项目反应理论等值研究新发展

2016-03-24张军之

2016年4期
关键词:等值

张军之

摘要:等值的发展,从CTT理论等值发展到IRT等值以及MIRT等值的发展。等值以及一种心理测量领域的重要课题,具有十分现实的应用价值。等值包括平行等值和垂直等值,单位等值和多维等值。此外由于实践的需要,等值研究由单位发展到多维。单位等值与多维等值有很多不同的特点。

关键词:项目反应理论;MIRT;等值;垂直等值;分割与并行等值

一、引言测验等值(test equating)是心理测量领域以及教育测量领域的重要研究方面,一直占有重要的地位。等值就是指将测量同一种心理的特质,但是由于测验的形式、测验误差‘测验对象、计分等因素造成的不同。在两个或者多个测验之间进行转换的过程。等值都是要满足以下几个基本条件的:同质、等价性、对称性、样本一致性。等值的方式包括锚题或者锚人也就是有一部分共同的被试。在具体的测和数据收集过程中,常见的设计方案包括;单组设计、随机组、设计与共同题设计。伴随着测试理论从CTT到IRT以及MIRT的发展,等值的理论也相应有经典等值方法,项目反应等值以及多维项目等值方法。经典测量等值的方法一般包括百分位等值、线性等值。项目反应理论等值的方法一般包括有:均值/均值方法(MM),均值/标准差方法(MS),SL(Stoking-Lord)方法,HB(Haebara)方法.项目反应理论发展到多维结构之后,又引起许多新的等值研究。项目在不同维度情况下,等值结果是一个非常值得研究课题。垂直等值也是当前等值研究的一个热点。

二、垂直等值。通常的等值研究都是研究同一心理特质、难度在同一个水平的等信度对称的样本中。但是在实际生活中,常常需要对一个或者一个群体进行追踪研究,这就涉及到需要对同一个体或群体在不同难度水平的相同心理特质的等值研究。比如对某门课不同年级之间进行等值,这就涉及到难度水平的不同。通常的等值方法是不能够解答这类需求,这个时候就需要采取新的等值方法,垂直但这就是解决此类问题的方法。垂直等值是指在相同的心理特质或者相同的学科不同水平测试之间进行转换,使之转换掉相同的尺度系统上进行等值分析。垂直等值的要求是测试具有高的信度和相同的结构,但是难度水平不同。其实目前的等值研究,主要是用于不同难度群主之间的等值研究,用于同一群体的追踪研究,尚未见。

早期的垂直等值主要采用Thurshone方法,就是假设被试能力成正太分布,年级水平呈线性关系。具体操作的时候,先将同群体被试内部进行能力正太话处理,然后在年级间进行线性转换。这种方法比较简便,但是遇到被试呈偏太分布就难以获取合理的结果。目前的方法主要采用IRT理论方法,这种方式的优点是,无需对被试进行正态假设,被试与项目参数不依赖样本,具有总体不变性。不过IRT垂直等值大多用在单维的期刊下,当考虑多维情况时这种方法就不合适。随着项目理论的发展到多维,垂直等值也提出适应多维度的方法。

Patz和Yao(2007)发展了MIRT情况下的垂直等值。

垂直等值具体实施的时候一般,首先选定模型,根据不同的数据结构选择不同的模型。例如0,1评分的数据与多级以及混合评分的模型选择是不同的。第二不是进行模型参数的估计和标定,第三步是在量尺转换的基础上进行估计被试的能力分数。多维项目等值也基本是同样的步骤,不同是多维同时标定要由于分别标定。另外多维等值存在一个问题就是,不同水平测试的维度可能不一致这使得参数的估计和转换造成困难。针对此问题Reckase和Martineau(2004)提出非正交普罗克鲁斯旋转法解决该问题。实际应用效果也较好。

三、最新发展。从经典测量理论发展到项目反应理论,虽然因为理论特点不同但是都是在单位度的范围考虑等值问题。发展到多维项目反应理论之后,由于涉及到维度的不同,所以就需要考虑不同维度情况下的等值。多维等值研究可以根据维度的不同,可以分为分隔等值和合并等值。关于多维分隔等值和合并等值的研究已经有一些,关于把分隔等值于合并等值已经进行比较的研究不多。Mayuko Kanada Simon(2008)比较了多维分隔与合并研究。在单位分隔与合并等值已经基础上,在群体相同的情况下合并等值比分隔等值效果更好。在非等组情况下分隔等值比合并等值效果更好。

实验考虑了样本大小、测试长度、群体等价、能力是否相关变量,采用五种不同的等值方式。研究结果显示总体上合并等值都优于分隔等值,甚至在群体能力相关比较高,群体平均数在0.5标注差的情况下,合并等值都优于分隔等值。关于参数,特别是在测试长度比较短的情况下,合并等值比分隔等值在大样本中更为有效。在分隔等值方式中,在非等群体情况下,ICF方式等值效果更好。Min方式效果相对最差。在等群体情况下各分隔等值方法效果相似。

另外,等值研究最重要就是如何设计锚的方式。既可以锚题也可以通过锚被试的方法进行等值。基于锚题设计,刘玥、刘红云(2013)在研究不同锚测验情况下的等值情况。同时考虑了测试长度、不同维度锚题数目比例、锚测试长度、维度的相关、能力水平的不同、锚题的选择策略几个方面的变量。等值方法采用了:均值/均值(MM)方法,均值/标准差(MS)方法,Stoking-Lord(SL)方法.Haebara(HB)方法,最小平方(LS)方法。研究结果表明,SL、HB、LS三种等值方法在各种情况下表现均比较理想。MM、MS在非等组情况下误差比较大。不同的锚测试设计对SL、HB、LS方法影响不大。在群体水平没有差异,测试长度、锚测试长度、维度之间的相关性相同情况下还是SL、HB、LS方法误差均方根最小。

在等值方法的研究方面除了以上已经发展比较成熟的物中方法,李韶伟(2015)有提出最小离差法(LC)。该方法与以上几种方法不同的是。其只考虑由各参数组成的矩阵,根据被试在测验和测验上的反应矩阵,分别估计出测验和;测验的项目参数。设目标函数

只要求出使函数达到最大值的等值常数α1,α2,β1,β2就是所求的等值常数.

等值一直以来都是心理测量与教育测量的一个重要研究领域,等值研究的发展有助于更好地解决教学和实际工作的需要。能够客观地刻画学业发展状况,对不同的测试之间进行比较也使得测试对象可以更便利地使用各种测试。(作者单位:江西师范大学心理学院)

参考文献:

[1]Patz,R.J,& Yao,L.H.(2007).Methods and models for vertical scaling.In:N.J.Dorans,M.Pommerich,& P.W.Holland(Eds).Linking and aligning scores and scales(pp.253–273).New York:Springer–Verlag.

[2]Reckase,M.D,& Martineau,J.A.(2004).The vertical scaling of science achievement tests.Paper commissioned by the Committee on Test Design for K-12 Science Achievement Center for Education National Research Council,Washington,DC.

[3][中]刘玥刘红云.心理学报.2013,Vol.45,No.4,466-480.

[4]李韶伟.多维项目反应理论的等值问题研究.西南大学.2015

猜你喜欢

等值
德国城乡等值化的发展理念及其对中国的启示
异步电动机等值负载研究
基于共同题非等组设计的等值结果评价标准研究综述
改进的网络等值法在配电网可靠性评估中的应用研究
电网单点等值下等效谐波参数计算
基于注入电流模型的等值法交直流电力系统潮流计算
多维数据IRT 真分数等值和IRT 观察分数等值研究
基于戴维南等值模型的静稳极限在线监视
基于戴维南等值的电压稳定评估方法
测验等值:新一轮高考改革的技术问题