APP下载

IRT模型参数估计的GRNN方法研究

2019-08-13陶永才贾圣杰琳2郑州大学信息工程学院郑州45000

小型微型计算机系统 2019年8期
关键词:参数估计被试者神经网络

陶永才,贾圣杰,石 磊,卫 琳2(郑州大学信息工程学院,郑州45000)

2(郑州大学软件技术学院,郑州450002)

E-mail:ieyctao@zzu.edu.cn

1 引言

测验通常由许多经过适当安排的项目(问题、任务等)构成,被试者对这些项目的作答可以记分,分数被用于评估被试者的情况.

项目反应理论(Item Response Theory,IRT)[1]是评估系统中作为项目参数估计的主要方法,较经典测验理论(Classical Test Theory,CTT)具有参数多的优点,且项目参数的估计与被试者的样本无关[2].同时在项目参数已知的情况下,可以根据相应的项目反应模型计算出被试者的能力参数.

参数估计是项目反应理论的重要组成部分,但是由于项目反应理论模型的复杂性,目前参数估计主要采用数理统计方法,项目参数和能力参数估计中常采用极大似然估计法、贝叶斯方法或最大期望(EM)算法进行参数估计的求解,求解中需要处理大量的积分运算,估计相对困难.而且数理统计方式的参数估计法要求较大的样本容量,才能得到标准误足够小的参数估计值[3],即测验人数和题数都较大时才有理想的估计结果.实际应用中需要大量的考生参加组有新试题的试验考试,样本的获取难度较大,同时也增加了试题的曝光度.估计IRT模型参数,就是在考生作答试题得到的作答结果中,找到一组与IRT模型相符合的参数,这样的一组参数能够描绘出能力参数不同的被试者作答项目参数不同的试题,得到作答的概率分布与实际分布拟合.于是,IRT参数估计问题等价于IRT模型(函数)的拟合问题[4].

人工神经网络(Artificial Neural Network,ANN)[5]是一种非经典数学方法,它通过生物神经网络的模拟,使用网络中的神经元间联结权重值的学习机制,可以处理复杂的非线性函数拟合问题.文献[6]使用ANN方法在小样本数据下进行IRT模型的参数估计,其使用神经网络研究CTT中的项目参数与IRT中的项目参数间的隐含关系.

本文提出基于广义回归神经网络(GRNN)[7]的参数估计方法,以二值记分的测验结果作为样本,通过实验与数理统计方法进行对比,并分析不同样本量下参数估计结果的误差.

2 项目反应理论模型

项目反应理论是一种用来分析测验成绩或调查问卷结果的数学模型.项目反应理论模型是为了确定相关潜在特征(latent trait),被试者能力能否通过测试题反应得出,以及被试者与测试题间的互动关系.目前在心理测量和教育测量相关领域有较广泛的应用.

项目反应理论的Logistics模型为一个非线性函数,其表示被试者在项目上的反应与被试者的能力和项目的参数之间的关系,常用的 3参数模型(3-parameter Logistic model,3PLM)的表达式如式(1):

图1 项目特征曲线Fig.1 Item characteristic curve

其中被试者j的能力值为θj,项目i的区分度、难度和猜测系数分别由ai、bi和ci表示,D 为常数值 -1.702,表示被试者 j答对项目i的概率.根据3PLM绘制出的函数曲线为项目特征曲线(Item Characteristic Curve,ICC).项目特征曲线如图1所示的S型曲线,其意义在于描述“被测试者成功作答某一特定项目的可能性”和“被测试者能力”之间的关系,其中被试者的能力值θ取值一般限定在[-3,3].对于项目i在图像上,c所代表的是ICC的下限,一个能力值θ接近负无穷(非常低)的被测试者仍能答对此题的概率,c为项目的猜测系数.b一般表示在ICC图像拐点处所对应的θ值,对于ICC下限为0(猜测系数c=0)的项目来说,b为p(θ)=0.5时被试者的能力值.b的改变会使曲线横向移动,形状保存不变,当b增加大时曲线向右移动,即θ保持不变时答对题的概率减小,题目的难度增加.题目的难度降低时曲线向左移动,b随之减小.曲线拐点处的斜率k与区分度a的取值成正比(a=4k),在这一点附近上,能力值θ的微小的改变会引起最大的答对概率p(θ)变动.双参数模型(2PLM)为ci=0时的特例,单参数模型(1PLM)为ci=0且ai=1时的特例.

参数估计是确定一组项目参数估计值以及被试者能力参数估计值的过程,估计出的参数值代入模型后,能够最大程度的拟合项目反应矩阵P.当n个被试者对m个项目作出反应时,共有n+3m个参数需要估计.显然,如果同时对如此多的未知数进行估计,那将是非常困难的.伯恩鲍姆(1968)提出将该问题分为两个步骤[8]:

步骤1.假设项目的参数已知,只估计能力参数.

步骤2.将能力的估计值假设为真实值,只估计项目参数.并将迭代这一过程,当参数估计值趋于稳定时停止.目前参数估计的各种方法依据伯恩鲍姆提出的两步骤进行.

测试的项目按照评分方式可分为二级评分项目、多级评分项目、连续评分项目.实际应用中,对二级评分项目的分析最为成熟.研究分析中的多级评分项目大多先转化为多个二级评分项目再进行处理.在连续评分项目模型的研究分析中,通常先将其转化为级数趋于无穷的多级项目,再做处理[9].二级评分又称二值记分或0-1记分.本文主要研究二值记分项目的参数估计方法.

3 广义回归神经网络

广义回归神经网络(GRNN)是一种径向基神经网络,建立在非参数回归的基础上,以样本数据为后验条件,进行非参数估计,根据最大概率原则计算网络的输出,具有良好的非线性函数逼近性能,尤其适合解决曲线拟合问题.实验表明[10],相比 RBF 网络[11]和 BP[12]网络,GRNN 在学习速度上较有更强的优势,网络在积聚较多样本量的优化回归面收敛.GRNN需要调节的唯一参数为平滑因子α(smoothing parameter),平滑因子的确定依赖于所选样本,很好的避免了人为对参数的影响.样本数据相对较少时,预测效果也可达到要求,得到较好的预测精度[14],这也是使用 GRNN进行预测的重要原因.GRNN学习过程就是确定平滑因子α的过程,相比其他网络类型构建更为方便,在信号过程、结构分析、控制决策系统等各个学科和工程领域得到了广泛应用.

GRNN的理论基础

GRNN神经网络为四层结构,各层由功能划分分别为输入层、模式层、求和层和输出层,其中输入为x=(x1,x2,…,xd)T,输出为 y=(y1,y2,…,yL)T.学习样本的向量维数 m 为输入层的神经元数,神经元为简单的分布单元,将输入变量直接传递到模式层.学习样本的个数n为模式层神经元数,样本与神经元一一对应.求和层将两类神经元求和.学习样本的输出向量维数L为输出层的神经元数,输出层神经元将求和层神经元各个输出相除,估计的输出结果yj对应第j个神经元.模型如图2.

图2 广义回归神经网络模型Fig.2 GRNN model

若自变量x及其函数y均为随机变量,其联合概率密度函数记为f(x,y).x的实际观测值记为X,y基于X的函数值记为Y,其数学期望 ^Y为:

使用GRNN进行回归分析的主要步骤为3步.

第1步.将学习样本数据按照规则分为两个部分,第一部分样本数据用做拟合训练,使用拟合训练所得到的网络预测第二部分样本数据,结合预测的误差对网络结构进行调整,当预测精度趋于稳定时神经网络结构即可确定;

第2步.使用确定结构的神经网络训练全部样本数据,获得该学习样本数据的神经网络预测模型;

第3步.使用得到的神经网络模型预测.

4 运用GRNN进行IRT参数估计

GRNN预测效果由唯一的参数平滑因子α决定.α的取值大于0,当其趋于0时^Y(X)与学习样本近似,而且对非样本点预测的效果非常差,表明网络泛化能力较差.α越大时回归曲面越平滑,α非常大时,^Y(X)接近样本整体的因变量平均值.即α越小时,网络对于样本数据的数值逼近性越强;α越大时,网络对于样本数据的数值逼近过程就越平滑,但误差也相应增大,通常α取值在0.01~1之间时能够得到理想的结果.由于训练数据通常较少,构建GRNN时常采取交叉验证方法进行GRNN神经网络学习,并结合循环找出最佳的平滑因子.

参数估计步骤

根据伯恩鲍姆的两阶段参数估计思想,使用GRNN网络进行参数估计的步骤如下:

第1步.对于一个实际的得分矩阵F进行二值化处理得到项目反应矩阵P;

第2步.使用数理统计法由矩阵P估计出一组初始被试者能力θ;

第3步.根据上述θ,使用蒙特卡洛模拟法[13]产生项目参数(a,b,c)已知的项目反应矩阵 P'.项目参数(a,b,c)作为网络输出,样本P'作为网络输入,学习得到item-GRNN网络,用于估计项目参数(a,b,c);

第4步.根据上述项目参数(a,b,c),使用蒙特卡洛模拟法产生被试者能力参数θ'已知的项目反应矩阵P''.被试者参数θ'作为网络输出,由P''作为网络输入,学习得到θ-GRNN网络,用于估计被试者能力参数θ;

第5步.重复进行第3步、第4步,直到估计值趋于稳定或循环次数达到限定终止.此时最终得到的两个GRNN网络可分别用于对被试者能力和项目参数的估计.

实验表明,两阶段参数估计法在迭代次数较小时就能达到参数估计值在较小的范围变化.

正在进行的FAVOR Ⅲ(The FAVOR Ⅲ China Study)中国单中心临床试验(NCT03656848)计划入组评估3 000例冠心病患者,与冠状动脉造影指导下的经皮冠状动脉介入标准治疗方案进行对照, 研究QFR指导下的经皮冠状动脉介入治疗方案能否获得优效的临床结果和手术成本效益。

本文使用实际考试作答结果即得分矩阵作为实验样本数即项目反应矩阵,对上述参数估计方法进行实验.使用传统的数理统计方法和GRNN参数估计法分别对得分矩阵进行项目参数和能力参数的估计,得到每一被试者的能力值和每一项目的项目参数,并计算其估计值对应的误差(BIAS、RMSE).

5 实验与分析

本文使用于某初级中学采集到的真实测验数据(2000个被试者对50道选择题的作答结果)作为原始数据.对原始数据进行二值化处理(答对为1,答错为0),将处理后的数据作为样本.从样本数据中随机抽取100个被试者作为小样本数据,原样本数据作为大样本数据,分别使用数理统计法和GRNN神经网络法对大样本和小样本进行参数估计.

5.1 数理统计法估计参数

从二值化处理(答对为1,答错为0)后的项目反应矩阵中随机抽取N个被试者与M个项目组成的项目反应矩阵P,使用数理统计方法的Langtest[15]工具1http://langtest.jp.(2015)对矩阵P进行项目和被试者的参数进行估计.得出所有被试者的能力参数θ和所有项目的项目参数(a,b,c),并计算参数对应的误差.

5.2 GRNN法估计参数

同样从二值化处理后的项目反应矩阵中随机抽取N个被试者与M个项目组成的矩阵P作为GRNN参数估计的样本.根据数理统计法估计出的被试者能力参数θ,使用蒙特卡洛模拟法,按照表1的项目参数分布和取值范围生成项目反应矩阵P',通过折交叉验证法确定item-GRNN网络的平滑因子.同样按照表1中能力参数分布和取值范围生成项目反应矩阵,通过k折交叉验证法确定θ-GRNN网络的平滑因子.根据3.1中的参数估计步骤进行迭代,直至参数估计值稳定.

表1 IRT参数分布及取值范围Table 1 IRT parameter distribution&value range

随机抽取N'个被试者与M'个项目组成矩阵作为样本输入item-GRNN和θ-GRNN网络估计出项目参数和能力参数.

5.3 误差统计指标

本文使用的标准误差(Standard Error,SE)[16]作为误差统计指标.

其中误差E=测试值-真实值.

5.4 实验结果

实验中被试者人数 N 分别取 2000、1000、500、200、100、50,项目个数M取50,分别对每组数据使用Langtest方法和GRNN方法进行参数的估计.

表2 平均标准误对比Table 2 Comparison of average standard errors

5.5 分析与结论

对比表2中在大样本N=2000、N=1000、N=500时,两种方法估计得出的各个参数的平均标准误相差不大,当样本数量N逐渐减小时Langtest法和GRNN法对应的平均标准误差均增大,当样本数量N=50时,Langtest方法对应的平均标准误远大于GRNN方法对应的平均标准误.

当样本量很小时(N<100),传统的基于数理统计方法的IRT参数估计方法估计出的参数存在较大的误差,而GRNN方法估计出的参数误差较小.

表2列出了6组实验的结果,其中每组为两行数据,分别为被试者样本数量为N时,两种参数估计方法中估计出的各个参数的标准误差的平均值值由式(11)计算得出.

6 结束语

本文针对测验中参数估计的实际问题,提出一种基于神经网络的试题参数和被试者能力参数的估计方法,以二值记分的IRT三参数模型,以GRNN为神经网络模型,基于实际测验数据使用蒙特卡洛模拟方法进行实验研究,将GRNN估计方法与数理统计估计方法进行了比较.结果表明,该方法具有一定的优点,相对于数理统计方法,GRNN法在小样本情况下参数估计的误差较小,可在较少被试者参加的测验中估计出较精确的参数.

猜你喜欢

参数估计被试者神经网络
基于神经网络的船舶电力系统故障诊断方法
基于递归模糊神经网络的风电平滑控制策略
基于参数组合估计的多元控制图的优化研究
一种GTD模型参数估计的改进2D-TLS-ESPRIT算法
德西效应
德西效应
基于神经网络的中小学生情感分析
外辐射源雷达直升机旋翼参数估计方法
儿童花生过敏治疗取得突破
浅谈死亡力函数的非参数估计方法