APP下载

基于IRT和XML的考试系统构建初探

2016-10-17严传波木拉提·哈米提毕雪华

科技视界 2016年21期

严传波 木拉提·哈米提 毕雪华

"

"

"

【摘 要】无纸化考试系统依据测试理论,通过分析考生对试题项目的正确反应概率,评价考生的能力潜质。它提高了考试的客观性和公正性,但当前无纸化考试系统还存在着不足。大多数考试系统的测验理论模型依据经典测验理论(CTT)数学模型,而CTT假定的试卷真分数T与观测分数X存在线性关系X=T+E与实际不符,试题难度、区分度等的测量严重依赖于被试样本,被试测验分数依赖于试题参数等。研究探讨了基于项目反应理论(IRT),构建无纸化考试系统的相关技术。应用IRT理论估计试题各项参数,并结合XML试卷客观准确地评估学生的能力。经试验,在基于IRT的考试系统下,考生平均测试试题项目数N<10,即可达到终止条件,探测出考生能力θ。IRT自适应考试系统测试效率高,试题曝光率低,考生能力的综合评价数据具有可比性。IRT在考生力评价方面具有CTT考试系统所不具有的独特优势。

【关键词】CTT;IRT;XML;考试系统

0 引言

随着Internet 技术、教育信息化的迅猛发展,许多行业部门如教育、卫生、银行等部门的考试越来越多地使用无纸化考试。无纸化考试有许多优点,它可以最大限度地减少考务工作量,增加考试的客观性和公正性[1]a。无纸化考试系统可以稍作改动,用于员工培训或学生自主练习。在学校,学生平时的课堂练习、单元测试,课程的期中及期末考试非常普遍。在我校,许多临床基础医学课程建立了网络题库,学生的期中考试、毕业考试均使用无纸化考试系统进行测试。

目前,无纸化考试应用开发技术已日趋成熟,但考试系统对试题的分析、对考生能力的评价所依据的数学模型还存在不足。多数考试系统的测验所依据的数学模型是经典测试理论(Classical Test Theory, CTT,即真分数理论)。经典测试理论相对于其他测验理论有其独特优点,其数学模型浅显易懂,易于理解,计算简便,便于实施;它是当前测量学界使用最广的测验理论,在测验实际工作中发挥着重要的指导作用[2]。应用CTT测量试题的各项指标如试题的难度、区分度、试卷的信度和效度等指标时,其指标精度可以满足实际工作的需要,且普遍适用于处理“0,1”记分和连续与等级计分的试题情形[3-4]。但CTT也存在着缺点,在实际应用中,CTT有关试卷真分数T与观测分数X存在线性关系X=T+E的假定与事实存在差异,X和T用非线性关系表达更符合实际。它对试题指标如难度、区分度、测验信度的测量严重依赖于被试样本。被试的观测分数X依赖于试题难度,测验试题难度越高,则被试观测分数越低,使得进行不同测验的被试难以比较[5-6]。研究和探讨应用新的测验理论方法测量试题项目难度、区分度,从而根据考生对试题项目的正确反应概率,形成更加科学客观且可比较的考生能力评价,对进一步提高教学水平,完善教学过程有重要的意义。

1 考试系统测试理论的数学模型

1.1 经典测试理论(CTT)数学模型

经典测验理论(Classical Test Theory,CTT)又称为真分数理论,它认为测验得分(测验观察分)是真分数和误差分数的线性组合,其数学模型X=T+E,其中X是观测分数,T是真分数,e是误差。当前,传统测验的信度、效度、试题分析的原理与方法均建立CTT数学模型之上[1]。经典测试理论CTT于20世纪初提出并发展起来,30年代得到广泛推广和应用,50年代以后逐步走向成熟。1987年,Gullikson发表了《心理测验理论》,标志着经典测验理论及应用方法已经确立并走向完善。经典测验理论(CTT)的数学模型简单,易于理解和接受,便于推广;它的理论假设较弱,对实施条件要求不严格;多数情况下CTT已足够精确,测验结果可信,所以CTT是目前各类测验所依据的最主要也是最有影响的测验理论。但经典测验理论在理论假设及实际应用方面也存在着缺陷,测验分数与试题难度及考生的能力之间存在着严重依赖关系,CTT对试题指标如难度、区分度、测验信度、效度的测量严重依赖于被试考生能力等等,采用CTT理论,以考生成绩评价考生能力有失偏颇。

1.2 项目反应理论(IRT)的数学模型

项目反应理论(IRT)是克服了经典测量理论的局限而逐渐发展起来的一种较新的现代测验理论,它主要研究应用项目特征函数(或项目特征曲线)描述被试在测验试题上的反应行为与被试能力之间的关系。目前。教育测量界以Logistic函数来表示该曲线,该曲线的形状与位置受到试题项目区分度a、难度b、猜测系数c参数的影响。被试在试题项目上的反应行为与被试的能力水平θ直接相关[7-9],项目特征函数三参数Logistic模型数学模型如公式(1)所示。其中,ai、bi、ci分别为试题i的区分度、难度和猜测参数。Pi(θ)是能力水平为θ的考生对试题i的正确反应概率。

IRT数学模型反映了考生对测验项目的正确反应概率与其潜在特质之间的关系。自50年代以来,人们研究和提出了多种IRT模型,以适用于不同情境下的被试能力的估计。50年代后期,伯恩鲍姆(Birnbaum,1957)提出了Logistic模型。Logistic曲线避免了复杂的积分运算,在估计被试能力和项目参数时更加简便。 Logistic函数数学模型成为当前IRT模型中被试能力水平及项目参数估计最主要应用的数学模型。逻辑斯蒂模型有单参数、双参数、三参数模型之分。20世纪70年代以后,人们通过编制计算机程序实现了对IRT模型的参数估计,从而解决了IRT模型计算复杂的问题,使IRT理论得到进一步应用与推广。

项目反应理论IRT与以典测试理论CTT相比,存在许多优势。IRT对项目难度的估计不受被试样本的限制,对被试能力的估计也不依赖于特定的测验题目;在被试能力估计中,IRT将被试能力和测题难度放在同一量尺上进行估计,不同的测验结果可以直接比较;测验者能够根据项目信息量的大小选择对能力估计精度最有增益的项目,使测验达到预先规定的满意的精度;IRT可以对不同能力的被试实施不同测题,既提高了测量精度又缩短了测验长度。但IRT也存在其不足,IRT单维性假定(假定对项目的正确反应概率其单一特质θ的函数)难以满足,人的心理特质是多维的;数学模型较复杂,应用与推广较困难。IRT理论对于0、1等级记分的项目分析研究与应用较为成熟,而在测验的实际应用中,多级记分的测试项目却很常见,这使其应用范围受到较大限制等。即使如此,随着计算机技术在测验领域应用的不断深入,IRT测试理论由于其独特的优越性,必将被越来越多的人们所接受,成为最有应用前途的测验理论之一。

【摘 要】本国(本土)的法律传统与面临的现代性转向以双向思维,即平等协商的方式达至一种微妙的平衡。东西方法律传统内均有的“为善”、“良知”、“人性”等概念是构筑社会变革模型中的基础共通性参数,法律制度如何移植方才能不产生排异反应,关键就在于对本土法律资源的合理使用与激活。制度并不能保证社会的良性运转,处于过渡期的国民需要的是对公平正义的一致信念。

【关键词】法律移植;本土法制资源;英租威海卫;德占胶;民事诉讼

【Abstract】The concepts of benevolence, conscience, humanity and so on, which embody in both western and eastern traditional legal system are the basic commonality parameter to build a social transformation model. The key to transplant legal system without any rejection reaction is to rationally use and activate the locally legal resources. However, the system cannot guarantee the smooth operation of society, but people in transitional period should have unanimous belief of equity and justice.

【Key words】Legal transplant; National traditional legal system; Weihaiwei colony; Jiaoao colony; Civil suit

0 前言

近些年来,在我国完善民事诉讼制度的潮流中,法律界在认真反思我国民事司法中的种种缺憾的同时,普遍将兴趣转向了域外的法制资源,希冀借助对发达国家民诉机制的吸收与移植,为我国司法改革注入新鲜血液。不过,西方国家的法律制度毕竟发端于特定的西方社会,所能发挥的最大功效也仅限于斯。每一类具体诉讼程序的背后,都蕴含着独特的人文色彩。如何遴选出符合我国发展要求的程序机制并加以可操作的改造,成为中国法律人不得不思索的一大难题。颇为微妙的是,百年前的英国、德国殖民者们初次进入完全陌生且纷繁复杂的传统中国土地时,也为怎能将与之几乎格格不入的程序制度植入这典型的乡土农耕社会而困扰。这里,笔者将以一种逆向的研究视角,即外来法律制度“本土化”的角度,通过威海和青岛两地成为租借地时期的史料分析,解析英德两国如何对向两地移植的民事诉讼制度作出调整,得以较为成功地减轻了制度变革的阵痛,顺应了当时社会商品经济发展的潮流。此前,有必要介绍的是19世纪英国、德国自身也分别经历的一场划时代的民事司法革新,即便是远离本土的威、胶两地,民诉法制建设也深受此次改革的影响。

1 英国民事诉讼制度在山东租借地的“本土化”进程

1.1 19世纪英国民事诉讼制度改革简介

自19世纪30年代伊始,老成谋国的英国人开始了近一个世纪的循序渐进的民事司法及诉讼制度改革,逐步确立了一整套完善缜密、可操作性强的民事程序制度。这场改革主要包括以下核心内涵,而这些内容也几乎能原封不动地从日后英租威海卫民事司法体例与民事诉讼中提炼出来:

1)统一司法权,规范各类司法组织,明确划分各法院管辖权,避免交叉管辖。成立枢密院司法委员会总揽大不列颠及北爱尔兰联合王国和各海外殖民地、自治领的上诉案件;

2)简化诉讼程序,裁汰不必要的诉讼环节。废除令状制度,起诉材料规范但力求简约。提高法院审判效率,避免案件积压,但保留重视程序的法治原则;

3)规定合理的诉讼费用,禁止法官及法院职员收受、索取额外费用,同时严惩贪腐行径。

4)对书面材料、判决书等要式要求较为宽松,判决内常引经据典,形式较为散漫。

经过这次完全的民事诉讼程序的改革,英国的民事司法制度步入了一个蕴含自由民主平等思想的新时代,基本完成了民事法律制度的现代化。这也让法治观念真正深入社会生活。诞生于改革的现代化的司法机制为英国民主制度的发展奠定了坚实的基础,而这次改革的余晖,也不遗余力地照耀在远在天涯的威海卫。

1.2 英租威海卫时期的民事诉讼制度简述与比较分析

总体而言,英租时期的威海卫内存在着一种二元法律体制,区别于英国本土的普通法与衡平法分立的二元法律结构,该制度包含着一些无奈的因素,这并非是一个刻意设计、精巧计算的结果,而是“徘徊于东西方之间”①的产物。本性趋于保守的英国人不大可能也没有必要强行推行不切实际的法制,这样可能带来的社会动荡与大英帝国声誉扫地的隐患更值得担心。所幸的是,这套二元体制成功地完成了它的任务,它不仅维系了当地的稳定,更是促进了威海港商品经济的发展,各位行政长官颇受爱戴,大英帝国的名誉也没有受到任何冲击。

1.2.1 民事司法组织与司法人员

1901年英国设立威海行政公署,做为租借地最高管理机构。行政公署下设正副华务司作为行使司法权的主要机关,其中正华务司主管审理民事案件,亦分管财政、民政、文案、狱政等行政事务,且正副华务司长官同时兼任南北两大行政区行政长官。从英国法制在威海卫“本土化”的角度,这套体制始终带着源自英国的烙印,19世纪的英国本土司法改革的一点核心内容即是统一司法权,建构司法的中央集权制度,分明法院管辖权限,法院体系结构简单,同时对法官素质的要求也颇高。行政与司法权集中于长官一人之手,司法并不独立与行政政治,或多或少承担着维系社会稳定的职能。

2.2.1 民事司法组织与司法人员

德国人登陆之初,即在胶澳湾地区设立了区公所这一极富殖民色彩的司法体制。与该制度所配合的是,胶澳总督在1898年5月即宣布胶澳境内“中国法律照旧施行,以治华人”。一份落款为1898年4月15日的文件显示,租借区以内在青岛李村两处设立地方官署,专理华人词讼。区公所的行政长官由德国人担任,据1898年度的《胶澳发展备忘录》所载,三名德国见习翻译到达青岛,首先完成语言训练。他们同时审理华人的民事与刑事案件,职权近似于德国正式法庭和陪审法庭。行政长官在宣誓就职时,要发誓成为一名“妥善之地方官也”。此外,区公所在受理的案件上也有严格的限制,只能受理民事中诉讼标的额小的或者承担刑事责任较轻的案件,其余则要归胶澳皇家法院受理。民事诉讼中物产钱债则管至二百五十元,如果在二百五十元以上则要归胶澳皇家法院受理。值得注意的是似乎德国人对如何在具体程序操作中治理远东的这片土地基本达成了一项共识,“在许多事务上,法律要考虑当地的关系,因此只能在这里起草和征求意见,而不是在本国。”

2.2.2 一般诉讼流程

在德租胶澳湾地区的诉讼制度中非常明显地被打上了其本国的1877年《帝国诉讼法》核心内核的烙印,胶澳皇家法院自不用多叙,但即使是在为华民而设的区公所,所体现的言辞主义也比较明显。如除特殊情况下,当事人不得在诉讼过程中委托全权代表,须亲自出庭应诉;审判结果公开,区公所的行政长官对于处以监禁三个月、笞责、罚金至五百元或单罚或连罚并可驱逐出境外,所处判决须向被告人公开宣告,让被告人知悉判决。对于判决书要装订卷宗,并且把证人证词等书面法律文件录入卷宗;保障当事人不服判决时的上诉权,不过该项权利受行政长官的限制;民事诉讼中,对诬告者实行反坐,一般处以罚款或劳役。另外,所有涉及到可能罚款的案件都需要缴纳“堂费”,即所谓的诉讼费,对于涉及到金钱的案件,原告须预交诉讼费,诉讼费按照所控数额的百分之二收取,但是胶澳皇家法院至少以十元为限,区公所以一元为限。由败诉方承担诉讼费用,其赔还原告并且区公所的行政长官有权减免当事人所应当缴纳的诉讼费。

德意志帝国在胶澳湾地区成功地建立起了一套成功的“现代化”民事诉讼法制模式,反向而言即是使胶澳地区较为成功地接受了德意志本土民事诉讼制度,日耳曼人借鉴了他们自身继受罗马法的经验,不急于清除当地的原有的法律制度与社会规范的同时,积极主动地探寻一种能顺应当地商品经济发展、适应同化华民的新的法律秩序,也通过社会政策抵消民众对殖民行径的反感,更主要的是由于德国对胶澳湾的高投入极大地刺激了当地经济的发展,迫不及待地投身工商业发展的人们对诉讼程序高效的渴求甚至超过了公正本身,在商品经济的大潮中传统社会土崩瓦解,一套全新的法律体系需要与社会磨合的时间较少。纵然如此,德国殖民当局还是因其较为严厉的统治手腕,残酷的殖民掠夺,对华人的歧视态度在历史上留下了毁誉参半的名声。殖民色彩浓厚的法律制度,势必与历史大潮相悖,纵然再“进步科学”,终究不能获得真正的认可。

3 启示与借鉴

英、德殖民当局清醒地意识到强行将外来的民事诉讼法律制度嫁接至传统乡土社会的结局必然是民众作为或不作为的抵制,祖祖辈辈接受“礼治”思想的传统中国国民并不在乎甚至不会察觉所谓“程序正义”,一个合理的、符合皇帝圣谕与道德伦常的判决对于他们而言即是满意的结果。费孝通先生如此描绘道:生于斯、长于斯、死于斯的社会所信赖的是公认合式的行为规范,而维持“礼”这一行为规范的是社会所积累的经验——传统。德国与英国发觉这一关键后做出了不同的对策,雄心勃勃的德国人向胶澳湾投注了大量资金与人力后掀起当地资本主义经济发展的狂潮,在商品经济与雇佣劳动将传统乡土社会连同传统行为规范冲击得体无完肤后,推出一整套合理高效的诉讼体制,并将“西人”与华民分而治之,从而巧妙地用一次剧烈且全面的社会变革化解了当地居民对新的法律制度的抵触。而资金、人力投入都相对较少的英租威海卫,治理殖民地经验丰富英国人选择了顺应乡土社会及其行为规范的方式,拾起中国的惊堂木与杀威棒,以村董制借助氏族长老的权威治理地方,在诉讼过程中重视调解,在判决中加入道德教化,在东西方之间保持着微妙的平衡,奠定了威海卫三十余年平稳安定的社会基调。从法律移植的宏观维度层面观察,二者殊途同归。

本国(本土)的法律传统与面临的现代性转向以双向思维,即平等协商的方式达至一种微妙的平衡。概括而言,是用本国国民能够接受的传统方式表现现代的法治精神,当这种精神被完全领悟后再对之做出以现代形态的表达。这种循序渐进的方式成本低廉,产生的社会阵痛感相对较轻。一个有远见并不断发展的民族不会害怕社会变革。转型期,新的经济、政治、社会因素的涌现时常挑战相对滞后的法律,若法律不因时而变,社会中机会型违法将与日俱增,传统的道德因素也将受到质疑,这对一个民族的精神内核来说无疑是一种不可逆的破坏。然而若其他国家或地区也曾经受过类似的考验,那么充分借鉴相关经验则显得尤为重要。但单纯地制度移植不能解决根本问题,最初受到变革挑战的国家并无先例可循,人类先辈的探索势必是以其所处时空维度的社会土壤、文化元素为参考,借鉴并接受的仅仅是一种创造性思路。当然东西方法律传统内均有的“为善”、“良知”、“人性”等概念则是构筑社会变革模型中的基础共通性参数,但法律制度如何移植方才能不产生排异反应,关键就在于对本土法律资源的合理使用与激活。

【参考文献】

[1]程汉大.英国法制史[M].齐鲁书社,2001.

[2]张志超.英租威海卫时期的民事诉讼制度[J].司法,2009(4).

[3]威海市档案馆馆藏.关于土地纠纷的调查处理.档号229-1-500.

[4][德]余凯思,国家清史编纂委员会,编译.在“模范殖民地”胶州湾的统治与抵抗[M].山东大学出版社,2005.

[5]青岛市档案馆编.青岛开埠十七年—《胶澳发展备忘录》全译.中国档案出版社,2007.

[6]谋乐.青岛全书(上卷)[M].青岛印书局,1914.

注释:

①张志超.徘徊于东西方之间:英租威海卫时期的法治[J].开放时代,2009(2):40.

[责任编辑:王伟平]