基于逻辑推理的计算机试题评卷算法研究
2014-04-29贾志先
贾志先
摘要:到目前为止,填空等试题的计算机评分方法,基本上是利用评分关键字与考生的答案匹配进行评分,评分结果并不理想。由于考生的答案多种多样,存在着不一致(inconsistent)或不确定(uncertain)的问题。R.Reiter缺省逻辑(default logic)推理可以有效地解决在不一致或不确定的情况下进行逻辑推理的问题。在N.D. Belnap四值逻辑的基础上,可将经典缺省逻辑推理推广到四值逻辑的双格结构上。将四值缺省推理应用到填空等试题的评分方法中,可使填空等试题的评分结果更加准确和科学。
关键词:四值逻辑; 缺省逻辑; 计算机评卷
中图分类号:TP391 文献标识码:A文章编号:2095-2163(2014)04-0047-04
Abstract:So far, the grading methods of filling in the blanks and other topics are almost by matching keywords of grading with answers of examinee, and the results of grading are not satisfactory. Due to the answers of examinee with diversity, there are inconsistent or uncertain problems. The default reasoning by R.Reiter can effectively solve the problems of reasoning in the case of inconsistency or uncertainty. On the basis of four-valued logic by N.D. Belnap, the classic default logical reasoning can be extended to four-valued. The default reasoning based on four-valued can be used to grade filling in the blanks and other topic, so as to make the results of grading more accurate and scientific.
Key words:Four-valued Logic; Default Logic; Computer Grading
0引言
随着计算机技术的发展,大部分考试和评分都实现了智能化和数字化。一些传统的考试题型,例如填空题,由于计算机自动评分难于实现所致,已在大部分考试中少获采用。
近年来,国内外学者在填空等试题计算机评分方面进行了一系列的研究[1-3]。到目前为止,填空等试题计算机评分方法,基本上是利用评分关键字与考生答案的相互匹配来完成评分。但在实际应用中,这些评分方法的评分结果却都未臻理想。并且,由于考生答案呈现的多样性,这就决定了考生答案中也必然存在着不一致(inconsistent)或不确定(uncertain)的问题,由此即可推知填空等试题的计算机评分将是一个非单调推理活动[4]。
在非单调逻辑的作用下,可能会由于某个新结论的产生或者新条件的加入而推翻先前的某个结论,从而使推理过程回返至上一步[5]。Reiter于1980年提出了缺省逻辑推理(default reasoning)[6],即已有效地解决了在不一致或不确定的情况下,进行逻辑推理的问题。
经典逻辑演算是二值的,即对于任何命题都只有两个可能的真值,真(t)和假(f)。但是二值逻辑对于不完备信息和不一致信息的情形却已宣告为无效。为了克服二值逻辑的不足,1977年,Belnap在经典逻辑真值中,增加了两个逻辑值⊥和┬,由此则构成了四值逻辑[7]。1986年, Ginsberg 进一步推广了N.D. Belnap的四值逻辑结构,并建立了双格概念[8],这种四值逻辑的双格结构为知识表示提供了方便。
本文中,在四值逻辑的基础上,将经典缺省逻辑推理外拓至四值逻辑的双格结构上。并且应用四值缺省推理到填空等试题的评分方法中,则可使填空等试题的评分结果更趋准确与科学。
1缺省推理
在推理过程中,经常涉及到一些在多数时候是真,但不总是真的事实的推理。前提真,结论却可能矛盾。应用缺省推理,则在可能的情况下,能够消除矛盾,并从矛盾的结论中得到可接受的结论[5]。
填空类型分为完全相同和包含等类型。其中,完全相同类型表示考生的答案与标准答案完全相同才能得分。包含类型则表示考生的答案中包含标准答案,并且在应用缺省推理过程中,满足理由才能得分。
一般情况下,填空等试题的答案不止一个,用key_number表示答案的个数。根据答案个数key_number,即可确定缺省推理评分结构数组keys。
4结束语
由于填空等试题,评分难度较大。对填空等试题的题目进行合理设计,是降低评分难度的一个重要方面,答案应该选择相对确定和唯一。
在考生回答填空等试题过程中,可能在答案中出现了一些多余的字符,例如,空格、标点符号等,另外还会存在英文字符的大小写与试题答案不一致等问题。因此,在评分之前,需要对考生的答案进行规范化处理。
应用缺省推理进行填空题的评分,相比利用评分关键字与考生的答案相匹配进行评分的方法,评分结果更为准确和科学。
参考文献:
[1]高思丹, 袁春风. 主观试题的计算机自动批改技术研究[J]. 计算机应用研究, 2004, 21(2):181-185.
[2]史娟. 考试系统中填空题自动评分的设计与实现[J]. 计算机应用与软件, 2010, 27(9):197-199.
[3]梁振球. 填空题自动评分系统的研究与实现[J]. 计算机系统应用, 2007, 16(2):109-111.
[4]HUNTER A. Using default logic in information retrieval [A]. Symbolic and Quantitative Approaches to Uncertainty (ECSQARU'95), edited by FROIDEVAUX C, KOHLAS J, Lecture Notes in Computer Science [C]. Springer ,1995, 946:235-242.
[5]张韧弦. 基于缺省逻辑的一般会话含义例证的形式处理[J]. 当代语言学, 2008, 10(2):158-167.
[6]REITER R. A logic for default reasoning [J]. Artificial Intelligence, 1980, 13(1&2):81-132.
[7]BELNAP N D. A useful four-valued logic [A]. EPSTEIN G, DUMM J, editors. Modern Uses of Multiple-Valued Logic [M]. D. Reidel Publishing Company, Boston, 1977:8-37.
[8]GINSBERG M L. Multivalued logics: a uniform approach to reasoning in artificial intelligence [J]. Computer Intelligence, 1988,4: 256-316.
[9]岳安步, 林作铨. 基于四值语义的缺省逻辑[J]. 计算机学报, 2005, 28(9):1447-1458.
[10]周北海, 毛翊. 一个关于常识推理的基础逻辑[J]. 哲学研究(增刊), 2003:1-10.
[11]FITTING M. Bilattices and the semantics of logic programming [J]. The Journal of Logic and Algebraic Programming, 1991, 11(1&2): 91-116.
[12]BOU F, RIVIECCIO U. The logic of distributive bilattices [J]. Logic Journal of the IGPL, 2011, 19(1):183–216.
[13]贾肇聪. 四值逻辑的直观语义[D]. 北京: 北京大学, 2013.
[14]ARIELI O, AVRON A. The value of the four values [J]. Artificial Intelligence, 1998, 102(1):97-141.
[15]HUNTER A, WILLIAMS M. Aggregating evidence about the positive and negative effects of treatments [J]. Artificial Intelligence in Medicine, 2012, 56:173-190.