大学数学作业自动批改系统的设计与实践
2022-03-31杨勤民江志松
杨勤民 江志松
摘要: 通过信息提取技术、数据匹配技术与一次性人工处理相结合的方法 , 将数学主观题转化为树状选择题 , 并结合现代信息技术和网络技术 , 开发了大学数学作业自动批改系统 , 且在大学数学公共基础课的教学中予以了实践. 此类系统解决了自动批改数学主观题的瓶颈问题 , 能够批改小学、中学和大学数学课程中的常规习题 , 如选择题、填空题、判断题、问答题、计算题、证明题等 , 可达到做完即批完的效果.还可以应用于数学教学的各个环节 , 如课前预习、课堂练习、课后复习、课外辅导、备考和在线考试等等.自动批改过程中采集的电子数据可用于数据分析、教学指导、教学研究和教育信息化的建设.
关键词:数学主观题; 信息提取; 树状选择题; 大学数学教学; 教育信息化
中图分类号: TP391 文献标志码: A DOI: 10.3969/j.issn.1000-5641.2022.02.009
Design and implementation of automatic correction for college mathematics assignments
YANG Qinmin, JIANG Zhisong
(School of Mathematics, East China University of Science and Technology, Shanghai 200237, China)
Abstract: By combining information extraction technology, data matching technology, and one-time manual processing, mathematical subjective questions can be transformed into tree-shaped multiple-choice questions. In this study, an automatic correction system for college mathematics assignments was developed by combining modern information and network technology; the system was subsequently trialed in the teaching of entry-level college mathematics courses. The proposed system solves bottlenecks related to automatic grading of subjective mathematics questions, including multiple-choice questions, fill-in-the-blank questions, judgment questions, quiz questions, calculation questions, and proof questions. The system can correct routine exercises for mathematics courses of primary schools, middle schools, and universities so as to achieve more efficient completion. The idea, furthermore, can be applied to various aspects of mathematics teaching, such as previews before class, classroom exercises, reviews after class, preparations for examinations, online examinations, etc. The electronic data collected in the process of automatic correction can subsequently be used for data analysis, teaching guidance, teaching research, and the construction of educational informatization.
Keywords: mathematical subjective questions; information extraction; tree-shaped multiple-choice questions; college mathematics teaching; educational informatization
0 引言
作業和考卷的批改一直是费时费力的工作 , 但又是必不可少的教学环节[1-2]. 信息技术的发展 , 使得用机器代替或辅助批改作业和考卷成为一种趋势. 机器批改的早期工作主要集中在计算机阅卷[3-4]方面 , 学生把选择题答案涂在答题卡上 , 由计算机自动识别和批改.这是从人工批改到机器批改的突变 , 但只能批改选择题 , 其他题型仍然需要人工完成.后来出现了网上阅卷[5-6] , 又称为无纸化阅卷 , 将学生的答卷扫描成图像 , 让教师对着图像批改.网上阅卷通过引入双评的误差控制机制 , 使阅卷结果更加公平.但是这样的网上阅卷不能实时地让考生知道答题的结果 , 也没有减少教师的工作量.近几年出现了以“猿题库”[7]为代表的商业化做题软件 , 用户可以下载试卷和答题卡 , 答完题后用手机扫描答题卡 , 软件就能自动判断出用户的答案是否正确.其方便之处在于可用移动终端答题 , 实时查看答案 , 但在批改方面还是局限于批改选择题和简单的填空题. 对于主观题 , 猿题库识别不了用户的答案.在数学作业和数学考试中 , 通常都有选择题、填空题、计算题和证明题这样的题型 , 并且以计算题和证明题等主观题为主.但是在目前的做题软件和大型考试阅卷系统中 , 并没有自动批改数学主观题方面的任何进展.另外 , 学生平时数学作业的批改也都由教师或助教手工完成 , 每一题的批改都要耗费不少的时间和脑力.在大班教学或者作业量较大时 , 很难保证批改的质量;虽然在一些数学课堂或教学辅助软件中 , 出现了让学生自批或交换批作业做法 , 但实施起来非常繁琐.
能对所有常规类型数学习题进行自动批改的功能的缺乏严重阻碍了当前数学慕课和微课等翻转课堂教学模式[8-9]的开展.不管网上学习资源多么丰富和有吸引力, 不管学生自主学习的选择范围有多么广泛 , 但如果缺少了对于数学习题的实时训练 , 缺少了对学习效果的实时反馈 , 学生就很难掌控自己的学习情况 , 很难有短期的成就感 , 很难有坚持学下去的理由.数学课程的混合式教学模式[10]的成败在于教与学之间的“互馈” , 但是习题课的线下互动严重阻碍了教学效率.因此具有自动批作业功能的数学教学辅助系统的开发迫在眉睫.
自动批改的难点在于自动识别和评价数学主观题的答案 , 具体体现在:手写体和手写公式的识别;文字的语义识别;逻辑严密性的识别. 对于前两个问题 , 都有一些相对成熟的研究 , 但对于逻辑严密性的识别还需要人工智能技术的进一步发展.为此 , 本文采用数据的智能处理技术与一次性的人工处理相结合的方法 , 将数学主观题改造为树状选择题 , 设计数学作业自动批改系统 , 成功地应用于当前的大学数学教学 , 取得了理想效果.采用的数据处理技术主要有数据的信息提取、数据的格式化与匹配.
教育部印发了《教育信息化2.0行动计划》[11] , 要求持续推动信息技术与教育的深度融合.信息技术离不开网络和数据. 将学生对于每道数学题目的答题详情记录下来 , 比如答题时间、正确率、出错的知识点等等 , 通过简单的统计 , 就能实时展现学生的学习成果和薄弱环节 , 为后续的教与学提供参考 .这样的答题信息还可存储于云盘 , 形成“大数据” , 通过智能分析和处理 , 进一步应用于后续的教学研究和实践.
1 数学主观题答案的信息提取和数据处理方案
在教学和考试中遇到的数学主观题(如问答题、计算题和证明题等)的答案并没有像作文那么“主观”. 对于每一题的解答而言 , 其常规解题方法的数目是有限的(很少有超过4 种解法的) , 可以一个一个地罗列出来. 每个标准答案里面的主要“成分”(可以用试卷评分标准中的得分点来理解这里的成分)是固定的.如果缺少这样的成分, 解答就是不完整的或错误的.这些成分在标准答案中出现的顺序往往是固定的 , 偶尔才会有不同的顺序(有不同顺序时 , 不妨把每一種顺序下的解答都看作一种解法). 上述特点表明 , 每一道常规数学主观题的每一个标准答案都由某些与此题相关的固定成分按照特定顺序串联而成. 因此, 数学主观题的标准答案的结构可用图 1来表示.
通过人工智能的方法 , 从一个数学主观题的标准答案里面自动识别出它的主要成分是很困难的.这里采用一个折中的方法 , 由计算机和一次性人工结合完成.我们聘请教学经验丰富的任课教师对每道数学习题的标准答案进行剖析 , 提炼出其中的主要成分 , 形成数据库 , 并存入云端服务器.要使用的时候 , 调用云端的数据库即可.
随后的工作是要将学生所给答案中的对应成分与标准答案中的主要成分(包括顺序)进行匹配 , 根据匹配程度得出批改结果.这个工作也由计算机和一次性人工结合完成.具体而言 , 由教学经验丰富的任课教师在提炼标准答案的各个主要成分时 , 顺带给出各个主要成分的若干干扰项 , 这些干扰项来源于学生答题时常犯的典型错误 , 如概念错误、方法错误和计算错误等.于是数学主观题可改造成图2所示的树状选择题.
图 2中 , 干扰项改记成了错误选项. 除根节点外 , 第 k 层的节点分别为该题的解答中从前往后的第 k 个成分和一些错误选项 , 每个节点都配有相应的分值 , 错误选项的节点分值为零. 如果某些解法前面的若干成分及其出现顺序完全相同 , 系统自动将它们合并到一起.在人机交互的界面上 , 系统只显示已经作答过的节点和当前层的节点 , 不显示后面层次的节点.系统随机打乱每一层中节点的显示次序.学生答题时 , 先写出手写答案 , 根据手写答案在树状选择题中逐层选出与手写答案最匹配的选项 , 直到选出某个叶节点. 系统将所选各节点的分值相加得到该解答的评分 , 至此就得到了批改结果.
2 习题数据库的设计
习题库中的数据存储在云端的如下4 个静态数据表中, 这些数据表中具体内容的填写由一次性人工完成.
2.1 问题分类表
问题分类表包含“编号”和“问题类别”2个字段 , 其中编号为主键. 该表主要用于标示习题内容的类别 , 是从教材各个章节中总结出来的典型方法或内容 , 每道习题只属于这里的一个类别. 教材的每个目里面一般含有这里的1 个或2 个问题类别 , 比下面的“知识点”要粗略一些 , 如利用凑微分法计算不定积分的问题、隐函数求导问题、低阶行列式的计算问题、矩阵特征值和特征向量的计算问题等. 在自动批改系统中 , 可参照该表挑选期中或期末考试试题 , 能确保考试内容覆盖所有章节.
2.2 知识点表
知识点表包含“编号”和“知识点名称”2个字段 , 其中编号为主键. 该表主要罗列教学内容中的知识点 , 可以是教材中的概念、定理和方法等 , 每道习题可含有这里的1 至5 个知识点.如极限的局部有界性、交错级数的莱布尼兹判别法、范德蒙德行列式、克拉默法则等.在自动批改系统中 , 可参照该表挑选章节测试题 , 能确保考试内容覆盖某一章的重点内容.
2.3 错误提示表
错误提示表包含“编号”“错误类型”“短评”和“所属知识点编号”4个字段, 其中编号为主键. 该表主要用于整理或回看错题时告诉学生错在什么地方、为什么出错 , 以及根据错题记录推荐用于加强练习的相关习题.
2.4 习题表
习题表包含“习题编号”“习题来源”“问题分类编号”“知识点编号”“题目”“难易程度”“计算量”“标准答案”“习题点评”和“树状结构”等字段 , 其中编号为主键. 该表为习题库的主体.为了方便本表数据的录入 , 我们专门设计了“教师剖题子系统”.
3 系统基础功能的设计
基础功能首先应该能够像教师亲自批作业那样 , 判别每个解答的对错 , 并在答错的地方指明出错原因, 甚至给出评语. 其次还要能方便学生答题 , 在学生答题结束的瞬间能给出准确的批改结果或得分.
在前面已经说明了如何将数学主观题改造成树状选择题. 而数学客观题 , 如选择题、填空题和判断题等 , 可以设计成除根节点外只含有一层节点的树状选择题. 于是 , 在教学中遇到的几乎所有的数学作业题和考试题 , 都可设计为树状选择题. 在开发系统时 , 由数学教学经验丰富的任课教师事先对每道想让学生完成的数学习题或考试题的每种解法 , 精心设计树状选择题中的节点、标准答案和习题点评 , 存入数据库(题库). 其中 , 正确选项所在节点含有标准答案中的成分的内容和相应的分值. 而错误选项所在节点的内容的设计很具有艺术性 , 含有学生做题时容易出现的错误和简要的错误类型说明(出错知识点). 每一道题的总分值是固定的(比如10分) , 学生做完该题马上就能知道得分.得分越高 , 说明该题做得越好;得分越低 , 则越差.如果某道题没得到满分 , 那么学生解答该题时最后选择的叶节点必定为错误选项 , 系统将该节点所存的简要错误类型说明反馈给学生 , 学生就知道自己这一题为什么做错了.每题都配有标准答案和答案点评(含有教师针对该题想对学生重点强调的内容) , 供学生答完该题后查阅.
现在的学生普遍都有电脑、智能手机或其他智能终端设备(如 iPad 等). 作业系统的人机交互界面设计在这样的设备上 , 而数据库存放在云盘. 只要在有网络的环境下 , 利用智能终端设备 , 学生就可随时答题 , 非常方便.
4 数学作业自动批改系统的部分拓展功能
有了上述的基础功能 , 可进一步设计一些拓展功能. 将题库中的题 , 按照问题类别或涉及到的知识点进行分类 , 方便教师在讲完某一小部分教学内容后挑出一些相应的习题供学生练习. 自动统计某班级学生在各个时段的做题情况 , 供教师教学时参考.根据标准答案中的计算量和所涉及知识点的难度, 给出每道数学习题的难度系数. 根据教师指定的难度系数、题量和知识点范围 , 系统可自动组卷或推荐习题 , 供教师命题和选题时参考.根据某学生的答题情况 , 系统自动统计该学生对哪些知识点掌握得比较好 , 对哪些掌握得不怎么好 , 有針对性地推荐习题供其练习. 针对每个学生 , 系统自动整理该学生所有答错的题目 , 供其复习.
基于作业的自动批改系统 , 还可实现数学课程的在线考试. 在命题、答题和阅卷三个环节 , 系统都可提供“一条龙”的服务. 在以视频教学为主的远程教育中, 迫切需要自动考试系统对学生的学习情况进行检测.如果配上合适的监考和考试环境, 完全可以在作业自动批改系统的基础上设计出自动考试系统.
5 基于作业自动批改技术的大学数学教学辅助系统在部分高校的试用情况
目前 , 基于上述设计思路开发的“千笔教学”这款大学数学教学辅助系统(以下简称千笔系统)已在多所高校试用. 所建题库囊括了6 000多道高等数学、线性代数和概率统计课程的习题 , 基本满足了理工科大学数学基础课程平时教学和考试的需要. 千笔系统的基本功能是能让学生在智能终端设备上答题 , 并实时反馈答题结果.使用千笔系统答题时 , 要求学生先在草稿纸上写出答案 , 然后对照系统上给出的树状分层选项 , 逐层选出与草稿纸上最一致的选项. 在手机上答题的典型界面如图 3、图 4、图5、图 6、图 7所示.
下面以 A 高校为例 , 简介一下试用情况. 该高校主要使用了千笔系统中的“课堂练习”“课后作业”和“在线考试”模块 , 并做了一些相关的教学研究.
在课堂练习模块 , 先由教师在备课时 , 根据所要讲的教学内容在千笔系统上选好练习题 , 并生成对应的课堂练习. 在上课讲完相关理论后 , 发布课堂练习 , 让学生当场完成.学生在答题时 , 教师可实时看到答题情况(比如答题进度、出错知识点和得分等) , 并可随时截止答题时间. 截止答题后 , 自动出现出错知识点、标准答案和习题点评 , 供教师讲解或学生阅读. 如果教师通过课堂练习发现学生对所讲内容掌握得不够好 , 还可临时挑选习题给学生练习或作为课后思考题. 题库中的习题非常全面 , 并已将所有习题按照知识点和难易程度分了类 , 教师挑选习题非常方便 , 提高了备课效率.教师通过千笔系统发布课堂练习 , 先练后讲 , 让学生有充分的思考时间 , 学习效果更好. 在手机上做课堂练习 , 提高了学生们的参与度 , 活跃了课堂气氛.在 A 高校 , 有学生反映 , 自从有了千笔系统 , 再也不敢缺勤了, 上课也不敢打瞌睡了.
在课后作业模块 , 教师通过千笔系统挑选并发布作业 , 指定截止日期. 学生在规定的截止日期之前完成作业. 过了截止日期 , 千笔系统将学生的得分和出错知识点等情况自动汇总 , 并生成 Excel 表格、柱状图、饼图或折线图等供教师参考 , 教师对学生的作业情况一目了然.截止日期之后 , 学生能看到自己的答题情况、标准解答和习题点评. 系统还为学生自动生成错题集, 供学生复习. A 高校的有些学生反映 , 同一个题目 , 在纸上做一遍 , 再在千笔系统上做一遍 , 加深了印象;也有学生反映 , 千笔系统里面的一题多解 , 丰富了解题思路.
早期 , A 高校只在习题课中使用在线考试模块进行章节测试. 在线考试的选题和发布与课后作业模块的操作方法差不多 , 只是把学生集中在教室里 , 当场完成.省去了印刷试卷和批改纸质试卷的麻烦 , 采用在线考试能很方便地增加测试频率.很多学生只肯把时间花在考前复习 , 提高测试频率能提高学生复习的频率 , 从而提高教学效果. 2020年上半年 , 新冠肺炎病毒肆虐 , 很多线下课程不得不转为线上课程 , 线下考试也换成了线上考试[12]. 在这个特殊的学期 , A 高校采用千笔系统中的在线考试代替了期末考试. 因为考题出现的顺序是随机的 , 每道题每一层的选项顺序也是随机的 , 所以学生需要真正理解选项的含义之后才能选出正确的选项 , 杜绝了抄袭现象 , 使得考试结果更加符合学生掌握知识的水平.考完之后, 教师能方便地下载试卷、标准答案、学生的答卷和得分等资料, 提交给教务存档.
在 A 高校 , 有些老师根据学生在千笔系统上的作业成绩和章节测试成绩的变化趋勢 , 找出学习上有所松懈的学生 , 督促他们学习;有些老师把知识点按学生做题时出错的频率排序 , 在复习的时候重点复习出错频率高的知识点;有个别老师还根据千笔系统上的学生成绩 , 研究了学生性别与各阶段学习成绩的相关度 , 得出了一些有趣的结论.
6 讨论
前面设计的数学作业自动批改系统也有一些值得商榷之处. 首先一个问题是 , 将常规的数学作业题改造为树状选择题供学生作答 , 会产生什么效果?树状选择题的一个明显优势是它的答案能够被计算机识别 , 从而实现了自动批改 , 并将作业信息融入了教育信息化的网络. 两者都考查学生对相应知识的掌握情况 , 但是树状选择题的选项对学生答题有一些提示作用 , 因此题目变简单了.选项中会隐含多种解答 , 丰富了学生的解题思路.然而 , 一个明显的弊端是树状选择题只需要学生选出正确选项 , 缺少对学生的书写能力和语言表达能力方面的考查. 目前克服这个弊端的做法是让学生先在纸上做 , 然后对照纸质答案选出树状选择题中的选项 , 相当于一个题做两遍.有些学生抱怨这种做法 , 而有些学生认为这种做法让思维得到了更好的训练. 还有一个弊端是可能有些学生的解题方法非常新颖 , 不在所列的选项之中.这种情况下 , 系统会鼓励学生换一种解法.如果学生坚持用原来的解法 , 可以将解答拍照上传 , 改为人工批改.
随着大数据和人工智能的发展 , 未来的教育机器人[13]可能具备自动识别和分析作业答案的能力.那时候 , 极有可能需要从学生的作业答案中提取关键内容与上述树状结构中的选项内容进行比较、分析和判断. 前面所述数学作业自动批改系统的框架仍然有效 , 只是学生不用对着智能终端设备答题 , 而只需把自己的答案拍照上传.
可能有人担心:作业的自动批改系统会不会让学生沉浸于题海战?这种担心并不是多余的 , 关键要看教师怎么引导. 作业系统是辅助教学的工具 , 要合理使用而不是盲目使用.
7 结论
本文提出了将数学主观题改造为树状选择题;并在此基础上 , 研究了数学作业的自动批改问题;给出了数学作业自动批改系统的设计思路;介绍了相应的教学辅助系统(千笔系统)在大学数学公共基础课程教学中的实践情况. 作业的自动批改能让教师及时方便地了解学生对所学知识的掌握情况 , 也能为学生的答题提供实时反馈. 可以预见 , 当前提倡的翻转课堂和混合式教学模式只有与作业的自动批改技术相融合才能落到实处. 在数学作业的自动批改中 , 日积月累记录下来的答题详情会形成“教育大数据”[14] , 促进教育信息化的建设和发展.
致谢最后 , 感谢千笔系统的开发者对本研究的支持.
[参考文献]
[1]钟梅.关于高等数学作业的思考与实践[J].大学数学, 2007, 23(4):7-10.
[2]吴亚娟, 朱晓欣.对高等数学作业系统的多元统计分析[J].数学教育学报, 2011, 20(1):69-72.
[3]裴世柏.标准化考试在我国的实践[J].教育评论, 1990, 6(4):44-45.
[4]姜伟光.计算机阅卷系统[J].电子技术应用, 1996, 21(2):23-24.
[5]杨明方.网络推动考试革命—广西高考“网上阅卷”采访札记[J].信息系统工程, 1999, 12(11):32-32.
[6]朱铭, 杨泽忠.网上阅卷之理性审视[J].教学考试, 2018, 7(6):12-14.
[7]陈曦.大数据做教育[J].中国企业家, 2013, 29(10):17.
[8]叶立军, 斯海霞, 唐笑敏.“慕课+ 翻转课堂”教学模式下的《中学数学教学设计》课程建设及实践[J].数学教育学报, 2016, 25(6):76-79.
[9]刘锐, 王海燕.基于微课的“翻转课堂”教学模式设计和实践[J].现代教育技术, 2014, 24(5):26-32.
[10]张萌, 杨扬, 柳顺义.基于双向互馈原则的混合式教学模式探索—以大学数学公共基础课程为例[J].现代教育技术, 2020, 30(12):119-125.
[11]任友群.走进新时代的中国教育信息化—《教育信息化2.0行动计划》解读之一[J].电化教育研究, 2018, 39(6):27-28, 60.
[12]葛玉敏, 于歆杰.疫情下在线教学与线下课堂的“实质等效”探索[J].现代教育技术, 2020, 30(10):124-126.
[13]李艳燕, 李新, 王君秀.教育机器人的设计与关键问题分析[J].现代教育技术, 2020, 30(1):12-17.
[14]熊余, 储雯, 蔡婷, 等.高校教育大数据应用支撑体系的设计与实践[J].现代教育技术, 2020, 30(11):91-97.
(责任编辑:李艺)