国际中文教育考试中的智慧评价平台构建
2023-08-29黄霆玮
黄霆玮
摘 要:在后疫情时代,线上教育已成为一种非常重要的教育形式,如何在线上进行考试,如何保证线上考试的信效度,与线上教育考试所采用的平台息息相关。以国际中文教育中的考试为例,分析了当前线上教育考试的四种需求层次,提出当前线上教育考试应是一种多平台协作的模式,在评价实践中,应根据教育考试的实际需求层次采用相应的考试方案。不过,这种平台模式操作相对复杂,很难满足教师教学的实际需求。为了达到与线下评价基本相当的效果,构建了国际中文教育智慧评价平台,该平台包含教师模块、学生模块和专家模块三个模块。在构建考试平台时,应遵循安全稳定、综合全面、共享开放、评价与教学相结合的原则。
关键词:智慧评价平台;教育考试;线上评价;国际中文教育
随着信息技术的迅速发展,多媒体技术、网络技术等在教学中的应用越来越广泛。新技术的应用极大地改变了教学的环境和方式等,传统的教学模式正面临着新的机遇。值得注意的是,评价作为教学过程中的重要一环,近些年来经历了从线下到线上的转型。在进行线上评价的过程中,我们深感建设智慧评价与教育平台的重要性与紧迫性,一方面,智慧评价平台能够为线上的教学与评价实践提供便捷,使处在不同空间的人们可以同时参加各种评价活动;另一方面,信息技术在教学评价中的应用,也极大地提升了教学测评中的数据收集分析能力、新测评方法的应用水平,为过程评价提供了更多的可能性。更为重要的是,智慧评价平台作为在线教育的一部分,它的发展有助于解决教育不平衡问题,扩大优质教育资源的覆盖面,有助于促进教育公平[1]。
一、教育考试的需求层次
我们平时提到教育考试,常常会想到高等教育入学考试、全国英语等级考试、大学英语四级考试、高等教育自学考试等[2],这些考试都是高利害的、大规模的标准化考试。而广义上的教育考试则指的是所有与教育有关的考试,包括在整个教学过程中运用到的各种评价方式。本文讨论的是广义上的教育考试,即在教育过程中需要用到的所有考试。
由于受到考试类型、网络硬件環境的影响,线上教育考试的需求从低到高可以划分为以下几个层次,具体如图1所示:
如图1所示,线上教育考试主要分为四个层次。一是开卷考试,如完成一个论文或其他作业。这种考试不需要监考,出题也比较简单,不需要使用特定的考试平台。二是低利害但出题复杂的考试。如语言考试会涉及到听说读写四种技能,对考试平台的要求较高。低利害考试对监考的要求普遍不高,如分班考试。考前会告诉考生考试的目的是分班,分班后仍可以试听;如果程度不合适,还允许考生换班,所以学生作弊的可能性不大。三是高利害但出题简单的考试。这种考试需要严格监考,达到与线下考试同样的效果,但是对考试平台的要求不高。如写作课程的期末考试,题目输入比较简单,但因为是期末考试,和学生的绩点、奖学金等挂钩,是一种高利害考试,对监考的要求较高。四是高利害考试而且出题复杂的考试。如各种学科竞赛,对监考的要求非常高,对考试平台的要求也很高。
线上教育考试的需求是多种多样的,主要是受监考的严格程度和对考试平台的需求影响。高利害的考试要求监考更为严格,低利害的考试对监考的要求不高。题目的内容会影响到平台的选择,有些题目的需求较高,如题干或选项中包含录音、图片、公式等;同时,评分方式也会影响到平台的选择。
二、多平台协作的线上教育考试模式
各种需求层次的线上教育考试,目前还没有一个平台可以完全满足。现有的线上教育考试大多是由工具和平台组合使用的,我们称之为“多平台协作模式”。下面,以分班考试为例,来具体说明这种模式。它通常发生在开学之初,面对从未谋面的学生,由教师在线上进行。分班考试,亦称为“分级考试”,实际上属于一种安置考试,目的是将考生安置到合适的班级中,强调通过考试来区分考生的实际汉语水平。安置考试应考虑同班学生的现有水平是否一致,以及学生在班级学习期间汉语能力的预期发展水平,以保证同级几个教学班的整体学业水平平行。
考前的组织联络一般通过微信群;笔试通过考试云、雨课堂、问卷星等平台;口试可以通过微信群、QQ群、邮件等完成间接口试,或者通过各种视频软件、视频会议平台完成面试。语言类考试一般包括听、说、读、写四项内容。以笔者所在院系的分班考试为例,我们的分班考试分为笔试和口试两个部分,选用的平台分别是考试云和微信群。考试云平台可以播放录音,也具备主观考试的功能,能够满足听、读、写考试的基本需要。由于没有合适的面试平台且面试需要的时间人力成本较高,我们采用间接口语考试的方式。给学生一份考试题目,让他们根据题目要求自己录音,完成录音后再通过微信群发给教师,由两位教师分别评分。微信群除了进行口语考试外,还兼有考试组织和管理的功能。教师在群里发布考试说明,回答考生疑问,并与考生进行交流等。分班考试的具体流程,如图2所示:
图2中加阴影的部分,是考试中所使用的各种软件和平台。按照具体功能,这些软件或平台可以分为5种:考务组织平台;题目传输平台(亦称为“考试平台”);题目结果分析平台;监考平台;其他平台。其中,监考平台一般会采用各种视频会议平台来代替,如腾讯会议、企业微信等。在高利害考试中,有时还需要两个摄像头,分别拍摄考生的正面和背面。其他平台则主要包括录音软件和随机分组软件等。
一般情况下,需求层次越高的教育考试,所使用的软件种类越多。需要指出的是,即使我们使用所有的软件和平台,也很难达到与线下考试一样的效果,难以发现考试过程中的各种异常情况。造成这种情况的原因主要是监考方式的变化。
三、线上教育考试的三种监考模式
在线考试的主要风险有考生通过网络互传答案、在网络上查询答案、查看书本和他人代考等。针对这些风险,目前主要是采取三种监考模式。
(一)依靠平台的监考模式
以雨课堂为例,该平台在考试之前提供了预防作弊的方法:上传证件照和本人进行比对,拍摄房间内景(包括正面、背面以及房间内所有陈设)等,以保证参加考试的学生在安全、安静的环境内答题,环境中没有其他能为考试提供帮助的书籍或电子产品。考试中的在线监考功能主要是在线抓拍,利用考生电脑的摄像头随机抓拍。这种模式目前只能在PC端进行,还不能在手机上实施。它实行起来相对简单,但仍有漏洞,毕竟抓拍不是全程监控。
(二)平台+会议模式
更为严格稳妥的一种监考方式是同时打开视频会议软件。这种方式在高利害的考试或者大规模商业考试中应用较多。考生首先登录一个会议平台,如腾讯会议、钉钉、企业微信等,进入视频会议模式,让老师可以看到考生的上半身及手部动作。如果是高利害考试,还可辅助以视频会议接入侧后方摄像头,并且要求学生显示器全程录屏;考试结束后,将录屏视频上传给老师。这种监考方式基本可以保证考试的严肃性,特别是加了侧后方的摄像头,录屏还能保证事后可以追溯[3]。一些高等院校的研究生复试、新教师录用等面试型考试,大多采用这种方式。
(三)设置切屏次数和禁止复制、粘贴模式
在考试过程中,禁止切屏能够防止学生离开考试界面,去搜索网页或打开其他程序。在教學实践中,我们把切屏次数设置为3次,如果超过3次,就会自动终止考生的考试资格。绝对地禁止切屏也不合理,有时可能会有误判。如果一次切屏就自动退出考试,未免过于严苛。将这一规则提前告知考生,也能够起到一定的威慑作用。考试云等平台还设置了禁止使用复制、粘贴等功能,以防止考生利用切屏进行复制、粘贴,我们也可以充分利用这些功能。
这三种监考模式下考试风险的规避情况,如表1所示:
由于第一种监考模式采取的是抓拍,因此,存在一定的小概率事件,都是部分规避。我们认为,期末考试采用第二种+第三种模式,基本可以达到杜绝以上风险的目的。如果是日常的单元考试等,也可以只采用第一种或第三种监考模式。
在上述监考模式中,我们还可以使用一些平台的自带功能来防止作弊。在线下考试中,常常有A、B两种平行试卷,用于防止作弊。在线上考试中,为了防止考生互相交流,我们可以采用多组平行卷,甚至是一人一卷。线上平行卷很容易实现,这是线上考试的优势之一。我们可以利用平台上的“随机呈现试题”“题目乱序”或“选项乱序”等功能,这时试题所呈现的顺序不同,选项所呈现的顺序也不同,从而实现一人一卷。这就能在一定程度上杜绝考生互相交流。问卷星平台中,考生在作答时,如果超过一定时间而没有滑动或点击屏幕,就会自动交卷。如果考生用手机打开问卷作答,同时用电脑搜索答案,一旦超过设定的时间就会自动交卷。
预防作弊是组织线上考试非常关键的一环,也是线上考试和线下考试的主要区别。在清华大学的一项有关疫情情况下如何考试的调研中,大部分学生都希望能够严格监考,这说明公平不仅仅是老师的要求,也是每位学生的内在需求[3]。如何能在线上考试中达到与线下同样的效果,是多平台协作的线上教育考试模式中的难点,其实质是如何搭配使用各种平台,来设计一个公平合理的考试方案。就目前的现状来看,根据考试的不同需求层次组织实施的成熟方案并不多见,需要相关研究跟进解决。在考试实践中,亟需建立功能完善的智慧评价平台,能够针对各种不同的考试环境,为教师们提供成熟的考试方案。
四、评价平台与教学平台的融合
Shute & Psotka指出,与考试相比,形成性评价是动态的过程,而非具体的工具[4]。在构建智慧评价平台时,我们应重视收集教学过程中的各种信息,构建评价与教学相结合的平台模式。考试是教学过程的一个环节,与教学密不可分。近些年来,教育考试逐步向教育评价发展,在向“为了学习的评价”的转变过程中,更加重视评价的诊断和发展功能[2]。线上考试方式的完善、智能评价平台的构建,主要目的就是实现“为了学习的评价”,它能够为从终结性评价到形成性评价的转变提供更加便捷的路径。
Osmundson指出,与考试相比较,评价是一个更宏大的概念,评价不仅包含了考试,也包含通过教学过程中的各种信息并加以反馈和引导的过程[5]。线上教学中,教师和学生之间的互动方式发生了根本性的变革,线下的一些常用方式都需要在各种教学平台上来实现,如课堂互动参与、小组讨论汇报、作业提交管理等。学生参与的时间、提交的汇报甚至音视频这些材料,都可以保存下来,供教学评价使用,这些资料和数据也正是形成性评价所需要的。从教学方面来讲,线上教学缺乏有效的互动和反馈,这就需要教师通过各种方式来加强反馈,特别是对学生作业、课堂表现以及单元考试的点评和评判。在线上教学的各种研究中,很多学者都提到在线上教学平台中实现在线评价功能,如让学生自主朗读、书写,并由系统自动测评,以丰富教学手段、提升线上教学效率等[6]-[8]。
在构建智慧评价平台时,设置课程教学平台与评价平台的接口,参考教学平台上的相关数据,以评价学生在学习中的表现,是今后智慧评价平台发展的主要趋势。随着平台建设以及数据化技术的发展,评价平台与教学平台的结合将不断深入,甚至会融合为一个平台。
评价与教学相融合的趋势,在一些数字出版物中已经有所体现。培生(Pearson)、麦格劳-希尔(Mc Graw-Hill Education)、霍顿·米弗林·哈考特(Houghton Mifflin Harcourt)等全球领先的教育出版集团,多年来一直积极进行数字化发展布局,以实现从教材、教辅出版商向数字化教育、教学解决方案提供商的转型[9]。这些出版商为已有教材教辅开发在线课程,提供在线评价等服务,智能化的自适应教学与评估系统是其中的重要内容。如ALEKS是麦格劳-希尔最重要的数字学习产品之一,涉及的课程门类众多,大类有数学、商业(包括会计学、统计学等)和科学(包括化学、行为科学等),细分学科则有100多种。与此同时,ALEKS还积极探索运用一些新的研究成果。该平台以Doignon & Falmagne所提出的知识空间理论为基础,运用该理论对学习者的学习状态进行评估。该理论认为,学生的知识状态由他所能解答的问题的集合构成,通过跟踪学生学习路径,可以形成特定的知识空间,从而能准确地判断学生目前的知识水平和学习状态[10]。可以说,这是一种对知识状态的评估,而不是以数字为代表的评估量化结果。评估结果对教学过程的反馈,可以促成个性化教学的发展。这种理论应用在教学评估实际中,需要深入地研究整个课程的知识点,分析知识点之间的关系,以及可能的习得先后顺序。需要指出的是,这种理论可能并不适用于所有的学科,应仔细考量其适用范围。
在汉语作为第二语言的教学研究中,第二语言习得领域的研究成果丰硕,其中,关于汉语不同句式的习得顺序的研究,已经逐渐清晰[11]。具有类似特点的学科可以采用ALEKS中的知识空间理论,构建本学科的知识空间,用于评价学生目前的学习状态,判断学生的学业水平,并为学生提供相应的学习建议。
五、智慧评价平台的结构和功能
基于评价与教学相融合的理念,并借鉴ALEKS等在线教育平台的评价功能,我们认为,一个功能完备的智慧评价平台应包括三个模块:教师模块、学生模块和专家模块,每一个模块分别对接不同的对象。智慧评价平台的主要架构,可如图3所示:
就教师而言,该平台基本能够满足各种需求层次的考试的需要,平台上有现成的考试方案以供选择。就学生而言,通过该平台可以参加各种类型的考试,并具有一定的诊断功能,为学生提供后续学习建议。专家模块主要是面向开发者以及评价专家,他们会根据各种不同情境评价的实际需要,不断更新、完善各种考试方案。
可以看出,智慧评价平台兼具教学与评价的功能,同时,平台功能也更加多元化、全面化,在面向教师、学生、专家等不同对象时,发挥着不同的作用。
(一)教师模块
在以往的多平台协作的教育考试模式中,教师主要是通过各类平台来上传试题、拼卷、阅卷并给出成绩。教师上传的题目被保存在平台上,但并没有采取有效的方式来连接、呈现,如同一道题目不同班级的答对率如何,同一个知识点的不同题目之间是否可以建立联系等。在智慧评价平台中,教师所上传的试题以题库的形式存在,每道题目都标记了各种参数,如难度(即学生的答对率)、区分度等。这些数据能够为教师的教学和评价提供反馈信息。教师不仅是题目的建设者,也是学习资源的建设者。教师可以通过平台上传各种教学资源,主要有PPT、与课程有关的视频音频等。当诊断出学生的薄弱之处时,教师可以利用平台系统向学生发送相关的学习资料,供学生进一步学习、巩固该知识点。教师还可以通过平台发现学生学习情况的历时变化,追踪考生的学习发展情况,从而为下一步的教学提供针对性的建议。教师模块还应包含教学策略知识等,以进一步完善线上教育体系建设。
(二)学生模块
在以往的多平台协作的教育考试模式中,学生所使用的平台功能比较单一,主要是参加考试、查看成绩。在智慧评价平台中,学生模块是平台的核心模块,除了参加考试之外,还记录有学生的各种信息,包括个人的历次考试成绩、每课学习内容和时长、课后练习的完成程度等。通过学习者的人机交互行为、课堂表现行为等,能够分析学生的知识结构、学习状态和学业水平,有助于教师了解学生的学习情况,为学生制定个性化的、科学化的学习方案,促进学生水平不断提高。同时,根据学生的学习动态,也能够了解他们的学习方法和策略,并反馈给专家模块,以不断完善专家模块中的有关模型。除了学习和评价以外,学生模块还可以实现多种功能,如自适应学习、评价学业水平、和教师反馈交流、生成学习报告、与同伴学习情况的比较等。
(三)专家模块
目前,多平台协作的教育考试模式仍存在着一定问题,如成熟的考试方案稀缺、评价自动化程度有待提高、作弊行为难以界定、数据挖掘仍需深入等。专家模块是整个评价系统的基础,致力于解决上述教学实践中的主要问题,并实现以下功能:
提供完备成熟的评价方案。以监考模式为例,在上述三种监考模式中,最严谨的一种仍要借助视频会议,没有一个平台可以独立实现所有的考试功能。考试科目不同,监考的方式也不尽相同,因此,教师应思考决定采用哪种模式、哪些平台考试。对考试中所出现的特殊情况也没有统一的预案。实际上,上述因素都是专家模块需要研究解决的。在接收到教师的相关需求后,专家模块会自动匹配相应的考试模式。
提高评价的自动化程度。考试是一项繁琐的工作,有命题、出题、校对等许多环节。目前的在线平台可以实现计算总分的功能,在一定程度上减轻了教师的工作量,同时,也还有非常广阔的提升空间。如在拼卷时,随机组卷是否能提供更多选项,规定考查同一语法点的两道题目不同时出现等。在阅卷时,是否可以设定答案的大小写都算对等选项,使阅卷过程更加便捷。
界定线上考试的作弊行为。在线下考试中,由于制定了详细的规则,考试作弊比较容易界定。在线上考试中,现场环境的不确定性因素较多,比如,切屏的原因到底是什么,3次切屏后考生则不能继续考试,是否就能证明他真的作弊,这些问题仍需探讨。专家模块中应包含如何判断作弊的整套流程,随时发现评价平台在实践中出现的各种问题,从而制定更為完善的规章制度,以保证线上考试的公平公正。
深入挖掘评价数据。评价数据分析包括两大部分:对考生成绩的分析和对试题质量的分析。现有平台所提供的数据主要是考生平均分、最高分、最低分等描述性数据,也可以自动生成考生的成绩分布图,但缺乏专业性的试题分析数据,如题目质量的区分度、信度、效度等数据,均未涉及。以考试云平台为例,对学生成绩的统计分析比较简单,仅有及格率、不及格率等相关数据。
相比而言,智慧评价平台能够提供更多的选项、更多的统计数据,使教师可以根据实际需要输出多种图表,如学生的成绩分布、各个分数段的人数等。平台也应向使用者开放统计模块,特别是反映题目质量和试卷整体质量的各种指标,为教师命题、组卷等提供反馈信息,这对提高命题质量是很有价值的。专家模块还应重视题目质量的分析,使平台不仅成为服务考生的平台,也成为服务教师提高命题质量、提高教学质量甚至辅助进行教学科研的平台,达到充分挖掘数据内涵的目的。
现代化的在线学习平台,不仅要提供丰富的内容资源,还应提供包括教学支持系统、智能管理系统、情境创设系统等在内的整体教学解决方案[7]。在实现评价与教学平台的融合后,专家模块的功能还可以包括设定教学大纲、确定教学策略、制定教学模式、提供教学设计、建议教学进度、监测教学水平等。
六、智慧評价平台的构建原则
构建智慧评价平台,既是信息时代教学与评价工作的必由之路,也是线上教育的必然选择。为保证平台的顺利运行,建设平台时应遵循以下原则:
安全稳定。与传统平台相比,智慧评价平台的服务领域更宽,覆盖范围更广,包括教师、学生、专家等不同人群。这些服务对象分布于世界各地,由于每个地方的信息化建设水平参差不齐,因此,首先应保证智慧评价平台运行的安全稳定,能够顺利提供各类考试服务,并尽量避免试题泄露、黑客攻击等意外情况的发生。
综合全面。本文以国际中文教育为例,分析了如何构建智慧评价平台,在实际应用过程中,该平台还能够为其他学科提供服务。在设计平台的功能时,应考虑到不同学科、不同领域的特殊情况,如能否输入数学公式、能否演示实验过程等,从而将该平台建设成为一个能为各类学科、多种对象服务的全面性平台、综合性平台。
共享开放。智慧评价平台是一个资源共享平台,为在线各学科的评价与教学服务,工作量十分巨大。各位教师和专家应同心协力,发挥各自优势,共同充实平台内容,共享平台的各种功能。如在教学策略部分,回馈给学生的学习建议,需要由教师来完成,而这些建议背后的策略如何反馈到模型中,则要由专家来判断执行。在多次往复的评价反馈中,教学过程逐渐明晰,学习模型不断完善。
评价与教学相结合。在构建智慧评价平台时,评价与教学相结合是非常重要的一条原则。教育考试是为教育服务的,在结果评价向过程评价转变的过程中,资料的收集一直是难点,如档案袋评价(portfolio assessment)、对话日志(dialogue journal)等评价方式的过程比较复杂[12](P189),在线教学则让实现过程评价变得更加方便快捷。同时,评价与教学相结合,使得评价能够切实发挥对教育的诊断和反拨作用。
总之,构建在线智慧教学与评价平台是线上教育的一种新基建[13],智慧平台的建设已成为学科发展的基础工程之一。本文以国际中文教育的线上考试为例,构建了包含三个模块在内的智慧评价平台模型。积极建设这一平台,能够推动当前教育考试中多平台协作模式的发展,有助于实现中文教学从结果评价到过程评价的转变,有利于促进教学方式的进一步完善。当前各界对智慧教学与评价平台的研究也在不断深入,如何将新理论运用到平台的建设上,如何将各种教育资源和服务进一步整合,都是需要学界认真思考的问题。我们认为,实现在线平台、APP移动端和纸质教材的联动,学校、出版社等机构联合发行数字教学资源[14],建立面对重大公共卫生事件的教学应急机制和应急预案等,将是智慧评价平台建设中应持续关注的课题。
参考文献:
[1]刘利民.这是一次世界上规模最大的“教育实验”[N].人民政协报,2020-03-25.
[2]戴家干.从考试到评价——论我国考试与评价制度的改革[J].中国考试,2010,(1).
[3]杨铮,赵毅,蔡新军,刘强,赵弋洋.疫情期间远程在线考试的实践与思考[J].计算机教育,2020,(10).
[4]Shute,V.J. & Psotka,J.Intelligent tutoring systems:Past,present,and future[R].Defense Technical Information Center,1994.
[5][美]Osmundson,E.理解课堂中的形成性评价[J].何珊云,王小平译.全球教育展望,2012,(4).
[6]陈雯雯.基于多平台协同使用的国际中文直播教学实践及启示[J].国际汉语教学研究,2021,(2).
[7]王瑞烽.疫情防控期间汉语技能课线上教学模式分析[J].世界汉语教学,2020,(3).
[8]杨芳,张欢瑞,张文霞.基于MOOC与雨课堂的混合式教学初探——以“生活英语听说”MOOC与雨课堂的教学实践为例[J].现代教育技术,2017,(5).
[9]徐丽芳,王心雨,张慧.国外教育出版数字化发展对我国的启示——以培生集团为例[J].出版广角,2019,(1).
[10]刘欣怡,徐丽芳.数字教育出版自适应智能教学与评估系统研究——以麦格劳-希尔的ALEKS为例[J].出版参考,2020,(6).
[11]施家炜.外国留学生22类现代汉语句式的习得顺序研究[J].世界汉语教学,1998,(4).
[12]罗少茜,张玉美,赵海永.语言测试与评价:理论与实践[M].北京:外语教学与研究出版社,2021.
[13]姜丽萍.“新冠疫情对国际中文教育影响形势研判会”观点汇辑[J].世界汉语教学,2020,(4).
[14]张燕.从翻转课堂的趋势看在线学习平台的功能设计和内容研发——以MindTap平台为例[J].中国传媒科技,2022,(3).
The Construction of Intelligent Assessment Platform in International Chinese Education Examination
Huang Tingwei
(Chinese Teaching Department, Beijing Chinese Language and Culture College, Beijing 102206, China)
Abstract:After the outbreak of the COVID-19, overseas students studying in China returned to their home countries, and International Chinese Education has been fully converted to online teaching. Taking the education examination in International Chinese Education as an example, this paper analyzes the four demand levels of the current online education examination, and puts forward that the current online education examination is a multi platform cooperation mode. In the evaluation practice, the corresponding examination scheme should be used according to the actual demand levels of the education examination. However, the operation of this mode is complex, and it is difficult to meet the actual needs of teachers' teaching. In order to achieve the same effect as offline evaluation, this paper constructs an intelligent evaluation platform including three modules: teacher module, student module and expert module, and proposes that the platform should follow the principles of stability, security, comprehensiveness, sharing and openness, and the combination of evaluation and teaching.
Key words:intelligent assessment platform;education examination;online assessment;International Chinese Education