人工智能时代外语教育教学评价与考核创新
2022-06-11张放平
胡 立,张放平
(1.湖南财政经济学院 外国语学院,湖南 长沙 410125;2.湖南省教育科学研究院 博士后工作站,湖南 长沙 410005)
人工智能的快速发展,给高校外语教育带来了挑战。机器翻译已经超过大学英语六级的平均水平。2018 年11 月,机器翻译参加全国翻译资格水平测试,达到《口译实务(交替传译类)》英语二级和《口译实务》三级合格标准①。人工智能时代,“差异化”“个性化”成为了教育评价的关键词。当前形势下的外语教学与课程考核是否能适应这一环境的变化?怎样的评价方式才能检测学生的外语能力?
一、教学评价与考核的应然之态
(一)人工智能介入下的动态化教育评价
人工智能的快速发展对新时代的人才培养提出了新要求。在语言教育教学过程中,学生的协作、沟通、批判能力显得尤为重要,学生的学习方式和实践能力的需求将发生深刻变化。智能时代的学生的信息素养、协作沟通能力、复杂问题解决能力等成为新时代外语人才具备的核心能力。在语言教学体系中,语言知识的技能测试不是考核的重点,个性化和可持续发展能力是语言教育的目标。教学管理部门可以利用人工智能技术跟踪监测教与学的全过程,实现多元化和过程化评价,利用教育大数据实现多维度、综合性智能评价;智能评价工具对学生的情感、态度、思维和行为进行综合分析,使教学评价更加全面、立体和多元;智能化教育质量检测体系能让家庭和学生等主体介入教育评价,使教育互动性评价成为可能。借助人工智能技术的适时跟踪与反馈的智能测评使得教育评价的过程化与动态化得以体现。
目前人工智能技术在语言教育中运用最为广泛的是语音测评和分级阅读。语音测评主要通过语音识别和自然语音处理等技术帮助学生学习和测评语言的语音、语调的标准度、口语流利度和口语表达能力。目前英语口语测评已经在G省、B市等10多个中考中运用,年均测试超过200 万人①。分级阅读除了对学生的学习能力进行测评外,还能根据学生水平,匹配与学生结果相应级别的内容,进行智能推荐。语音测评软件能对测试者的语法、词汇、阅读、听力、发音和流利度进行诊断。基于AI 的智能语音测试系统能通过人机对话实现学习者听说能力的测试,这些系统在广东、江苏、上海、天津等10多省市的中高考中全面应用。在写作能力方面,作文批改网能实现智能化识别,快速、准确完成“扫描试卷—手写体识别—自动评分”的过程,实现“按句点评”功能,自动识别学生的语言错误,给出“学习提示”“推荐表达”,并能根据班级学生的“学习表现”和“错误分布”进行“数据对比”与“维度分析”,这些智能化手段分析大大节省了教师重复劳动的时间,将老师从重复性劳动中解放出来。
(二)外语课程要求引导下的多样化课程评价
在评价方式方面,外语课程评价更强调“过程性”与“多样化”。《大学英语课程教学要求》提出,对学生学习的评估分为形成性评估和终结性评估两种。形成性评估包括学生自我评估、学生相互间的评估、教师对学生的评估、教务部门对学生的评估等。形成性评估可以采用课堂活动和课外活动记录、网上自学记录、学习档案记录、访谈和座谈等多种形式,以便对学生学习过程进行观察、评价和监督,促进学生有效学习。在信息化教学模式下,基于网络教学平台的大学英语课堂教学,为形成性评估手段多样化提供了便利。网络学习平台的“章节测验”、在线测试、学习平台得分、课堂积分等都是阶段性学习成果的“学习证据”。这些可以操作的、可以量化的“过程性考核”数据可以纳入到学生的成绩考核中。
在评价内容上,大学英语课程评价更强调语言的输出能力。《大学英语课程教学要求》提出:“无论采用何种形式,都要充分考核学生实际使用语言进行交际的能力,尤其是听说能力”[1]。一定意义上说,语言教学评价包括检测、反馈、干预、教学行为的调整和学习过程的记录等,这种评价并非一次性完成,而是一个评价、反馈、再评价的非完结性的动态过程。英语教学评价需要坚持“价值多元性”,而不是传统的“管理主义倾向”[2]130,在评价实施过程中,主张采取质性评价方式,借助于评价者与被评价者之间的共同协商[3]来完成。因此,对学生的学业评价不等同于考试或测验。在具体实施过程中,除了人机测验等书面测评内容外,还包括学生听说表达、学生课堂学习情况记录、课后学习表现等多维度的展现。
二、教学评价与考核的实然之状
目前针对英语学习市场上有各种App,可是其利用率较低,尤其在高校学生中利用率更低,学生将高校英语的学习定位为“考试不挂科”和“通过大英四六级考试”。相比基础教育的外语课程评价,高校外语课程的评价与其他课程评价一样,增加了30%的过程性评价分。一般包括了出勤情况、作业表现和自主学习情况等。
(一)考核方式未体现课程的现实需求
目前外语课程考核评价方式和其他课程一样,以期末试卷考核方式为主,在口语和听力方面的考核重视不够。在一项高校教师关于“您认为目前大学英语评价方式”情况的问卷调查②中,46.53%的受访教师“希望改革过程性考核的力度”,11.88%的受访教师“希望改革成绩评价方式,加大学生听力和口语方面的考查力度”(图1)。
图1 高校教师对大学英语评价方式的看法
在调查中,有教师提出“课程评估方式应多元化,多维度,综合评价”。有教师认为“评价方式单一,课程不灵活”。不难看出,外语课程本身的考核并没有考虑课程“内涵”。以C 高校大学英语课程考核方式为例(表1)。
表1 C高校大学英语课程考核方式
从表1中可以看出,对于学生学习效果的评价,依旧是以量化成绩为主,虽然试卷考试能检测学生语言知识,但这种测试并非是形成性评价,不能反映学生学习的过程。在调查中,有教师认为“应该改革学生评价机制,让学生成为学习主体”。在教师课堂评价中,C高校对教师课堂教学质量的综合评价中,学生评价占60%,教师所在教学单位对教学常规等方面的评价占20%,督导评级与自我评价分别占15%和5%,如表2所示。
表2 C 高校教师课堂教学质量综合评价
学校对于教师的考核,也是基于量化的分数。这种考核是一种“任务型”考核,并未建立良好的反馈机制。在一项“您对最近一次教学评价”的调查中,25.74%的受访教师表示并不清楚自己的教学评价情况。
目前对于课程评价的方式停留在传统意义上的“试卷考试”,而没有根据课程内涵和现实需求进行多元化调整。在试卷考试上,教师需要花费大量时间去评阅学生试卷,认真校对学生答卷,从出卷、试卷审定到阅卷教师的“签字”,都给教师带来了“沉重的负担”,而从平时成绩分析数据来看,教师给学生的平时成绩分数偏高。C高校大学英语考试平时成绩平均分高达94分,而期末成绩平均分在这种“无区分度”的平时成绩下“形同虚设”。
(二)考核重心偏离语言实践应用的目标
在课程考核重心方面,目前的考试评价方式依旧是语言技能的测试,真正考虑学生综合应用能力不够。在开放性问答“您目前大学英语教学过程中最不满意的地方是什么?您有什么好的意见或建议?”中,有教师提出“课程评价制度没有考虑大学英语课程的特点,跟其他课程一刀切,希望充分尊重一线教师意见,加快大学英语课程改革步伐”。有教师认为“最不满意的地方是大学英语不是用来倡导如何读书的,而是如何考级的。建议弱化考试,回归真正意义上的读书”。从教师意见来看,教师希望课程评价能够更多指向实际运用,能够体现语言课程的特色。
在学生问卷调查中(图2),37.68%的受访学生认为“成绩评价单一,不能反映学生英语水平”,还有10.74%的学生“不太清楚成绩评定方式”。有学生在“您认为大学英语教学中最不满意的地方”的调查中表示“英语评价标准太单一”。从“只以考试为目的,并没有考虑到以后在生活中的实际应用”“应该多一些实用型的学习而非为四六级或各种考试的学习”“考试内容不合理”等反馈意见来看,学生期待评价制度能指向“实用型”,能更多关注日常生活实际中的语言运用能力。
图2 学生对目前大学英语评价方式的看法
(三)评价机制未对学生和教师行为给予合理引导
评价机制既是课程评价理念的体现,又是课程评价的“指挥棒”。评价导向性对教师行为和学生行为起“引导”作用。当前形势下的学校管理与考核机制中,行政权力优先于课程管理权力。而行政权力的“一刀切”使得评价机制缺乏课程本身的“特性”,因此,语言类课程也无法体现其“应用型”特色。课程本身评价机制的不合理会导致课程偏离存在的价值。学生在课程中的收获不是从期末考试的分数中呈现,而是通过课程的学习,能让学生“保持基于个人天赋与潜能之上的向学之心”[4]。如果课程评价能激发学生的“学习之爱”,让学生的学习力变成现实的行动,课程便被赋予了“促成学生自主自觉”的价值。目前阶段,学生存在学习不认真,学习动力不足等情况,学校对于学生的考核在于学生行为本身的“到场”,比如对学生日常行为的管理,而忽略用一定的机制去激励教师和学生,正如在调查中有教师提出:“学校英语教学改革后几乎全都是大班上课(五六十人到七八十人不等),所有的有效教学方法什么的几乎就无用武之地,学校更是从高清监控随时监控课堂进行通报,从而让老师在课堂更多关注有没有人睡觉或者玩手机什么的,无法说什么高效授课!”
三、教学评价与考核的现实之因
借助人机对话、AR 等智能手段教学具有很大优势,可高校的考核评价机制并没有随之改变。考核机制与教学模式的不匹配,导致教学模式的创新缺乏活力与秩序力。
(一)人工智能教育模式与现有考核体系的不匹配
人工智能时代,教育教学与管理环境发生变化,教师角色、学生角色、学校教育环境、教育教学模式、教育评价体系发生重大变革。智能学习工具为学生提供个性化学习服务,而考核体系也需要随之改革。目前有关形成性评价的改革与探索较多,包括学生学习成绩对比,问卷调查等,但是系统测试的使用频率最低[5]。一方面,人工智能教育产品不断推出,另一方面,学校的课程考核、测评体系依旧是传统型、终结性、书面化考试。在线上线下教学模式下,“在线时长”“观看视频个数”等量化指标的考量,导致许多学生消极应对“线上”课程内容,通过“刷视频”等方式消极应对“线上”考核内容,使用各种手段在网络学习记录上创造“虚假形成性记录”,干扰了网络自主学习的形成性评价[2]86。
(二)考试机制对语言输入输出型技能的偏重
书面化的、总结性的考试主要注重语言的输出技能,而过程性的质性评价方式能兼顾学生在语言学习过程中的输入技能。外语能力评价体系是输入与输出技能的综合反映。学生的综合语言运用能力确实是在语言知识、语言技能、文化意识、情感态度和学习策略等素质整合发展基础上形成的[6]。在大学英语四六级考试中,考试的重心主要在语言技能的考察,对于语用、语篇和交际策略的评价因素较少。而在语言交际过程中,学生在文化意识、情感态度等方面运用语言能力较弱,在真实语言情境中,学生会觉得“无话可说”。考试评价中若不关注学生语言从输入到输出过程中的变化程度,则个性化教学和过程性评价无法得以保障。
(三)教师课程评价权利的缺失
目前情况下,教师在教学改革实施过程中,课程教学方式改变,但课程评价方式变化不大。尽管《教学大纲》要求,课程需要进行“形成性评价”改革,但政策的具体落实仍存在一些教学管理方面的障碍。即使有的高校将大学英语课程纳入考查科目,也只是提前结课,将期末考试时间提前。考核方式和考核内容依旧按照考试科目的“各种规范”进行。教师课程权利的获得并不等于取消管理部门对课程的管理,而是使课程权利发挥本身的能动性,去充分调动教师课程开发、实施的积极性,促成课程中师生生命的“共生”。教学管理部门对课程评价的方式做了“制度性规定”,而导致教师关于课程评价的改革很难开展,在“行政权力”高于“课程权力”的环境下,不能根据课程本身特点对学生学习能力进行综合评价。在“停课不停学”期间的纯线上教学模式下,有的学校发布“一院一策”“一课一策”“一班一策”的整体考核要求,但在具体实施过程中,关于课程考核方式和考核内容,依旧按照原来的模式:需要通过教学主管领导的审核才能实施,教师对课程考核的权利被“限制”。
四、教学评价与考核的可行之道
人工智能时代的外语教育教学评价,需要在人工智能技术的驱动下,依托于人工智能所具备的数据挖掘、高速计算、自动分析等功能,辅助评价工作的高效开展,记录情感信息的动态变化,实现真实课堂的精准采集,追踪师生成长轨迹[7]。
(一)利用“人机合作”实现“以评促学”
“停课不停学”期间的大规模在线学习催生了常态化线上教学方式,教学的评价方式也需要随之改变。在评价方式上,可以借助人工智能技术,进行线上平台测评。为了全面考核学生进步程度,可以进行多次测试。目前常用的期末考试的“终结性考试”方式,学生能查询到自己量化分数,而不清楚自己在哪些方面技能的缺失。“动态化”多次评估的方式能让学生根据自己的弱项开展针对性学习,提高学习效率。教师在写作阶段测试中,利用“批改网”对学生作业进行“系统”评价,再在教学过程中结合“同伴修改”和教师的“人工反馈”,帮助学生关注写作表达中语言知识、句子结构中的错误,提高学生自主修改作文的能力和语用能力。一些英语学习软件,具备大数据分析功能,能及时帮助学生纠正错误,学生也可以重复练习,从这方面而言,普通教师在知识传递上处于“弱势”,在人工智能时代,要达成教学效率的提升,教师就需要在知识传递之外,更加注重学生学习能力的提升。在利用机器学习上,学生可以获得语言知识等“硬技能”,而在真实语境下灵活运用语言的能力、形成性学习能力、养成良好学习习惯等“软技能”则需要在师生交往、生生互动中形成。
(二)注重输入输出能力的平衡,实现“以评导学”
在输入技能考核上,主要注重对学生学习过程的“形成性”,除了利用现代技术,考核学生学习时长等“显性学习数据”,还需要检测阶段性学习效果。在学生自主学习能力较差的情况下,课程考核的导向影响学生的学习行为。在网络课程学习中,若考核机制注重“学习时长”,学生“刷分”现象便会产生。教师对学习任务“完成期限”作出要求,学生会有意识养成“守时”“按时完成任务”的习惯。教师既要注重学生在学习时间、学习任务完成效率的“输入”过程的考核,又要注重学生“输出”质量的考核。在考核过程中发现学生出现的“个人无法解决的错误”,教师要及时反馈,引导学生“发现问题”,并给予指导,帮助学生“分析和解决问题”。课程评价中,要注重系统测评的结果与日常教学观察数据结合起来,让学生参与并感知“课程评价”。尽管学生的评价不一定绝对科学与客观,但学生作为最直接的体验者,他们的评价具有非常积极的现实意义和直接作用[8]。
(三)给予教师课程权利,实现“以评督学”
大规模在线学习期间,线上教学开课率、学生在线到课率、线上教学效果与线下教学效果的差异等成为教学管理者关注的重点。教师在教学过程中,对于课程的把握需要根据学生的学情和个人风格实施教学,而“一校一卷”的“终结性”评价不能满足外语教学目标“立足实际运用、重在能力培养、突出跨文化意识”的考核。在“翻转课堂”教学模式下,“学生展示”、小组协作成果、课外阅读情况等平台记录的成绩为教师的“过程考核”提供了数据支撑,教师可以根据班级学生特点进行有针对性开设“学习处方”,也可以选用“个性化”的“学习验收”方式。通过教师“一班一评”的考核方式,既能倡导教师对学生的“个性化”培养,也能激发教师督促学生积极参与课堂活动的热情。教师拥有更多的课程“自主权”,在面对不同班级不同情况,才能“因材施评”,最后实现真正意义“因材施教”。当教师拥有一定的课程权利时,教师在课程内容、课程实施等方面,可以充分调动学生的“课程权利”,让学生参与课程内容的建设、课程教学效果的评价,让课程改善成为一种“内生需求”,而不是外部考核指标的“导向”。适合班级内容的教学内容与教学评价,赋予了学生更多的课程参与权利。否则,一体化的教学内容会导致教师在教学中无形中给予了学习基础好、课堂参与积极的学生更多的参与权利,而“边缘学生”在越来越少的参与中,学习积极性越来越差,对学生课程平等权是一种“隐性侵犯”。
总之,人工智能时代,个性化学习成为可能,人工智能技术将教师从“日常生活”中“解放”出来,人工智能不能完全代替教师,但运用人工智能技术开展教学的教师会逐步取代完全不使用人工智能的教师。人工智能技术帮助教师进行学习者行为分析,帮助优化知识建构方式,最终实现“双回路学习”[9]。因此,人工智能时代的外语课程评价需要利用现代信息技术,充分调动教师和学生的参与积极性,在课程评价量化的基础上,更多注重课程的质性评价。高校外语类课程评价需要还原语言类课程的“特性”,在确保学生掌握语言知识、技能的前提下,激发学生开展语言交际的“向学力”。教师只有在新的课程理念的引导下,基于完善的顶层设计,有了从“理念”到“实践”的指引,确保从“道”转化为“器”的过程平稳有序[10],才能积极促成学生的主动学习,实现由“表层学习”向“深度学习”与“跨文化交际”能力提升的转变。
注释:
①数据来源:科大讯飞2019新品发布会:你的世界因A.I.而能。科大讯飞董事长刘庆峰在2019新品发布会上作主题发言:https://www.sohu.com/a/315679040_467215.2019-5-22.
②该调查为笔者于2019 年7 月针对包含C 高校在内的6 所应用型本科院校的教师和学生开展的问卷调查和访谈。共收到2179份学生问卷,101份教师问卷。文中所引的教师和学生的意见、建议和评价均来自本调查。