中文写作智能批阅的精准实施与结果的有效运用
2021-12-29刘兵易海华
摘要: 智能批阅是目前智慧教育新兴的研究领域,它为写作评价与写作教学带来了无限的想象空间。在完善与提升中文写作智能批阅功效方面,除了技术手段的不断提升之外,还需要从教学角度来研究写作智能批阅的精准实施与结果的有效运用。可从以下几个方面探讨:第一,如何从命题角度强化具备解释性的特征值,提升中文写作智能批阅的精准度;第二,如何从评价标准的角度,探索写作各能力维度的评估模型;第三,如何运用中文写作智能批阅的结果形成大数据分析,以此构建作文个性化提升路径。
关键词:中文写作;智能批阅;特征值;评估模型;大数据分析
中文写作智能批阅是指采用计算机程序对作文进行智能评分,也就是我们平常所讲的“写作自动化评分”。国外英语写作自动评分的研究始于20世纪60年代。1966年,美国杜克大学教授埃利斯·佩奇(Ellis Page)带领研究团队开发了“PEG”(project essay grader),这是最早的写作自动评分系统。它在分析语言表面结构方面效果较好,但在分析写作内容时存在一定不足。20世纪90年代,美国培生知识分析技术公司开发的“IEA”(intelligent essay assessor)和美国教育考试服务中心的吉尔·伯斯坦(Jill Burstein)博士等开发的“E-rater”(electronic essay rater),则在评价写作内容方面有了很大提升;由美国卓越学习公司开发的“IntelliMetric”则是第一套基于人工智能的比较全面的写作评分系统。
国内中文写作自动化评分的研究始于21世纪初。在借鉴国外英文写作自动化评分原理的基础上,研究者尝试将智能批阅技术用于课后作文批改、低风险作文测试,在一些高利害的考试中也开始尝试用智能批阅技术作为作文阅卷的辅助手段。
然而,中文写作智能批阅自一开始就陷入学界的争议之中,质疑者的意见主要集中在这几个方面:第一,中文写作重“义”、重“情感”,冷冰冰的智能批阅技术如何保证评价的准确性与可靠性?第二,中文写作智能批阅是否有形成统一模板的趋势,造成写作者个性的缺失?第三,智能批阅可以说是教育教学评价方式上的一个变革,这对教师的作文教学会带来哪些变数?
笔者自2018年起开始进行省级重点课题“大数据时代中小学作文智能网络教育研究与实践”的探讨,在中文写作智能批阅的精准实施及评价结果的运用方面进行了一些尝试。笔者认为,智能批阅只是一种阅卷手段,关键在于怎么运用。在不断完善技术手段的同时,我们也应该从教学端考虑,从命题、评价及大数据结果运用的角度不断完善中文写作智能批阅,让它从最初的单纯评分测量手段转变为评分测量手段、能力评价手段与个性化写作能力提升手段相结合的综合智能体。
一、命题形式上凸显特征值,提升智能批阅的精准度
中文写作智能批阅是指借助计算机的自然语言处理、信息检索、技术统计、人工智能等多项技术,通过特征值抽取、模型筛选、算法确定、分数报告与解释等几个核心环节,完成对一篇文章的“计算”,也就是“批阅”。从技术层面来看,明显的特征值和固定的评价模型有利于计算机提升批阅的准确性。但是,写作是一件丰富多彩的事情,尤其是中文写作,更重视内容的丰富多样、形式的个性化张扬。从这个角度来讲,不是所有的写作试题都适宜于智能批阅,因此,要提高智能批阅的精准度,首先要在作文命题上做一些适合智能批阅特点的设计。
适合智能批阅的作文试题应该符合以下要求:第一,写作对象指向明确,特征明显;第二,写作内容有一定的限制,便于特征值的有效抽取;第三,写作要求可操作性强。过于空洞、发散的作文试题,则不利于智能批阅技术的精准实施。
实践中,我们选择了教材中一些单元的作文试题,经过修改将其变成更适合智能批阅的试题。例如,统编教材七年级上册第一单元“写作实践”中的“练习一”:
(原题)九月份,由夏入秋,天气转凉,昼夜温差增大,自然景物、人们穿戴等方面也相应发生了许多变化,你注意到了吗?到生活中去细心观察、体验,选取一个场景,写一段文字描述这些变化。
(修改)九月份,由夏入秋,天气转凉,昼夜温差增大,学校的自然景物、同学和教师的穿戴等方面也相应发生了许多变化,你注意到了吗?到生活中去细心观察、体验,选取学校中的一个场景,写一段文字描述这些变化。
依据表1的特征值分析,修改后的这道题目中,有“九月份”的特定时节限制,有“学校”的空间特征限制,有“自然景物”“人们穿戴”等观察对象的特征限制,还有“场景描写”的写作特征限制。这样特征值更加明显,中文写作智能批阅的精准度更高。
此外,拟制作文试题的时候,为了让写作特征值更加明显,我们提倡拟题时的“一题一点”:一个较为明确的主题,一个着重突破的写作点。
例如这样一道作文试题:
“考试”是我们最熟悉的一种学习活动,很多人认为“考试”是紧张而又辛苦的,但是,如果我们换一个角度来看,可以寻找出“考试”的许多快乐。请围绕“考试”主题,按照下面的要求,写一篇记叙文。
要求:1.以“考试”为线索,写出学习与生活的乐趣。
2.通过细腻的心理活动描写来表现人物的内心世界。
3.不少于600字。
依据表2的特征值分析,这道题目在“主题”与“突破点”上的限制分别为“学习与生活的乐趣”和“细腻的心理活动描写”。“一题一法”的拟题方式,不仅让写作的针对性更强,也更有利于特征值的凸显,提升智能批阅的精准度。
二、建立分项分等的评价模型,构建智能批阅的多维评价模式
目前,单纯用于测量的机评作文一般只提供一个最终得分,但是从教学评价的角度来看,我们需要有多个维度的测量数据,因此需要构建一个多维度的评价模型。
我们可以依据以下步骤建立一个比较科学的中文写作智能批阅多维度评价模型:第一步,研究《义务教育语文课程标准(2011年版)》和《普通高中语文课程标准(2017年版)》,细化小学至高中各学年段作文评价标准的要求。第二步,按照分项(分为立意、中心、内容、结构、语言等项)、分等(按照从高到低的顺序分为六等)的原则,构建作文多维评价模型(见表3)。第三步,依据多维评价模型,结合各学段的教材,从各个评价维度具体拟写各单元作文的评分细则,或者拟写作文测试题的评分细则。
进行中文写作智能批阅前,可以依据这个多维评价模型,根据年级、学情的不同,以及具体的作文试题设置具体的评价内容。同时,智能批阅的给分也从单纯的总分给分改变为分项给分。
三、从系统构建角度将智能批阅的自动评分转变为写作能力的系统性评价
单个写作试题的自动化评分结果显示出的只是一次作文的测量情况,而且,因为中文写作智能批阅试题特征值的要求,测量的范畴可能比较狭窄单一。但是,如果将每一次作文的测量情况放在一个大的作文系统框架里来研究,就有了“由点到面”的突破,能够全方位地为学生的写作能力以及潜在属性发展提供研究的证据,从而揭示出写作能力的普通发展规律与不同子群体写作能力发展之间的差异,为我们的写作教学提供重要的研究内容。
通过分析课标、教材和作文课堂教学现状,我们初步构建了一个系统性与序列性相结合的作文体系。这个体系从小学三年级一直到高中三年级,按照“一题一点”的形式构建了写作系统。表4至表6所示的初中学段写作系统构建表中,“一题”就是写作主题,根据课标、教材要求及学生年龄的认知特点,系统地安排写作主题,尽量做到写作主题不重复;“一点”就是写作突破点,从写作方法和写作技巧的角度设置,每一次作文重点突出一种作文方法或者作文技巧的训练,做到重点突出,针对性强,能够深入掌握这一方法或技巧,进行深度训练。
四、有效运用智能批阅的数据结果,全面服务写作教学水平的提升
如果将智能批阅的作用仅仅理解为降低了人工作文评分的时间成本和精力成本,那是非常肤浅的认识。它的巨大魅力在于大数据的收集及基于大数据分析的个性化服务。
(一)基于大数据分析的作文评价报告
借助智能批阅的多维评价模型,教师可以得到学生本次作文在主题表达、思维特征、材料范围、结构特点、用语习惯等方面的多维度数据。同时,针对所有参与写作者进行大数据分析,可形成一个既有整体学生写作共性分析,又有单个学生个性化特征分析的作文智能评价报告,从而为学生的写作水平提升提供更好的帮助。
(二)基于大数据分析的范文智能推送
在智能批阅的基础上,我们还可以搭建基于大数据分析的作文网络智能学习平台。通过大数据分析,对学生的中文写作智能批阅数据进行系统分类,结合作文中体现的年龄特点、思维特点、性格特点、语言习惯和写作风格,遴选并推荐与学生特点相匹配的范文,并智能推荐相匹配的群文阅读、众筹阅读信息,形成针对不同层面和特点的学生作文的智能推送,更好地为学生提供个性化的学习资源,从而激发学生自主学习愿望,也为学生的自主学习提供智能的路径指引,养成学生的自主学习习惯。
(三)基于大数据分析的批改数据反馈
在作文教学中,作文评价标准难以准确把握而导致教师作文评价主观性较强、偏差较大的问题一直很难解决。智能批阅之后的大数据分析,则是教师准确掌握作文评分标准、提高作文批改水平的第一手教研资料。教师可以根据这些大数据,自我纠正作文评卷中的认识误差,进一步提升自己的作文阅卷水平。
(四)基于大数据分析的作文标杆库建设
标杆作文是教师在作文评价与作文讲评中经常用到的,但常常因为标杆作文设置的不准确影响到作文评价的质量,也影响到学生作文能力的提升。中文写作智能批阅则能通过大数据的筛选与分析,给教师提供一个海量的标杆作文库。利用这些标杆作文,教师可以进一步领悟与掌握评价的尺度,快速提高作文评分水平。学生也可以利用这些标杆作文了解自我,突破自我,提升写作能力。
(五)基于大数据分析的作文微课资源建设
教师可以依据大数据分析反映出的学情难点,细化知识与能力的关键点,制作相应的微课讲解视频,建立海量的作文微课教学资源,形成作文微课资源“云端”。同时,学生通过使用中的数据记录与积累,可形成对资源的精准定位,然后通过资源特点的标签化,实现学习需求的精准配对。通过不断的配对使用,积累反馈信息,完善资源构成,能够形成适合学生特点的个性化教学微资源库。
此外,微课教学资源库的建设,能够实现对微课资源的智能匹配与智能分析查找,为教师的课堂教学提供更丰富、更适合的微课资源,有效解决课堂效率提升问题,也帮助解决教育资源均衡的问题。
五、中文写作智能批阅的未来发展方向
中文写作智能批阅不仅仅是一种方法上的创新,更是教育理念与教育思想的创新与提升。无论是从创新的角度,还是从未来发展方向的角度看,中文写作智能批阅的开展都非常有价值。
第一,智能批阅将成为作文教学的一种辅助手段。智能批阅只是一种评价形式,计算机只是一种工具,它必须学习人的评价模式之后才能通过复杂的运算开启自己的工作。所以,希望智能批阅完全取代人工作文评分是不现实的,我们应该将智能批阅看作人工作文评阅的一种辅助方式,主动地将作文评价分成智能批阅和人工批阅两类,并根据不同类型的特点拟定相应作文题目和评分标准,体现出两类作文的不同特色。这样,限制与发展相依相存,学生既能在限制的空间里磨炼自己的适应能力与操作能力,也能在发展的空间里尽情想象、尽情发挥,施展个人特色。所以,从全面的角度来看,无须担心智能批阅可能会牺牲个体的个性,也无须担心一些有创意的作文可能被湮没。
第二,智能批阅将成为大数据采集的主要手段。智慧教育将成为未来教育的重要组成部分,大数据的采集与分析将是教研的主要手段,智能批阅在数据的采集方面有着得天独厚的优势,它将承担起写作数据采集的主要任务。
第三,智能批阅的评价维度将更加丰富,各种维度的相关数据将成为学生写作能力检测与分析的依据,并在此基础上研究形成各学段、各年级的写作能力标准,最终形成写作能力测量模型。
第四,智能批阅基础上的智能推送将成为学生作文个性化提升的重要路径。智能批阅产生的相关数据,包括横向的整体数据与纵向的个人数据,将成为分析学生写作能力的重要数据。作文智能平台要根据数据分析出学生写作的盲区与误区,并实施数据标签基础上的范文、微课的智能推送,为学生寻找到适合自己的个性化写作提升途径。届时,计算机不再是冷冰冰的机器,智能批阅也不再是呆滞的统一模板,而会是在智慧教育背景下成为学生个性化写作提升的贴心助手。
第五,智能批阅将给教师的作文教学带来理念上的重大改变,教师将更关注学生作文的相关数据,关注学情,同时更关注微课资源的积累以及资源的共建共享,在学生写作个性化提升方面,给予更多的提升路径指引。学生在教师及大数据分析指引下的智慧自主学习将成为写作能力提升的主要途径。
第六,智能批阅基础上搭建的写作智能平台,以及基于大数据分析而进行的作文微课资源建设,可有效解决目前作文教学师资的城乡差异和校际差异,从另一角度有效解决教育师资均衡的问题。
注:本文系湖南省“十三五”教育科学规划重点课题“大数据时代中小学作文智能网络教育研究与实践”(课题批准号:XJK18JC003)研究阶段性成果。
(作者刘兵系湖南省长沙市教科院基教室主任,中学语文教研员,高级教师;易海华系湖南省教科院初中教育研究室主任,中学语文教研员,副研究员)
责任编辑:孙建辉