基于语料库大数据的英语写作实证研究
2015-12-28袁昌万金双军
袁昌万, 金双军
(川北医学院外国语言文化系,四川南充637000)
一、引言
写作是人类利用语言工具反映主客观世界、传递信息、表达思想的创造性书面交际过程。从中国古代考试选拔制度的“一文定终身”到“英国唯物主义和整个现代实验科学的真正始祖”(马克思语)培根的经典论断“Writing maketh an exact man”,都反映出写作的重要意义。
“信息技术对教育发展具有革命性影响,必须予以高度重视。”[1]信息技术与语言交叉整合产生的语料库是外语教学研究的有力工具,语料库及其工具应用于英语写作教学,有利于教师主导、学生主体作用的充分发挥,推动学生有效输出,促进知识向能力的转换,显著提高英语写作教学的效果、效率和效益。
二、英语写作的重要意义和教学现状
英语写作能有效推动学习者语言基础知识、技能和综合应用能力的发展,培养其思辨、创新、跨文化交流等素养,是大学英语教学的重难点。它是学习者在内化英语语言知识基础上的书面语言创造,是语言的产出性实践技能,较为客观地体现出学习者的英语综合应用能力。英语写作在体现书面交际的语言工具性的同时,推动人的思想情感交流,促进人的知识、能力、思辨、创新等综合文化素养的全面发展,也体现语言的人文性。英文写作是大学英语教学的重要目的和有效手段,是学习者语言基础和综合应用能力的反映,是英语测试最常见的题型之一。只要题目出得好,作文对考生书面综合运用语言能力的测量最准确,效度最高[2]。
英语写作既是英语教学力争实现的核心目标,也是促进英语知识和技能发展的有效途径和手段。但英语写作水平不容乐观,亟待提高。一方面学生英语词汇、语法等语言知识需要高度内化整合,才能转化为语言应用能力,实现有效的英语写作输出;另一方面英语写作是一个系统工程,涉及语言知识、批判性思维、创新和跨文化交际能力等诸多因素,写作水平的提高是一个缓慢、渐进的过程。加之学生英文写作、教师评分和批改耗时、工作量大,作文评分标准的把握主观性强、一致性难度大,导致教学中存在学生英语写作练习机会少、教师批改压力大等突出问题。
三、国内外智能辅助写作、批阅系统
国内外智能批阅系统在信息技术飞速发展的推动下日新月异,极大地提高了英文写作和评阅的效果和效益。梁茂成等依据写作评分要素,引介了国外具有代表性的三大作文自动评分系统,指出基于不同的核心技术,PEG(Project Essay Grade)重视语言质量分析,忽视内容;IEA(Intelligent Essay Assessor)重视写作内容,但对语言和篇章结构分析不足;影响深远的E-rater兼顾语言、内容及篇章结构,但三者均有待进一步深入[3]。作文自动评分是一个复杂的过程,要充分利用技术手段,围绕语言、内容、结构等评分要素,不可偏废,提高作文评分的信度和效度。
同时,国内英语写作智能辅助、批阅系统获得长足发展,如基于语料库和云计算提供英语作文智能评分批改服务的句酷批改网,体验英语写作教学资源平台系统和冰果英语智能作文评阅系统等。
四、以批改网为例的实证研究
(一)实验设计及相关统计分析
本研究通过实证评价英语作文智能批改系统(句酷批改网),分析基于语料库大数据的英语作文评阅、批改和教学实践,为大学英语写作教学提供参考与借鉴。研究问题包括智能评分系统与人工评分的相关分析,智能评分系统的意义以及进一步提高对文章主题内容分析的建议和方法途径。
研究数据来源于某医学类院校借助句酷批改网的一次英语写作比赛(作文题目:ambition)。要求参赛学生在第一轮纸笔现场定时写作(350人参赛,批改网题号:361554),然后原样录入计算机,提交句酷批改网评分批改;第二轮根据批改网的修改建议,3天内反复修改、提交,开放写作(340人参赛,批改网题号:361555),两轮成绩加权处理为竞赛最终成绩。两轮作文语料简况见表1。
表1 两轮参赛作文语料统计简表(部分)
观察表1发现:361555号作文语料的库容量、形符、类符、类符形符比、标准化类符形符、单词平均词长、句子平均长度等指标比361554号作文语料大。同时,批改网对两子库的共性对比分析发现,361555号作文语料在词汇拼写、常用搭配、语法结构等方面的错误明显减少。说明借助该系统,学生可以较大程度地避免词汇、语法、搭配等常见错误,同时提高词汇的丰富程度和高级学术词汇的比例,并完善句子结构,将文章写长。
完全独立的人工评分员对两轮竞赛作文(借助批改网批改的前后两次作文)的评分(随机抽取30对)见图1。
图1 人工独立评分员对两轮竞赛作文的评分折线图
由图1可知,由于同一评分员的评分基本稳定,具有相对较高的一致性。观察人工评分员对两轮竞赛作文的评分发现,第二轮作文得分(最上面的曲线)整体高于第一轮作文得分(中间的曲线),两轮得分差的平均值为8.7,说明借助作文智能评阅批改系统平台,学习者自主修改,可在一定程度上避免词汇、语法等错误,改善并提高写作质量。
(二)英语写作智能评阅批改系统的意义
将信息技术与英语写作教学深度融合,借助英语写作智能评阅、批改系统,有利于教师主导、学生主体作用的充分发挥,推动有效输出,促进知识向能力的转换,显著提高英语写作教学的效果、效率和效益。
智能批改系统能调动学生英语写作的积极性,通过系统引导、自主修改练习,提高写作质量。智能批改系统能及时给出较为合理的词汇、语法等单项成绩及总分、名次等,有利于调动学习者的积极性。提高分数、名次(修改、提交后分数即有变化)的暂时强烈动力会促使学生选择、探索新的写作方法和手段,分数提高的成就感反过来又会增强英文写作、修改的动力,促使学生课外积极自主探索、主动构建利用语言知识。以此方式良性循环,形成有效的学习策略和强烈的语言文化学习深层动机。引导、激励学习者由重视分数的近期、外在、工具型语言学习动机向对英语语言文化的持久兴趣的内在、融入型动机的转变,最终实现语言学习的目标[4]。
除及时给出分数外,智能批改强调对作文教学的反拨作用,逐句点评,给出修改建议,引导学生个性化“修改”。个体学习者可以借助英语作文智能批改系统即时反馈的词语搭配、语法结构等改进建议,反复修改,进行语言输出实践,在语言的应用实践中主动构建知识,提高英语写作技能。这与王初明教授倡导的“外语写长法”[5]和文秋芳教授强调“输出驱动假设”[6-7]在英语教学中应用的精神实质一致。同时,学习者通过智能批改系统平台,实现师生互动、人机互动、生生互动以及和英语本族语者互动(通过本族语语料库),在即时交互协助中推动英语写作能力的提高。
借助英语作文智能批改系统能显著提高教师作文批阅效率。词汇拼写、常用短语、惯用搭配、语法结构、中式英语等是英语作文中容易出的问题,学生通过智能批改系统可基本避免这些问题,这样老师就可将作文批阅的重心放在对文章主题内容和宏观结构的把握上。教学中老师的引导、监督和管理功能,对作文题目的设计、共性分析(如典型共性错误)以及基于学生个体差异的个性化辅导等成为写作教学的重心。同时,学生英文写作数据的积累便于教师基于大数据开展写作教学研究,来自学习者整体的一手数据资源便于教师观察学习者英文写作的共性、薄弱环节及个性差异。借助系统平台,教师对学生多次修改稿的观察分析,有利于教师把握学习者的写作过程,为作文教学提供参考和支持。
(三)改善提高文章主题内容、语言质量
复核计算机和人工评卷员评分差异较大的个案,分析发现电子评分员重视作文的语言质量,但对主题内容相关程度的掌控有待提高。梁茂成分析认为应使用分析型评分方法,围绕作文的语言、内容和篇章结构对作文进行人工评分,以得到的评分对自动评分模型进行训练。他认可基于潜伏语义分析(Latent Semantic Analysis)的作文自动评分系统IEA(Intelligent Essay Assessor)对作文内容进行分析,该系统通过去除文本中的干扰信息,分析潜在于文本词汇项中的语义之和,挖掘反映文本内容质量的变量,预测作文质量[3]。
在学生的英语写作、教师或智能系统的评分和批改过程中,借助语料库信息技术,统计、分析大样本的学生同题英语写作语料,参照、对比并检索本族语者大型通用语料库,以词为中心,挖掘反映作文主题内容的相关词汇,可供学生写作时深入主题、开拓思路,同时供教师或智能系统评分、批改参考借鉴。
对本次大赛的两轮作文用语料wordsmith生成词频表,以大型通用语料库BNC为参照语料库,生成学生作文语料的关键词(见表2中 Key words列,以 Keyness值高低为序)。同时,以 ambition为检索词,在英国国家语料库(BNC)和当代美国英语语料库(COCA)两大通用平衡语料库中检索(左右跨距均为9,MI>3),检索跨距内与ambition共现的语境高频词(见表2)。
表2 BNC、COCA和学生作文语料中与ambition高频共现词
表2中英国国家语料库和当代美国英语语料库的共有高频搭配词personal,通过语境搭配检索,最常用的搭配形式为personal ambition,而本项目实验对象更多地使用our、my、your等代词。在ambition的动词搭配上,英国英语与美国英语一样,在使用fulfill的各种曲折变化的同时,也常常与动词achieve搭配使用,而实验对象基本不使用fulfill与ambition这一高频搭配。
在COCA语料库中,以WORD(S)=ambition,COLLOCATES=[v*],左右跨距均为9,检索与ambition搭配共现的常用动词,经词目还原归并如下(括号内为出现频次):fulfill(16)fulfilled(15)fulfilling(6);lacks(12)lacked(11)lacking(8);succeed(19);driven(19);motivated(17)。本实验对象在表达“缺乏雄心”等相关概念时高频使用without ambition,或少量使用lack的名词形式,基本不使用其动词形式。同样,也可通过语料库检索ambition与其他词类的共现搭配。通过155 billion库容的Google Books:A-merican English语料库检索ambition的N元组合(ngrams),发现 personal ambition,object of ambition,lack of ambition,selfish ambition等常用搭配。
在COCA语料库中,以“[=ambition]”为检索词,检索出和ambition语义相近的名词,以频率高低为序分别为:hope[s],drive[s],goal[s],dream[s],purpose[s],spirit[s],desire[s],objective[s],motivation[s],aim[s],determination[s]等。进一步的语义分析拓展可通过杨百翰大学学术单词表模块(http://www.wordandphrase.info/academic/)浏览和检索单词的频次,源于英语词汇语义知识库Word-Net的义项、同义词及其追踪检索、常用搭配词及语境检索行,共同构筑形成一个以作文题目相关检索词为中心的立体的语义网络。实验对象在写作中反复使用ambition或ambitions,基本没有同义、近义词替换,词语的多样性匮乏。
通过学习者同题英语作文语料的分析,对作文核心词汇基于语料库大数据的高频共现词汇、搭配及其语义网络的检索分析,有利于学习者开拓写作思路、提高语言质量;便于教师和智能评阅系统把握主题内容,提高英语作文评阅批改的效果、效益和效率。
五、结语
英语写作既是英语教学力争实现的核心目标,也是促进英语知识、技能和综合应用能力发展的有效途径。同时,还有利于培养学习者思辨、创新、跨文化交流等素养,充分体现了英语的工具性和人文性,是大学英语教学的重难点。
信息技术与语言交叉整合产生的语料库是外语教学研究的有力工具。语料库及其工具应用于英语写作教学,改变了当前教学中学生英语写作练习机会少、教师批改压力大的突出问题,极大地提高了师生英文写作和评阅的效果、效率和效益,有利于教师主导、学生主体作用的充分发挥,推动有效输出,促进知识向能力的转换,显著提高英语写作教学的效果和效益。
信息时代以大数据为基础的语料库检索、统计、分析是英语写作、评阅和批改的重要手段和工具,革新了英语写作教学的各个环节。基于语料库的英语写作智能评阅和批改系统,能对学生的英语习作及时、客观地评分和提供词汇、语法等语言质量方面的改进建议。学习者通过智能批改系统平台实现师生互动、人机互动、生生互动以及和英语本族语者互动(通过本族语语料库),在即时交互协助中主动构建知识,推动英语写作能力的提高。
英语写作、电子评阅和批改涉及语言学理论、语言处理技术、信息检索和统计分析诸多方面,是一个十分复杂的过程。在英语写作、评阅和批改中,要兼顾语言、内容和结构等要素,发挥开发智能评阅和批改系统对语言质量分析的准确、高效、快捷优势;积极探索智能系统在主题内容、结构方面的分析预测能力,结合人工评阅的优势,提高大学英语写作教学的效果、效益和效率。
[1]中华人民共和国教育部.国家中长期教育改革和发展规划纲要:2010-2020[M].北京:人民出版社,2010.
[2]杨惠中.大学英语四、六级考试回顾与展望[J].外语界,1998(3):27-31.
[3]梁茂成,文秋芳.国外作文自动评分系统评述及启示[J].外语电化教学,2007(10):18-24.
[4]秦晓晴.中国大学生外语学习动机研究[M].北京:高等教育出版社,2007:3.
[5]王初明.外语写长法[J].中国外语,2005(1):45-49.
[6]文秋芳.输出驱动假设在大学英语教学中的应用:思考与建议[J].外语界,2013(6):14-22.
[7]文秋芳.“输出驱动—输入促成假设”:构建大学外语课堂教学理论的尝试[J].中国外语教育,2014(2):3-12.