对比分析我国英语专业硕士与本科毕业论文的语言错误
2016-06-12邵林
邵 林
(苏州经贸职业技术学院,江苏 苏州 215000)
对比分析我国英语专业硕士与本科毕业论文的语言错误
邵林
(苏州经贸职业技术学院,江苏 苏州215000)
[摘要]在英语学习过程中,二语学习者无法避免地会犯各种各样的语言错误。英语专业的研究生与本科生普遍被认为是高级英语学习者,他们对英语的掌控能力和熟练运用程度已达到或接近英语本族语者。然而,我国英语专业硕士毕业论文和本科毕业论文中仍存在各种各样的语言错误。文章通过对英语专业硕士毕业论文和本科毕业论文的语言错误进行对比分析,旨在探讨中国英语专业硕士毕业论文与本科毕业论文在语言错误类型及频次上的差异。
[关键词]英语专业;毕业论文;语言错误;对比
英语专业硕士毕业论文(MA thesis)被认为是英语专业学生在三年的研究生学习生涯中最为重要的科研成果,是其英语语言综合能力的集中体现。而英语专业的本科毕业论文(BA thesis)也普遍被认为是四年本科学习的一个必不可少的阶段性总结。
英语专业本科生在撰写毕业论文时,恰逢他们备考英语专业八级之时。可以说,在经过大一、大二两学年的基础阶段,英语专业学生接受了听说读写等各个方面全方位的语言基础的夯实。而从大三开始的高年级,国内绝大部分高校的英语专业开始开设包括文学、语言学、文化、笔译、口译等在内的专业课。总的来说,英语专业学生在接受了四年正规的学校教育后,其英语综合能力应有突飞猛进的提高,应具有扎实的基本功、宽广的知识面、一定的相关专业知识、较强的能力和较高的素质。[1]因而,英语专业毕业生独立完成的5 000字左右的英文毕业论文中,不应出现较多语言错误。而英语专业研究生的英语基本功应当更为扎实,而其硕士论文的撰写大约耗时两年,经过了反复的修改,体现了英语专业研究生英语输出的最高水平,应当是最大程度地避免语言错误。
自1967年Corder提出错误分析理论之后,语言错误在语言的教与学的过程中,不再被认为是避之唯恐不及的“失败的例证”,而被越来越多的研究者接受,他们逐渐认同Corder的观点,即:错误可以为教师提供学习者语言被掌握的情况,为研究者提供语言时如何被习得的证据。至此,对语言错误的研究就具有更加积极的意义。[2]
目前,国内语言错误研究更多关注的是英语初级或中级学习者的语言输出,或是以非英语专业大学生的课堂英语书面输出材料为研究样本,[3]却鲜少有针对英语专业学位论文而进行语言错误分析的研究。而少数现存的对英语专业硕士论文的研究,集中在语篇分析,摘要撰写,引言写作等方面。[4-5]而对英语专业本科毕业论文的研究都集中在其写作风格,写作策略抑或是单纯对现有问题的分析及问题解决对策的探讨等方面。[6-8]
英语专业硕士研究生和本科生作为两个相互关联,却又截然不同的群体,他们毕业论文中所出现的语言错误应当具有一定的典型性和代表性,分别体现这两个群体各自的语言使用特点和语言石化之处。本文通过对于英语专业硕士研究生毕业论文和本科生毕业论文的对比分析发现,英语专业硕士毕业论文和本科毕业论文中都仍然存在着较多的语言错误,并在语言错误类型和频次上存在着差异。
本文的研究问题为:(1)中国英语专业硕士毕业论文与本科毕业论文中主要的语言错误类型是什么?(2)中国英语专业硕士毕业论文与本科毕业论文语言错误在频次上有什么差异?
二、研究方法
1.语言研究样本
本文所使用的硕士毕业论文的语言研究样本是下载自中国知网(CNKI)2009-2010年共500篇的硕士毕业论文。为了尽可能地确保语言样本的代表性,所下载的硕士学位论文在研究方向上涵盖了文学、理论语言学、应用语言学和翻译四个子方向,在学位论文所属学校方面覆盖了“985工程”高校、“211工程”高校以及普通高校这三种类型。而每一个子方向中所包含的约21篇学位论文均是在此框架中随机下载的。即实验中所用到的2009年985高校文学方向的约21篇硕士毕业论文,是在“2009年”“985高校”“文学”这三个条件并存的框架下进行检索,从所呈现的论文列表中随机下载。这样做的目的是为了最大限度地确保实验样本的代表性,进而保证研究数据的有效性。本实验所用2009-2010年英语专业硕士毕业论文分布情况见表1。
表1 2009年硕士毕业论文分布情况
由于英语专业本科毕业论文无法在学术网站上直接下载,因而收集起来较为困难。本文所使用的500篇英语专业本科生论文均来自各高校教师所指导过的毕业论文。这500篇本科毕业论文横跨2009-2013年,毕业论文所属学校覆盖“985工程”高校、“211工程”高校、普通本科院校以及三本独立院校。论文内容涉及文学、语言学、翻译、英语教学等方面,尽可能地确保实验样本的代表性,本科生论文分布情况见表2。
表2 本科生论文分布情况
本文中有关英语专业硕士研究生毕业论文的语言错误的分析是某个研究课题的一个部分,因而,硕士毕业论文的语料库相对大一些。本科生毕业论文语料库的建立是为了本文之需。
2.研究工具
本文所关注的是英语专业硕士毕业论文与英语专业本科毕业论文的语言错误对比,考虑到样本容量较大,篇幅较长,一个可信度较高,较为权威的语言错误检测工具是不可或缺的。本文所使用的语言错误检测工具是一个在线语言抄袭度及语言错误检测网站(WWW.turnitin.com)。Turnitin是目前国内外公认的、可信度和准确度相对较高的在线语言错误检测的程序。Turnitin检测的语言错误类型包括文法(grammar)、技巧(mechanics)、使用(usage)、风格(style)。而技巧与风格这两大类的关注点与本文所探讨的语言错误这一指向不符,因而,本文主要就Turnitin检测出的文法和使用两类错误语言现象进行分析。另外,要探讨英语专业硕士毕业论文与本科毕业论文中的语言错误出现频率差异是否具有统计意义,或者说是否具有显著性差异,则需要使用SPSS进行进一步的检验。
3.研究步骤
首先笔者将上述所建的硕士毕业论文语料库500篇以及本科生毕业论文语料库中500篇进行一系列的手动操作,将其转化成WORD格式(Turnitin并不识别PDF等学术论文文本常用格式)。为了尽可能确保研究结果的有效性和检测结果的准确性,笔者对研究中所用到的所有论文进行了必要的删减,只保留论文的主体部分,也就是说,Turnitin所检测的论文语言材料只包括从Introduction到Conclusion部分。由于硕士毕业论文与本科毕业论文在篇幅上差异较大,本文在作对比分析时,采用的是计算每千字错误出现的频率,以此来确保研究结果的可信性。经计算发现,本文中所使用是的硕士毕业论文的平均长度为每篇18 700字,而本科毕业论文的平均字数为每篇5 868词。
另外,就Turnitin文法及使用中所涉及的语言错误而言,本文只关注每千字错误频次超过0.1次的错误,而频次过低的语言错误可能不具备代表性,研究价值较低,本文将不再具体分析。在这里需要说明的是,由于硕士毕业论文篇幅过长,一篇完整论文无法直接上传到Turnitin进行检测,而必须一分为三而后进行上传。也就是说,500篇硕士论文是分为1 500个语篇进行一一上传检测的。而本科毕业论文则可以直接上传检测。由于操作过程中和程序识别检测过程中的一些误差,最终,出结果的硕士论文共473篇,即1 421个语篇。500篇本科毕业论文中,出结果的共488篇。
本文重点探讨的是文法类中的连写句错误、错误或遗漏的字、混淆的句子、代名词上的错误、分裂句或遗漏逗号、主谓一致性、所有格的错误;而使用类别中,本文分析的是遗漏或错误的冠词、混淆的字、单字上的错误、介系词上的错误。
三、研究结果
1.硕士论文与本科论文主要的语言错误类别
(1)将上述所有共961篇本硕论文一一上传到Turnitin,经过一系列较为繁琐的数据处理与整合,其结果显示,硕士毕业论文中(473篇总字数为8 845 100),文法错误出现频次大于每千字0.1的语言错误类型频次由高到低的排列顺序如表3所示:
本科论文(488篇总字数为2 863 584)文法错误出现频次大于每千字0.1的语言错误类型频次由高到低的排列顺序如表4所示:
表3 硕士论文文法错误频次大于每千字0.1的错误列表
表4 本科论文文法错误频次大于每千字0.1的错误列表
在所有文法错误种类中,英语专业硕士论文错误频次大于每千字0.1的错误类型为上述七种。由所列数据可以看出,硕士论文文法(grammar)错误中,分裂句或遗漏逗号与连写句出现频率远高于其他五种文法错误类型。其中分裂句或遗漏逗号出现的频率最高,达到每千字1.42次,占所有本文所讨论的七种文法错误的36.1%;连写句占30.3%;而错误频次第三位的是主谓一致性,占总数的9.2%。此外,校对与所有格上的错误每千字出现频率比较接近。错误的动词和代名词上每千字错误出现频率也都超过0.1次。
而与硕士论文相比,本科论文中错误频次大于每千字0.1的错误类型为六种,这六种错误类型也均出现在硕士论文的文法错误中。代名词上的错误在本科生论文中出现频次小于0.1次每千字。另外,值得注意的是,本科论文中分裂句或遗漏逗号错误出现频次较低,为每千字0.285,仅位列错误出现频次的第六位,即最后一位,仅占每千字错误频次大于0.1总数的11.7%,与研究生论文中的36.1%形成鲜明对比。连写句是出现频率最高的错误类型,占七种错误类型总数的26.2%;其次是主谓一致性,占六种文法错误总数的21%;校对是本科论文第三种最多的错误类型,占这七种文法错误总数的14.5%。所有格上的错误与错误形态的动词出现频次相差无几,均占总错误频次的13%左右。
总的来说,本文中所讨论的英语专业硕士论文文法错误集中在连写句和错误或遗漏的字上,其原因可在以后的研究中探讨。本科生毕业论文文法错误相对分散一些,错误或遗漏的字出现频率相对较高。
(2)同样地,硕士年毕业论文中使用错误大于每千字0.1的错误类型频次由高到低的排列顺序如表5所示:
本科论文文法错误出现频次大于每千字0.1的语言错误类型频次有高到低的排列顺序如表6所示:
表5 硕士论文使用误频次大于每千字0.1的错误列表
表6 本科论文使用错误频次大于每千字0.1的错误列表
就本文所探讨研究的硕士毕业论文与本科毕业论文的样本来看,Turnitin检测出来的这两大类语言材料中每千字错误出现频率超过0.1的使用错误(usage)类型同时都集中在以上四类,并且错误类型由高到低在频次上的排序是完全一致的。
遗漏或额外的冠词这类语言错误,不管是在硕士毕业论文中还是在本科毕业论文中,都占了绝大多数。其中硕士毕业论文中,遗漏或额外的冠词出现频次多达每千字6.70次,而这一数字在本科毕业论文中甚至更高,达到每千字8.26次。此外,介系词的使用错误也相对较高,在硕士毕业论文和本科毕业论文中都接近或超过每千字1次。混淆的字与单字的错误形态这两种错误类型在硕士毕业论文与本科毕业论文中每千字出现的频率较为接近。
2.要进一步探究英语专业硕士毕业论文与本科毕业论文中的语言错误出现频率是否具有显著差异,就要使用SPSS(17.0)社会科学统计软件进行检测。根据实际需要,本文使用的是两组不同受试者数据之间的比较,非参数分析中的Mann-Whitney检验。
将上述每篇论文中的每种错误类型及个数逐一输入到SPSS中,其中,硕士论文属性为2,本科论文属性为1。将硕士论文与本科论文中的7种文法错误以及4种使用错误逐个对比。经过Mann-Whitney检验,呈现出11个秩次检验结果表,本文认为,当显著水平小于0.05时,即为有显著差异;而当显著水平大于0.05时,即为没有显著差异。笔者对这11个错误类型的比较进行逐一检验,发现本文中所使用的这961篇本硕论文里,有以下几种语言错误在统计学上具有显著差异:连写句、错误或遗漏的字、混淆的句子、主谓一致性和遗漏或额外的冠词。究竟是什么原因造成了这五种语言错误在英语专业硕士毕业论文和本科毕业论文中,在出现频率上有显著差异,而其他的语言错误却没有显著差异,笔者在本文中就不进行探讨了。
四、结语
英语专业本科生与研究生在完成毕业论文写作时,绝大多数人已取得国内英语专业最高等级证书,即英语专业八级,应当具备较高的英文书写能力。而本项对于英语专业硕士毕业论文和本科毕业论文的语言错误检测研究却发现,在这些经过反复修改的毕业论文中,仍然存在着各种各样的语言错误。此外,本文所探讨的某些语言错误在硕士毕业论文和文科毕业论文中出现的频率是有显著差异的,而有些语言错误却没有显著差异,背后的原因有待后续研究进行深度挖掘。
[参考文献]
[1]高等学校英语专业英语教学大纲[Z].北京:外语教学与研究出版社,2000.
[2]Corder,S.P.The Significance of Learners’ Errors[J].International Review of Applied Linguistics,1967,(5).
[3]张茜.非英语专业大学生英语写作连贯现状分析——以聊城大学为例[J].哈尔滨学院学报,2014,(2).
[4]张晓兰.英语专业大二学生英语写作错误分析及启示[J].四川外语学院学报,2004,(2).
[5]徐有志,郭丽辉,徐涛.学术论文体裁教学不可或缺——英语专业硕士学位论文引言写作情况调查[J].中国语文,2007,(4).
[6]王俊菊.二语写作认知心理策略研究[J].山东大学学报,2006,(6).
[7]孙文抗.英语专业学士论文写作现状分析[J].外语界,2004,(3).
[8]王崇义.加强毕业论文指导提升学生综合素质——关于本科生毕业论文若干问题的思考[J].外语教学,2004,(6).
责任编辑:思动
A Comparative Study on Language Errors in English Majors’ MA Theses and BA Theses in China
SHAO Lin
(Suzhou Institute of Trade & Commerce,Suzhou 215000,China)
Abstract:In the course of English learning,L2 learners will inevitably commit various kinds of language errors. Graduates and postgraduates majoring in English are supposed to be advanced English learners,who have reached or at least ultimately approached native speakers’ language fluency and proficiency. However,a variety of language errors still find their way into English majors’ MA theses and BA theses. By analyzing language errors in English majors’ MA theses and BA theses,the present article sets out to explore the differences in error types and corresponding frequency between MA theses and BA theses under discussion.
Key words:English majors;MA theses;BA theses;language errors;comparison
[收稿日期]2015-09-28
[作者简介]邵林(1989-),女,安徽蚌埠人,实习研究员,硕士研究生,主要从事应用语言学研究。
[文章编号]1004—5856(2016)04—0089—04
[中图分类号]H319
[文献标识码]A
doi:10.3969/j.issn.1004-5856.2016.04.021