基于语料库的工科学生英语写作中的词汇研究
2016-12-20杨家明石永珍
杨家明,石永珍
(西北工业大学 外国语学院,陕西 西安 710129)
基于语料库的工科学生英语写作中的词汇研究
杨家明,石永珍
(西北工业大学 外国语学院,陕西 西安 710129)
基于批改网139名工科学生的英语作文语料,统计分析其中实词的使用、基本动词结构掌握、常用动词搭配。结果表明,范围上,工科学生英语写作中实词词汇使用范围小,范围狭窄,产出性实词非常有限,对生活中常用动词掌握好,能熟练正确使用基本动词的搭配但受母语影响较大;数量上,对大部分动词只会识义,学生能熟练使用的词块数目较少,长度偏短,缺乏应有的变体,尽管词汇认知量很大,但在写作中相对本族语使用者更倾向用基本动词。因此,教师在加强词汇教学的同时,应重视学习和记忆英语语块,将消极词汇转化为积极词汇,本研究对二语习得和教学具有启示意义。
语料库;词汇;写作
英语的输出一般体现在两个方面,一是口语输出,二是写作输出。由于口语输出具有语料收集困难等缺点,写作输出相对来说更易于研究,因此工科大学生的英语写作教学研究,一直是应用语言学研究的焦点。一方面工科学生相对于英语专业学生在英语学习时间上的限制,迫切需要找到英语输出的标准,语料库可以提供客观详实的语言证据,揭示最典型的语言特征,发现语言在实际中的使用规律,反映语言的真实面貌,为开展各种语言教学研究提供真实、可靠且丰富的数据资源,即学生通过了解本族语者词汇使用习惯,提高自己的写作水平;另一方面,受应试教育的影响,目前大学生英语写作因语言输入量不足,我国工科学生在写作用词上有比较明显的倾向,中国学生使用的语块与本族语者相比有较大差异,具有口语化倾向[1]。丁言仁、戚炎发现,在英语口头复述故事和限时写作中无论是口语还是写作,学生个体之间在词块使用上存在较大差异[2]。本文旨在探究工科学生在英语写作中的用词倾向,揭示他们的词汇运用原则。
一、基于语料库的写作词汇研究现状
当前,国内学者基于语料库对二语学习者词汇的研究较多,使用学习者语料与本族语语料对比的研究中,王立非、张岩的 “基于语料库的大学生英语议论文中的语块使用模式研究”用SWECCL(中国学生英语口笔语语料库)语料库的作文字库参照LOCNESS(The Louvain Corpus of Native English Essays,书面语料来自美国大学生写的英语议论文)研究中国大学生英语议论文中语块的使用特点,中国学生使用的语块与本族者相比有较大差异,具有口语化倾向。王立非、陈功的“大学生英语写作中的名物化现象研究”通过对比中国大学生(WECCL)和英语本族语者(LOCNESS) 的英语作文语料,得出结论,中国学生的名物化总体使用不足,名物化随英语水平的提高呈现上升趋势。刘向红、王家义等的“基于语料库的工科学生英语写作用词特点透视”分析工科学生作文中实词的使用、基本常用动词结构的掌握和虚化动词现象,作文语料来自真实的学生作文,将学生作文输入电脑,对文本进行相应处理,用AntConc软件统计分析后得出学生在写作中使用的产出性实词非常有限,学生使用虚化动词的频率较低。
较前人的研究,本研究使用的是基于批改网工科学生的真实语料,句酷批改网是辅助老师批改英语作文的在线服务系统,能对学生提交作文各项数据进行科学系统的分类,结果相对于研究者手动输入真实客观,避免因此产生的偶然误差。中国大学生口笔语语料库中的语料来自英语四六级考试,近年来学者对它的使用比较频繁,基于批改网的工科学生词汇研究较少,笔者希望借助真实语料对学生写作用词特点进行探究,希望对教学和二语习得有启示。
二、研究目的与方法
本研究采用语料库的方法,通过分析试图回答以下三个问题:(1)工科学生写作中实词的使用情况如何;(2)对常用动词+名词搭配掌握是否准确;(3)中国学生使用词汇和本族语者相比存在哪些差异。
相应语料来自西北工业大学139名工科大一学生的英语作文“We Are What we Read”,学生需要在规定的时间内(一周)上交作文至批改网。用于参照的本族语语料库为The Corpus of Contemporary American English(美国当代英语语料库,目前单词容量为4.5亿,同时也是世界上最大的英语平衡语料库)。本研究对每万词为单位的标准化频数进行对比,采用卡方检验验证中国工科学生和本族语者词汇使用是否具有显著差异性。
三、结果与分析
将上述学生的作文作为语料,基于批改网统计和分析这些语料。该语料共139篇作文,单词的总词数为31505个,总句数1876句,最长句有92个单词,平均句长为16.79个单词。
如表1所示:动词的使用数量最多,比例占到25.23%,其次是名词、形容词、介词、副词、代词、连词。
表1 作文中的词性分布
表2 中外语者动词、名词对比(万分率)
频数万分率批改网学生作文COCA语料库批改网学生作文COCA语料库动词61608377426225231861名词52349975576421432216
动词和名词万分率分别为2523,2143,相比于COCA语料库中的1861,2216,我国工科学生动词使用多662频次,差异性十分显著,笔者发现,相对于本族语者,工科学生使用的句式简单,大多主谓句式,主观性强,口语化而且句子长度较短,因此动词频率较高;名词使用少73频次,差异性不是十分显著,原因主要是我国学生名物化总体使用不足,相对于本族语者名物化意识薄弱,文章结构单一。
为了使研究结果更科学,笔者将与作文有关的主题高频词(read/learn)进行删减,将选择前二十位的11个动词进行分析,卡方检验其差异是否具有显著性。
表3 动词详细分析 (负值代表本族语者使用多于所选作文语料)
频数万分率批改网学生作文COCA语料库批改网学生作文COCA语料库卡方值Be929146548466295325-1.45Can56119760741784480.88∗∗∗Have232501360573111-7.84∗Do18138158615784-5.17∗Make163993365522212.13∗∗Think145911214462010.24∗∗Will145211493346470.01Know12598762340225.22∗get107107854034241.72shall9437127230911.32∗∗may4364800814140.00
P<0.05
(一)Be动词(is/am/are/was/were/isn’t/weren’t/been/being)
工科学生作文中“be”动词每万词中频数为295/每万词,比本族语者的325/每万词少30频次,但该差异并不显著(卡方检验χ2=-1.45,小于卡方理论值3.84,df=1,p<0.05) 。分析作文发现,作文中be动词使用频率最高的是现在时态以及“wh从句”,我们可以推断,一方面,虽然学生对基本句法都掌握,但简单句式还在作文中占有很大比重;另一方面,学生也在作文中尝试使用能够体现高水平英语写作水平的同位语从句,that从句,但是使用数量不够。
(二)情态动词(can/will/shall/may)
学生对情态动词can的使用频数为178/每万词,比本族语者的44/每万词多138频次,差异性十分显著(卡方检验χ2=-80.88,远远大于卡方理论值3.84,df=1,p<0.05),反映出学生对该词的过度使用。分析其中原因,一方面由于语料的容量较小,使得该词比频数较突出,另一方面can的过度使用反映出学生写作用词倾向,大部分学生倾向使用can的“能够,能”之意,在议论文中就更加突出,学生大多使用该词表达“阅读能使人受益”“通过读书能使人了解世界”等意思。
学生对will的使用频数较少,与本族语者差异并不显著,对于will,学生倾向使用其将来的用法,而在该议论文中,对此种词义需求不高。
学生对shall(shall/shan’t/should/shouldn’t)的使用频数为30次/每万词,相比于本族语者9次/每万词,高出21频次,差异性显著(卡方检验χ2=-11.32,大于卡方理论值3.84,df=1,p<0.05)。学生对should的使用远远多于本族语者,一方面,学生用该词在议论文中强调“应该,不应该”之意,多为“提出建议、办法”,我们在生活中也经常使用表达该意思的汉语,而本族语者对该词的使用偏少,笔者对该词在COCA语料库中进行检索、发现,该词的使用频率呈现逐年下降的趋势,如表四:
表4 should在COCA的历年用词总数
笔者认为原因可能是“shall/should”表达“义务,劝告”的含义被较多使用,而在本族语者的语言中,大多数人遵循礼貌原则从而尽量避免使用该词汇。
学生对May的使用与本族语者差异并不显著,一方面该词主要表“委婉语气”,在作文中能够使用该用法的地方较少,另一方面对于该词,本族语者的使用数量也呈现出逐年下降趋势。如表五:
表5 May在COCA历年用词总数
Have(have/has/haven’t/hasn’t/had/hadn’t)
在学生作文中出现的频数为73频次/每万词,比本族语者111频次/每万词少38 次,(卡方检验χ2=-7.84,大于卡方理论值3.84,df=1,p<0.05),差异性显著。学生作文多使用have “有,拥有”之意,现在时态用法较多,意思多集中于“有影响,有用处,有态度等” ,很少使用have的完成时态用法。 本族语者对“have”使用较为平均。
Do(do/did/does/don’t/didn’t/doesn’t)
学生对助动词“do”的使用在作文中出现的频数为57频次/每万词,比本族语者84频次/每万词少17次,(卡方检验χ2=-5.17,大于卡方理论值3.84,df=1,p<0.05),差异性显著。学生在作文中多使用“do+动名词”的搭配,例如“do reading/do practice等”,相对于本族语者,有过度使用此用法的倾向。
(三)实义动词
学生对实义动词make的使用频数为52/每万词,比本族语者的22/每万词多30频次,(卡方检验χ2=12.13,远远大于卡方理论值3.84,df=1,p<0.05)差异性显著,体现出学生对此动词过度使用。“make”是中国学生作文出现的高频实义动词,在表达相关用法时(犯错/取得成就)是学生经常使用的动词,这显然跟平时的强化练习有关 ,“make mistakes/make achievement”此类词组经常被重复练习,学生对此用法较熟悉。
Think:学生对实义动词think的使用频数为46/每万词,比本族语者的20/每万词多26频次,(卡方检验χ2=10.24,大于卡方理论值3.84,df=1,p<0.05)差异性显著,体现出学生对此动词的过度使用。一方面, 差异性显著的原因是该动词的意思跟本文的主题较为贴近,学生容易联想到该词,另一方面,此动词被学生广泛使用在宾语从句中(think that) 中,议论文引用此种用法能够使论述更有说服力,此种用法也跟平时的强化练习不无关系。本族语者对该词的使用没有那么多,主要原因是think表达主观意愿强烈,在文章中使用只能表达作者的主观意愿,不够有说服力,造成这种差别的原因也跟各自的思考角度不无关系。
Know:学生对实义动词know的使用频数为40/每万词,比本族语者的22/每万词多18频次,(卡方检验χ2=5.22,大于卡方理论值3.84,df=1,p<0.05)差异性显著,体现出学生对此动词的过度使用。学生主要使用该词的“了解/认知”之意,与本族语者差异大也可能是由于学生能够灵活使用的词汇数量有限,对能表达此意的 “acknowledge/understand”不能在写作文时灵活使用。
Get:学生对实义动词get的使用频数为34/每万词,比本族语者的24/每万词多10频次,差异性不显著,分析具体用法发现,学生多使用该词“得到”之意的用法“get knowledge/get job”。
(四)作文中的搭配分布,以knowledge为例
分析学生作文中的搭配错误,发现中式英语在学生作文中出现较多。 以 “knowledge”为例:
表6 knowledge搭配
由此表可以看出学生对“knowledge”高频搭配有 “get knowledge*/acquire knowledge/increase knowledge/learn knowledge/give knowledge/remember knowledge”,我们对所有搭配在COCA中进行检索,发现“get knowledge/learn knowledge/give knowledge/remember knowledge”在COCA中的使用频率极低,即本族语者在平时不会使用此用法,由此可以判定为错误用法,但是在学生作文中却高频率出现,分析其中原因,我们发现,“get knowledge/learn knowledge/give knowledge/remember knowledge”这些词组在汉语中都可以找到对应用法“获取知识/学习知识/给予知识/记住知识”,由此可以推断,学生此类搭配使用受到汉语的影响很大,可以看做是母语的负迁移作用。
四、教学启示
本研究发现,中国非英语专业大学生写作中情态动词存在过度使用的现象,与本族语者差异性十分显著;搭配的使用受到母语影响较大,有些搭配错误可能一直存在,需要教师在指导过程中帮助学生意识到错误并纠正,因此通过语料库来帮助教学是很有必要的。语料库会帮助我们识别经常使用的中式英语,帮助我们发现传统词语辨析所不能发现的一些差异性特征或以更全面和更准确的方式揭示传统词语辨析曾发现的某些差异性特征[3]。学生写作中能够使用的产出性实词非常有限,大部分学生只会使用最基本的实词,学生对常用动词结构掌握较好,但在使用过程中受母语影响大,出现搭配不符合英语习惯的情况。虽然大学英语一直强调学生词汇的扩大和丰富,但仅仅满足消极词汇的增加,对积极词汇的正确使用和全面掌握不深入,没有有意识地促进消极词汇向积极词汇转化。此外,学生受母语影响,动词搭配中常出现中式搭配现象。为了更好地解决这一问题,教师可以强化学生对词块的学习,可以指导学生进行模拟填空写作练习,再进行自主写作练习,不仅使学生掌握动词结构,也能学会正确搭配,帮助学生正确、灵活使用它们,帮助学生使用更多样化的词汇、更长的单词、更多被动语态和名词,对减弱学习者书面语中的口语化倾向,有效促进学生表达能力,增强作文连贯性和流利度有一定帮助。
本研究的不足之处在于,学生的语料数量较小,统计不够全面,本族语语料库的人工检索会带来一定的误差,统计的范围不够,只对动词、名词进行分析,对形容词、介词和常用搭配没有统计全面,有一定局限性。
[1]董洪学,初胜华.基于计算机网络语料库驱动的英语写作教学模式研究[J].外语电化教学, 2010,(9).
[2]丁言仁,戚焱.词块运用与英语口语和写作水平的相关性研究[J].解放军外国语学院学报, 2005,(3).
[3]王立非,马会军.基于语料库的中国学生英语演讲话语立场构块研究[J].外语教学与研究,2009,(9).
[4]刘向红,王家义等.基于语料库的工科学生英语写作用词特点透视[J].外语学刊,2009,(2).
[5]王立非,张岩.基于语料库的大学生英语议论文中的语块使用模式研究[J].外语电化教学,2006,(8).
[6]王立非,陈功.大学生英语写作中的名物化现象研究[J].中国外语,2008,(5).
(责任编辑:王丽)
Based on 139 engineering students’ writing materials, the author analyses the use of lexical verbs, the mastery of basic structure of verbs, and the common collocation of verbs. According to the results, the author concludes that the range of verbs used by the engineering freshmen is limited, they are still good at using the basic verbs and collocation and their mother tongue influences their writing a lot; although the students can memorize the verbs they learned, they can hardly transform these negative verbs into positive verbs. Therefore, the teacher should guide the students to realize the importance of chunks, and help them to focus on the use instead of the memorization.
corpus; vocabulary; writing
2015-09-05
杨家明(1992-),男,山东肥城人,西北工业大学外国语学院在读硕士,主要从事特殊用途英语研究;石永珍(1964-),女,甘肃兰州人,西北工业大学外国语学院副教授,硕士生导师,主要从事英语语言学及应用语言学、专门用途英语研究。
H315
A
(2016)01-0033-05