APP下载

基于SWECCL与COCA的Learn与Study的对比分析

2016-04-13杨东焕辽宁对外经贸学院公共外语教研部辽宁大连116052

韶关学院学报 2016年3期
关键词:互信息对比分析

杨东焕(辽宁对外经贸学院公共外语教研部,辽宁大连116052)



基于SWECCL与COCA的Learn与Study的对比分析

杨东焕
(辽宁对外经贸学院公共外语教研部,辽宁大连116052)

摘要:基于SWECCL与COCA语料库词汇对比的研究方法,以辽宁对外经贸学院2012级学生作文语料库为例,分析英语写作中的高频词Learn和Study。研究表明,中国学生过度使用了Learn与study“学习”这一词义,而忽略了这两个词的其他词义、词性和用法。

关键词:SWECCL;COCA;互信息;对比分析

现代语料库语言学(modern corpus linguistics)是20世纪中后期兴起的一门语言研究科学,是指专门对大规模储存于计算机里的语料库进行研究的学问[1]。本研究使用了三个语料库,一是中国学生英语口笔语语料库Spoken and Written English Corpus of Chinese Learners(以下简称SWECCL);二是美国当代英语语料库Corpus of Contemporary American English(以下简称COCA);三是笔者自建的语料库,即收集辽宁对外经贸学院2012级学生作文建立的辽宁对外经贸学院2012级学生作文语料库(以下简称2012级学生作文语料库)。SWECCL是由文秋芳、梁茂成和宴小琴共同完成的。文秋芳负责总体设计与审定,梁茂成负责语料库建设,宴小琴负责口语语料库的转写与校对工作。SWECCL采集于我国本科扩招后英语专业学生(2003-2007年)的语料,代表了我国高校扩招后的教学效果和扩招后学生的英语口语和书面语水平。COCA是由美国Brigham Young University的Mark Davies教授开发,目前单词容量为4.25亿,是美国最新的当代英语语料库,也是当今世界上最大的英语平衡语料库。该语料库的语料来自1990-2011年,每年更新,检索功能强大。

一、研究方法与工具

在进行语料库检索之前,首先参阅了《朗文当代高级英语词典》对于learn和study两个词的具体解释,供对比研究使用。

本研究基于2012级学生作文语料库、SWECCL 与COCA三个语料库:首先,使用AntConc3.2.0软件在2012级学生作文语料库中检索learn与study的使用情况;其次,在SWECCL中检索这两个词的搭配情况;第三,在COCA中检索这两个词的搭配情况;对检索到的结果进行对比分析,总结中国学生与本民族学生使用learn和study的差异性。

二、研究过程

(一)2012级学生作文语料库中learn与study的使用情况

笔者在批改学生作文时发现了learn和study在使用中出现了一些问题,于是把学生作文收集起来,建立了2012级学生作文语料库。用AntConc以左右各三个词的跨距提取learn和study搭配词。在2012级学生作文语料库中,名词与learn搭配频率排在前100位的词是English,people,knowledge,words,students,internet,help,something,language等;名词与study搭配频率排在100位的词是English,students,college,classes,school,class,time,knowledge,opinion等;与learn和study两个词都能搭配的词有:English,knowledge,students,life,people,class。从以上分析结果可知,在2012级学生作文语料库中,learn和study的使用情况无明显的差异。

(二)SWECCL中的learn与study使用情况

2012级学生作文语料库是否能代表目前中国大学生的实际英语水平呢?2012级学生作文语料库中learn与study的使用情况与其SWECCL中的使用情况是否一致呢?于是笔者同样使用AntConc以左右各三个词的跨距提取learn和study搭配词。在SWECCL中,名词与learn搭配排在前100位的名词按从前到后的顺序为:children,knowledge,things,English,university,people,students,time,society,life,education,something,school,skills;名词与study搭配排在前100位的名词按从前到后的顺序为:university,life,students,time,knowledge,English,English,schoo l,people,studentCollege,children,things;与learn和study两个词都能搭配的词有:knowledge,English,things,time,life,university,students,children,school,people.因此,在SWECCL中,learn和study的使用情况没有明显区别。

综合以上对2012级学生作文语料库以及SWECCL的检索结果的分析可知,中国学生对于learn和study的使用情况无显著的差异性。

(三)COCA中learn和study的使用情况

1.Learn在COCA中使用情况分析

在COCA检索栏中输入learn一词,collocation选择搭配跨距都选择1,POS LIST选择NOUN ALL(所有名词),SORTING选择RELEVANCE,然后点击SERACH进行检索。

从检索结果可知,在以learn为节点词,learn右侧的跨距为一个词,按互信息值由高到低排列前100位的统计结果如下:English(英语),braille(布莱叶盲文),hebrew(希伯来语),mathematics(数学),math(数学),lessons(教训,功课),skills(技能,技巧),languages(语言),patience(耐心,毅力),(纪律,学科),concept(概念,想法),statistics(数据),stratigies(战略),survival(幸存,存活),responsibility(责任),techniques(技术,技能),French(法语),I-talian(意大利语),things(情况),songs(歌曲),science(科学)。从learn右侧出现的词可以看出,learn一词最常见的搭配是语言类名词,比如English,braille,hebrew,Italian,French,还有语言languages本身等;其表中English排在第二位,互信息值为5.01,可见learn English在COCA中使用频率非常高。其次是学科类名词,如mathematics,math,science,等等。第三是技术、技能类名词,如skills,techniques,等等。Lessons在COCA检索结果中与learn的互信息值排在第24位,MI值3.38;learn lessons在COCA中释义均为词典第(5)、(6)种解释:从错误中学习,吸取教训;(从错误和教训中)学会某事。由此可见,learn lessons在COCA中使用频率很高。

从learn一词的检索结果并未找到learn与knowledge(知识)的搭配的情况,由此可知learn与knowledge搭配的情况在COCA中是不存在的,换句话说,把英语作为母语的人不使用learn knowledge这种搭配。

2.Study在COCA语料库中使用情况分析

在COCA检索栏中输入study一词,collocation选择搭配跨距都选择1,POS LIST选择NOUN ALL(所有名词),SORTING选择RELEVANCE,然后点击SERACH进行检索。

从检索结果可知,与study搭配的相关词汇按互信息值由高到底排列的情况可知,与排在100位的词搭配使用时,study绝大多数情况都作为名词使用,词意为词典中对于study的第(1)种解释,即“研究,研究报告”,如:great-books study,multicentre study,feasibility study,a study coauthor,a cohort study,a pilot study,a Bible study,a case study,等等;study作为名词使用还涉及了词典中对于study的第(2)种解释,即:“自习时间,自修课”,只有一个词:a study hall。

按互信息值由高到低排列在100位的搭配词中,Study作为动词词性使用,只检索到如下7个短语:to study syphilis(研究梅毒),to study anatomy(研究解剖学),to study protocol(仔细研究外交礼仪、草案),read,and study scripture(研究《圣经》、经文),to study hypotheses(研究假设),to study math(学习数学),to study journalism(攻读新闻业、新闻写作)。Study在作为动词词性使用时,词意涵盖了词典中的三种含义,即“学习,攻读;研究;仔细研究(计划,方案等)”,且“研究”这一词意出现频率最高。

Study作为动词使用的情况如何?在COCA检索栏中输入study.[VVO],collocation选择搭配跨距都选择1,POS LIST选择NOUN ALL(所有名词),SORTING选择RELEVANCE,然后点击SERACH进行检索。

从检索结果对比可知,study一词作为名词使用频率很高,而作为动词在COCA中使用的频率很低。从检索结果中查到了study music,study technology,study algebra(代数学),study earthquakes,study computer,study math,study melody(旋律),study art,study laws,study English,study geology(地质学),study nematodes(线虫类),study things,study sample,study physics(物理学),study works,study typography(印刷术),study history,study objects,study orbit(轨迹),study arthritis(关节炎),study literature,study Latin,study science,study engineering,study architecture,study opera,study psychopaths(精神病患者),study Greek,study morality,study language,study genetics,study Hinduism(印度教)等等。从这些搭配可知,study一词在study music,study technology,study algebra,study physics,study laws,study geology,study English,study Latin, study Greek,study language这些搭配中释义为“学习,攻读”,而在其余的搭配中释义均为“研究”,这与study在按互信息值由高到低排列的情况一致。

在COCA中,study无论是作名词使用,还是在作为动词使用,均未查到Study knowledge这种搭配,这说明study knowledge这种搭配在COCA语料库中是不存在的。

三、研究结论

(一)learn的使用情况对比分析

中国学生普遍使用learn一词在词典中的第(1)种解释,即“学习、学到、学会”;第(5)、(6)种解释,即“从错误中学习,吸取教训”,Learn lessons在COCA语料库中使用频率很高的用法,中国学生几乎没涉及到。中国学生过多使用了learn一词作为“学习;学会;学到”这一含义,而过少使用了learn其他含义和用法。

(二)study的使用情况对比分析

对于study一词,中国学生普遍使用它的动词词性,即在词典中作为动词使用的第(1)种解释的“学习,攻读”。检索结果中出现了the study,our study,in study等,study作为名词使用时,含义仍然是“学习”。而COCA中study一词主要作为名词使用,释义为词典中的作为名词使用的第(1)种释义“研究,研究报告”;study作为动词使用在COCA语料库中出现的频率很低,检索到搭配词的释义主体为词典中作为动词使用的第(3)种解释“研究”,部分涉及到了第(1)种释义“研究,攻读”。由此可见,中国学生过多使用了study动词词性的用法,而过少使用了名词词性的用法;从词意角度,中国学生过多使用了study释义为“学习”的用法,过少使用了study释义为“研究”的用法。

(三)learn English与study English

learn English在COCA检索结果中,按互信息值由高到低的统计结果出现在第二位,由此可知learn English在COCA中使用频率非常高。而study作为动词在COCA使用频率非常低,尽管检索到了study English这种搭配,但是使用频率极低。因此,涉及到“学习英语”这一概念时,建议使用“learn English”,而不是“study English”。

(四)learn knowledge与study knowledge

无论是learn knowledge还是study knowledge,在COCA中均未检索到这种搭配,acquire knowledge是常见的表达方式。由此可知,learn knowledge与study knowledge是中国学生依据自己的母语“学习知识”这一概念翻译得来的Chinglish(Chinese English),因此要杜绝使用。

本研究基于SWECCL与COCA两个语料库,以2012级学生作文语料库中learn与study的使用情况为例,分析中国学生与本民族学生对learn和study用法的差异性。语料库为语言教学提供了一种全新的视角和研究思路,它既是一种资源又是一种方法,具有巨大优势。科学恰当地利用语料库进行研究,可以使语言教学和研究更加富有成效。

参考文献:

[1]何安平.语料库语言学与英语教学[M].北京:外语教学与研究出版社,2004:1-2.

(责任编辑:廖铭德)

The Contrast Analysis of“Learn”and“Study”based on SWECCL and COCA

YANG Dong-huan
(Public English Department,Liaoning University of International Business and Economics,Dalian 116052 Liaoning,China)

Abstract:Chinese students use“learn”and“study”frequently when write compositions,while they don't understand the usage of the two words actually. The results of the study,which analyzes the differences between “learn”and“study”based on SWECCL and COCA,indicate the overuse(the overuse or something used rarely)of “learn”and“study”in their articles,and give a suggestion that Chinese students should grasp the usage of“learn”and“study”as soon as possible.

Key words:SWECCL;COCA;mutual information;contrast analysis

中图分类号:H314

文献标识码:A

文章编号:1007-5348(2016)03-0177-04

[收稿日期]2015-11-25

[基金项目]辽宁省高等教育学会“十二五”高校外语教学改革专项2015年度重点课题“高校学生英语作文中出现的跨文化语用失误研究——基于SWECCL与COCA语料库的分析”(WYZD150017);辽宁对外经贸学院2013年度校级教学改革研究项目“提升非英语专业学习者英语写作能力的途径与方法研究——基于语料库的研究”(2013XJJGYBXM23)

[作者简介]杨东焕(1975-),女,辽宁大连人,辽宁对外经贸学院公共外语教研部副教授,硕士;研究方向:跨文化交际及语料库语言学。

猜你喜欢

互信息对比分析
基于改进互信息和邻接熵的微博新词发现方法
戴·赫·劳伦斯《菊馨》三个版本对比分析
成渝经济区城市经济发展水平比较研究
采用目标区域互信息的星空图像配准
英汉动物词汇文化内涵的对比分析
基于互信息的贝叶斯网络结构学习
联合互信息水下目标特征选择算法
基于数据库的唐诗宋词对比研究
改进的互信息最小化非线性盲源分离算法
基于增量式互信息的图像快速匹配方法