WECCL和LOCNESS中 议论文口语连接词对比研究
2010-01-19张建武李敦之
张建武 李敦之
摘 要:本文运用语料库的研究方法对比了WECCL 和LOCNESS两个语料库中议论文连接词的语体风格。研究发现中国英语专业大学生议论文中口语化连接词的使用总量显著高于本族语大学生的使用总量。导致这一结果的原因是对连接词语域的直觉判断、连接词教学的缺陷以及语言习得过程中的发展因素。最后,本文从连接词的语域角度对英语写作教学给出了一些建议。
关键词:语料库;语域;直觉判断;发展因素
中图号:H314.2文献标志码:A文章编号:9451(2009)02-114-04
A Contrast of Connectives with Spoken Feature
BetweenWECCL and LOCNESS
ZHANG JianMwu,LI DunMzhi
(Department of International Studies,Xian Technological University,Xian 710032,China)
Abstract:A contrastive study is made by using a corpusMbased method of connectives in WECCL and LOCNESS to investigate the use of connectives with spoken feature.The study found that Chinese English majors use significantly more connectives with spoken features than native college students do,intuitive judgement,insufficient instruction and developmental factor account for the finding.The pedagogical implication of this study is to shed some light on the instruction of EFL writing in terms of register of connectives.
Key Words:corpus;register;intuitive judgment;insufficient instruction;developmental factor
作为一种衔接手段,连接词对于文章的连贯起着重要作用,是构建语篇不可缺少的要素。相比较而言,连接词是中国学生使用比较频繁的一种衔接手段。
与其他词类一样,语域的概念也同样适用于连接词。作为在英语写作中必须考虑的一个因素,连接词的语域会在一定程度上影响文章的整体写作风格。如果连接词的风格与文章的其余部分不相匹配的话,那么整个文章的语体风格必将受到影响。英语议论文属于正式的书面文体,也是大学阶段使用较多的一种文体。在一定程度上,频繁使用的连接词,对于文章的风格肯定有所影响。
对于中国英语专业大学生而言,英语是他们的外语,其二语写作在很大程度上是对目标语的模仿,包括连接词使用。而模仿的前提是对本族语大学生作文中的连接词语域有一个清楚的认识。基于这种认识,对中国英语专业大学生的英语作文和本族语大学生的作文就所使用的连接词的语体风格做一个比较,找出二者之间的差别,并给今后的英语教学以启示就显得非常必要。
一、研究方法和程序
人们普遍接受的一个观点就是不正式的词语通常用于口头英语,而正式的词语则多用于书面语体中。连接词也不例外。依据这个原则,可以通过对比出现于口头英语和书面英语中连接词的频率的方法来判断一个连接词的正式与否。由于议论文属正式语体,本文将采用语料库的方法来调查具有口语特征连接词的总量,以揭示出中外大学生英语作文中连接词总的语域倾向。
(一)WECCL和LOCNESS语料库简介
本文所采用的语料库为WECCL(Written English Corpus of Chinese Learners)和LOCNESS(Louvain Corpus of Native English Essays)。有关两个语料库的详情见表1。
西 安 工 业 大 学 学 报 第3卷
成和王立非等人于2005年建成的一个学习者语料库,总容量约200万词。WECCL语料库是它的一个书面语子语料库,本文采用其中所有的议论文,共约100万词。
LOCNESS 语料库是由比利时Louvain大学的Sylviane Granger教授主持建立的一个英美本族语大学生作文的语料库,其总容量约32万。本文采用其中所有的议论文,共约24万词。
(二)第三方语料库简介
语料库有许多功能。一个连接词正式与否可以借助第三方语料库来判断。在众多的语料库中,BYUMBNC (British National Corpus)语料库因其巨大的容量和独特的设计而被本文采用来判断连接词的语域。BYUMBNC 是由Brigham Young University大学的MarkDavis 建立的在线语料库,其网址是:http://corpus.byu.edu/bnc/。BYUMBNC的总规模约1亿词,其中包括1000万词的口语语料和1530万的学术英语语料。当出现BYUMBNC不能判断某些连接词语域的情况时,则另一个语料库COCA(Corpus of Contemporary American English) 将被使用。COCA也是一个由Mark Davis 建立的在线语料库,其网址是:http://www.americancorpus.org/。该语料库的总容量约3.85亿词,其中口语语料和学术英语语料分别为7880万和7620万词。在这两个容量如此巨大的语料库的帮助下,每一个被选用的连接词的总的语域趋势将会被揭示出来。
之所以采用BYUMBNC和COCA这两个语料库的另一个原因是它们的特殊设计。在这两个语料库的界面上有许多区域划分,如口语、小说、新闻和学术等,它们清楚的表明每一个检索请求在这些区域中的分布情况。
(三)连接词检索及处理
经调查,在WECCL和LOCNESS中大约有70个经检验已经在原始频率上达到显著性差异的连接词。这70个连接词将被在BYUMBNC或者COCA中使用检索软件AntConc 3.2进行检索。由于这两个语料库的特殊设计,很容易获得每一个连接词在口语和学术英语两个部分的分布情况,并计算这两部分之间的显著性差异,从而判断出他们的语域。学术英语是典型的正式书面语,可以作为议论文的代表。所有具有口语特征的连接词被集中以作进一步的研究(见表2)。
为了更加清楚地阐述这一研究方法,现以连接词first of all为例来加以说明(见图1)。图1 展示了first of all 在BYUMBNC语料库中检索以后在不同区域的分布情况。从柱状图的形状上来看,first of all显然多用于口语之中,有着很强的口语特征。但是为了避免主观臆断,保证研究可靠性,
本文使用对数似然性函数(LogMlikelihood)以便从数据上进一步对连接词的语域加以确认。对数似然性函数可以替代卡方检验,且比卡方检验更加可靠。在本文中玃值设置为P<0.01,即当对数似然性值大于6.63时,可以99%地认为比较双方存在显著性差异。经过计算,在口语部分和学术英语部分之间,first of all的对数似然性值为740.65,表明first of all是一个具有很强口语特征的连接词。表2中的连接词都是使用这种方法经过检索和处理的。
二、结 果
表3表明在WECCL中有25个连接词具有口语特征,其总频率是5448,占70个连接词总频率的45.98%;而在LOCNESS中有21个是具有这种特征的连接词,其总频率是360,占59个连接词总频率的32.72%。经对数似然性函数检验,对数似然性函数值为+61.89(玃<0.01),表明WECCL和LOCNESS中具有口语特征的连接词所占的比例已达到显著性差异。“+”表示经LogMlikelihood检验,与LOCNESS相比,具有口语特征的连接词在WECCL中过度使用。
研究结果表明,与本族语大学生相比,中国英语专业大学生的连接词具有更强的口语特征,这表明中国英语专业大学生的作文从连接词方面讲属于口语和书面语的混合文体。尽管本族语大学生作文中也存在口语化连接词,但相比之下,无论从类型还是数量上讲,都少于中国英语专业大学生所使用的程度。
三、讨 论
为了能使本研究结果对今后的英语写作教学有所启示,本文对两类作文中连接词语体风格所表现出的差异的原因进行了调查。
(一)直觉判断
一般来说,中国英语专业的大学生具有较强的语体意识,但是对他们而言有时很难决定一个连接词的语域,除非他们被明确告知或者有可以使用的语料库或具有查阅语体功能的词典可供使用。中国英语专业的大学生判断语域的主要方法是凭从实践中得来的直觉感受,因为他们通常无法直接接触到连接词的语域。对于中国学生而言,一个看起来长而复杂的连接词通常被视为正式的,但这种方法并不总是正确,基于这种原因,不同语体连接词的混用在所难免。从这个角度上讲,如何判断一个连接词的语域是中国英语专业大学生所面对的问题之一。
(二)不充分教学
在传统的语言教学中,与语体的适当性相比,语法的精确性被认为更重要。这个问题也体现在连接词的教学上。常见的事实是:许多连接词被罗列在教科书中,很少或者没有任何评论,给学习者的印象是这些连接词可以相互替换。这种情况对中国英语专业的大学生同样适用。连接词的简单罗列忽略了连接词之间具有的任何可能的差别。比如,so和therefore常被同时罗列出来,但却没有告知therefore比so更常用于学术文体,这可能就是so在WECCL中被过度使用的原因之一。缺乏语域的教学最终导致了口语连接词和书面连接词的混用,从而影响了议论文体的正式性特征。然而,这个问题依然被忽视。今后的连接词教学应该重视发展学生的语体意识。
(三)发展因素
本族语大学生作文中也存在口语化连接词的事实为作者提供了从语言发展角度来解释中国英语专业大学生连接词语域混用问题的线索。
对比中介语分析(Contrast Interlanguage Analysis CIA)是研究中介语的一种方法,它不是建立不同语种之间的比较,而是建立同一种语言学习者变体之间的对比(见图2)。 对比中介语分析的目的是通过对比同一种语言之间的变体以发现某种相同或不同的东西。考虑到中国英语专业大学生是英语学习者的一种变体,因此可以使用对比中介语分析理论来探索其口语化连接词多用的原因。
本文已经发现:在包含379篇母语为英语的本族语大学生作文的LOCNESS中,口语化连接词占32.72%,尽管这与WECCL相比要相对少(48.98%),但这个事实清楚地表明本族语大学生也有使用口语连接词的趋势。因此可以大胆假设:连接词语域的混用是语言习得过程中的一个必然现象,是语言学习者由中介语迈向目标语过程中的一个必经的阶段。这对本族语大学生如此,对于中国英语专业大学生更是如此。基于这种分析,中国英语专业大学生使用了多于本族语大学生所使用的口语化连接词是一种正常现象。
四、教育意义
本文发现中国英语专业大学生使用的口语化连接词比本族语大学生的要多,这表明中国英语专业大学生缺乏连接词的文体意识。中国英语专业大学生认为处于同一个语意类别下的连接词可以相互替换使用,但却忽视了连接词之间的语体差别。这就要求教学者在教学方式上要有所改进,使教学更加充分。中国英语专业大学生无从获得连接词的语域,而仅凭不可靠的直觉判断是导致书面语具有口语特征的原因之一,若引入语料库的学习方式对学生会有所帮助。既然连接词语域的混用是语言发展过程中的必然现象,那么教学者就可以提前做好防范工作,在教学中有意识地渗透连接词的语域概念。总而言之,应该提高学生们的语体意识以达到连接词与文本的兼容,使文章更地道,更有可读性。这是在今后的连接词教学中值得注意的一个问题。
参考文献:
Chen C W Y.The Use of Conjunctive Adverbials in the Academic Papers of Advanced Taiwanese EFL Learners.International Journal of Corpus Linguistics,200611,(1):113.