英语写作中增补连接词的应用研究——基于CLEC和Brown语料库
2016-01-31陈振龙江桂英
陈振龙 江桂英
(1.福建农业职业技术学院 福建福州 350007;2.厦门大学外文学院 福建厦门 361005)
英语写作中增补连接词的应用研究
——基于CLEC和Brown语料库
陈振龙1江桂英2
(1.福建农业职业技术学院福建福州350007;2.厦门大学外文学院福建厦门361005)
【摘要】基于CLEC和Brown语料库,结合韩礼德和哈桑(1976)的衔接理论、增补连接词分类,应用语料库检索软件Antconc 3.3、统计软件SPSS 19等,探究中国英语学习者英语写作中增补连接词应用情况发现:中国英语学习者增补连接词应用频数相比本族语者有过多使用现象;学习者与本族语者连接词选择具有相似倾向;学习者增补连接词的使用情况大体上与学习者层次、水平成正比;学习者的增补连接词功能应用与本族语者相似,主要集中在简单增补关系上。
【关键词】语料库;衔接理论;增补;连接词;中国英语学习者语料库(CLEC);布朗语料库(Brown)
句子中、小句间、句子间两个以上的结构成分,常需语法、词汇等作为衔接纽带进行连接,以呈现其相互之间的逻辑语义与相互依赖关系。连接是语篇衔接中重要的手段类型之一[1]F29, [2]533,通过连接性词语的运用,人们可以了解相邻句子(群)之间的连接关系及句子之间的语义联系,甚至可经前句从逻辑上预见后续句的语义[3] 92。在语法层次上,连词、连接副词、介词短语等连接词表示连接关系。英语连接词按抽象逻辑语义区分范畴,含添加或增补(additive)、转折(adversative)、因果(causal)和时空(temporal)等类别[1]238-267; [3]96-106。
增补是语义系统语篇构成成分的概括性语义关系,是以and的逻辑概念为基础[1]234,指语言使用者在陈述第一句后,意犹未尽,又补充了一些新的情况[3]96,以添加前句陈述事件或状态额外的信息[2]406, [4],增补衔接关系是使用最广泛的衔接关系之一,但当前的连接衔接关系研究仅涉及因果、转折关系,增补性连接词的衔接关系研究尚未出现。
一、 研究设计
本文研究基于桂诗春与杨惠中的中国英语学习者语料库(CLEC)和本族语美国Brown语料库,这两个语料库库容量都为100万词左右的书面语文本语料,故适合对比研究。CLEC为高中阶段st2,大学阶段非英语专业低年级st3与高年级st4、英语专业低年级st5与高年级st6 5个子语料库,总词量1070602;Brown为500篇,每篇2000字左右书面语语料,总词量1189210。笔者应用语料库检索软件Antconc 3.3等检索两语料库增补性连接词应用频数,用SPSS分析数据,进行对比分析,并尝试回答以下问题:
(1)学习者与本族语者在增补性连接词使用频数上是否存在显著差异?
(2)学习者与本族语者常用与少用的增补连接词选择倾向是否相似?
(3)学习者与本族语者各种功能的增补连接词使用情况如何?
二、 数据分析
按照Halliday和Hasan(1976)的衔接理论、胡壮麟(1994)的增补连接词分类,分析4种衔接增补衔接关系的43个增补连接词[1]242:
(1)简单增补关系: and, also, not only… but (also), too, nor, either, neither, or, or else, as well as, as well, after all, above all;
(2)复杂增补关系: further, furthermore, moreover, additionally, besides, besides that,in addition, what’s more, apart from, incidentally, by the way;
(3)比较关系: likewise, similarly, in the same way, in this way, in this case, on the other hand, by contrast, conversely;
(4)同位关系: that is,I mean, in other words, for instance, for example, as follows, as if, such as, namely, and so on, and the like.
(一) 增补连接词频数分析
检索两语料库中43个增补连接词频数发现:CLEC共检索出39542个增补连接词,Brown共检索出37973个。因两语料库总词量略有差别,为便于CLEC语料库及其子语料库与Brown语料库比较,笔者将检索数据转换成每百万词频数:CLEC语料库共有36934个增补连接词,Brown语料库共有31931个;每百万词频中CLEC语料库相比Brown语料库多5003个增补连接词,平均频数比本族语者多116.4。其中,学习者使用频数在100词以上的增补连接词有17个(文中数据未标注单位,均基于百万词频数),本族语者有15个。
学习者使用所有43个增补连接词,而本族语者使用42个增补连接词:学习者使用105次的what’s more连接词在本族语者语料中并未出现。与本族语者连接词频数相比,学习者明显过多使用25个连接词,also, and, for example, and so on, such as, too, not only…but(also), on the other hand, besides, that is等10个连接词每百万词频比本族语者多100词以上,尤其also, and比本族语者分别多1510、1208词。同时,学习者又过少使用18个增补连接词,or, nor, either 3个词每百万词频比本族语者少100词以上,另7个连接词(或短语)每百万词频比本族语者少50个词以上,而余下8个连接词每百万词频仅比本族语者少1至7个。总体上看,学习者增补连接词使用频数比本族语者高,呈现使用过多现象。
对CLEC与Brown语料库检索增补连接词频数进行成对样本T检验,成对样本相关系数为0.997,sig=.000;样本T检验P=.028<0.05,说明两组数据具有显著性差异,进而说明学习者增补连接词频数比本族语者显著增多,学习者增补连接词应用频数比本族语者有过多使用现象。
(二)增补连接词选择倾向
CLEC与Brown语料库中学习者与本族语者使用频数最多、最少的10个增补连接词较相似。
Granger(1994)基于ICLE语料库中法语子库检索10万词频数据发现,学习者与本族语者使用的前15位连接词有11个相同[5]。Altenberg, B. & Tapper(1998)发现SWICLE与LOCNESS前10个连接词有7个相同,虽然排序不同[6]。潘璠与冯跃进(2004)比较自建20万词英语专业硕士研究生的英语作文学习者语料库,与500万词的英语本族语语料库,在使用频率最高的前10位中,8个连接词或短语都是相同的[7]160。与此类似,本研究中使用频率最高的前10个增补连接词,学习者共用了35090个,占所有增补连接词的95.01%,而本族语者共用了30593个,占95.81%。前10个连接词中有6个相同:and, or, also, too, such as, that is,其中and使用频率最高:学习者用了25455词,本族语者有24246词,说明“and作为增补连接词的典型范例,具有非常普遍的连接关系,是最基本的增补连接词”[1]239。学习者使用频率最高的前10个连接词频数总频数为35090例,而本族语者为30593例(见表1),频数最多的前6个词中仅or的频数比本族语者少,其它5个连接词频数都比本族语者多。
表1CLEC与Brown中频数最高的10个增补连接词
No.CLECBrown连接词频数连接词频数1and25455and242462or3064or35473also2409also8994too1059too7075forexample807either2406suchas675thatis2407andsoon524aswellas2008notonly…but(al-so)426further1839thatis354suchas16710ontheotherhand317nor164
使用频数最少的10个增补连接词中,双方也有7个连接词相同:and the like, or else, by contrast, conversely, additionally, besides that, in the same way(见表2),但本族语者这些连接词使用频数比学习者略多。使用频数最多、最少连接词相同,反映了学习者与本族语者常用、少用增补连接词的选择上具有相似倾向。
表2CLEC与Brown中频数最少的10个增补连接词
三、 结果讨论
(一)语言迁移与增补连接词过度使用(overuse)
学习者增补连接词频数比本族语者丰富,43个增补连接词在每百万词频平均数中比本族语者多116.4词,总体呈现使用过多现象。二语习得中,某些语法形式的过度使用是因语内处理不当,如过度概括产生。过度使用也可能因迁移导致——通常是为了回避或少输出某些较难结构所致[8][9],是对汉语流水句的矫枉过正(hypercorrection)。
与所有衔接手段相比,连接是英汉两种语言差别最大的一种[10],因英汉句法结构差异,连接使用容易产生偏误。英语句法结构重形合,句中成分的相互结合常用连接词语,以表示其结构关系。汉语句法结构重意合,句子成分的相互结合多依靠语义贯通、语境映衬和词序排列,而少用连接词语。英语句子衔接如其句法结构较为严谨;汉语句子衔接则相对灵活、自由,较少使用表层衔接手段,表层句子结构较为松散。英语写作时,学习者若采用汉语思维,没有较好地进行汉英句法结构转化,可能导致流水句负迁移语误。汉语句法允许省略连接词的流水句存在,但如果教师在课堂上特别强调连接词的连贯作用,使学习者了解到汉语母语流水句的语言现象,在英语写作时,学习者便会有意识地增加连接词的使用频率,以体现英语语篇衔接力,凸显连贯,提高英语输出语言衔接效果,这样就会导致矫枉过正,英语作文充满连接词,错用连接词,混淆连接词的语义联系。
学习者在英语写作过程中能够有意识地使用话语联系语来向读者提示前后语句内容之间的关联方式,在客观上确实有助于读者正确而又较为轻松地解读他们的写作意图和信息内容。事实上,从母语写作的最初阶级(初中阶段,甚至更早),学习者就被要求在写作中密切注意句意之间的起承转合,并恰当地运用连接词来标明这些语义上的联系。在英语写作课堂上,教师也一贯地强调这一点。这种专门性指导成功地培养了学生通过话语联系语来明确思路、减轻读者理解负担的语用认知意识[11]353。增补连接词虽不如汉语那般少用,但话语联系语(即连接词)使用过频也会使读者感到文章生硬乏味,而该使用联系语处却没有用又会给读者增添阅读负荷[11]353-354。
因此,学习者应多输入地道本族语,了解本族语者增补连接词应用情况与语境,恰当应用增补连接词。“在合理、正确的前提下,利用英语连接词的多样性和得体性,避免将注意力转向利用连接词达到写作连贯的负面效应”[12]。
(二)语言水平与连接词关系
为验证各语料库代表的不同层次学生的语言水平关系,采用文秋芳等人的(2003)方法,用wordsmith统计“两个相对客观、易于统计的参数:句子平均长度和平均词长”[13]270(见图1)。高中组st2平均词长、平均句长都处于最低点,非英语专业st3、st4平均词长变化不大,平均句长呈直线上升趋势;英语专业组st5、st6,平均句长、平均词长都增加,尤其是平均句长呈直线上升趋势。
学习者英语平均词长与句长呈现上升趋势,说明不同层次学生语言水平不同,大学英语组和英语专业组语言水平呈上升趋势,从学习者内部连接词应用情况看,连接词与学生语言水平成正相关:语言水平高,连接词使用频率高、类别广。st6阶段学生语言水平最高,其平均句长、词长都达最高值,平均词长几乎与本族语者相同,与本族语者丰富度一致:都用了42个连接词,连接词使用情况也最接近本族语者;但st6连接词密度却大于本族语者:每百万频数共超出了8952个,平均每个连接词都多用213.14个,呈现使用过多现象。
图1各(子)语料库平均句长和平均词长
学习者连接词使用密度普遍比本族语者大,但不同年级学习者连接词使用情况并不一致。对学习者子语料库增补连接词频数分析发现,不同层次学生的增补连接词使用丰富度和密度存在差异(见表3)。
表3各语料库中所检索增补连接词
语料库 频数频数类别st2st3大学英语四级st4大学英语六级st5英语低年级st6英语高年级CLECBrown丰富度25354039424342密度32260396003355338063408833693431931
在丰富度方面,从st2(高中生)到大学低年级st3(非英语)、st5(英语专业)到高年级st4(非英语专业)、st6(英语专业),连接词丰富度越来越高,都呈非线性递增。同层次中,英语专业学生(st5、st6)比非英语专业学生st3、st4连接词丰富度更高,英语专业低年级st5学生连接词丰富度接近非英语专业高年级st4学生,而英语专业高年级st6连接词丰富度最高,与本族语者相同,达到42个词。
在密度方面,不同学习者连接词密度都比本族语者大。st2(高中生)连接词密度最小,但仍比本族语者大;到大学低年级st3、st5阶段,连接词密度都越来越大,呈上升趋势;但是st3阶段学生连接词密度比st5学生增幅更大,而高年级st4连接词使用频数反而减少,但在st6阶段,连接词频数依然增加,达到最高值。
st2语言水平相对较低、词汇量小,能灵活应用的增补连接词较少,连接词丰富度最低,密度也最小。st3、st5大学低年级学生英语水平较高一些,词汇量也略多,经大学阶段教师专门性指导,接触一些英汉句法结构差异,稍了解汉语流水句负迁移偏误,所以其增补连接词密度、丰富度都比st2高。英语专业因课程设置、课程安排都比非英语专业学生多,输入英语语言材料也自然增加,所以st5学生词汇丰富度比st3高,更多语言输入促进了学生对英语句法结构的理解。
高年级st4(非英语专业)、st6(英语专业)阶段学生了解更多英汉句法结构衔接知识,对英语增补连接词使用获得输入,语言水平更高、词汇量更大,连接词丰富度也有所提高。但st4学生连接词密度比st3下降:不滥用连接词,慎用连接词,显性衔接手段节制,或用隐形衔接手段实现语用衔接目的实现局部、整体内在连贯,其具体原因还有待研究。st6学生,较其它阶段语言水平相对较高、词汇量更大,其书面语更准确、文体特征更正式,涉及语篇、语境知识,能有意识地使用更多类别连接词,避免单调、枯燥,连接词丰富度也最高,密度也最大。
可见,学习者增补连接词丰富度大体上与学习者层次、水平成正比:学习者水平越高、词汇量越大,写作输出时,就能激活越多的增补连接词,连接词类别就越多、丰富度越高。总体上,不同阶段学习者连接词密度都超过本族语者,大体呈线性增加趋势,但丰富度却只有st6学生接近本族语者。
(三)增补连接词功能与应用分析
韩礼德和哈桑(1976)将增补连接词功能分为:简单增补关系、复杂增补关系、比较关系、同位关系[1]249。
学习者与本族语者使用的连接词功能都主要集中在简单增补关系上:衔接前后句,增加补充陈述一些新的信息。CLEC共有32993个简单增补连接词(占89.33%),Brown有30407个(占95.23%)(见表4),尤其体现在频数最多的前4个简单增补连接词and, or, also, too,学习者共使用31987词,占所有增补连接词比例的86.61%;本族语者则用29399词,占92.07%。
其次,学习者也较频繁使用同位关系连接词,“通过标志词表达结构上的同位”[1]249:连接词所添加的内容是前一句内容的转述或举例,这种连接具有同位意义[3]98。学习者比本族语者更频繁地使用同位关系增补连接词,习惯从举例的角度来佐证自己的观点,用举例性的同位增补连接词衔接前后句,阐述例子、支撑观点,如for example, such as, and so on, that is, for instance 5个词的百万词频比本族语者分别多662、508、509、114、51例,但学习者(除st6外)少用as if,namely等连接词。
此外,学习者复杂增补关系、比较关系功能增补连接词的应用频数也比本族语者多:学习者两种功能连接词每百万频数为1377个(占3.73%),而本族语者仅为669个(占2.09%)。
总体上,学习者的增补连接词功能应用与本族语者相似,主要集中在简单增补关系上,其次是同位关系,比较关系功能连接词使用频数最少,但本族语者增补连接词的应用比学习者更突出地聚集在简单增补关系上。
表4CLEC与Brown中增补连接词各功能使用频数与百分比
语料库 数据分析不同功能类别CLECBrown百万词频百分比百万词频百分比1.简单增补关系3299389.33%3040795.23%2.复杂增补关系9032.45%4991.56%3.比较关系4741.28%1700.53%4.同位关系25646.94%8552.68% 总数36934100%31931100%
四、 结论
本研究根据衔接理论分析学习者写作增补连接词方面的应用情况,得出以下结论:
(一) 通过学习者与本族语者增补连接词应用对比,发现中国英语学习者增补连接词应用频数存在显著差异:学习者增补连接词使用频数比本族语的增补连接词频数高,呈现使用过多现象,小部分连接词出现过少使用现象,但连接词选择具有相似倾向。在功能上,学习者的增补连接词功能应用与本族语者相似,主要集中在简单增补关系上,但学习者比本族语者更频繁地使用同位关系连接词。
(二) 在学习者内部,学习者增补连接词的使用情况基本与学习者层次、水平成正比:学习者水平越高、词汇量越大,在语言输出时,就能激活越多的增补连接词;所用连接词密度越大,丰富度也越高。但大学英语高年级st4学生增补连接词密度骤降,其原因还有待进一步研究。
参考文献
[1]Halliday, M. A. K., R. Hasan. Cohesion in English[M]. 北京:外语教学与研究出版社, 2001: F29, 238-267,242,239,249.
Analysis on Additive Conjunction in Student’s Writing
——Based on CLEC and Brown Corpus
CHEN Zhen-long1, JIANG Gui-ying2
(1.Fujian Vocational College of Agriculture, Fuzhou 350007, Fujian, China;
2.College of Foreign Language and Culture, Xiamen University, Xiamen 361005, Fujian, China)
Abstract:The article investigates the application of additive conjunction based on CLEC and Brown Corpus, under the framework of cohesion theory and classification of addition presented by Halliday and Hasan (1976), with Antconc 3.3 and SPSS software. The results reveal that foreign language (FL) learners apply overused and diverse additive conjunctions than native speakers (NS), FL and NS’ choice of additive conjunctions appears similar tendency, the application of additive conjunctions among different sub-corpora nearly indicates the positive correlation with language proficiency, and both FL and NS majorly focus on the simple additive relations.
Key words:Corpus; Cohesion theory; Addition; Conjunction; CLEC; Brown Corpus
收稿日期:2015-09-17
【中图分类号】H315
【文献标志码】A
【文章编号】1672-4860(2015)06-0062-05