APP下载

基于TECCL和LOCNESS语料库的英语学习者时序类连接词应用研究

2019-03-21吕长竑

昌吉学院学报 2019年5期
关键词:本族语连接词频数

张 锐 吕长竑

(西南交通大学外国语学院 四川 成都 610000)

引言

1976年,Halliday和Hasan合著的《英语的衔接》一书的出版,标志着衔接理论的系统研究的开始。连接是语篇衔接中重要的手段之一,人们通过连接性可以了解相邻句子(群)之间的语义联系,甚至可以经前句从逻辑上预测后文的语义[1][2]。由于连接词“明确表示文本段落之间的联系,因此连接词就与连接成分和从句一起成为了创建文本凝聚力的重要手段”,它们在章节长度或更长的话语的连接单元中具有广泛的文本功能[3]。按照抽象逻辑语义区分,韩礼德将英语连接词,分为四大类:增补、转折、因果、时序,每类又分为了许多小类。

国内对于连接词的研究主要分为宏观研究和微观研究两类。宏观角度的研究主要是对英语写作中连接手段使用的总体情况的研究。例如,陈新仁[4],赵蔚彬[5],邓飞[6],都平、吴晓春和王清正[7]。微观角度的研究主要是对某种特定连接手段或者某些连接词的深入研究。例如,莫俊华[8],吴志芳[9],初良龙和赵成发[10],陈振龙和江桂英[11]。以往的研究,总体而言都获得了比较一致的发现,即中国学习者使用连接词的数量比本族语者多,但是丰富度却不如本族语者。但在微观研究角度方向,当前的连接衔接关系研究仅涉及因果、转折和增补关系,时序类连接词的衔接关系研究尚未出现。且以上研究中,在选择中国学习者语料库时主要是基于CLEC或者SWECCL,这两个语料库建立时间比较早,语料较老,语料库任务也多半是高风险的标准化考试作文。本文所选的学习者语料库是北外语料库团队建立的中国学生作文万篇英语作文语料库(TECCL),该语料库于2015年年底建库,语料较新,写作任务类型包括课堂限时作文、课后家庭作业、期中期末考试作文,为课堂演讲而准备的讲稿,以及小组协作作文等,属于英语课程体系内的学业任务,代表性较强。目前,还没有学者基于TECCL对连接词进行过相关研究。

一、研究设计

本文的研究是基于中国学生作文万篇英语作文语料库(TECCL)和英语本族语者语料库(LOCNESS),使用语料库检索软件Wordsmith 6.0和数据分析软件SPSS 24,进行对比研究。研究过程中,笔者根据文本文件批量分离程序将TECCL中的学生作文语料按照年龄段分为三个子语料库:小学阶段作文语料库、中学阶段作文语料库和大学阶段(小部分其他)作文语料库。

时序顾名思义即表示时间和序列,综合Halliday,Chen和赵蔚彬对衔接理论、时序类连接词的分类,时序类连接词主要可以分为时间类、顺序类和总结三类[12]。本文结合几位前辈的分类,主要研究以下44个时序类连接词:

时间类:early,previously,formerly,before,after,until,later,afterwards,meanwhile,in the meantime,at the same time,simultaneously,on another occasion,occasionally,at this moment,after a while,all the time

顺序类:first,second,third,firstly,secondly,thirdly,then,next,at first,first of all,to start with,in the first(second,third)place,in turn,last,finally,initially

总结类:all in all,in short,in summay,in brief,in sum,in conclusion,to sumup,to summarize,to conclude,overall,in a word

主要是解决以下四个问题:

(1)学习者与本族语者在时序类连接词使用频数方面是否存在显著差异?

(2)学习者和本族语者最常使用和最少使用的时序类连接词是否有相似性?

(3)学习者和本族语者在三类不同功能的时序连接词的使用情况是怎样?

(4)不同语言水平学习者在使用时序类连接词时有什么差异?

二、结果与讨论

(一)时序类连接词频数分析

通过检索44个时序类连接词的频数发现,TECCL和LOCNESS中分别有21496和2199个时序类连接词,这可能是两个语料库总体规模不同导致的。笔者将检索数据换成了百万词频:两个语料库中分别有11828和7630个时序类连接词。每百万词频中TECCL语料库比LOCNESS多使用4198个时序类连接词,由此可见,中国学习者较英语本族语者更多地使用时序类连接词。但是从Wordsmith 6.0中检索到的平均句长和平均词长来看,学习者和英语本族语者作文的平均句长分别是14.36和20.05,平均词长分别是4.46和4.64,可见,在语言水平上学习者较本族语还有一定差距。

以百万频数来看,中国学习者使用频数在200词以上的时序类连接词有17个,本族语有11个。在44个时序类连接词中,中国学习者使用了43个,而本族语者只使用36个,其中on another occasion在两个语料库中都没有使用。而in a word,in the first place,in brief,in the meantime,in summary,in sum和to summarize这7个时序类连接词是中国学习者语料库有出现而本族语者语料库没有出现的。在学习者过多使用的7个词中,尤其以in a word最为突出,以百万词频计算,该短语在本族语中使用了283次。但是学习者在本族语者使用过的某些时序类连接词里面,也有少部分是学习者过少使用的,比如until,overall,in turn,to conclude,initially,simultaneously 和formerly这7个词。总体而言,学习者时序类连接词使用频数比本族语者高,呈过多使用的现象,少部分词呈过少使用现象。

用SPSS数据分析对TECCL和LOCNESS语料库中检索的时序类连接百万词频数进行配对样本T检验发现,配对样本相关系数是0.845,sig=0.000,样本T检验P=0.002〈0.05,说明两组数据具有显著性差异,由此进一步说明学习者时序类连接词比本族语者显著增多,学习者时序类连接词比本族语者使用过多。

(二)时序类连接词使用相似性分析

TECCL和LOCNESS中最常使用的10个时序类连接词分别是first,after,then,last,second,before,finally,secondly,firstly,next和 then,first,after,before,until,second,last,later,next,finally,两个语料库中最常使用的时序类连接词有8个是相同的,有两个不一样,但总体差别不大,这说明学习者和本族语者在时序类连接词的选择上具有相似倾向。笔者推测之所以学习者使用最多的10个时序类连接词中有firstly(468)和secondly(393),而本族语者没有,且本族语者使用二词的百万词频分别仅为104和62,原因在于相比于first和second而言,中国学习者可能认为firstly和secondly更带有连接副词或者连接词的标记性(-ly),而认为first和second更多是数词,有些中国学习者并不认为这两个词具有连接副词的功能。就两个语料库各自使用最少的10个时序类连接词而言,有6个词是相同的。综上,中国学习者和本族语者在常用和少用的时序类连接词的选择上具有极强的相似性。

(三)不同功能的时序连接词的使用情况分析

学习者和本族语者使用的时序类连接词都主要集中在顺序类连接词上:表次序和序列的连接词。TECCL中有7789个顺序类连接词,占学习者所用时序类词的65.86%;LOCNESS中有4424个顺序类连接词,占本族语者所用时序类的57.97%,尤其体现在频数最多的前四位:first,then,last,second。但总体而言,学习者较本族语者更多地使用顺序类连接词。其次,学习者和本族语者使用次频繁的是时间类连接词,本族语者比学习者更加频繁地使用该类连接词,但本族语者使用过的所有时间类连接词,学习者也都有使用。就总结类连接词而言,在使用比例上本族语者更多,占6.2%,学习者只占2.7%;就总结类连接词使用类型而言,学习者要多很多,其中in a word,in the first place,in brief,in the meantime,in summary,in sum,to summarize这七个连接词在本族语者语料库中检索出来的结果都为0,特别值得注意的是,就百万词频而言,in a word在学习者语料库中使用了283个;in the first place使用了59个。

笔者推测学习者和本族语者在三类时序类连接词中使用时间类连接词不多的原因是这些作文的体裁主要是议论文和说明文,不会带有太多的时间标记。而顺序类连接词的使用比总结类多是因为总结类连接词一般都用在结尾或者段末,而顺序类连接词一般用在文章主体的叙述中,文章的主体应占全文的大半以上,自然是使用顺序类连接词比时间类和总结类多很多。而in a word,in the first place,in brief,in the meantime,in summary,in sum,to summarize这七个连接词在本族语者语料库中检索出来的结果都为0,但在学习者语料库中却经常使用的原因是这些表达总体上就比较偏中式英语的表达,它们当中有的就是汉语“一句话总结来说”“简而言之”等中文的完美对应,本族语者少用也是不言而喻。

(四)不同语言水平学习者使用时序类连接词差异分析

为检验不同层次的学生的语言水平关系,笔者采用文秋芳、丁言仁和王文宇(2003)的办法,用Wordsmith 6.0统计了各层次水平学生的平均词长和平均句长。小学和中学的平均词长和平均句长都比大学要低,可见大学学习者的英语语言水平是三个阶段里面最高的,尤其是平均句长呈上升趋势,符合正常认知发展思维。比较有趣的是,中学组的平均词长和平均句长分别是:4.29、12.42,小学组的平均词长和平均句长是4.42、14.25,可见在TECCL语料库中,中学组无论是平均词长还是平均句长都比小学组要低,即中学组语言水平比小学低。显然,这个推论是不太符合常识的,但是数据的确是真实数据。笔者查阅了TECCL语料库来源情况后发现,在TECCL语料库中小学生的语料库只有59篇,而且只来自两个省份:江苏和湖北,而中学生的语料库占了2795篇,文本数量的差异和所选省份的小学生英语水平过高可能是导致数据差异的主要原因。笔者推测,因为TECCL语料库收集的是学生作文,而如果小学生都能达到写英语作文的程度,这说明这些小学生英语水平应该就是比较高。在中国小学生英语能够达到写作文的程度的省份并不多,因为很多中西部省份小学并没有开设英语课,即便有,很多小学的学生的英语水平也不能达到写作文的难度。所以,TECCL语料库中小学组样本的选取比较难取,而江苏和湖北是比较成功的样本选取省份,因为这两个省份的小学生英语开设较早且培养得较好,学生的英语水平能够达到写作文的程度。这也从侧面说明,如果学习者在小学就开始接触英语,小学六年的时间的英语学习效果,有可能比中学才开始学习英语的学习效果要好。当然这只是笔者的推测,具体情况还有待后期研究。

三、结论

本研究根据衔接理论,对比TECCL和LOCNESS两个语料库,分析学习者写作时序类连接词方面的应用情况,得出结论:(1)中国英语学习者与本族语者在时序类连接词使用频数方面存在显著差异:学习者时序类连接词使用频数总体上比本族语者高,呈现使用过多现象,小部分连接词呈现使用过少现象;学习者和本族语者最常使用和最少使用的时序类连接词呈现相似性特征;学习者和本族语者在三类不同功能的时序连接词的使用情况方面也具有相似特征,主要集中在顺序类连接词上,其次是时间类,总结类使用比例都最少;不同语言水平学习者在使用时序类连接词时呈现大学(及其他)阶段使用时序类连接词水平最高,学习者时序类连接词的使用情况与学习者水平、层次不太成正比,主要是表现在小学组的水平比中学组高,这里的具体原因还有待进一步研究。在时序类连接词的分类上,某些词的归属可能还存在争议性,如last既可以是顺序类连接词,也可能是时间类连接词,也需要后续研究加以注意。

猜你喜欢

本族语连接词频数
连动结构“VP1来VP2”的复句化及新兴小句连接词“来”的形成
宾语从句的语序
中考频数分布直方图题型展示
吸引阅卷老师的“连接词”
《本族语和非本族语科技写作中的词块:语料库方法在语言教学中的应用》述评
学习制作频数分布直方图三部曲
频数和频率
英汉本族语者对中国英语学习者的口音感知及言语理解度的对比研究
盗汗病治疗药物性味归经频数分析
麻雀作文