APP下载

基于语料库的模糊限制语迁移考察

2017-10-23李小鹏

关键词:语料母语语料库

李小鹏

(宿州学院 外国语学院,安徽 宿州 234000)

基于语料库的模糊限制语迁移考察

李小鹏

(宿州学院 外国语学院,安徽 宿州 234000)

以统一框架和语言迁移多维模式为理论基础,通过对比分析Crown Corpus2009、TECCL以及TORCH2009三类语料库,考察了模糊限制语的语言迁移现象。结果显示,中介语中模糊限制语的使用存在明显的迁移痕迹,且迁移途径不一,不仅发生在语体内,还发生在语体间,主要遵循了语体内词汇层面的语义迁移、语体内词汇层面的概念迁移和语体间语篇层面的概念迁移三个途径。

语料库;模糊限制语;语义迁移;概念迁移

模糊限制语指语义模糊的词语[1]。众多语言学家从模糊语言学和元话语的视角证实了模糊限制语通常作为一种交际策略在口语和书面语中广泛使用,具备丰富的语言功能。[2][3][4]近年来,二语习得领域模糊限制语的研究集中于对比分析各类中介语语料与目的语语料间模糊限制语的使用差异。研究结果表明,因学习者个体及群体因素不一,模糊限制语在中介语和目的语中的使用频率和用法会表现出一定差异。[5][6][7]至于差异的来源,过往研究一般归结于母语迁移,而具体的迁移如何界定和迁移的途径是什么,国内外对此研究较为少见。基于此,本研究拟以Crown Corpus2009、TECCL以及TORCH2009三类语料库为基础,分析模糊限制语的语言迁移现象,以便更好地促进模糊限制语的习得和教学。

一、研究理论基础

1.模糊限制语的分类

模糊限制语的分类研究主要基于语义、语法和语用层面。E.F.Prince等从语用角度对模糊限制语的分类,是目前世界上普遍接受的分类研究结果。他们把模糊限制语主要分为两大类:变动型和缓和型。变动型又分为程度变动和范围变动,如almost、actually、commonly等属于程度变动,kind of、sort of、about等属于范围变动。缓和型以说话人的态度反映句子的真值分为直接缓和和间接缓和。如I think属于直接缓和,He believes属于间接缓和。[8]

Hyland进一步细化了模糊限制语的语用分类研究结果。[9]223-224通过对不同体裁文本的分析,他给出了常见的101种模糊限制语。Hyland给出的模糊限制语大多为单一词汇,且其中多为同一动词的不同变体,如feel、feels、felt。表示词组或结构的相对较少,如常见的it is said、according to等并不在其列。因此,本研究以E.F.Prince等人的模糊限制语分类研究为基础,结合 Hyland给出的101种模糊限制语,增加词组或结构类型的模糊限制语,最终确定检索101种模糊限制语(情态动词和If结构不在其列,不同动词的多种变体视为一种),对比分析其中高频的15种模糊限制语,以考察模糊限制语的迁移情况。

2.统一框架的语言迁移界定模式

基于比较取向,Jarvis提出研究语言迁移的统一框架理论。他认为,语言迁移的存在一般具备三类证据。第一,组内同质性。即同一母语背景的学习者在同一种中介语中的表现相同。第二,组内一致性。即同一母语背景的学习者在某些中介语的使用中与母语对等的表达方式相同。第三,组间异质性。即不同的母语学习者在同一中介语中的表现不同。Jarvis强调,上述三类证据中的一致性需要借助统计学中的显著水平来界定,且至少满足两个证据方可断定迁移的发生。[10]有不少语言学家借助统一框架,通过语料库对比分析,发现了语言迁移的存在。如Paquot通过自建小型语料库与国际学习者语料库对比,发现法国学习者英语词汇习得的迁移涉及诸多方面,如词汇搭配、词汇语法模式、使用频率等。[11]

可以看出,统一框架理论界定迁移的主要基础是频率统计的价值,对以语料库为基础的迁移研究有重要意义。但是过往研究局限于关注同一语体内语言迁移现象,而语言迁移不仅发生在同一语体内,也可能发生在不同语体间。为避免研究语言迁移过程中遗漏语体间的迁移痕迹,本研究结合统一框架理论,总结如下四种模式界定模糊限制语迁移的发生:1)某一类模糊限制语使用频率在母语(NSC)中显著高于中介语(EFL),并且中介语中这一类模糊限制语使用显著高于目的语(NSE),即 NSC〉EFL〉NSE;2)中介语中某一类模糊限制语使用频率显著小于母语并显著高于目的语,即NSC〈EFL〈NSE;3)NSC和 EFL之间无显著差异,但是显著大于或小于NSE;4)中介语中某一类模糊限制语使用频率显著高于母语和目的语,即EFL〉NSC≈ NSE。

3.多维语言迁移途径

蔡金亭、李佳在梳理语言、概念等迁移研究的基础上认为语言迁移有形式迁移、语义迁移和概念迁移三个维度。[12]形式指拼写、发音、语序等心理表征。语义指词汇和命题语义的心理表征。这两者属于语言层迁移,即二语学习者在使用二语表达时,倾向于使用与母语一致的表达方式,或者按照母语的语义结构及模式对表达方式进行编码。概念主要指隐藏于语言表象之下,且能够被某一特定文化群体以普遍方式理解、接受并使用的心理表征。概念迁移一般表现为对母语概念系统的挪用、调整或者重新建立,其主要原因是由于跨语言差异引起。[13]Jarvis指出,研究者可以通过收集语言证据,判断不同语言间的概念化倾向,以证明概念迁移的存在。[14]语言层迁移是概念层迁移的前提,确定概念迁移首先要确定是否具备形式迁移以及语义迁移。模糊限制语作为一种交际策略,有语块形式和词汇形式,而且作为元话语标记,也会涉及到语篇层面,其迁移的发生既可能会是语义迁移,也可能会是概念迁移。本研究对概念迁移的判断不涉及数据收集的过程,只涉及语料输出的结果。

二、研究设计

1.研究问题

研究拟回答的问题为:中国大学生中介语中模糊限制语的使用有无迁移发生(本文研究的迁移主要指负迁移)?如果有,迁移的途径是什么?

2.语料

研究基于三种语料库,母语(汉语)、中介语、目的语(英语)。母语语料库为TORCH2009(汉语语料库),该语料共有1,087,619词,1,703,635汉字,包含报道、社论、小说等15种体裁,收录文本大部分在2009年出版,语料在2013做了修订。中介语语料库来自于TECCL,其中所有语料产生于2011-2015年,由大约9,864篇中国英语学习者英语作文构成,涵盖小学、中学、大学三个学段,来源包括香港、台湾在内的省市自治区和特别行政区。根据本研究需要,剔除小学生和中学生的语料2862篇,剩余大学生英语作文7,002篇,字数1,493,947,简称为TECCL。目的语语料为Crown Corpus 2009(英语语料库),同样涵盖15种体裁在内500篇文章,字数1,157,575。该语料出版于2009,2000-2012年做了修订。

三、研究结果与讨论

1.数据统计结果

研究对中介语语料库中101个常见模糊限制语进行检索,列出其中高频的15种模糊限制语,并对15个词条在三类语料库中的频次以每十万为基础做标准化处理,统计结果如下:

表1 中介语语料库高频模糊限制语频次及频率(每十万词)

针对上述15种高频模糊限制语在书面语中较为细微的语义差异,以及二语学习者在使用中所希望表达的相近汉语释义,研究结合《英汉词典》(外文出版社,2010)《汉英词典》(外文出版社,2010)相关词条释义,最终确定I think和In my opinion为一组,汉语基本释义为“我觉得”“我认为”“我想”“按照我的观点”“我看来”“xxx个人观点”等;always和often为一组,汉语释义为“总”“ 常 ”“ 经 常 ”“ 常 常 ”“ 时 常 ”“ 通 常 ”“ 总 是 ”“ 一 直 ”“老是”等;between一组,汉语释义为“在xxx之间”;maybe一组,汉语释义为“也许”“可能”“大概”等;I believe(believed)一组,汉语释义为“我相信”等;seem一组,汉语释义为“好像”“看起来”等;possible一组,汉语释义为“可能的”“合适的”等;quite 一组,汉语释义为“很”“相当”“完全”“非常”等;more than一组,汉语释义为“超过”“多于”“不只是”“高于”等;about一组,范围变动汉语书面语中释义为“约”“大约”“大概”“近”“将近”等。ac⁃cording to的统计最初有296个,后面所接第一人称有7个,其中三个接my experience,归入as far as I的范畴,汉语释义为“据我所知”“据我了解”“根据我的经验”等。according to最终统计量为268,汉语释义为“据”或者“根据”(除第一人称)。almost一组,汉语释义为“几乎”“差不多”“差点”等。TORCH2009语料库的检索不允许检索某些词条的全称,如“我相信、我认为”等。本研究对此类词条的检索方法是首先确定核心词,再通过Collocation的方法在搭配词库中寻找对应的词条,并辅以人工筛选确定其在语料库中出现的频次。

鉴于样本中低频次的词汇会对研究结果有无法估量的影响,以及对数似然率对有关频次研究的显著效果,本研究对以Chi-square and Log Likelihood Calculator为工具两两对比其在语料库中对数似然率的差异显著性,如两者之间具备显著性差异(P值小于或等于0.05),直接用为大于或小于符号表示;若两者之间不具备显著差异(P值大于0.05),则用约等于符号表示。结果如下:

表2 三类语料库中模糊限制语频率比对模式(每十万词)

如表2所示,模糊限制语的迁移痕迹较为明显,可分为三类。第一,always、often、quite、about、almost在中介语和母语中出现的概率没有显著性差异,但是显著高于或低于目的语中使用的频率。第二,maybe、seem、more than在中介语中使用的频率介于母语和目的语之间,和母语、目的语均有显著差异。第三,母语和目的语中模糊限制语的使用频率无显著差异,但是中介语中该类模糊限制语的使用显著高于前两者。如I think和in my opinion的使用,学生在作文中使用的频次为3045次,远远高于目的语和中介语,而目的语和母语中I think使用的频次之间却无显著差异。as far as I结构也是如此。

2.讨论

上述研究结果以频率及显著性的统计方法界定了模糊限制语的迁移模式。频率对判断不同语料库间特定词汇使用差异的显著水平有重要价值,但是无法有效解释因母语语言表达习惯或模式引起的迁移途径,因而本研究结合了词汇搭配强度的统计方法。该方法主要用于检验两个词在同一语料库中在一定跨度内的共现强度。在两者数据分析的基础上,笔者认为模糊限制语的迁移主要遵循了三类途径。

第一,语体内词汇层面的语义负迁移。Al⁃ways和often、quite、about、almost属于该类别,主要原因在于中国大学生在使用该组词汇中更多地借鉴其母语认知系统中相对应的词汇和模式,造成习得偏误。以often为例,频率统计结果显示,其在中介语中的使用频次与目的语中有显著差异。以前3后3搭配窗口的方法考察often在中介语语料库中的共现词汇时发现,与often共现词汇强度最高的是I,共220次,预计搭配频率48.292;其次是we,共116次,预计搭配频率36.782;第三是people,58次,预计搭配频率18.428。继而以相同的方法考察了母语语料库和目的语语料库。母语语料库中often共现词汇强度最高的前三个依次为:我、我们、他。目的语语料库中often共现词汇强度最高的前三个依次为:and,is,are。中国大学生对often的使用习惯与母语趋同,一般在人称主语之后加上often一词表示频率。此类习得结果的根源也可以从I一词在中介语语料库的频次得出。I在中介语语料库中出现30,339次,目的语语料库中出现7888次,中介语语料I的频次几乎是目的语语料中的四倍。often迁移的发生一是表现为过度使用与母语一致的词汇,二是倾向按照母语的语义结构来进行二语表达。

第二,语体内词汇层面的概念负迁移。如more than、maybe、seem。 以 more than 为 例 ,Crown Corpus中检索more than 528次,less than 130次。TECCL中检索more than 336次,less than 39次,TORCH中检索类似more than的语义和形式表达有55次,less than 37次。中介语中“多于”或“少于”的表达方式深受母语概念系统影响,基本是挪用了汉语的概念系统。从共现信息值来看,目的语语料库中more than互信值最高的前九位词语均是数据,母语语料库中前三位则依次为:满意、均、水平,前九位无一数据。目的语与母语在表达“高于”的概念系统截然不同。二语学习者在初次接触该类词汇时可能会意识到这种文化差异,但是随着时间的推移,受二语输入和输出内容、频率和互动的影响,中介语中该类心里词库的概念与母语的联系逐渐强与于目的语的联系,最终在某个阶段会对more than的使用挪用母语的概念系统,导致迁移的发生。

第三,语体间语篇层面的概念负迁移。这一迁移既有目的语口语语体对书面语的迁移影响,也有母语口语语体对中介语书面语语体的影响。如,I think和As far as I结构。以I think为例,I think在话语中出现,一般会起到评价和调控整个会话的功能,表示确定性和不确定性。I think在TECCCL中使用的频次远远高于TORCH和Crown Corpus,在TORCH和Crown Corpus中使用的频次之间却无显著差异。转换语体,从书面语转到口语,会发现中介语口语和书面语中I think的使用在一定程度上类似,两者所接的强势立场语气远远高于弱势搭配,多用于句前,接完整句。如,“I think the most feasible way is to educate and persuade them…”(引自TECCL)。而英语口语中,I think的使用多接弱势立场语气。[15]I think的表达方式多用于汉语和英语口语,TORCH中检索出现了483次,Crown Corpus检索I think的使用频次为178,且多见于信件、自传、爱情小说等文体。中国大学生在习得I think的时候,接受了口语系统中I think的语篇概念,并付诸于写作语体,造成语篇概念的形式和意义迁移。

结 语

本研究以语料库为基础,结合统一框架理论及语言迁移的多维分析模式,探讨了模糊限制语的迁移现象。结果显示中国大学生书面语中模糊限制语的迁移现象不仅存在,而且迁移的途径复杂多样,这对模糊限制语的教学有一定的启示意义。

尽管本研究在语料库检索中对词汇采取模糊到精确的搜索方式,但是由于汉语和英语在词汇、语法及篇章上的客观差异,检索结果无法做到穷尽和完全的对等,存在一定的弊端。国内外目前对言语行为的语用迁移研究,数据收集大多以语篇补全测试(DCT)为主,该模式主要从语篇层面考察各类交际策略的迁移,未曾涉及到词汇层面。模糊限制语有其特有的属性,其语用功能的实现既可能是词汇形式,也可能是以语篇形式。单一的语篇测试并不能完整界定模糊限制语的迁移,以语料库为基础的对比分析虽然在考察模糊限制语的频率上有较为客观的说服力,但是如上文所述,其弊端也显而易见。今后的模糊限制语迁移研究在研究方法上可采取共时与微观、个案历时研究等形式相结合,语料收集上采取语篇测试和语料库相结合,对不同表现形式的模糊限制语分类研究,方能使研究更加深入全面。

[1]Lakoff,G.Hedges:A study in meaning criteria and the logic of fuzzy forms[J].Journal of Philosophical Logic,1972(2):458-508.

[2]Crismore,A.&Vande Kopple,W.Readers’learning from prose:the effects of hedges[J].Writing Communication,1988(5):184-202.

[3]Ivelina K.Tchizmarova.Hedging functions of the Bulgarian discourse marker[J].Journal of Pragmatics,2005(8):1143-1163.

[4]Hiroko Itakura.Hedging praise in English and Japanese book reviews[J].Journal of Pragmatics,2013(1):131-148.

[5]Gao Xiaofang.Contrastive analysis of hedges in a sample of Chinese and English molecular biology papers[J].Psychological Reports,2004(2):487-493.

[6]蒋跃,陶梅.英汉医学论文讨论部分中模糊限制语的对比研究[J].外语学刊,2007(6):115-122.

[7]徐江,郑莉,张海明.基于语料库的中国大陆与本族语学者英语科研论文模糊限制语比较研究——以国际期刊《纳米技术》论文为例[J].外语教学理论与实践,2014(2):46-55.

[8]Prince,E.F,Frader,J,and Bosk,C.On hedging in phys-ician-physician discourse[J].Linguistics and the Professions,1982(8):83-97.

[9]Hyland,K.Metadiscourse[M].Beijing:Foreign Teaching and Research Press,2008.

[10]Jarvis S.Methodological rigor in the study of transfer:Identifying L1 influence in the interlanguage lexicon[J].Language Learning,2000(2):245-309.

[11]Paquot M.Lexical bundles and L1 transfer effects[J].International Journal of Corpus Linguistics,2013(3):391-417.

[12]蔡金亭,李佳.语言迁移的多维动态理论框架[J].外语教学,2016(4):43-49.

[13]刘永兵,张会平.认知语言学视域下的二语学习概念迁移理论探究[J].外语与外语教学,2015(4):37-42.

[14]Jarvis S.Fundamental questions for conceptual trans fer research[J].外语与外语教学,2015(4):32-36.

[15]徐曼菲,何安平.中、英大学生口语中I think的对比研究[J].当代外语研究,2011(3):22-26.

责任编校 人云

H319

A

2095-0683(2017)04-0074-05

2017-06-25

安徽省高等学校省级优秀青年人才基金重点项目(2013SQRW080ZD);宿州学院优秀青年人才计划项目(2014XQNRW001)

李小鹏(1981-),男,安徽宿州人,宿州学院外国语学院讲师,硕士。

猜你喜欢

语料母语语料库
基于归一化点向互信息的低资源平行语料过滤方法*
母语
《语料库翻译文体学》评介
母语
基于JAVAEE的维吾尔中介语语料库开发与实现
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法
语篇元功能的语料库支撑范式介入
论《远大前程》的语言特色及其母语迁移翻译
Reliability assessment consideringdependent competing failure process and shifting-threshold