APP下载

论Charles C.Fries的语料库语言学思想及方法

2014-04-15韩存新

集美大学学报(哲社版) 2014年2期
关键词:代表性语言学语料库

樊 斌,韩存新

(1.集美大学外国语学院,福建厦门361021;2.厦门大学外文学院,福建厦门361005)

一、引 言

如果以 Quirk等进行的“Survey of English Usage”①R.Quirk等从20世纪60年代初开始着手进行“英语用法调查”(Survey of English Usage)的研究,但当时的调查是纯手工完成。该语料库直到1989年才实现计算机化。(参见李文中,2010)作为起点的话,语料库语言学发展至今已经有将近50年的历史。语料库语言学基本上以Firth和Sinclair的语言学思想作为其理论基础,[1-2]而作为美国结构主义创始人和代表人物之一的Charles C.Fries(1887-1967),在语料库语言学界知道的人并不多,因为他在应用语言学方面的巨大成就掩盖了他在语料库语言学方面的探索。其实,Fries不仅是一位开拓性的应用语言学家,还是一名具有超前意识的语料库语言学思想家和杰出的语料库实践家。国内对Fries的应用语言学思想进行研究的比较多,但是对其语料库语言学思想进行探讨的文章尚不多见。鉴于此,本文拟从Fries的数据观、研究焦点、研究范式三个方面对Fries的语料库语言学思想及方法进行阐述,以期填补语料库语言学史的研究空白,为更好地继承他的语料库语言学遗产做出一点贡献。

二、数据观

(一)真实交际中的口语数据

“数据是研究方法和研究范式的组成部分,其重要性不言而喻。一定性质的数据往往和语言学流派及其哲学立场相关”。[2]25与同时代其他结构主义语言学家不同的是,Fries在语言研究当中并没有摒弃意义,而是把语言看作传递意义的工具。他认为,语言本身不是意义,语言是信号的代码。至于语言学,他认为是“对语言的科学研究”,是“关于人类语言本质和功能的知识和理解”。[3]92Fries的语言交际观以及对待语言学的科学态度决定了他选择真实交际中的语言作为研究材料。

20世纪早期,语言学研究的重点还是在对书面语言,特别是文学语言的研究上。而Fries认为文学语言与真实话语相比,实现的交际功能有限,对于语言学研究的价值也有限。因此,他强调“真正”的语言是人们在交际中使用的口语。在其专著《美国英语语法》一书中,他指出“对于调查当今美国英语的音调变化和句法来说,最理想的材料莫过于大量记录那些自然发生 (spontaneous),即席而成 (unstudied)的语言”。[4]99为了完成对英语结构的研究,Fries 从1946年开始,用录音机记录了美国中北部说标准英语的人的许多会话材料。他收集了大约300个不同说话人所提供的内容各异的50个小时的会话录音,经过转写后语料库库容总共达到25万多字。[5]

站在真实客观数据的立场上,Fries对于主观内省的材料有所贬抑。他坚信,既然语言是潜意识的、自发的行为,那么把内省这种带有一定意识的材料作为研究的数据源是“极其”可疑的。[6]75Fries的数据观与当代语料库语言学的数据主张完全吻合。Firth强调使用“验证的”(attested)数据,而与之一脉相承的Sinclair则主张使用“自然发生数据” (naturally occurring data)。[2]25与以上二者稍微不同的是,Fries在肯定真实使用中的数据的同时,并没有完全否定内省数据的价值。比如,他认为内省在语言学研究中有提示 (suggestions)和启示 (hunches)的作用。[4]

(二)代表性数据

除了强调真实客观的数据以外,Fries还注意到了数据的代表性。这是基于他对语言学研究进行科学处理的自然结果。他认为,用于语言分析的的数据必须是能够代表某个社区语言的“代表性样本”。当然,“代表性样本”本身就是一个有争议的概念,因为数据是否具有代表性取决于“想要代表谁”。Peter H.Fries①Peter H.Fries是Charles C.Fries的儿子,现为美国中密歇根大学教授。归纳了语言学家通常使用的两种语料库采样方法:随机采样和系统采样。[4]随机采样指的是收集各种类型的语言实例,其目的是为了获得支持研究的证据或用于教学。这种采样的缺陷是无法给语言现象以全面的观察,因此其代表性较弱。而系统采样指的是系统地收集语言某个层面的代表性样本,特别注意样本要代表的对象及收集样本的方法。Matthiessen把前一种样本统称为“文档” (archive),而把后一种样本称为“语料库” (corpus)。[7]虽然Fries在研究中力图使用具有代表性的语料库,但是有时由于一些客观原因又不得不与社会现实妥协。比如,在对英语结构的研究中,尽管他使用了录音机,但是由于受到客观条件的限制,他只录制了极其有限的几个人的会话。但是这在当时已属不易。“我们不能因为条件的限制,而否定他所收集的语料及其研究的价值”。[4]103

Fries对于数据代表性的主张还包括对语域的考虑。尽管 Fries并没有正式提出“语域”(register)的思想,但是他清楚地知道人们在从事不同的社会活动时会相应地改变所使用的语言。在研究shall和will的用法时,他发现“在几种文体当中,由于不同语法人称的分布,导致它们在数据上的分布也不同。因此,可比较的统计数据必须来自同一类型的文体”。[8]987-989而在撰写专著《美国英语语法》的时候,他在选择研究数据的过程中就非常注意选择那些同一主题的信件,要求“这些通信必须涵盖不同话题。使用的材料基本上都是在详细描述家庭情况,比如家庭活动、家庭纠纷等等”。[4]107在语料库语言学成为一门科学的过程中,语料库的代表性起着关键性作用,因为它保证了语料库调查结果真实可靠。从理论上来讲,语料库的库容越大,收集的素材类型越多,其代表性就越强。而Fries的语料库实践启示我们:语料库的代表性取决于它“想要代表谁”。语料库的选择和收集最好是参考语料库研究的目标和对象来定。研究中所使用的语料库并非越大越好,而是取决于所研究语言特征在语料库中是否有充足的出现率。

三、研究焦点

Fries使用的一个重要研究手段是“对比性特征” (contrastive features)。[9]43-44词汇意义由词汇项的对比性特征表示,结构意义由这些词汇项的对比性排列和形式表示。[10]Fries指出,识别一种语言的词型 (word-pattern)和句型(sentence pattern)的功能单位并不是由一些语音特征像积木那样相加组合在一起。[3]98这些功能单位其实是一些抽象的对比性差异——声音特征、序列、分布、音高上的对比性差异。所以在Fries看来,“结构意义是语句基本的、必要的意义,是语句最重要的部分。这就使得Fries注重研究表示结构意义的信号,研究形式和对比的对比性区别”。[9]44Fries(1928)在编撰《近代英语词典》 (Early Modern English Dictionary)时,精选了69篇具有代表性的语篇,并制作了700 000张用法小纸条。[4]这些纸条详细记录了每个词每个意义的差别性语境。Fries把这些差别性语境称之为不同意义的“词汇集” (lexical sets)。需要注意的是,Fries的“词汇集”概念涵盖“搭配”和“类联接”这两种语言现象。在语法结构上,他既关注横组合也关注纵聚合。但是相比较而言,从他的语言对比观出发,他更强调纵聚合结构在语言研究中的重要性。在Fries几乎所有的大型研究项目中,他总是利用语料库对出现在语料库当中的对立性对比特征(conflicting contrastive features)进行系统性、穷尽性统计。这足见他在数据分析中对纵聚合关系的重视。

Fries的研究焦点与当代语料库语言学的研究对象不谋而合。基于Firth学说的语料库语言学将研究对象设定为“真实使用中的语言,中心内容包括重现的语言型式及其基本规律、不同方式的意义与功能的实现,等等”。[2]25Sinclair则提出了扩展意义单位 (Extended Unit of Meaning)概念。根据Sinclair的说法,扩展意义单位包括了词的搭配、类联接、语义选择趋向和语义韵等内容。可见,Fries关注的研究焦点正是当代语料库语言学所关注的重要研究对象。

四、研究范式

Peter H.Fries总结出语料库分析大致有三种范式:(1)为了配合某人的研究目的而搜索语料库,寻找合适的例证;(2)在语料库中系统地、彻底地分析所有相关例证;(3)对语言某个层面的对立性对比特征进行系统性、穷尽性统计。[4]虽然这三种范式Fries都用,但是他比较偏向使用第三种。因为他觉得,统计对比性特征可以在语言的使用和发展中识别语言型式。Fries一直反对将语言看作是一组没有联系的词项。他坚持认为词项间的关系才是最重要的。因此,他提出从结构主义的观点出发,所有孤立的词项都不具备语法意义。只有当它们在一个任意的型式系统当中与别的词项构成对立才有语法意义。也就是说,语言当中最重要的是处于对比之中的语言特征”。[3]

无论Fries使用上面的哪一种方法,我们都可以看出这是一种基于语料库的研究方法。而当代语料库语言学早已分化为“基于语料库”和“语料库驱动”两大阵营,尽管有些学者反对这样的区分或者认为两大阵营正在融合。[11-13]在这一点上,我们赞同卫乃兴的立场,即“两大阵营的区分似乎不宜绝对化。绝对或纯粹的客观证据并不存在……语料库研究的主流方法是数据驱动,但假设驱动的研究也应有其一席之地”。[1]18总之,二者并非是对立、不可调和的,而是相辅相成的关系。它们完全可以从对方的研究当中汲取养分从而达到相得益彰的效果。

五、讨 论

Fries的语料库语言学思想概括一下主要有以下几点:(1)语言学是一门科学。因此,他主张用实证的研究方法来研究真实交际中的语言。(2)口语是第一性的。书面语只不过是口语的映像。(3)数据要想具有代表性必须考虑到语域的差异。(4)语言学研究的焦点是语言中的对比性特征。不过,Fries的语料库语言学思想及方法也存在着一些不足。这其中一部分是客观条件的限制所致,比如,从Fries的所有语料库研究来看,他从未使用过赋码的计算机语料库,所使用的一些统计手段也只是频数统计。相比之下,当代语料库语言学已经发展起一套非常精密复杂的语料赋码系统和数据统计手段。另外一部分不足则源于Fries的个人认识。比如,他太过强调口语语料和定量研究的重要性,因而忽视了书面语料和定性研究。虽然Fries在研究当中注意到了语域的差异,但是他却没有意识到口语和书面语也只不过是语域的一种变体。另外,书面语料对于语料库语言学研究来说同样重要。尽管有学者指出“语言研究应当更多地注重口语”,[14]但是从世界范围内来看,目前绝大多数语料库研究还是基于书面语料的。这个跟建成的语料库绝大部分是书面语料库不无关系。其次,当代语料库语言学的研究范式也不再是单纯的定量研究,而更多的是定量和定性相结合的研究。

六、结 语

Fries从20世纪20年代起就开始使用手工的语料库进行研究,比Quirk等进行的“Survey of English Usage”以及 Henry Kucera和 W.Nelson Francis创建的BROWN语料库要早将近40年。因此,他完全可以称得上是语料库语言学的先驱。从以上讨论可以看出,尽管有些许不足,但是Fries的不少语料库语言学思想至今都是语料库语言学研究的基本指导原则。研究Fries的语料库语言学思想及方法,不仅可以填补语料库语言学史研究上的空白,而且还有助于继承Fries的语料库语言学遗产,推动当代语料库语言学思想与方法的创新。

[1]卫乃兴.John Sinclair的语言学遗产——其思想与方法评述[J].外国语,2007(4):14-19.

[2]卫乃兴.语料库语言学的弗斯学说基础[J].外国语,2008,31(2):23-32.

[3] FRIES CHARLES C.Linguistics and Reading[M].New York:Holt,Rinehart and Winston,1963.

[4] FRIES PETER H.Charles C.Fries,Linguistics and Corpus Linguistics[J].ICAME Journal,2010,34:89-119.

[5] FRIES CHARLES C.The Structure of English[M].New York:Harcourt Brace,1952.

[6] FRIES PETER H C C.Fries'View of Language and Linguistics[M] //P H FRIES,N M FRIES.Towards an Understanding of Language:Charles C.Fries in Perspective.Amsterdam,New York:John Benjamins,1985:63-84.

[7] MATTHIESSEN CHRISTIAN M I M.Frequency Profiles of Some Basic Grammatical Systems:An interim report[M] //G THOMPSON,S HUNSTON.System and Corpus:Exploring Connections.London:Equinox,2006:103-142.

[8] FRIES CHARLES C.The Periphrastic Future withshallandwillin Modern English[J].PMLA,1925,40(4):963-1024.

[9]杨信彰.Charles C.Fries的语言交际理论与信号语法[J].外国语,2000(1):41-46.

[10] FRIES CHARLES C.Meaning and Linguistic Analysis[J].Language,1954,30(1):57-68.

[11]MCENERY T,RICHARD X,TONO Y.Corpusbased Language Studies:An Advanced Resource Book[M].London and New York:Routledge,2006.

[12] GRIES S TH.Corpus Linguistics and Theoretical Linguistics:A Love-hate Relationship?Not necessarily…[J].International Journal of Corpus Linguistics,2010,15(3):327-343.

[13]濮建忠.语料库与语言一元化研究[J].解放军外国语学院学报,2010,33(2):41-44.

[14]卫乃兴.约翰·辛克莱“语料库语言学的发展与前景”导读[J].现代外语,2004,27(2):112.

猜你喜欢

代表性语言学语料库
国家级非遗项目代表性传承人简介
漳州市非物质文化遗产代表性项目代表性传承人名录
闽台地区代表性道地药材
《语料库翻译文体学》评介
非遗代表性传承人
——勉冲·罗布斯达
认知语言学与对外汉语教学
基于JAVAEE的维吾尔中介语语料库开发与实现
社会语言学名词
语料库语言学未来发展趋势
基于认知语言学的“认知修辞学”——从认知语言学与修辞学的兼容、互补看认知修辞学的可行性