公式化语言加工研究的目标、问题与方向
2013-08-15张建琴
张建琴
(上海大学外国语学院,上海 200444)
一、引言
语言学家很早就注意到语言使用中的一个有趣现象,即许多词组或句式在使用中反复出现,他们的形式相对固定,其使用对语言的流利度和地道性具有促进作用[1-3]。这样的词组或句子有许多名称,如“公式化语言”、“预制语块”、“词汇短语”等等,其定义也多种多样。本文采用Wray的名称和定义,即公式化语言(formulaic language)是“连续或间断的词或其他成份构成的序列,在语言使用中,他们常常表现为整体提取,而非通过语法生成”[2]9。
公式化语言的研究始于上世纪二三十年代Parry等人对史诗和民间故事的研究,游吟诗人常常借助公式化语言降低其表演的难度[4]。上世纪70年代,语言习得领域出现了第一波公式化语言研究热潮,对语言使用中出现的公式化语言进行短语学特征描述。进入21世纪以来,公式化语言研究在语料库语言学、心理语言学和神经语言学的推动下得到深入和拓展,出现了第二波热潮[5],公式化语言加工研究是其中一个重要方面。
语言加工研究是心理语言学的常用方法,其目的是通过各种实验手段探究人们习得和使用语言的过程。与行为研究相比,心理实验结果更为直观和可靠。国内外语言加工的研究已经开展了较长时间,但公式化语言加工研究仍处于起步阶段。本文旨在回顾近年来公式化语言加工研究的目标和方法,并指出其中存在的问题和未来的研究方向。
二、公式化语言加工研究的主要阶段
(一)早期理论探索阶段
上世纪70年代开始,语言学界就开始关注公式化语言在语言习得和加工中的作用,如Pawley和Syder对本族语者的研究以及Peters,Hakuta和Wong Fillmore分别所做的关于母语和二语习得的研究等[1,6-8]。他们指出,公式化语言在加工过程中很可能是以整体形式储存和提取的,因此具有经济省力的特点。但是,这个阶段的研究大多是理论上的探索,并没有对公式化语言的加工过程进行具体的实证研究。
(二)公式化语言加工初步研究阶段
2004年,Schmitt等人首次对本族语者和二语学习者的公式化语言加工进行了开创性研究[9]。他们从不同角度采用眼动实验、自定速度阅读等心理语言学方法研究了公式化语言加工的不同方面。
(三)公式化语言加工细化研究阶段
2007年以后,陆续出现了一些新的公式化语言加工的研究,包括以Schmitt等人2004年研究为基础的深化研究。这些实验的设计更严谨,结果也更可靠。例如 Jiang和Nekrasova的研究讨论了Schmitt等人研究设计的不足,并重新设计实验[10]。Nekrasova对Schmitt和Grandage等人的研究进行了分析,指出其不足,并改进了他们的研究设计,重新进行实验[11]。另一方面,公式化语言加工研究内容更为广泛。如Conklin和Schmitt对公式化语言在成语意义和字面意义语境下的加工进行了研究[12]。
三、公式化语言加工研究的主要目标和方法
公式化语言加工研究主要目标有二:一是对公式化语言的省力性进行研究,即公式化语言是否整体储存和提取;二是对学习者公式化语言加工过程中的影响因素进行研究。
(一)公式化语言加工整体效应研究
Wray提出了公式化语言的整体加工假设,她认为除了成语、俗语等不符合语法规则的词块是以整体形式储存在大脑中,许多符合语法规则的词组和句子在语言的理解和使用中也可以作为整体储存[13]。对这一假设进行检验的主要方法有在线语法判断、口头复述、眼动实验、自定速度阅读实验等。
Underwood,Schmitt和Galpin在2004年利用眼动仪对本族语者和二语学习者的公式化语言加工进行了实验研究[14]。已有研究表明,人的双眼在阅读时经常停顿,停顿时间是对阅读材料进行加工的时间。停顿时间越长,说明加工时间越长。如果前文可以给一个词提供一定的预测性,那么双眼在该词上的停顿时间比它在没有预测性的上下文中要短。他们的研究是比较同一个词在公式化语言的末尾和非公式化语言的上下文中时双眼在该词上的停顿时间。如果一个目标词在公式化语言末尾时,双眼停顿的时间更短,次数更少,则说明公式化语言可以提供较高的预测性,具有加工上的优势。研究发现,本族语者对公式化语言末尾词的停顿时间较其在非公式化语言语境中短、次数少,说明对本族语者来说公式化语言具有整体加工特性,而二语习得者在加工公式化语言时停顿的次数比非公式化语言少,但时间上没有显著差异。
Schmitt和Underwood利用自定速度阅读实验来检测受试对公式化语言中每一个词的加工[15]。实验对象自己按动电脑按键决定阅读速度,每次屏幕上呈现一个单词。结果发现:本族语者在公式化语言最后一个词上的停顿时间比该词在非公式化语言的语境中短。然而,二语学习者读一个公式化语言中越晚出现的词,花的时间越多。
Jiang和Nekrasova提出Schmitt等人先前的研究并没有得出一致的结论,主要是他们的研究方法和测试材料存在问题[10]。他们采用成语研究中的在线语法判断实验来检验公式化语言使用和存储是否具有整体性。他们的实验对象包括本族语者和二语学习者,两组受试对公式化语言、一般对照词组和不符合语法的对照词进行语法判断,并用E-Prime软件对其判断的时间进行记录,如to tell the truth是公式化语言,研究者们设计了to tell the price与之对应,这两个词组只有一个词不同,并且truth和price的词频和长度相似。通过分析两组受试反应时间,发现两组实验对象对公式化语言的反应时间要比非公式化语言更快,错误率也更低。
Nekrasova在Schmitt和Grandage等人研究的基础上,采用补全句子和听写练习来研究本族语者、高级外语学习者和中级外语学习者公式化语言加工中的差异[11]。她使用的材料主要是多词组块(lexical bundles)。她发现:本族语者和高级外语学习者的多词组块使用情况优于中级外语学习者,本族语者和高级学习者的使用没有明显差异。三组研究对象对语篇构造短语的掌握要优于指示性短语。她指出对于多词组块而言,简单地把它们分为整体储存或是非整体储存并不准确,应该把他们的加工看作一个梯度,从更具分析性到更具整体性。
Siyanova-Chanturia等人采用眼动实验对本族语者和二语学习者公式化语言的在线加工进行研究[16]。他们研究了公式化语言在成语意义和字面意义语境下的加工。例如,“at the end of the day”的成语意义是“最终”,字面意义是“傍晚”,他们设计了一个非公式化语言与之匹配“at the end of the war”。结果发现,本族语者加工成语的速度快于非成语,他们在加工成语的成语意义和字面意义时速度没有明显差异。非本族语者加工成语和非成语的速度没有明显差异,而且成语的比喻意义要比字面意义加工得更慢。
从现有的研究结论来看,本族语者的公式化语言加工具有明显的优势,而二语学习者的公式化语言加工结论并不一致,有些研究支持公式化语言的加工优势,而其他研究则没有发现这样的加工优势。
(二)公式化语言加工影响因素研究
已有的研究发现本族语者在加工公式化语言时比非公式化语言的速度更快,这给公式化语言的省力性提供了支持。但是,是什么因素形成了公式化语言的加工优势呢?
词素加工研究中一直存在双系统和单系统之争。以Pinker为代表的双系统论者认为,不规则变化的词以整体形式储存在词库中,而规则变化的词则根据语法规则生成[17]。Bybee提出的单系统加工假设认为不存在规则和记忆两个系统,而是由使用频率决定加工的整体效应,频率高的语言材料具有加工优势,频率低的则没有加工优势[18]。
已有研究发现,规则词形的曲折变化具有频率效应,如need和kneed的过去式,两者频率不同,受试对need的过去式的反应时间要比kneed的过去式反应时间短。这支持Bybee的单系统加工假设,频率高的规则词具有加工优势[19]。在此基础上,Sosa和 MacFarlane提出,既然词素的规则变化可以有整词效应,那么符合语法规则的公式化语言也可以有整词效应[19]。因此,他设计了“…of”短语的辨别任务,让受试辨别一句话中是否含有of。其假设是:频率越高的“…of”短语,受试检出其中含有of的反应时间越长。结果发现:高频短语的of检出时间要大于低频短语中of的检出时间,因此,假设得到了支持,即频率对公式化语言的加工时间有影响。
李红、缪道蓉在Sosa研究的基础上,将学习者水平也纳入考察范围,对不同水平的学习者公式化语言加工速度与公式化语言的频率和学习者水平的相关性进行了分析[20]。他们采用听辨公式化语言的方法进行研究,材料主要是含有“…of”的两词搭配。受试听一段话中,认为一句话中听到of的就做出肯定判断。研究发现,频率与学习者公式化语言提取的速度相关,但学习者水平与速度的相关性不显著。
Ellis等人也研究了频率、互信息(mutual information)和词长对公式化语言加工时间的影响[21]。他们采用三个实验分别测试理解和产出、口语和书面语形式下本族语者和非本族语者公式化语言的加工过程。第一个实验是在线语法判断任务,发现本族语者受到公式化语言中各个词之间的互信息和词组长度的影响,而二语学习者受频率的影响。第二个实验是朗读起始时间,结论与第一个实验一致。三个实验结果表明:本族语者受互信息的影响,而二语学习者受频率的影响。他们的解释是互信息是反映词与词之间联结强度的指标。在此基础上,他们提出了一个语言习得的模型:即在语言学习最初阶段,学习者受频率的影响较大,随着学习的深入,学习者开始更多地受互信息的影响。
从以上公式化语言加工因素的研究分析可以看出,母语学习者和二语学习者受不同因素的影响,频率对公式化语言的加工存在影响。高频率的公式化语言的加工时间短,低频率的公式化语言的加工时间较长。这在一定程度上支持了Bybee的单系统假设。
四、公式化语言加工研究的问题与方向
(一)已有研究存在的问题
1.公式化语言的定义不统一
根据Wray的统计,公式化语言大约有50多种不同的名称[2]。这些定义有广义和狭义之分。广义的定义便是Wray的定义[2],即包括所有的词块、俗语、成语等等,只要他们在功能上是整体使用,便可以定义为“公式化语言”。这个定义虽然涵盖面很广,但操作性较低,因为“整体使用”是心理范畴,无法用客观标准来衡量。Wray讨论了一些界定标准,如频率、形式上的不规则性、意义不透明性等等[3],但是这些特点无法确定所有的公式化语言。同时,“整体使用”又因人而异,有的学习者可能将某一词组或句子整体使用,而另一位学习者可能采用规则构成该词组或句子。因此,公式化语言在定义上有内在矛盾性,它被认为是整体提取和使用的,可是“整体提取和使用”却很难判断。Wray提出了采用客观和主观判断相结合的方式来鉴别公式化语言,这在一定程度上可以弥补公式化语言定义上的内在缺陷[3]。
从狭义上看,公式化语言可以指成语、词汇短语(lexical phrase)或是词块(lexical bundle)。这些词组在其定义、性质和特征上各有不同。成语的意义不能从其中各个词的意义相加得出,如“spill the beans”,“beat around the bush”,“a piece of cake”等。词汇短语是“不同长度的语块”[22],例如“once upon a time”,“so far”,“I don't know”,“on the other hand”等。词块是“三个或三个以上经常同时出现的单词”[23]。他们具有结构上的不完整性,如“in the case of”,“the point of view of”,“I don't know if”等。
在一定程度上,这种差别是现有研究缺乏一致结论的原因。虽然许多研究以公式化语言为对象,但是仔细考量他们所用的材料,发现存在较大的差别。Schmitt等人2004年的研究大量采用成语作为研究材料,他们认为成语是最典型的公式化语言,因为他们的意义不能从字面得出,只能整体使用。Jiang和Nekrasova的研究则采用了词汇短语,并不包括成语[10]。Nekrasova研究了多词组块的加工过程[11]。因此在比较不同研究时,我们需要具体检验其中的公式化语言究竟是成语、词汇短语还是多词组块,才能准确地理解其研究结论。
2.公式化语言的本质不明确
根据现有的研究结论,二语习得者公式化语言的加工优势并不明确,可能是他们的语言输入和输出还未达到一定的量,因此对二语习得者来说,公式化语言的加工优势可能是一个梯度的概念,公式化语言和非公式化语言的加工并不存在质的差别。本族语者在语言习得过程中以整体形式积累了大量的公式化语言,他们的公式化语言加工优势比较明确,这可能和他们的语言习得过程有关。因此,本族语者和二语学习者的公式化语言加工可能存在本质上的差异,需要进一步研究。
(二)未来研究方向
1.公式化语言加工影响因素研究
Sosa、李红、缪道蓉等的研究都指出了频率的作用。Nick Ellis等人的研究更是在频率的基础上指出了互信息的影响,并提出了语言习得的模型。这一模型是否能够解释二语习得的过程,需要进一步研究。已有的研究发现,频率、互信息、公式化语言类型和学习者水平都可能影响学习者的公式化语言加工。究竟他们之间有着什么样的关系,现有的研究尚不能够很好地回答这一问题。
2.本族语者和二语习得者公式化语言本质的研究
已有的研究发现本族语者在公式化语言的加工方面具有比较明确的优势,但是二语习得者的加工优势并不确定。因此,这种差异是否意味着本族语者和二语习得者在公式化语言加工中存在本质差异,是否反映了母语习得和二语习得的本质差异,有待进一步研究。
3.公式化语言各类子类别加工的研究
不少现有研究把公式化语言作为一个整体进行研究,并没有明确地将公式化语言进行分类并研究其子类别的加工优势。成语、词汇短语、多词组块等子类别在其习得和使用上有一定的区别,这些区别对他们的加工有什么样的影响,值得继续深入探究。
4.公式化语言加工的生理基础研究
对失语症患者的研究发现,右脑受伤的病人可以进行符合语法规则的表达,但是无法说出寒暄话语;而左脑受伤的病人无法说出符合语法的句子,却可以说一些公式化语言。另外,已有的脑功能研究发现,与左脑相比,右脑更擅长加工整体性内容[24]。这一研究发现对公式化语言加工又有什么启示,值得进一步探讨。
五、结语
公式化语言的学习是高级语言学习者最容易遇到的瓶颈。对公式化语言加工的研究可以让我们深入了解学习者语言习得的过程,具有十分重要的理论意义。同时,研究的结果对语料的提取和教材的编写都具有实际的指导意义。国外公式化语言加工研究已经取得了一些成果,研究已经日益深入和细化,但是国内对公式化语言的研究还刚刚起步,尤其是汉语公式化语言的加工研究较少,值得我们深入探讨。
[1]Pawley A,Syder F H.Two puzzles for linguistic theory:nativelike selection and nativelike fluency[C]//Richards J D,Schmidt R W(Eds.).Language and Communication.New York:Longman,1983:91 -226.
[2]Wray A.Formulaic Sequences and the Lexicon[M].Cambridge:Cambridge University Press,2002.
[3]Wray A.Identifying formulaic language[C]//Corrigan R,Moravcsik E A,Ouali H,et al(Eds.).Formulaic Language.Amsterdam:John Benjamins,2009.
[4]Parry M(Ed.).The Making of Homeric Verse:The Collected Papers of Milman Parry[M].Oxford:Clarendon Press,1971.
[5]Bardovi-Harlig K.Conventional expressions as a pragmalinguistic resource:recognition and production of conventional expressions in L2 pragmatics[J].Language Learning,2009,59(4):755 -795.
[6]Peters A M.Units of Language Acquisition[M].Cambridge:Cambridge University Press,1983.
[7]Hakuta K.A case study of a Japanese child learning English as a second language[J].Language Learning,1976,26(2):321 -351.
[8]Wong Fillmore L.The Second Time Around:Cognitive and Social Strategies in Second Language Acquisition[D].Palo Alto:Stanford University,1976.
[9]Schmitt N(Ed.).Formulaic Sequences:Acquisition,Processing and Use[M].Philadelphia:John Benjamins,2004.
[10]Jiang N,Nekrasova T.The processing of formulaic sequences by second language speakers[J].The Modern Language Journal,2007,91:433 -445.
[11]Nekrasova T.English L1 and L2 speakers'knowledge of lexical bundles[J].Language Learning,2009,59:647-686.
[12]Conklin K,Schmitt N.Formulaic sequences:Are they processed more quickly than nonformulaic language by native and nonnative speakers? [J].Applied Linguistics,2008,29(1):72 -89.
[13]Wray A.Formulaic language in learners and native speakers[J].Language Teaching,1999,32(1):213-231.
[14]Underwood G,Schmitt N,Galpin A.The eyes have it:An eye-movement study into the processing of formulaic sequences[C]//Schmitt N(Ed.).Formulaic sequences:Acquisition,processing,and use Philadelphia:John Benjamins,2004:153 -172.
[15]Schmitt N,Underwood G.Exploring the processing of formulaic sequences through a self-paced reading task[C]//Schmitt N(Ed.).Formulaic sequences:Acquisition,processing,and use.Philadelphia:John Benjamins,2004:173 -189.
[16]Siyanova-Chanturia A,Conklin K,Schmitt N.Adding more fuel to the fire:An eye-tracking study of idiom processing by native and non-native speakers[J].Second Language Research,2011:1 -22.
[17]Pinker S,Prince A.Regular and irregular morphology and the psychological status of rules of grammar[C]//Lima S D,Corrigan R L,Iverson G K(Eds.).The Reality of Linguistic Rules.Amsterdam:John Benjamins,1994:321-351.
[18]Bybee J,Thompson S.Three frequency effects in syntax[C]//Bybee J(Ed.).Frequency of Use and the Organization of Language.New York:Oxford University Press,2007:269 -278.
[19]Sosa A,MacFarlane J.Evidence for frequency-based constituents in the mental lexicon:collocations involving the word of[J].Brain and Language,2002,83:227-236.
[20]李红,缪道蓉.频率和语言水平对公式化语言整体加工的作用[J].重庆大学学报:社会科学版,2009(5):124-128.
[21]Ellis N,Simpson-Vlach R,Maynard C.Formulaic language in native and second language speakers:psycholinguistics,corpus linguistics,and TESOL[J].TESOL Quarterly,2008,42(3):375 -396.
[22]Nattinger J,DeCarrico J.Lexical Phrases and Language Teaching[M].Oxford:Oxford University Press,1992.
[23]Biber D,Conrad S,Reppen R.Corpus Linguistics:Investigating Language Structure and Use[M].Cambridge:Cambridge University Press,1998:183.
[24]Sidtis D,Canterucci G,Katsnelson D.Effects of neurological damage on production of formulaic language[J].Clinical Linguistics & Phonetics,2009,23(4):270-284.