优势语序还是优势解读?利用ERP考察汉语双论元歧义句的解歧过程*
2015-02-05王路明
王路明
(浙江工业大学外国语学院,杭州310023)
1 引言
句子理解是一个从声音、文字或手势等简单语言形式到复杂句子意义的动态过程。该过程的实现方式在所有语言中相同还是因语言的不同而不同,这是心理/神经语言学家探索语言加工机制时面临的一个重要课题。早期心理语言学研究通常利用句法结构,即以词类和语法关系为基础的理论,来解释一些句子加工现象(如Kimball,1973;Frazier&Fodor,1978),最具代表性的是主语优势现象(subjectpreference),一种主语优先于宾语的语序效应。譬如在印欧语言中,当句首论元(NP1)既可以是主语也可以是宾语的歧义情况下,它更有可能被分析成主语而不是宾语。然而,近期ERP研究在“主语”概念本身就极具争议的汉语中也发现了主语优势:相对于主语在先的参照句“演员理解了…”,宾语在先的条件句“小说理解了…”在解歧动词处发现一个N400,反映了违反NP1主语优势所带来的加工成本。这说明此现象背后隐藏着语言加工的普遍机制(Wang,Schlesewsky,Bickel,&Bornkessel-Schlesewsky,2009)。前期研究进一步表明,NP1的主语优势不受论元的语义特征—生命性的影响(汉语:Philipp,Bornkessel-Schlesewsky,Bisang,&Schlesewsky,2008;Wang et al.,2009;土耳其语:Demiral,Schlesewsky,&Bornkessel-Schlesewsky,2008)。当句子出现双论元时,即需要指派题元角色(孰为施事者孰为受事者)时,可以看到论元的生命性对句子加工的影响,表现为有生命的论元优先解读为施事者,如果违反了这一优势解读,无生命施事者将产生一个N400(Bornkessel-Schlesewsky&Schlesewsky,2009a)。该结果也符合有关生命性层级的类型学概括,即在一个及物事件中,有生命的论元比无生命的论元更适合做施事者,或者说有生命施事者更为典型(Animacy hierarchy,Comrie,1989:p.185)。我们认为,前期研究中NP1的主语优势不受生命性的影响可能是受到只有一个歧义论元(NP1)的制约。可以推断在汉语中,当句子涉及到两个歧义论元时,生命性将对句子加工产生比较明显的影响。那么语序和生命性多大程度影响题元角色指派?汉语是否和印欧语言表现一致?为了解答这些问题,本文利用听觉ERP实验考察汉语双论元歧义句,即名词-名词-动词句子(NP1-NP2-Verb)的解歧过程。
扩展的论元依存模型(The extended Argument Dependency Model(theeADM),Bornkessel&Schlesewsky,2006;Bornkessel-Schlesewsky,&Schlesewsky,2008,2009a)通过考察不同语种的认知神经数据,发现主语优势现象实为{S,A}优势,是我们大脑尽可能简化语义依存的产物,因此简化语义依存(而非主语概念本身)才是语言加工的普遍机制。首先NP1被分析为句子的唯一论元,即一个不及物事件的主语S,它在语义上独立[-dep];当句子被解歧为一个及物事件时,S转化为施事者A而非受事者O以避免不必要的依存,因为O[+dep]在语义上依存于A[-dep](Primus,1999)。需要指出的是,简化语义依存建立在选择简单结构的基础之上。句子加工第一阶段包括选择句子结构模板(core templates,van Valin&LaPolla,1997)。当NP1出现时,选择最简单的结构模板NP-V;句子加工第二阶段将NP1解读为S,这与第一阶段选择的最简结构NP-V相匹配(SV)。显然,NP1(S)不受生命性的影响,它可以是有生命的也可以是无生命的,如“孩子/手机不见了”。但是当句子被解歧为一个及物事件时,其他因素如生命性开始影响题元角色指派。
根据该模型,可以推测在本实验中有两个语言加工原则会影响双论元歧义句的题元角色指派:(1)简化结构原则,即在语序自由的情况下,结构较为简单的那个语序占优势;(2)优化解读原则,即在及物事件中,较之无生命论元,有生命论元是施事者的那个解读占优势。实验条件如表1所示。NP1和NP2的题元角色模糊,句末动词为解歧处,明确NP1或NP2是施事者还是受事者。由于所有句子都表达及物事件,S与A重合,所以句子解歧为SOV语序或是OSV语序。汉语句子的基本结构模板为NP-V-NP(SVO),NP-V(SV),V-NP(VO/S)或V。一定语境下,汉语允许OSV和SOV语序。前者主题化O,后者强调对比O(Ernst&Wang,1995;Li&Thompson,1981),两者的区别体现在信息结构的不同上。信息结构包括代表主题的左脱离位置(Left-detached position,简称LDP)和代表焦点的前大核心位置(pre-core slot,简称PrCS),它们都附加于结构模板(van Valin&LaPolla,1997)。OSV是一个LDP和一个NP-V模板的结合(主题O和SV),而SOV是一个LDP,一个PrCS和一个V模板的结合(主题S、焦点O和V)(Ernst&Wang,1995也通过生成语法框架来区分,譬如OSV中的O是IP成分而SOV中的O是VP成分)。根据简化结构原则,本实验将会出现宾语优势(object-preference),因为OSV比SOV信息结构更简单。因此无论是前期研究通过NP-V展现的主语优势,还是本实验通过NP1-NP2-V考察的宾语优势,都是表象,背后都遵循简化结构原则。另外,实验句子涉及到两个歧义论元,我们预测生命性将会明显影响题元角色指派,具体分两种情况讨论:
(i)在无生命NP1的两个条件中,生命性和OSV的题元角色指派方向一致:两者共同反对“施事者-受事者”,共同支持“受事者-施事者”。在解歧动词处,SOV(优势语序-,优势解读-)的加工成本应明显比OSV(优势语序+,优势解读+)大,表达为SOV vs.OSV。
(ii)在有生命NP1的两个条件中,生命性和OSV的题元角色指派方向不一致:OSV支持“受事者-施事者”而生命性支持“施事者-受事者”。语言加工机制是遵从哪个原则是本实验关注的问题。若遵从优势语序,则违发该语序的SOV(优势语序-,优势解读+)应比OSV(优势语序+,优势解读-)的加工成本大;若遵从优势解读则结果相反。若语言加工机制受到两者的共同牵制,生命性和OSV互相竞争共同指派题元角色,那么两者将产生交互作用,有生命NP1的两个条件之间的差异应比无生命NP1的两个条件之间的差异小,表达为SOV vs.OSV 汉语被试28名,其中女生13名,平均年龄为27.6岁,年龄范围为22~34岁。皆右利手。视力或矫正视力正常。其中3名因脑电伪迹过多或行为测试错误率过高而被剔除ERP分析。所有被试自愿参加实验,并填写知情同意书,实验结束后得到一定报酬。 2×2两因素重复设计。语序:OSV vs.SOV;生命性:有生命vs.无生命。表1中,S=施事者;O=受事者;an=animate,有生命;in=inanimate,无生命。语境总是主题化NP1。句末解歧动词为比较脑电反应的关键区,用下划线标识。 每个条件36句共144句双论元歧义句,实验还加入288个非歧义句作为填充,这些句子通过“把”和“被”(而非句末动词)明确论元角色,如“侦探把子弹保存了”。总共432个句子(144+288),以两种不同的序列呈现。所有句子由两位汉语(北京音)母语者以男问女答的形式朗读。朗读过程被数字化录音,音频采样率为44.1 kHz,采样大小为16 bit。另有一名汉语母语者按句切分音频文件并检查句子,朗读不自然的句子被重录。为确保各句子成分在4个条件下没有明显的语音差异,后期对各句子成分进行了声学分析,结果如表2和图1所示。 表1 四种条件示例 表2 四个条件各成分的平均音长和平均音强。括号里为标准偏差 图1 四个条件的音高升降曲线图。各成分的基频(F0)按照起始值、最小值、最大值、终止值依次陈列。 F p F p 实验在隔音的电磁屏蔽室内进行,被试坐在17英寸主机屏幕前约1.2 m处听取句子。每个测试(trial)由问句开始,答句之前500 ms在屏幕中央出现一个星号提醒被试答句即将开始,该星号持续到答句结束后1000 ms。在星号出现的时段内,被试需要认真听取答句,同时注视星号避免移动包括眼动。实验要求被试完成两个任务:首先,句子接受度判断,即要求被试在听完一个问答组合后,根据语境尽可能地区分答句是否自然(是,选择笑脸图标;否,选择哭脸图标)。其次,句子内容理解判断,即要求被试判断屏幕中出现的问题是否符合所听答句内容。问题采用主动句或被动句,例如面对“侦探保存了子弹吗?”或“子弹被侦探保存了吗?”的提问,被试需要按“是”;而面对“保姆保存了子弹吗?”或“子弹被侦探丢弃了吗?”的提问,被试需要按“否”。回答“是”和“否”的问题数量在每个条件中相等。每36个测试为一个组块(block),两组块之间有短暂休息。正式实验开始之前,被试进行简短的练习以熟悉实验任务。 采用德国Brain Products公司的ERP记录系统,通过固定在32导电极帽上的25个AgAgCl-电极记录脑电。接地电极为AFZ,以双耳乳突连线的中点为参考电极。双眼外侧记录水平眼电,右眼眶额上下记录垂直眼电。所有电极的头皮电阻小于5 kΩ。采样频率为250 Hz/导。在离线处理EEG时不使用基线而使用0.3~20 Hz滤波带。它在排除慢漂移方面与使用基线效果相似,但又规避了因为-200~0 ms基线校正造成的关键区间ERP效应大小的改变(Roehm,Winkler,Swaab,&Klimesch,2002)。在听觉实验中,刺激的识别也不可能在其呈现之前完全相同(Friederici,Wang,Herrmann,Maess,&Oertel,2000),因此该滤波带被广泛应用。分析时程1200 ms。自动和手动排除眼电和头部移动等波幅大于±40 μV的伪迹。剔除句子理解判断错误的测试,只叠加判断正确的测试的脑电反应,最后得到ERP波幅总平均图。 F F p 表3 各条件的句子接受度、句子理解的正确率和各自反应时间的平均值(标准偏差) 图2直观地显示了生命性和语序的交互作用。为了客观准确地把握交互作用的变化,我们对200~900 ms进行50 ms连续视窗统计分析,即使用ANOVA依次分析200~250 ms,250~300 ms…800~850 ms,850~900 ms的效应,若相邻两个以上的50 ms窗口(>100 ms)显示相同的效应,则视其为稳定效应(参考Gunter,Friederici,&Schriefers,2000),合并时窗,最终确定450~700 ms和700~850 ms两个分析时窗。 图2 句末动词解歧处ERP波幅总平均图,有效样本25人。四个条件按NP1的生命性分别显示在图A和图B。负波分布在前区,故选取FZ反映四个条件一起比较的结果。 综上,生命性和语序的交互作用在动词处十分明显。在450~700 ms内,无生命NP1条件中SOV比OSV诱发了一个更大的前区负波;有生命NP1条件中,两种语序之间没有显著差异,但都比O(in)-S(an)诱发了更大的前区负波,波幅介于两个无生命NP1条件之间,即S(in)-O(an)>S(an)-O(in)/O(an)-S(in)>O(in)-S(an)。在700~850 ms内,无生命NP1条件中能看到同样的负波,而在有生命NP1条件中则相反,OSV比SOV诱发了更大的前区负波,即S(in)-O(an)>O(in)-S(an)和O(an)-S(in)>S(an)-O(in) 在理解NP1-NP2-Verb句子过程中汉语明显地呈现O(in)-S(an)加工优势,但这种宾语在先的语序优势必须是在施事者为有生命的前提下。当生命性和OSV的题元角色指派方向不一致时,这种语序优势就会消失,正如早期时窗450~700 ms的有生命NP1条件。如果生命性和OSV任意一个占主导,那么违反主导优势的条件势必产生加工成本,然而事实上有生命NP1条件之间并没有加工差异。这说明OSV和有生命施事者在早期加工阶段势均力敌,导致语言加工机制无法做出特定的题元角色指派,譬如在听到“侦探子弹保存了”最后一个动词,语言加工机制不能确定是施事者-受事者还是受事者-施事者。也有可能是语言加工机制做出特定的题元角色指派,但这一指派随着测试的变化而变化,并不稳定。譬如在某些测试中,语言加工机制遵循优势语序选择受事者-施事者(OSV),而在另一些测试中,它遵循优势解读选择施事者-受事者(S(an)OV)(选择随测试而变的证据请参照Traxler,Pickering,&Clifton,1998;van Gompel,Pickering,&Traxler,2001;van Gompel,Pickering,Pearson,&Liversedge,2005)。这样有生命NP1的这两个条件各自有50%的测试需要再分析(reanalysis),而同时违反这两个原则的S(in)-O(an)有近100%的测试需要再分析,平均叠加下来有生命NP1的这两个条件之间没有明显差异,却都诱发了一个波幅介于无生命NP1条件之间的前区负波。以上两种可能都能解释早期时窗的数据S(in)-O(an)>S(an)-O(in)/O(an)-S(in)>O(in)-S(an),但无论是语言加工机制在加工早期缺少明显的题元角色指派导向,还是导向随测试而变得不稳定,结果都说明OSV语序和生命性共同参与NP1-NP2-Verb的在线加工,它们影响语言加工机制的力量总体持平。 在700~850 ms时窗内,S(in)-O(an)和O(an)-S(in)在解歧动词处诱发了一个前区负波。这两个条件都违反了有生命施事者原则,这说明在晚期加工阶段,生命性最终强于OSV对语言加工机制起主导作用。这个结果也与行为测试,也就是被试读完整个句子后做出接受度判断的结果一致,有生命施事者S(an)的条件比有生命受事者O(an)的条件接受度都要高。对于这个前区负波也可能存在其他解释,例如它可能是因为“击中了”“保存了”词汇本身不同造成的。但如果是这样,应该观测到一个分布在顶叶中部的典型N400(Kutas,van Petten,&Kluender,2006),然而实验结果是一个前区偏右侧的负波。另一种解释是,该负波是由非合理性加工造成的。例如,被试可能把“子弹侦探击中了”错误地解读为侦探击中了子弹,这种非合理性解读产生了加工成本。如果是这样,我们也应该观测到一个分布更为典型的N400(van de Meerendonk,Kolk,Vissers,&Chwilla,2010)或语义P600(Kuperberg,Kreher,Sitnikova,Caplan,&Holcomb,2007),和一个正确率十分低下的句子理解结果。但事实也并非如此。因此,我们更倾向于将该负波解释为无生命施事者作用于有生命受事者这一非典型事件的加工成本。其实Wang等人(2009)在ERP实验中使用了NP1-Verb-NP2句子,在NP2位置上,当整个句子被解歧为一个无生命施事者(NP1)作用于一个有生命受事者(NP2)时,也发现了一个类似的前区负波。 综上所述,本实验结果反映了OSV和生命性在题元角色指派过程中的交互作用,两者在早期加工阶段和晚期加工阶段呈现出不同的力量对比。首先,在整个加工阶段,违反OSV语序和生命性题元角色指派的条件S(in)-O(an)始终比遵从这两者的条件O(in)-S(an)产生一个更大的前区负波;其次,当OSV语序和生命性的题元角色指派方向发生矛盾时,两者在加工早期力量相当,然而在加工晚期,生命性强于OSV语序主导题元角色指派,违反施事者是有生命的条件O(an)-S(in)最终比满足这一原则的条件S(an)-O(in)产生了一个更大的前区负波。 汉语实验结果支持简化结构原则和有生命施事者原则具有跨语言的普遍性,同时也表明生命性在汉语句子加工方面的重要地位。 首先,实验结果支持简化结构原则。在NP1处,语言加工机制选择最简结构NP1-Verb并解读为SV。当NP2出现时(及物事件),语言加工机制面临两种选择:(1)遵循具有简单结构的优势语序OSV把NP1解读为O[+dep],或(2)遵循生命性施事者这一优势解读把NP1分析为A[-dep]而放弃OSV。实验表明,采用哪种选择取决于生命性。当生命性与OSV指派论元的方向一致时,语言加工机制就选择(1)产生一个明显的O(in)-S(an)加工优势;而它们指派论元的方向不一致时,语言加工机制受到双重影响,或选(1)或选(2),造成语序优势消失(在450~700 ms,O(an)-S(in)和S(an)-O(in)没有差异)。也有观点认为非结构因素也能对句子加工进行早期干预(MacDonald,Pearlmutter,&Seidenberg,1994;Hagoort,2003,2005)。根据这种观点,在本实验中语境因素可以和结构因素一样参与句子的早期加工:实验问句总是主题化NP1,OSV语序优势来自语境需要。因为汉语是一个主题性显著的语言,一个主题化NP1的语境可能对整个NP1-NP2-Verb的加工产生影响,譬如它可能使语言加工机制从一开始就放弃了NP1[-dep]的分析。然而本实验句子包含两个歧义论元,NP1上的语境影响不太可能在句末动词处还能观测到,另外NP2的出现也可能改变语言加工机制对NP1的解读,因此是结构还是语境产生OSV优势需要今后通过操作不同的语境得以分离。 其次,实验结果也支持优化解读原则,并揭示了生命性在汉语NP1-NP2-Verb加工中的重要地位。生命性在德语双论元歧义句NP1-NP2-Verb加工中不能使语言加工机制放弃优势语序(Schlesewsky&Bornkessel-Schlesewsky,2009),而在汉语中却可以(在700~850 ms,S(an)-O(in)反比O(an)-S(in)更具加工优势)。由此可见,生命性在各个语言中的重要程度不尽相同。与印欧语言相比,它对汉语句子理解的影响比较大。这可能是由于汉语自身特征造成,譬如汉语缺少格助词,也缺少词类的形态变化,生命性成为题元角色指派过程中少数几个可供依赖的线索(Miao,Chen,&Ying,1986;Li,Bates,&Mac Whinney,1993)。此外,本实验也说明了在同一语言中,生命性在不同句型中的重要程度也不尽相同。前期相关研究测试了NP1-把/被-NP2-V非歧义句,题元角色指派由“把”和“被”完成,生命性能影响施事者的典型性,比如被字句的施事者(NP2)须为有生命(Philipp et al.,2008)。而在本实验中生命性直接参与题元角色指派,因为NP1-NP2-Verb歧义句没有“把”或“被”等形态标记,对语序的要求也相对宽松,两论元的生命性对比得到凸显(参见“distinctness”于Bornkessel-Schlesewsky&Schlesewsky,2009b)。如果说双论元非歧义句的实验结果反映了语言加工的普遍性,即生命性会影响语言加工机制评判施事者是否典型,那么双论元歧义句加工则更体现了语言与语言之间的差异,展示了生命性在汉语中的重要地位,即参与题元角色指派。 最后,实验结果对完全以句法或者完全以语义为基础的语言加工理论提出了挑战。虽然纯句法加工理论能够解释优势语序,但它却不能解释生命性能调节该语序,也不能解释生命性只在句子出现双论元时(而不是单论元时)开始影响题元角色指派。而纯语义加工理论似乎可以解释生命性对双论元角色指派的早期影响,譬如它主导语言加工机制将有生命的分析为施事者无生命的分析为受事者(参见关系从句加工中的生命性Mak,Vonk,&Schriefers,2002,2006),但如果是这样,那么在本实验450 ms起就应该观测到一个和S(in)-O(an)vs.O(in)-S(an)相反的语序效应,即O(an)-S(in)vs.S(an)-O(in),显然这不是事实。因此句法与语义交互理论能更好地解释实验结果。值得指出的是,交互作用并不是在整个时窗内不变的。和印欧语言支持的句法优先模型相比(Friederici,2002,2011),本实验中句法因素并不比语义因素优先加工,它们同时发生的交互作用似乎更倾向于支持多重因素并行加工的观点(Hagoort,2003,2005)。不少研究也发现,汉语甚至可以在句法出错的情况下继续进行语义加工(Jiang&Zhou,2009;Ye,Luo,Friederici,&Zhou,2006;Zhang et al.,2013),体现了汉语语义加工的特殊地位。然而在本实验中比起加工早期,语义因素直到加工晚期才凸显加工优势,因此句法优先模型在分层级加工的整体设计方面有其合理性。本实验结果启示我们有必要建立和完善多重因素分层级加工并在一定程度上允许并行加工的语言加工模型(如eADM)。在一些语言中,被传统语言学理论定义为语义因素的生命性也可能承担句法功能,如在汉语中生命性能指派题元角色。因此,跨语言研究视角也启示我们有必要重审句法和语义两分法框架。 本文首次利用听觉ERP实验考察汉语双论元句子的解歧过程。该过程受到优势语序(OSV)和优势解读(有生命施事者)的影响。OSV必须得到生命性的支持,当生命性和它题元角色指派的方向相悖时,这种语序优势消失,甚至在句子加工晚期被生命性所推翻。优势语序和优势解读在语言加工中普遍存在,但重要性却因语言的不同而不同。汉语实验结果显示了生命性在汉语句子加工中的重要地位,为我们完善语言加工模型和语言学理论提供了有益的启示。 致谢 Psychological Review,113 Brain Research Reviews,59 Language and Linguistics Compass,3 Lingua,119 Linguistic universals and language typology Cognition,106 Journal of East Asian Linguistics,4 Cognition,6 Trends in Cognitive Science,6 Physiological Reviews,91 Human Brain Mapping,11 Journal of Cognitive Neuroscience,12 Journal of Cognitive Neuroscience 15 Trends in Cognitive Science,9 Journal of the American Statistical Association,65 Neuropsychologia,47 Cognition,2 Brain and Language,100 Handbook of psycholinguistics . Mandarin Chinese:A functional reference grammar Journal of Memory and Language,32 Psychological Review,101 Journal of Memory and Language,47 Journal of Memory and Language,54 Studies in child language development Cases and thematic roles Brain and Language,105 Journal of Cognitive Neuroscience, Papers from Brain-Talk.The 1st Birgit Rausing Language Program Conference in Linguistic Journal of Memory and Language,39 Journal of Cognitive Neuroscience,22 Journal of Memory and Language,52 Journal of Memory and Language 45 Syntax:Structure,meaning and function Language and Cognitive Processes,24 Brain Research,1071 Brain and Language,1262 实验
2.1 被试
2.2 设计
2.3 材料
2.4 步骤
2.5 脑电记录
2.6 数据分析
对于行为数据,计算句子接受度、句子内容理解的正确率和各自的反应时间。其中句子理解只计算理解正确的测试的反应时间。使用ANOVA计算被试内因素(语序和生命性),以及随机因素(被试3 结果与分析
3.1 行为结果
3.2 ERP结果
4 分析与讨论
4.1 汉语NP1-NP2-Verb中语序与生命性的交互作用
4.2 实验结果对语言加工模型的启示
5 结语