认知语言学视角下回指编码分析模型研究综述
2022-03-17潘宁宇
潘宁宇,司 洁
(嘉兴学院 外国语学院,浙江嘉兴 314001)
一、引言
回指(Anaphora),有学者也将其翻译为“复指”[1]或者“指同”[2],是语言中最常见的现象之一。回指现象看似简单,却是句法学、语义学、语用学、语篇分析、认知语言学等各个领域学者们关注的焦点之一;甚至在语言学之外,也是哲学、逻辑学、心理学、认知科学、人工智能等诸多学科的研究问题之一。
回指研究起源于西方学术界,“最早是哲学家和逻辑学家关注的对象”,而“回指现象成为现代语言学理论研究的中心课题之一,是从20世纪70年代开始的”[3]1,80年代更是回指研究的爆发期。[4]近40年来,多个语言学派的学者从不同的理论视角对回指现象进行分析,取得了巨大成就。姜望琪较系统地回顾了这些年来语言学主要学术流派,包括生成语法约束理论、语用学理论、可及性理论以及系统功能语法衔接理论,对回指现象所提出的相关理论进行了探讨。[5]许宝芳、肖德法、侯建波等学者也从不同角度综述了回指研究的相关文献,涉及了多个理论学派的观点。[6-7]
“当代语言学的一个重要特点是逐步确立了语言是一种心理或认知现象的观点”,[8]语言研究就是透过形式化的表象去探究其背后的认知动因。而从认知心理视角出发,“回指确认是整个篇章理解过程中的一项子任务”[9]。在认知层面,回指是同一概念在记忆系统中重复出现并形成心理上的连贯,因此,认知语言学主张要从认知心理的视角来分析回指现象。随着认知语言学的发展,许多学者从认知心理的视角提出了回指现象的研究理论和分析模型。前文提及姜望琪等学者的文献综述更侧重于从多个学派的角度系统回顾回指研究的发展历程,但很难做到对每个学派中的相关理论面面俱到。他们对认知语言学视角回指研究的理论回顾多集中于Ariel的可及性理论,而笔者通过文献回顾发现,从认知心理视角对回指现象进行研究的理论远不止可及性理论。因此,本文旨在从认知语言学视角,回顾语篇回指现象的相关重要理论和分析模型。
二、回指编码和语篇实体
在语言学领域,回指研究的一个焦点问题在于回指编码的选择和分布状态。回指编码,即回指(语)形式,是代指回指对象所用的语言形式,[3]5也就是回指语的具体形式。认知语言学研究者都认同回指现象本质上是认知心理活动在语言层面的表现,因此,从认知的角度研究回指编码机制自然是众多持上述观点学者的选择。许多学者(Ariel[10-13]、Chafe[14-15]、Gundel[16]、Kibrik[17-18]、Tomlin[19-21]、许余龙[22-23]、王义娜[24]、熊学亮[25-27]、王劼[28]等)认为,回指语形式的选择与说话人的认知状态紧密相关,分析回指编码机制要考虑其背后认知因素的制约作用。
从认知视角而言,回指形式在认知层面表现为语篇实体(discourse entity)。语篇实体就是说话人或听话人在语篇交际过程中,使用或听到一个指称词语时,在大脑认知层面建立的对应心理表征。[23]29需要强调的是,语篇实体是一个认知心理学概念,而不是一个语言单位,指称形式才是它的语言表达式。回指形式就是在语篇交际过程中被再次或者多次提及的指称形式;在认知层面,特定的回指形式对应特定的语篇实体,两者互为表里,关系密不可分。同时,语篇理解的一个关键问题就是构建局部或整体连贯性,而连续的话语常常是以一系列的语篇实体为中心而展开的;而在语言层面,“用来指代语篇实体的指代词形式是影响语篇连贯性和可理解度的一个重要因素”[29]。
回指形式在认知层面对应语篇实体,因此,特定回指语具体编码形式的选择取决于其所对应的语篇实体认知状态。关于语篇实体的认知状态,不同的学者以不同的术语对其进行描述并分类:Prince根据说话人假定听话人对语篇实体信息状态的熟悉程度,提出了熟悉度层级(Familiarity Scale)以区分语篇实体信息从完全已知到完全未知的不同状态。[30]Chafe把激活状态分为三类:“激活的”(active)、“半激活的”(semi-active)、“未激活的”(inactive);任何一个特定的概念,在特定的时间节点,可能处于其中的某一个状态。[31]Gundel等人则把语篇实体认知状态分成六类,并依次排列成已知性等级(The Givenness Hierarchy)。[16]275
Ariel在可及性理论中没有明确地对语篇实体认知状态进行分类,她把可及性标示(回指形式)分为高可及性、中可及性、低可及性三类,本质上所对应的就是语篇实体三种不同的认知状态。[11]当然,Prince、Chafe和Gundel的讨论方式是对语篇实体认知状态直接进行分类,而可及性则是从语言使用者激活相关语篇实体的难易度视角来分类,这种难易度对应的正是语篇实体认知状态。Levelt就直接用可及性状态(accessibility status)这个术语来分析说话人对听话人认知状态的评估,这也从一个侧面证明了可及性等级也是对语篇实体认知状态的分类描述。[32]
综上所述,根据认知语言学的理论视角,回指编码对应认知层面的语篇实体,具体的回指编码是语篇实体认知状态在语言层面的反映。Kibrik将这一理论共识概括为:“如果指称对象的语篇实体在说话人工作记忆中高度激活,其一般被编码为简略的名词性成分(代词回指或零代词回指),而语篇实体在工作记忆中的激活程度低于某个阈值,其被编码为完整的名词性成分(名词短语)。”[18]30
三、认知视角下回指编码的三种分析模型
根据认知语言学的观点,语言形式是认知心理状态的反映,语篇编码取决于语篇实体的认知状态。然而,需要指出的是,在实际交际过程中,处于认知层面的语篇实体是无法直接观察到的,交际双方需要通过其他一些语篇因素来判断语篇实体的认知状态。哪些因素对语篇实体认知状态有重要影响,不同的学者(或者同一学者在不同的时期)有不同的理解,这导致了对语篇回指编码不同的分析模式。前人的研究思路及其具体分析方式大致有三种模式:语篇距离模式、语篇片段模式、认知状态多因素模式。
(一)语篇距离模式
许余龙认为,“语篇的理解过程是语篇的心理表征(mental representation of the discourse)的建立过程”[23]29,这个心理表征就是语篇实体。当某个指称词语首次出现在语篇中时,交际双方在记忆系统的语篇表征里建立一个语篇实体,当该指称词语所指对象再次出现在语篇中时,交际双方则从语篇表征中提取某个已经建立的语篇实体,用于理解那个指称词语,这就是语篇回指在认知层面的发生过程。语篇表征中引入某个实体后,随着时间的流逝,该实体的激活度会慢慢消退,一般而言,时间越长,实体的激活度就变得越低。而时间的变化反映在语篇中是和语篇距离密切相关的,一般而言,时间越长则产生和理解的语篇篇幅越长,也就是语篇距离越长。因此,有些学者,如Clancy[33]、Givon[34]、Ariel[10-11]等,从语篇距离的角度分析回指编码的选择。只不过Clancy和Givon 主要还是侧重于从功能的视角进行分析,而Ariel则明确地把认知因素引入指称现象的分析。简单而言,语篇距离模式的分析思路就是:先行词和回指语之间的语篇距离越短,对应的时间越短,语篇实体认知激活度消退得少,所以实体保持了较高的激活度,反映在语言层面上选择用简略的回指形式;相反,先行词和回指语之间的语篇距离越远,对应的时间越长,语篇实体认知激活度消退得多,所以实体认知激活度明显降低,反映在语言层面上选择用复杂的回指形式。当然,Ariel没有直接用“认知激活度”这个术语,而是采用了“可及性”这个术语,而“可及性”本质上反映的就是语篇实体的“认知激活度”。在该理论基础上,Ariel以语篇距离为测量标准(包括“同句”“前句”“同段”“跨段”四个参数)对指称可及性进行量化统计,讨论了英语中不同指称编码对应的可及性程度。
Ariel的可及性量化统计方式在继承前人分析方法的基础上引入了认知因素,把对回指编码的讨论推进到认知心理层面,在理论上对回指和回指编码选择进行了更为深刻的阐述。在具体操作方面,Ariel的统计分析模式是测量语篇实体认知状态的可行方法,具有较好的可操作性,在我国有较大影响力。张德禄[35]专门撰文评述了回指可及性影响因素的认知心理学研究,其他不少学者,如许余龙[9,22]、王义娜[24]、熊学亮、刘东虹[27,36]等,则在分析语篇回指语过程中批判借鉴了Ariel的模式。
不过,Ariel的可及性量化统计方式还是存在着缺陷。首先,Ariel语篇距离分析模式参数标准设定自身存在缺陷。正如许余龙[9]95指出的那样,“将是否跨句和跨段作为衡量篇章间隔距离的标准,这一标准本身就有其局限性”。实际上,有时候先行词和回指语分布在不同段落,但两者之间的距离可能比“同段”还短。Ariel的分类标准是把“语篇距离”和“语篇边界”两种标准杂糅在一起,自然不能准确地反映语篇距离。
更重要的是,Ariel的分析模式并没有反映其理论全貌。具体而言,Ariel[11]28-29在分析影响实体可及性时提出了四个影响因素:距离、竞争性、显著性和一致性,语篇距离只是其中之一,因此,她在理论层面分析实体认知激活度影响因素时考虑得比较全面。然而,在实际操作层面,Ariel所构建的可及性量化统计方式直接以语篇距离为主要标准,没有探讨其他几方面因素,这和其理论有一定差异。这导致了以语篇距离为标准分析语篇实体认知状态和对应回指编码的结果,并不总是符合关于指称形式和实体认知状态关系的理论假设。Tomlin[19]456就指出,完整的名词短语形式回指语可能用在语篇距离很近的位置。而代词回指形式也可能用在语篇距离较远的位置。这些无法回避的语言事实说明语篇距离模式虽然有较强的可操作性,但也存在难以克服的局限性。
(二)语篇片段模式
除了以语篇距离为标准分析语篇实体认知状态的模式,文献[19,21, 34, 37-38]则从语篇片段边界的视角探讨回指形式的选择。语篇片段模式认为,虽然语篇在语音层面是线性的,但在意义层面,语篇的结构不是线性的,而是不同语篇片段组成有序的层级结构组织。认知实体的激活程度和概念实体意义的识解密切相关,因此,线性距离不足以说明实体认知激活程度的变化,应该从语篇意义层级结构的角度来分析语篇实体和对应回指编码。
Fox从语篇层级结构(修辞结构)角度分析影响回指形式的语篇条件,认为语篇中的信息流、语篇结构和回指语的使用之间存在紧密联系。[37]从语篇修辞结构理论(Rhetorical Structure Theory)的视角出发,Fox提出了对名词回指和代词回指在语篇中分布规律的完整论述。简单而言,某个语篇实体首次引入语篇一般用名词形式,之后在同一语篇结构单位(话轮、段落、情节、事件和主题等语篇形式)内再次提及该实体时,倾向于用零代词形式或代词形式来回指它;当该语篇实体跨越到新的结构单位之后,则倾向于用名词形式来回指它。Fox的研究证实,语篇中的回指分布受语篇层级结构的影响,克服了话题连续模式只重线性距离的缺陷,为语篇层面的回指研究提供了新的视角。不过,她的分析框架主要以语篇功能视角为切入点,对语篇实体认知状态论述较少。
Tomlin的研究则直接以实体认知状态为切入点,验证了语篇层级结构对回指形式选择的影响。[19,21]他指出,语篇距离模式存在缺陷,因为根据该模式的理论假设,语篇距离较近对应实体认知激活度高,反映在语言层面回指形式较简单;反之亦然。但实际上却存在相反的语言事实,较近的语篇距离可能对应较复杂的回指形式,而较远的语篇距离也可能对应较简单的回指形式。Tomlin分别在1987年和1991年就英语回指和汉语回指做了两个心理实验,并得出结论:语篇片段结构和边界才是实体认知状态的决定性因素。如果先行词和回指语出现在两个语篇片段中,由于边界的分割,回指语实体的认知激活度低,倾向于选择较复杂的回指形式;如果先行词和回指语出现在同一个语篇片段中,由于没有边界的分割,回指语实体的认知激活度高,倾向于选择较简单的回指形式。Tomlin的结论是基于其心理实验得出的,在实验中他使用的不是自然状态的语篇,而是几组人为分割边界的语篇片段。他也承认语篇片段模式存在的缺陷,在于很难在自然语篇中明确无误地划分语篇片段和边界。[19]475因此,他的方式不适用于自然语篇分析。更重要的是,和语篇距离模式一样,语篇片段模式在考虑语篇实体影响因素方面也存在局限性。[20]180
(三)认知状态多因素模式
语篇距离模式和语篇片段模式都存在缺陷,然而,并不能就此否认语篇距离、语篇片段对回指对象实体认知激活度的影响,更不能否定以上两种分析框架的理论价值和贡献。语篇实体认知状态取决于多个因素,语篇距离、语篇片段就是其中两个重要的因素,只强调某一个因素作用的分析模型是有缺陷的,但也不能因此就完全否认这个因素对实体认知状态的作用。一些学者主张把更多的语篇因素纳入到语篇实体认知状态的分析过程中。
事实上,Ariel在其可及性理论层面就主张实体认知状态受多方面因素的影响;她提出了实体可及性的四个影响因素:距离、竞争性、显著性和一致性。[11]28-29但是在构建具体的指称可及性量化统计模式时,Ariel只是以语篇距离为主要标准分析回指形式的可及性,导致这个分析模式根本上的局限性,结果自然难以解释一些语言事实的反例。
Tomlin在提出语篇片段分析模型[19,21]多年之后,又主动推翻原来的理论框架,明确提出实体认知激活度受多方面因素的综合影响:[20]语篇片段分析模型把实体认知激活度与语篇片段结构和边界绑定,并将后者作为选择指称形式的决定因素的模式是有局限性的;因为,这种模式的理论观点把实体认知激活度过于简化,忽视了认知的复杂性。[20]180事实上,指称形式的选择受距离、时间、模糊性、片段、激活、全局规划、意愿等等多种因素的综合影响。[20]176
上述Tomlin的研究是以心理实验的方式验证指称形式与认知因素的关系,不适合直接套用到较长的自然语篇分析中,不过他的研究证实了语篇实体认知激活度受多种因素的影响。Kibrik在分析俄语和英语自然语料的基础上,提出了回指认知激活计算分析模型,主张从多因素角度分析语篇实体认知激活度。[17-18]Kibrik认为,由于工作记忆容量的有限性,只有在工作记忆中心位置的实体认知激活度才最高,越到边缘实体认知激活度越低,而实体认知激活度决定了回指形式的选择。在语料分析基础上,他提出,影响实体认知状态的因素分为“先前语篇(previous discourse)影响因素”和“指称对象稳定特征” (stable properties of the referent)两类。[17]258第一类因素包括:先行词与回指语的修辞距离(rhetorical distance to the antecedent)、线性距离(linear distance) 、段落距离(paragraph distance)三种因素;第二类因素包括先行词的句法和语义角色(syntactic and semantic role of the antecedent)、参与者重要性(protagonisthood)、生命度(animacy)以及先行词和回指语对象是否完全等同(sloppy identity)四种因素。每个因素根据具体情况分成几个不同的项,每项的数值在0.7至-0.3之间。[17]269一个语篇中具体的回指对象在每个影响因素中对应一个特定的项,并被赋予对应的数值,最后把所有数值相加得到一个总的数值,根据这个数值就能判断回指形式的选择。Kibrik后来在分析英语语料基础上,删除了先行词和回指语对象是否完全等同这个因素,增添了强邻接性(super contiguity)、时/空转换(temporal/spatial shift)、弱指称对象(weak referent)、可预见性(predictability)、先行词是否具有引导性(antecedent is introductory)等五个因素。[18]当然,不论七种影响因素还是十一种影响因素,Kibrik的理论观点始终是一致的,即通过对多个认知影响因素赋值,用数学的方式求出某一特定实体的数值,并根据这个数值来判断回指形式的选择。
Kibrik通过对多因素赋值的方法来分析实体认知激活度与回指语选择的分析模型,突破了基于单一影响因素的语篇距离模型和语篇片段模型的先天局限性,提供了分析语篇实体认知状态的多维视角,是回指形式选择相关认知理论的重要创新。Kibrik是以自然语篇语料分析为基础,构建其回指认知激活计算分析模型,因此,该模型和Ariel的可及性等级分析模型一样具有较好的可操作性;当然,由于Kibrik纳入了更多的影响因素,其具体操作过程也更为复杂。
当然,Kibrik的模式也存在一些不足。首先,最大的问题在于不同项目数值的合理性,Kibrik赋予这些项目的数值缺乏科学实践依据。例如,线性距离这一因素,Kibrik分为1、2、3、4+四个项目,分别对应先行词在前一小句,先行词再往前第二个小句,先行词再往前第三个小句,先行词再往前第四个小句或者更远这四种情况;这种划分是以语言现实为依据,是合理的。然后,Kibrik直接把这四种情况赋值为0、-0.1、-0.2、-0.3,数值越小对应实体认知激活度越低。这说明从线性距离的因素来看,距离越长对应实体认知激活度越低,符合Ariel[10-12]等学者的理论分析。但是Kibrik并没有给出这些赋值的依据,为何是0、-0.1、-0.2、-0.3这四个具体的数值?为何不能是其他的数值?这种赋值方式缺乏心理实验相关证据的支撑。其次,Kibrik的分析模型最后直接把不同因素的赋值相加求和,显然他没有考虑到影响实体认知激活度的各种因素,在共同发挥作用时不一定是简单相加的关系。同样地,这种计算方法也没有以认知心理实验为依据,难免让人质疑其合理性。
虽然多因素分析模式目前仍不完善,不过综合文献来看,这种分析模式一定程度上代表了认识视角下回指编码研究的发展方向,正如张德禄所言,“‘多因素决定论’才是解决回指问题的正确途径”[35]。石艳华以Kibrik的分析模型为基础,综合语篇间隔距离、语篇实体、修辞结构、句法位置等因素构建了认知激活分析框架,对汉语小说语篇中的名词回指形式分布趋势展开讨论。[39]王倩则从先行语凸显因素和结构因素两方面入手,综合分析了先行语和汉语零形回指的认知距离和复句语义关系,并总结了汉语零形回指的五个认知原则。[40]
四、认知视角下回指编码研究的特征及发展趋势
近40年来,回指研究经历了从小句到篇章、从形式到认知功能的变迁。随着认知语言学理论的发展,一些语言学者认识到从心理机制层面分析回指现象的必要性,并将认知心理因素引入回指形式分布的分析中,给回指现象探讨带来了新的研究视角,这又进一步激发了更多学者的研究热情。认知视角下,回指编码研究提出了多个理论和分析框架,呈现两个特点。第一,国外的研究比较注重理论的发展和完善,从语篇实体认知状态角度分析回指形式的相关理论和分析框架基本是国外学者提出的;国内学者更注重吸收借鉴国外的理论成果,用以分析汉语语料,并在此基础上对理论进一步修正完善。第二,认知语言学理论发展给回指研究提供了深入心理机制层面的分析视角,学者们据此提出了多种分析模型,但每种模型都有其局限性。根据前文回顾的三种主要分析模型,前两者在分析实体认知状态时仅考虑了一个制约因素,难免有失偏颇;而第三种模型在分析认知实体制约因素过程中考虑比较周全,但是该模型对这些因素如何综合作用于回指形式选择的分析缺乏足够的实验数据支撑,影响了整个理论框架的说服力。
虽然认知视角下的回指研究模型还存在着一些不足,不可否认的是其有不可替代的优点。
第一,从考虑单一的认知影响因素到综合考虑多个影响因素。从Ariel[10-11]的可及性等级分析模型和Tomlin[19,21]的语篇片段分析模型,到Kibrik[17-18]的认知激活计算模型,学者们在不断探索影响语篇实体认知状态的语篇因素,且其趋势是从以单一因素为切入点分析实体认知状态到把多个因素纳入分析框架。人类认知是一个极为复杂的现象,很难说已有的回指语选择模型已经详尽了所有影响说话人选择的因素。因此,以后的研究要继续多因素综合分析的方向,并探索前人学者未曾研究的认知实体影响因素。
第二,借鉴相关学科(特别是认知心理学)的研究方法和成果。从语篇实体角度分析回指现象,就是把认知心理因素引入语言研究的成果,无论是可及性概念,还是实体认知激活度都和认知心理研究密切相关。然而,目前几个分析模型的不足在于其只能从定性的角度来讨论实体认知状态对回指形式的影响,一旦涉及定量分析(例如Kibrik认知激活计算模型中的赋值计算部分),则说服力不足,根本原因在于缺乏可靠的认知实验证据。具体回指形式对应语篇实体认知状态是否可以定量的方式进行描述?如何进行描述?这些问题都需要认知心理实验的相关证据来解答。因此,认知语言学视角下回指研究的发展方向,应该是和实验认知心理学更加紧密地结合。
五、结语
回指语在语言中发挥重要的作用,因而回指研究是当代语言学的一个研究热点。随着语言学理论的发展,不同学派的学者从各自不同的理论视角探讨回指现象,认知语言学视角下的回指研究重点在于,从认知心理的角度分析语篇回指编码选择动因。发展至今,认知语言学者都认同回指形式和语篇实体认知状态密切相关,并据此提出了多个理论模型,在回指研究方面取得了很大成果。总的来说,认知视角下回指研究趋势呈现出两方面特点:一是对语篇实体认知状态的考量从单一影响因素到多项影响因素,从更全面、综合的视角分析回指形式选择的认知动因;二是回指研究和认知心理科学紧密结合,积极借鉴认知科学的实验成果。这也是推动回指研究进一步发展的有效思路。