移情优选及其概率分析模式研究
2017-11-30李向华
李向华
移情优选及其概率分析模式研究
李向华
OT语法是一种形式化语法理论,从最初的经典理论到后来的标准理论和扩展的理论一直在发展变化。Coetzee A将经典模式扩展为等级序列模式,主要将传统候选项二级分割的优选方式发展为多级分割,并扩大了评估器的评估能力,解释了语言中的一义多形问题,但不能解释特定环境中等级序列的变化和优选机制。采用动态概率加权的优选模式可以解决这种静态模式的不足。
OT语法;移情优选;概率评估;动态模式
优选论(Optimality Theory,简称 OT)出现于 20世纪 90年代,由Alan Prince,Paul Smolensky于1991年在美国亚利桑那大学召开的音乐学会议上最先提出,其源于生成语言学的一种音系学理论[1]。OT语法的灵感来自于联结主义试图模仿神经网络运行的计算模型。但是,联结语法和OT语法的主要不同在于对约束条件的不同处理,前者将约束条件指派一个不同数量的重量,使得低重量的制约条件可以通过多个合并的形式加权来超过高重量的约束条件,从而影响候选项的选择;而后者采用的是严格的等级约束。MVE Vidal,ML Jungl后来将该理论延伸到句法学、语义学和语用学等领域,均得到了极大的发展。国内最早介绍这一理论的是王嘉龄,后来李兵和马秋武等人也进行了详细的介绍,并将优选论用于汉语现象分析。但是,他们主要是用优选论的理论来分析汉语的语音现象,很少涉及句法、语义和语用等方面。本文概略介绍优选论的经典模式和扩展模式,阐述这种理论对汉语移情现象分析的可行性,并提出话语移情优选分析的概率评估模式。
一、经典优选论的评估模式
经典优选论的运行程序非常简洁,主要由两部分构成:生成装置(Generator,简称GEN)和评估装置(Evaluation,简称EVAL)。这两个部分都有输入和输出端,生成装置对语言材料进行加工输出某种语言中的合法结构,再进入评估装置的输入端。通过制约条件等级体系的评估过滤,优选出最终的优选项见图 1[2]。
图1中的几部分可以用数学方法定义如下:
(1))输入项集(Input):I={i1,…,in}
(2)候选项(Candidates):K=GEN(I)
(3)优选项(Out):Out=EVAL(C,K)
(4))制约条件(Constraints):C:K→ù
(5)生成装置(Generator):GEN:I→K
(6)评估装置(Evaluation):EVAL:(C,K)→Out⊆K
图1 经典优选论的评估模式
在这6个部分中,第一个定义为集合;后面几个定义为函数;候选项为生成器的输出值;优选项为评估器的输出值;制约条件为候选项集到自然数的函数;生成装置为输入项集到候选项集的函数,自动生成最大限度的候选项集;评估装置为制约条件集和候选项集到优选项的函数。
Prince,McCarthy认为,OT语法是建立在一套完整可违反的制约条件集上的从输入到输出的函数。MVE Vidal,ML Jungl和 Rajesh Bhatt把 OT 语法看成是从一个候选项集到一个候选项集的函数。如果我们将制约条件内化到评估器中,那么,可以将生成装置和评估器相结合构成一个复合函数:EVAL·GEN(I)=Out,以表示优选的过程。因此,语言的优选过程实际上就是一个复合特征函数的运算过程。
在实际分析中,优选论的评估过程有串行和并行的两种方法。串行评估模式又称和谐串行理论(Harmonic Serialism,简称 HS),该理论遵循两个基本原则:生成器一次只生成一个变化的候选项和生成候选项必须呈单调性和谐度提升的过程。前者保持评估比较项的变化;后者保证能够优选出最优的选项,因为这种和谐度的单调提升一直循环到不再有任何提高的时候为止,这个最后的选项就是优选项。并行处理模式又称并行优选论,生成器为输入项一次性生成一个包含多处改变的候选项集,以供评估器一次性并行处理得出优选项。总体而言,大多数研究都是采用并行的处理模式,主要是采用竞赛表的方式来描写语言的优选现象。实际上,就是将候选项集中的成分一次性放到制约条件等级体系中进行并行比较考察,将违反制约条件程度最低的候选项确定为优选输出项。
传统的生成语法认为,制约条件之间的地位是平等而不可以违反的,所有语言都需要遵守这些原则,否则就会产出不合法的句子。而且,该理论采用的是串行推导模式,语法通过对原则的改进而排除或解决例外情况。优选论恰恰是对生成语法这种核心观点的背叛,认为决定句子合法性的所有制约条件都是可违反的,而且这种违反具有严格等级上的差异,处于高等级的条件对低等级的条件具有绝对的优先性,McCarthy称之为严格等级约束[3]。优选论认为语法单位之间合法度的差异实际上就是违反制约条件等级和次数上的不同,而不是通过原则而得出的合法与不合法的不同。由此,优选论将生成语法单位合法性之间的绝对差异改为相对的不同。这种观点实际上是对生成语法原则系统的改进或妥协。
生成语法和优选论的一致之处在于,都把普遍语法作为自己的研究目标。不同的是,生成语法旨在寻找一套适用于全世界所有语言的普遍原则系统,一般称为“普遍语法”。乔姆斯基认为,当特定的语言赋予这个普遍语法一套具体参数,并最终形成句法、语音和语义等知识时,普遍语法就转化成“具体语法”。所以,研究具体语法既是为了寻找普遍语法,也是为了演绎具体语法,二者并行不悖。优选论将原则系统提炼为一套制约条件,并认为制约条件也具有普遍性,对所有语言都是适用的,世界上不同语言之间的差异不是制约条件本身的不同,而是它们排列顺序的不同,不同制约条件的排列规定着某种语言特殊的语法特征。所以,搞清了一种语言制约条件特有的排列顺序,也就掌握了该语言的语法[4]。通过这种方式,优选论将世界上不同语言之间的差异同质化为一套制约条件体系。通过具有等级差异的忠实性和标记性制约条件相互间的冲突,优选论为不同的候选项排序,最终得出候选项集中违反程度最低的优选项。
二、语言的移情梯级形式和优选论的扩展
从语用角度看,话语的使用过程实际上就是顺应语境的优选过程,将最切合特定语境的话语从一个极差序列中优选出来。影响话语优选的因素很多,但起决定性作用的主要是文化、认知和移情。如果从更为宏观的角度看,文化的顺应实际上还是为了移情的需要,因此,语言中真正影响话语选择的就是认知和移情。一般来说,认知的顺序会反映移情的顺序,但二者有时也不一致,这时决定说某个话语更为重要的因素是移情,而不是认知。因此,研究移情的优选过程实际上就是从本质上考察话语的优选过程。传统语用学将话语的选择归为语境的需要;认知语用学认为话语的选择取决于认知凸显度的差异。前者只是摆出了现象,并没有解释;后者虽然侧重于解释,但是并不完整,只有以移情为基础,并结合认知才可以完整解释话语的生成理据,但这种思路目前并没有任何理论可以做到。
OT语法具有天然的处理自然语言的优势。它是一套形式化的演算系统,给定特定的输入就会得到确定的输出。保障输出项正确的核心就是评估装置中的制约条件严格等级体系。OT语法制约条件的可违反性特征为自然语言中的一些例外或模糊现象提供了一种可行的分析程式,而忠实性和标记性条件之间的竞争又赋予了语言变化发展的活力。因此,无论是类化的还是梯级的特征都可以在OT语法下得到统一的解释。这样来看,在语言由内容向形式的投射中,违反制约条件是一种常态,是语言变化的一种必然,也是一个程度的问题。所谓句子合语法就是违反制约条件程度相对较轻的句子;句子不合语法就是违反制约条件程度相对比较重的句子。语言的合语法和不合语法之间并没有截然的分界线,呈现为一种性状,在语言上一般表现为有限数量的梯级状态。在话语优选上,我们只要遵循着选择最小违反的总原则就可以得出最佳的形义匹配体。
经典OT语法将生成器生成的候选项集分割为两个子集,即优选项集和非优选项集。但是,这种模式在处理移情现象时会遇到一些无法解决的问题。因为OT语法只允许一个候选项成为优选项,不存在两个以上的选项成为输出项的可能。但是,实际情况是,语言中存在着大量的由同一个思想投射出来的具有移情值极差的同义句集,且语感上都是合法的,而且在特定环境下也都会使用,形成了一种一义多形的变体。条件变体在一定程度上反映输出项的唯一性,而自由变体则完全是两个或多个并列的输出项。这种现象实际上就是语言中的一义多形现象,即一个底层的语义输入项投射为两个或两个以上的表层形式。这超出了经典OT语法的处理范围[5]。更为重要的是,这种现象在语言中大量存在。作为优秀的语法理论必须能够处理语言的各方面问题,而不仅仅是部分现象。显然,经典OT语法理论并不完善。
Coetzee A对经典OT语法提出了一种在不改变其核心思想和分析程式基础上的改进措施。这主要包含两个方面:首先,将经典OT语法中的评估器对候选项集的二级分割改为多级分割,称为“等级序列评估模式”。这就打破了优选项只有一个成分的限制,在一个具有梯级特征的候选项集合中可以允许多个候选项成为最终的优选项,只是这些优选项之间在地位上不平等,处于最高等级的优选项为最优项;处于第二位置的为次优项,语言中也是可以见到的,只是相对最优项在使用频率上低一点。余者以此类推,最终形成一个输出项的等级序列。这个序列对应于经典OT语法的单一候选项。这种思想实际上是对经典OT语法评估结果的重新解释,将原来经典OT语法认为无需考虑的信息重新捡起来加以运用。这种对评估器功能的扩大很好地解释了语言的变异现象,即一种内容或思想对应多个形式的问题,也很好地解释了词语或短语等的固化判断问题。
其次,扩展了评估器的评估能力,将原来只可以评估来自同一个输入项的候选项集扩展为可以评估来自不同输入项集的候选项。在自然语言的实际形义匹配中,很多时候输出的形式和要表达的内在思想之间相差较远,根本无法做到忠实性的对应。这就意味着一个话语的输出形式可能和这个话语所代表的思想的输入形式之间没有多大的关系。如果我们仅仅将评估器局限于同一个输入项,即话语思想命题的原型匹配项,那么,也就意味着生成器生成的候选项集都来自这个原型匹配项,其结果就是实际的评估中有大量的话语根本没办法找到对应的优选输出,或者反过来一个优选输出找不到一个对应的输入项。因为这个最终的输出项可能并不来自于这个命题的原型匹配项,这显然给OT语法造成了不小的挑战,也有违OT语法的精神。但是,如果我们将评估器的评估能力扩大到可以评估任意来源的候选项,显然就解决了这个矛盾。两种OT语法评估模式见图2[6]。
这种OT语法的柔性处理方式实际上更适合语言的实际情况。在自然语言中,一个意义多种形式,或者一种形式多种意义应该是一种常态,是任何成熟语法理论都必须要解决的现象。移情现象作为语法的一个重要组成部分,在语言中的梯级存在形式和这里的多级OT评估模式之间有着天然的匹配性。因此,我们完全可以用OT语法理论来描写和分析语言中的移情现象。
图2 两种OT语法评估模式
三、移情与概率及其优选分析模式
Coetzee A发展了等级序列评估模式,并通过频率和反应时间的参项将之运用于解释语言的变异现象和词语固化的判断。这种等级序列模式能够解释一个候选项集合中不同候选项之间的相互依存关系,以及为什么一个候选项会比另一个候选项出现频率更高等问题。但是,该模式并没有发展出一种技术手段去解释一个等级序列为什么在不同环境下优选出了具有不同移情值的候选项,而不是最高移情值的候选项,也就是选择语言中自由变体的问题。一个好的理论不仅能够描写话语的结果,也能够解释这种结果产生的动因和过程,而这正是该理论薄弱的方面。
从本质上看,等级序列评估依然是一种静态理论,无法解决涉及语境的动态性问题。一组候选项和特定认知环境结合时,就会受到认知环境的制约,这时每个候选项的移情值会重新调整,进而重新排序,最后得出的结果和语言中客观的移情等级序列并不相同。但是,等级序列评估理论并不能告诉我们这种和认知语境结合产生的动态变化过程。也就是说,等级序列模式仅仅描述了语言中的自然移情序列,并不涉及这种自然序列在动态语境中的变化。从话语生成的角度看,这种自然的模式仅仅完成了话语产出过程的一半[7]。
因此,只有通过某种手段将Coetzee A提出的静态等级序列模式改进为动态模式,增加话语优选的主观评估部分,才能完整描写解释语言的产出过程。显然,增加制约条件的思路是行不通的,因为这样一来,制约条件就成了一个开放系统,且不可避免会产生因例设置条件的现象,这显然有违OT语法所提倡的简约性。我们也不能够将认知语境看成是一个开放的系统,这样OT语法也没法计算。我们唯一能够采用的方法就是启发式的程序,评估器在自我评估、自我输出中完成对语言的描写和解释。
在认知上,我们说什么话、不说什么话都存在一个潜在的评估过程,只是有时候是有意识的,有时候是无意识的。在这种过程中言者实际上主要考虑两方面的因素:一是话语本来需要怎么说;二是当前环境下能不能这样说,应该怎么说。前者反映语言中的表达常规;后者反映在语言表达常规基础上语境顺应的变化。这二者都是语言评估的主客观依据,体现这种依据的方式和结果是概率。换句话说,语言的选择过程实际上就是一组单位之间的概率计算过程。所谓优选就是将特定环境中出现概率最大的候选项计算出来。因此,优选论和概率之间有着本质的联系。而概率是一个匀质的概念,它可以将各种主客观因素统一在一起加以计算,得出综合性的结果。因为语言中的这种极差是一种模糊极差,不是绝对值之间的等级关系,基本上符合冥律的长尾分布。在理论上,我们可以将等级序列模式中候选项的极差序列转化成概率的级差序列,从而为主客观的综合评估提供了可能性。为此,我们可以设计一个建立在所有制约条件CON基础之上的移情概率优选评估模式。主要有以下几个步骤:
(1)制约条件等级序列的激活。这是由评估对象的特征和认知语境协同作用而激活的。这个步骤建立在关联理论的基础上,即特定的语言处理仅仅涉及与之关联的认知语境,而不可能是所有语境[8]。与之对应,我们在处理特定语言对象时,也仅仅会涉及部分的制约条件,而不可能是所有的制约条件。
(2)候选项客观概率计算。部分CON激活之后,对生成器生成的候选项进行等级评估,得出每个候选项相对于每个制约条件的得分向量,并求出商集。接下来将每个制约条件下的商集K/Ci合并为笛卡尔积,利用字典序求出交集,并得出最终的客观等级序列(K/CCom,≤com),最后将这种序列转化成概率序列。这里的概率序列符合冥律中的长尾分布。
(3)候选项主观概率计算。这部分根据话语主体特定的认知语境对候选项影响的不同而赋予其特定的加权概率,并按照由大到小的顺序排列,形成候选项序列的主观加权概率序列。
(4)将主客观概率序列按照一定的权重分配后合并。得出最终的综合概率,并排出概率等级序列。
(5)概率序列向移情序列的转化。将这种综合的概率序列转化为移情等级序列,并将处于等级序列最高位置的候选项确定为优选输出项。
这里需要注意两点:一是语言中最和谐的移情候选项不一定是最优选项,这点违背了McCarthy提出并被OT语法学家遵守的严格等级约束原则,也不同于Rajesh Bhatt提到的传统OT语法中提出的权重观。因为这里的权重观是认知语境的加权,而不是特征值的加权。实际上,这里优选出来的候选项在语言中不一定出现频率最高,也不一定感觉最自然,但在这个语境中一定是最合适的。因此,这种综合的概率优选更加符合语言的实际表现。二是概率评估的着眼点是话语移情值,不是句子内部对象的移情值。这种概率处理方式增加了主观动态加权部分,分解了偏序商集中最高位置的候选项和优选项之间的必然联系,从而可以确保客观等级序列中切割线以上的任何候选项都有机会成为优选项。由于运用概率是这种评估模式的主要特点,所以我们将之称为概率评估模式,以凸显这种评估模式的特征。
四、结语
本文主要介绍了优选论的经典评估模式以及Coetzee A在这种模式上的等级序列扩展模式。该模式主要将传统候选项二级分割的优选方式发展为多级分割,并扩大了评估器的评估能力,即:候选项的单一输出变为序列输出;输入项由单一来源变为多来源。这两个方面的拓展极大地发展了OT语法理论对语言现象的描写和解释力。可是,它的解释能力依然有限,并不能告诉我们语言中一义多形现象的优选机制,以及明显违反等级原则的低等级移情候选项成为优选项,而高等级移情候选项反而为非优选项。更为严重的是,这并不是个案或少数情况,而是日常话语中的一种常见现象。导致这种问题的原因是移情等级序列模式本质上仍是一种静态理论。这种模式可以描写和解释语言中出现的移情等级序列,但并不能解释特定环境中这种等级序列的变化和优选机制。因为这种变化和语境联系在一起,是一种动态的过程,而这已经超出了等级序列模式的能力范围。
为了解决Coetzee A这种静态理论的不足,本文提出了一种以移情等级序列为基础的概率评估的综合计算方式。这种方式的好处是将所有的主客观因素都转化为概率,然后进行累加,最终可以得出每个候选项的综合概率值,从而可以相互比较高低,排出概率的序列。这种序列在解释力上明显强于静态的序列,它既可以解释语言中存在的客观序列,也可以解释候选项加权的认知机制,还可以解释为什么特定环境下某个候选项为最优项,而不是其他的甚至在客观移情序列上高于最终优选项的成分。这种移情概率模式既坚持了OT语法单一输出的原则,也解释了语言中一义多形的理据。
这种基于概率的综合移情评估模式具有严格的数学上的严密性和可重复性,输入特定的具备OT语法分析条件的研究对象,就会得出可预期的分析结果。另外,这种严格的数学模型分析方法具有很强的应用性。比如,在自然语言理解的计算机动态处理,以及人工智能中人机互动的语言实时理解解决方案等方面,该理论均具有较强的可操作性,因而具有广泛的应用价值。
[1]李兵.优选论的产生、基本原理与应用[J].现代外语,1998(3).
[2]VIDAL M V E,JUNGL M L.Remarks on optimality-theoretic pragmatics[J].Marta carretero, 2006(1).
[3]王嘉龄.优选论[J].国外语言学,1995(1).
[4]马秋武.优选论[M].上海:上海教育出版社,2008:33-40.
[5]COETZEE A W.Variation as accessing ‘non-optimal’ candidates[J].Phonology, 2006(3).
[6]COETZEE A.What it means to be a loser:Non-optimal candidates in optimality theory[J].Phd diss, 2004(1).
[7]李向华.现代汉语语用移情研究[M].学林出版社,2017:194-204.
[8]SPERBER D,WISLSON D.关联:交际与认知[M].蒋严,译.北京:中国社会科学出版社,2008:10-14.
(编辑:文汝)
H04
A
1673-1999(2017)11-0072-04
李向华(1974—),男,博士,九江学院文学与传媒学院副教授,南昌大学汉语国际教育专业硕士生导师,研究方向为语言理论、认知语言学和对外汉语教学。
2017-07-17
国家社科基金项目“汉语语用移情的优选机制及其应用研究”(15BYY146)阶段性成果。