“句法—语义”接口视域中词汇与句法的互动制约研究∗
2018-04-03孙道功施书宇
孙道功 施书宇
(南京师范大学,南京210097;南京体育学院,南京210014)
提 要:“句法—语义”接口的核心问题是如何处理词汇与句法的关系。目前国外对此主要有5种处理模式:词汇语义决定句法、词汇结构决定句法、句法语义影响词汇、句法结构影响词汇、构式语法模式。本文基于大规模语义知识库,以层级性接口理论(词汇单位—角色转化—范畴排序—句法实现—语用制约—语义变化)为指导,在“句法—语义”接口视域中探讨词汇和句法的互动制约关系。结论认为,词汇(词汇单位和词汇语义)对句法(句法结构和句法语义)的制约主要体现为对组合对象、组合框架、角色投射位置的选择限制;句法对词汇产生反制约,主要体现为对充当某一句法语义范畴的词汇单位的生命度、定指度、意愿性等方面产生限制,并对进入句法结构的词汇单位产生规约,引发词汇语义的凸显变化。
世界范围内的自然语言处理经过字处理、词 处理阶段之后先后进入句处理阶段(冯志伟 詹宏伟2018:13)。句处理的核心问题是使计算机理解并生成自然语言的句子。无论是基于规则还是统计的策略,都面临“句法—语义”接口或界面(interface)问题(孙道功2011:7)。目前冠以“句法—语义”接口或界面(以下简称接口)的论文、论著很多,但何谓接口,从研究内容看所指并不一致。徐烈炯认为词义影响句法,包括词义如何影响句法,词义的哪部分并在多大程度上影响句法,就是所谓的“句法—语义”接口(沈园2007:1)。而Ramchand和Reiss从概念外延角度出发,提出接口的广狭两个层面,广义着眼于语言外部,狭义着眼于内部,“句法—语义”接口属于狭义层面(Ramchand,Reiss 2007:34-39)。目前,国外接口研究多倾向于语言内部层面和外部交叉学科的综合研究,国内研究更倾向于语言内部层面的关系研究。
“句法—语义”接口,即句法与语义之间的关联与实现关系,其核心是词汇与句法的关系。“词汇”包括词汇单位和词汇语义;“句法”指句法结构和句法语义范畴,不仅包括词汇单位在句法结构中实现的论元或充当的句法成分,还包括词汇单位角色实现后构成的语义组合模型等。
1 词汇与句法的关系研究回溯
目前国外的接口模式,其共性是将词汇和句法的关系作为其研究核心。但如何处理二者关系形成不同的接口模式,刘宇红根据其观点差异,区分为4种类型:(1)词汇语义决定句法。该观点着眼于名词(或名词性结构)对句法的制约。如Fillmore(1968:1-88)提出基于名词语义特征抽象出的语义格决定句法。Jackendoff提出题元层面(Theme,Path,Location)和动作层面(Agent,Patient)可以决定句法。而Foley和Van Valin提出宏观角色可以决定句法(Jackendoff 1990:212-244),最典型的就是agent和patient(Foley,Van Valin 1984:25)。Dowty提出元角色(包括施事元和受事元)决定句法(Dowty 1991:547-619)。语义格(或角色、题元)都由名词或名词性结构充当,但是名词与语义格的内在关系,以及充当语义格的名词如何被动词制约尚有待研究。(2)词汇结构决定句法。该观点着眼于动词对句法的影响,强调词汇结构对句法的制约。如Baker的题元指派一致性假说认为对动词而言,相同的题元关系表征为相同的句法结构关系(Baker 1996:7-34)。Grimshaw则认为词汇结构中蕴含组合层面形成的题元框架,最终决定句法(Grimshaw 1993:75-89)。而Tenny(1994)的体接口假说理论指出题元结构和题元之间的投射受动词体特征的制约,只有能体现为体特征的参入者才能在句法结构中实现。(3)句法语义影响词汇。该观点着眼于句法语义关系对词汇概念内容的影响。Croft(1991)提出解释事件结构的因果链方法。因果链实际上是一种句子语义关系,包含因、果、力量和动能的传递等要素,而这些要素都是由词汇单位充当。句法语义关系的变化,必然会影响因果链中由词汇单位充当的各个要素。(4)句法结构影响词汇(刘宇红2013:59-63)。该观点着眼于句法内部结构表征对词汇内容的影响。如Hoekstra和Mulder提出句法结构可以改变动词的体特征(Hoekstra,Mulder 1990:1-79)。Hale和Keyser提出可以从句法关系解释词汇的题元结构,并把句法关系概括为“中心词+补语”和“修饰语+中心语”两种类型(Hale,Keyser 2002:1-76)。就现代汉语而言,句法结构是否能够改变动词的体特征有待考察。以上4种模式都表现为研究的单向性。构式语法弥补这一缺陷,在此作为第5种模式,即词汇与句法的双向互动研究。构式语法认为词汇义和构式本身具有双向互动关系。为保证互动的进行,Goldberg提出语义连贯原则和对应原则(Goldberg 1995:48-50)。Goldberg进一步提出动词语义对句法构式的作用体现为:使构式意义更加具体(elaboration)、为构式提供动态作用力(force-dynamicrelation)、提供前提关系(precondition)、表达与构式同时进行(co-occurring activtiy)(同上1997:25-39)。构式对词汇具有反作用:解释句中词汇语义之外的内容、剥夺动词的参入者角色、把参入者角色强加给动词、过滤语义不合格的动词。
相较而言,构式理论对词汇与句法关系的认识更为深刻,尤其是其“双向互动”的观点,对接口的探讨也更具解释力,也更有利于解决多重论元、动词非典型句法的实现以及动词多义性等问题。但构式语法也有若干不足,如研究对象覆盖范围相对狭窄,缺乏在宏观层面词汇和句法关系的探讨等。
2 词汇与句法互动研究的思路
层级性接口理论认为,“句法—语义”接口是通过“词汇单位—角色转化—范畴排序—句法实现—语用制约—语义变化”逐层实现,词汇与句法的制约呈现为双向互动关系(Sun 2015:53-54)。本文基于语义知识库,以层级性接口理论为指导,从制约和反制约两个维度探讨二者的互动关系。如图1所示:
图1 词汇与句法互动研究的技术路线
互动关系考察使用例句均来自于自建的100万字的语义知识库。该知识库标注词汇义类和句法语义范畴等信息,其中词汇义类包括10大类32小类;句法语义范畴包括:动核8大类20小类,基本角色9大类36小类,附加角色5大类28小类,篇幅所限不再赘述。
3 词汇与句法的互动制约及表现
词汇与句法的互动制约具体表现为词汇对句法的制约和句法对词汇的反制约。句法对词汇的反制约问题,在目前掌握的材料中鲜有涉及。本文通过对互动制约关系的探讨,尝试在词汇层面和句法层面之间建立关联,构建词汇与句法的互动关系模型,最终实现词汇语义和句法语义的一体化描写。
3.1 词汇对句法的制约
“句法—语义”接口中词汇处于基础地位,无论是词汇单位的角色实现,还是句法语义范畴的词汇选择,词汇语义都发挥底层制约作用。这里的词汇语义主要是对动词词汇语义而言,名词词汇语义制约主要体现为义征缠绕,将另文讨论。考察发现,词汇对句法的制约主要体现为3方面。
3.11 词汇语义对组合对象的选择制约
Levin和Rappaport的谓词分解理论指出,动词与名词不同,作为对外部世界事件的词汇化和概念化,其内部语义通常表现为事件结构形式,包括词根义和结构义两部分,前者表现为活动方式和结果等,具有恒定性,后者表现为基本谓词序列,具有变化性(Levin,Rappaport 2005:25-39)。动词的组合差异主要体现在结构义上。Perlmutter和Postal的普遍联系假设理论(Universal Alignment Hypothesis)认为,语言中存在一些制约论元实现的普遍原则,这些原则针对的不是个别动词而是语义上属于同类的动词(Perlmutter,Postal 1984:81-125)。语义上相近的动词在句法实现上具有相似性,所以可以通过动词的词汇语义预测与体词性成分的结构关系以及形成的结构模式。实际上,普遍联系假设理论等强调的一致性是就同一义场动词形成的句法或语义框架模式而言的,在具体研究中我们以义类或义场为单位进行考察。对于同一义场的动词而言,具体组合对象的选择仍然受制于动词的语义特征(简称义征)。例如:“吃”和“喝”同属于“进食”义场,形成的句法和语义框架一致。句法框架原型是“主语+谓词+宾语”,语义框架原型是“施事+动核+受事”。但在实际话语中,两词支配的组合对象大相径庭。除流质类食物外,食物义场中其他小类都能与“吃”组合,如“馒头、面条、米饭”等。除非流质(固体)食物外,其他成员都可以与“喝”组合,如“粥、饮料、水”等。同一义场词汇单位在组合对象选择上的差异性,正是因为两个词的词汇义征不同。换言之,词汇语义对组合对象选择具有制约作用。义征分析如下:
吃[+动作][+用口][+咀嚼][+吞咽][+食物][-流质]
喝[+动作][+用口][-咀嚼][+吞咽][+食物][+流质]
“吃”的区别义征是[+咀嚼][-流质],要求组合对象必须具有[-流质]|[+食物]特征;“喝”的区别义征是[-咀嚼][+流质],要求组合对象必须具有[+流质]|[+食物]特征。不难看出,动词词汇语义能够制约与之组合的对象,其义征表达式中已经蕴含组合层面关涉的角色特别是内层角色范畴(inherent role category),以及这些范畴该由哪些词汇单位来填充。
3.12 词汇语义对角色投射的制约
词汇语义对角色投射的制约,主要表现在对角色投射位置的选择上。当某个角色存在多重投射时,就存在位置的优选问题。投射优先选择序列差异也是由词汇语义差异决定的。题元理论认为,动词的词汇语义决定题元框架中的哪些角色必须得到侧重(profiling)。侧重的角色通常是与动词联系的实体,并且对应于必须在视域(perspective)中出现的参与者。这种侧重是由词的词汇语义决定且不受语境影响,被侧重角色投射到主、宾位置时具有优先性(Fillmore 1977:59-81)。实际上,角色侧重差别正是动词之间的语义差别的体现。
以手部动作义场高频动词“打”为例。“打”作为汉语最典型的二价动词,《现代汉语词典》(第6版)收列24个义项。在此仅分析与手部动作直接相关的意义。经过甄别最终确定7个,依次编号为:打1(用手或器具撞击物体)、打2(殴打)、打3(搅拌)、打4(捆)、打5(编织)、打6(揭/凿开)、打7(举/提)。对7个义位分析如下:
打1:[+手部动作][+人类][+手|持具][+敲击][+物体][±出声]
打2:[+手部动作][+人类][+手|持具][+攻击][+人][+受伤害]
打3:[+手部动作][+人类][+手|持具][+搅拌][+物体]
打4:[+手部动作][+人类][+手|持具][+捆绑][+物体]
打5:[+手部动作][+人类][+手|持具][+材料][+编织][+物体]
打6:[+手部动作][+人类][+手|持具][+凿开][+物体]
打7:[+手部动作][+人类][+手][+向上][+把持][+物体]
[+手部动作][+撞击][+攻击][+搅拌][+捆][+编织][+凿开][+把持]等义征要求组合时动作发出者、接受者同现。这就决定“打”子场在组合层面关涉的基本角色范畴是施事和受事。基于语义知识库考察发现,施事可以投射为主语或状语,主语为原型位置。受事可以投射为宾语或状语,宾语为原型位置。以施事为例:
施事通常位于手部动词之前,受事位于之后,形成N施+V+N受模式。当施事或受事投射到状语位置,往往具有特殊语用价值,通常是为了强调和凸显施事或受事成分,需要介引性成分同现才能成立,形成的语义结构包括N受+介+N施+V和N施+介+N受+V两种类型。实际上,“打”对应的义征序列中,已经蕴含N施+V+N受。施事、受事作为动作行为的发出者和接受者,也决定投射为主语和宾语的优先性。[+生命度]的高低强弱也会对投射位置产生影响,[+生命度]高的词汇具有投射到主语位置的优先性。此外,考察发现两个义位义征序列的相似性与角色投射位置一致性正相关,即包含的相同义征数量越多,角色范畴特别是外层角色在投射位置上一致性就越强。本文认为这绝非偶然,这正是词汇语义对角色句法实现潜在制约的体现。由于篇幅所限,语义角色句法投射的诸多问题需专文讨论。
3.13 词汇语义对组合框架的制约
词汇语义对组合框架的制约强调同类动词形成的框架模式的差异,而对组合对象的选择制约强调同类动词对需求的同现对象的不同。对组合框架的制约体现为两方面:一是动词词汇语义特点制约组合框架的类型,如一价、二价、三价动词需要同现的配价成分(valency elements)数量不同,形成的组合框架不同。二是对于同价类或同义场的动词而言,对配价成分需求的强制性程度不同,从而形成不同的组合框架。这是本文分析的重点,以三价的“给予类”动词为例。就理论而言,三价动词需要3个基本配价成分与之同现。实际上,除语用因素外,动词本身对3个基本的配价成分同现的强制性程度并不相同。有些配价成分具有强制约性,必须出现;有些属于弱制约性,隐现并不影响结构的合法性。以“给予类”6个高频动词“给、送、告诉、教、卖、献”为例:
②他给了我一个奇怪的答案。/他给了一个奇怪的答案。/∗他给了我。
③客人送了主人礼物。/客人送了礼物。/∗客人送了主人。
④我不能告诉你事情的真相。/我不能告诉你。/我不能告诉事情的真相。
⑤他教我们英语。/他教我们。/他教英语。
⑥那房子被主人卖给了隔壁老张。/那房子卖了。/那房子被主人卖了。/那房子卖给了隔壁老张。/∗主人卖给了隔壁老张。
⑦招弟献她一个花篮。/∗招弟献她。/∗?招弟献一个花蓝。/?献一个花蓝。
对三价“给予类”动词而言,施事、受事和与事同现,具有语义的合理性和组合的合法性,即N施+V+N与+N受是其原型语义框架模式。但是基于知识库考察发现,不同动词对配价成分的需求限制并不相同,形成的组合框架类型和数量也有差异。包括5种类型:第一,施事和受事是组合的强制项,必须与“给予类”动词同现。与事并非强制项,可以不出现,如例②③⑤⑥,即与事成分缺失是句法结构所能容忍的,而且这种缺失可以通过语境关联得以补偿。换言之,除原型模式外,还可以形成语义框架N施+V+N受。第二,施事和与事是组合的强制项,而受事并非强制项,如例④⑤,可以形成N施+V+N与框架。第三,受事是组合的强制项,是必须与“给予类”动词同现的成分,如例⑥中“那房子卖了”,可以形成N受+V框架。第四,受事和与事是组合的强制项,如例⑥中“那房子卖给了隔壁老张”,可以形成N受+V+N与框架。第五,施事、受事和与事都是语义上的强制项,不可或缺,否则组合结构不具有自足性或语感接受度低,如例⑦。
同属于三价“给予类”动词,形成的组合框架类型和数量并不相同。本文认为与动词本身的词汇语义具有内在关联。“给予类”动词的语义共性是所有权转移,包括两个次类:一是具体物质转移类,如献、给、送、卖;二是抽象信息转移类,即话语信息的转移,如告诉、教。从初步研究来看,物质转移类形成的组合框架类型和数量相对较少,信息转移类较多。另外,与事不是语义上的强制项,尤其是当与事所指对象是众所周知或不言自明时,其隐含自由度越高。而“献”形成的组合框架中,与事之所以不可或缺,仍与词汇语义有关。因为“献”表示下对上的给予关系,与事和受事成为凸显的焦点(focus)信息,而施事成为背景(background)信息,所以与事侧重为组合框架中的强制语义项。此外,“献”还有一点不同,即在应用时倾向于把表示上级的与事用介词提前,达到信息凸显的语用目的,如例⑧:
⑧少先队员向先烈们献了花圈。
此外,“卖”在语义上属于物质转移类,但形成的组合框架比同类动词多。原因是“卖”强调转移的有偿性,而有偿性及其多少与“卖”的内容直接相关,所以受事成为强制度最高的语义项。显然,同一义场词语在组合框架类型及数量上的差异性,同样受制于词汇语义。
3.2 句法对词汇的反制约
3.21 句法结构对词汇单位的语义需求限制
当若干词汇单位形成句法结构时,并不是无序的组合。范畴义征会对尝试进入句法结构的词语进行规约,只有符合范畴义征规约条件才具有实现为某一句法语义范畴的可能性(孙道功2011:311)。如“打”要求动作主体具有[+有生性]的范畴义征,但并不意味着具有该特征的词汇单位就可以充当其施事。句法结构对词汇单位的义类具有选择制约作用,即充当某一句法语义范畴的词汇通常具有某一义类特点,或者属于同一义场的成员。句法结构对词汇单位的选择性制约,与词汇对句法结构的制约相辅相成。仍以三价“给予类”动词为例。该类动词在语义上要求施事、受事和与事3个配价成分,虽然配价成分都是由名词或名词性结构充当,但是形成的句法结构对填充配价成分的词汇在定指度、生命度等方面具有不同的规约要求。本文借鉴周国光(2013:195-213)的研究方法,分析如下:
3.211 定指度
基于知识库考察发现,“给予类”动词形成的句法结构中,施事对所填充词语的定指度要求最高,受事最低,与事介于二者之间,例如:
⑨那位先生给了他一个银元。
⑩他回国后手把手教给每一个学生国外最新的技术。
充当施事的,如“那位先生、他”都是定指成分,定指度高;充当受事的,如“一个银元、国外最新的技术”属于不定指成分,定指度低。而充当与事的两者兼而有之,“他”是定指成分,“每一个学生”是不定指成分。在语料中,虽然例⑨表示定指的“那位”有时会缺失,但在语境中仍然指向明确,仍具有定指度高的特点。定指度高低具有相对性,对定指度高低的词语选择实际上代表一种倾向性。如“每一个人都给了他鼓励”,施事为非定指成分。之所以如此,是因为该句表达是为强调周遍性,所以施事才会由定指度低的“每一个”填充。基于语义知识库随机抽取的200个包含“给予类”动词并且3个成分同现的例句考察发现:施事中定指型占95.63%、非定指型占4.37%;受事中分别是9.43%和90.57%;与事中分别是52.62%和47.38%。
3.212 生命度
除定指性外,施事倾向于由生命度高的指人(或拟人化)名词充当,受事则多由生命度低的指物名词充当,而与事处于二者之间。仍以随机抽取的200个“给予类”动词构成的句子为对象,考察发现:施事中生命度高的指人名词占96.21%、生命度低的指物名词(包括拟人化)占3.79%;受事中指人名词占6.35%、指物名词占93.65%;与事中分别是96.36%和3.64%。这种分布比例与“给予类”动词语义密切相关。此外,生命度低的指物名词因为配价成分类型差异又有所区别。施事和与事类似,出现类型包括机构、国家、单位和省市名称等。受事最为复杂,几乎所有指物名词都可以充当受事。
3.213 意愿性
“给予类”动词的核心语义表示所有权转移,这就决定形成的句法结构表达语义的意愿性或主动性。意愿性是“给予类”动词的词汇语义赋予的,但对配价成分意愿性强弱需求限制是由句法结构决定的。“给予类”动词形成的句法框架决定配价成分中施事的意愿性倾向最强,而与事次之,受事属于所有权转移对象,意愿性最弱,例如:
⑪姑妈送我一个新文具盒。
显然,例⑪中施事和与事都表现出较强的意愿性,因为代表所有权转移的双方,没有意愿性参与,就无法实现物品的所有权转移。相对而言,施事意愿性更强,是动作的发出者,也是决定这一事件顺利完成的动力要素。与事意愿性也相对较强,是所有权转移的接受者,如果没有与事的自愿配合,事件也无法顺利完成。意愿性强弱也是相对而言的,没有具体的量化指标。本文认为意愿性还体现在“给予类”动词构成句子的主动义上。基于随机抽取的200个句子考察发现,95%都是主动结构,被动结构只有10例,仅占5%,例如:
⑫小女孩被人贩子卖给了杨瘸子。
“给予类”动词之所以倾向选择主动结构,与所表达的意愿性是统一的。同时,句法结构对不同角色填充成分意愿性强弱的不同需求,也体现出句法结构对词语义类的制约。
3.22 句法结构引发的词汇语义变化
静态词汇单位进入动态的句法结构,其语义会受到组合对象的影响和制约而引发语义变化。主要表现为两个方面。
3.221 句法结构引发词汇义征的凸显
句法结构会引发某一词汇单位凸显某个或某些义征,从而使某个或某些义征成为实际使用义,其他成为背景隐含义。如“给予类”动词“给”,义征分析如下:
给[+动词][+人类][+主动][+转移][+所有权][+平级]
⑭你给我句痛快话!
例⑬属于常规凸显;例⑭属于非常规凸显,仅凸显[+言说]义,并没有凸显义征表达式的常规意义,也没有实现所有权的真正转移。
3.222 句法结构引发词汇义征的变化
除义征的凸显外,词语在进入句法结构时,有时还会引起义征数量的增减或转化。如“给予类”动词“借”,强调“把物品或金钱暂时供别人使用”,义征分析如下:
借[+行为][+人类][+主动][+转移][+所有权][+时限][+平级][+物品/金钱]
⑮我借你个胆,你也不敢去。
按照“借”的常规语义,该句指“我把我的胆借给你用”。实际上,这种所有权的转移无法实现。在句法结构的规约下,[+转移][+所有权]等义征脱落,“胆”转指“胆量或勇气”。这虽与认知语言学的转喻有关联,但毫无疑问这种转化是“借”进入句法结构后引发的。
3.3 基于词汇与句法互动制约的接口模型
在“句法—语义”接口视域中,以词汇与句法的互动制约为核心,层级性的“句法—语义”接口模型如图2所示:
图2 层级性的“句法—语义”接口模型
4 结束语
“界面互动研究近年来受到学界的广泛关注。”(薛兵 张绍杰2016:59)词汇与句法的关系作为“句法—语义”接口的核心,其处理方式和研究方法具有重要的理论意义和方法论价值。本文在“句法—语义”接口视域中,对已有研究模式评介的基础上,基于语义知识库,从制约和反制约两个维度探讨词汇与句法的互动关系,并构建基于互动制约的接口模型。但词汇与句法的互动制约非常复杂,尤其是其制约机制仍需进一步探究。