格“变”:超越抑或过载?
——从格语法到框架网络评Fillmore语义学思想
2017-09-08杨林伟
杨林伟
(1.北京外国语大学,北京;2.烟台大学,山东烟台)
格“变”:超越抑或过载?
——从格语法到框架网络评Fillmore语义学思想
杨林伟1.2
(1.北京外国语大学,北京;2.烟台大学,山东烟台)
Fillmore语义学思想历经三个发展阶段,主要体现为格语法和框架语义学两个理论。以框架语义学为基础的框架网络项目是Fillmore语义学思想的最新进展。前人研究从宏观视角以介绍与评述两种理论、梳理理论的发展与演变为主,鲜有关于Fillmore语义学思想发展的评价研究。本文首先概述Fillmore的语义学思想发展过程,然后从微观视角系统分析“深层格”到“框架元素”的演变过程。研究发现,“格”问题的处理是其思想发展的主线,由“格”到“框架元素”演变体现了Fillmore由规定到描写、由理性到经验、由理论到实践、由句法到词汇的思想变化。然而,这一变化未能彻底解决“格”问题,且有重蹈格语法“覆辙”的可能。
格;格语法;框架网络;语义角色
1. 引言
格语法(Case grammar)由Fillmore(1968)提出,开启了句法语义研究的新路径。自问世之初,格语法便得到语言学界,特别是自然语言处理学界的青睐,并在多个研究领域中得以应用。在生成语法理论中,格语法被认为是以“格”为基底的转换语法,对名词在语句中的语义角色分类具有任意性,最终在管约论中发展成为题元角色。在自然语言处理研究中,格语法作为语义分析理论,曾是语句分析与扩充转移网络(Augmented Transition Networks)的核心(Schank & Colby, 1973; Harris, 1985)。在理论语言学界,格语法理论曾被视为分析语句语义的主要方法,研究语句的谓词与论元(Lakoff,1972)。格语法作为经典语言学理论之一,无论在理论语言学、计算语言学还是自然语言处理学界都发挥着重要作用,值得研究者关注。
学界对Fillmore语义学理论的研究主要包括格语法与框架语义学理论介绍(程琪龙,1995;潘艳艳,2003;杨成凯,1986),以及框架网络(FrameNet)、框架语义学与格语法之间的关系(冯志伟,2006;刘宇红,2011;陶明忠 马玉蕾,2008;汪然等,2013;武仲波,2015),少数研究者(汪然等,2013)从框架网络视角对Fillmore语义学思想的发展进行评述。现有研究多关注格语法不同阶段的理论发展及宏观评述,缺乏对理论中核心概念的历时演变微观考察。有鉴于此,本文试图对比分析深层格、格框架、场景、视角等核心概念在格语法理论中与框架网络中的差异,以微观证据为基础进而从理论与方法两个层面对Fillmore语义学思想的发展进行评价。
2. 理论发展概述
杨成凯(1986)将Fillmore的格语法理论划分为两个发展阶段,Fillmore(1968)和Fillmore(1971)为“初期”,Fillmore(1977)为“二期”。陶明忠马玉蕾(2008)沿用杨成凯(1986)的划分方法,认为框架语义学(Fillmore,1976/1982)是格语法的进一步发展,即“第三阶段”,并指出“框架语义学和框架网络是理论与实践的完美结合,适应了时代的需求,解决了上面提到的格语法理论中所存在的所有问题①陶明忠、马玉蕾提出的格语法问题有四个:语义格清单无法确定、语义格身份模糊、有些核心成分的句法关系不遵循突显等级顺序、对语义成分与句法关系的研究不完整。”。冯志伟(2006)将上世纪90年代末Fillmore基于框架语义学理论建立的语义框架网络视为格语法的最新进展。本文将前人对Fillmore语义学思想发展阶段的划分连在一起(见图1),对这一思想在初期格语法、二期格语法、框架语义学、框架网络这四个阶段的发展过程加以研究与评述。
图1 Fillmore语义学思想发展过程
2.1 初期格语法
初期的格语法重在探讨语言中的普遍语义和句法关系,继承了转换语法中关于深层结构经过转换得到表层结构的基本假设。与Chomsky (1965)不同,格语法理论中的深层结构表现为语句中名词短语与谓词之间存在的深层语义关系,即“深层格”。转换语法则用词汇语义对句法作进一步制约(选择性限制),而这种限制只是对词汇的再分类,难以囊括全部词汇语义内容。格语法可以将语义与句法融合起来以探讨深层格生成表层结构的普遍性(句法共性),比Chomsky(1965)的标准理论更为精确,是转换语法理论的修正。Fillmore(1968)认为语法理论模型中应该有一种基础结构(base structure)的概念,在这种基础结构中,格(case)的关系是这一理论的初始项;在这种基础结构中没有主语、宾语这样一些概念,因为这些概念只属于某些语言的表层结构。因此,使用格框架分析句法结构可以避免生成“酒喝约翰”这样的句子,比转换规则更加精密,可以从语义角度弥补生成语法的不足。当时的语言学界将格语法称为探讨结构与语义之间关系的新语法理论,同时也是一种新的语义学理论(王玲玲,1994)。
格语法中的格(case)与传统语言学研究中的句法格不同,没有形态变化,是语句(clause)深层的语义格。语义格指句中的参与成分(participant)与谓词之间所具有的深层语义关系,在格语法里,其形式标记(即格标)是前置词。谓词总是与某些语义格产生句法语义关系,并形成一定的格框架。例如,“John opened the door with the key.”可表示为框架[_____ O + A + I ]。因此,按照格语法第一条基础原则,上述简单句可以表示为:M+[_____ O + A + I ]①格语法认为,一个简单句由两部分构成,即S →M+P。S代表句子,M代表情态(时态、语态等),P代表命题(即格关系)。(Fillmore,1968:45);其表层形式是据此深层语义格关系生成的。主语选择原则②如果句子中有A,A为主语;如果没有A而有I,I 为主语;如果无A无I,O为主语(Fillmore, 1968:33)。则是由深层格到表层结构转换的重要规律。一个句子从深层结构转换为表层结构的过程,一般可以总结为以下五个步骤:从深层格中选出表层主语;表层主语前置;主语前置词删除;宾语前置词删除;时态加入谓词。然而,Fillmore以有限的格关系解释普遍句法现象的做法受到了学界(Anderson, 1971; Huddleston, 1970)的质疑。面对质疑,Fillmore(1971)对格语法理论进行了修正。为了克服确定格清单的主观性,他提出一格一用、对立、互补等三条法则,将原来的6个抽象语义格修正为9个,并按照主语选择等级进行排序。Fillmore(1971)认为确定格的法则仍然具有很强的模糊性,但是相比最初的格表,依据上述法则确定的新格表已经令人满意了。
2.2 二期格语法
初期格语法理论仅靠格角色这个平面把语句所描述的事件跟语言结构联系起来,直接用格角色去解释句子的语义和句法现象。这种方法虽然比较简捷,但是存在缺陷,无法全面、细致地描写自然语言。格定义、格标准、格数目等难以确定一直是格语法的棘手问题。另外,Anderson (1971)等一些语言学家发现,识别某些普遍语义规律,需要使用深层结构的主语和宾语的语义功能。如(1b)中的直接宾语是the truck,传达的意义与(1a)不同。(1b)带有“装满干草”的含义,而(1a)则没有,这取决于深层结构中the truck作部分性解读(partitive interpretation)还是整体性解读(holistic interpretation)。
(1)a. I loaded hay onto the truck. 我把干草装进了卡车。
b. I loaded the truck with hay. 我用干草装满了卡车。
针对上述两个棘手问题,Fillmore(1977)再论(reopen)格语法时,认为“格语法”这一术语本身容易产生误导,需要对格角色进行了重新解读,并提出了识别与确定格角色的新方法(Fillmore,1977: 75)。Fillmore把初期格语法理论中表示格角色的结构叫做底层结构,底层结构由格角色构成,经过转换可直接得到表层结构;而在二期格语法中,由格角色构成的底层结构,在转换之前还必须在“场景”(scene)的制约下,通过“视角”(perspective)的选择,进行深层主语和深层宾语等语法关系的分配,从而得到深层结构,然后进入转换部分,得到语句的表层结构。这样一来,每一个句子就有格角色、语法关系和表层结构三个平面。格角色和语法关系这两个平面,把语句所描述的事件联系起来,解释其语义和句法现象。如(1)a与(1)b的句法语义差异可由“场景”、“视角”和深层语法关系加以解释。
2.3 框架语义学与框架网络
框架语义学是对二期格语法的进一步发展和阐释,其中心思想是对词的意义的描述必须与语义框架相联系。Fillmore(1976)提出“描写语法和词汇特征时,需要增加对认知框架和互动框架的描写”。框架是信仰、实践、制度、想象等概念结构和模式的图解表征,它为一定言语社团中意义的互动提供了基础(冯志伟,2006)。比如,表示商业事件的认知框架包含买方、卖方、商品、货币等语义角色;包括钱和商品在买卖双方间发生位移这一子事件;还包括商品交易前后,对钱和商品所有权发生转移的认知理解。诸如“buy”、“sell”、“pay”、“charge”、“cost”等词中的任意一个都可以激活人们大脑中的商业实践框架,尽管只是将整个框架中一小部分语义角色前景化。被激活的认知框架投射为某个特定的语义框架,这个特定的语义框架通过特定的句法语义形式得以表达。因此,需要在框架中描写和理解语言的本质。
基于框架语义学理论,Fillmore重视词语的句法、语义特征的研究与描写,并于上世纪90年代末开始致力于框架网络的建设研究。框架网络是由Fillmore主持的计算词典学项目,该项目于1997年获美国国家科学基金会(National Science Foundation)批准,旨在建立基于框架的英语通用词库(Fillmore,2003)。框架网络中的框架(Frame)是指该项目的理论基础,即框架语义学;网络(Net)是指词汇参与构建的语义网络。框架网络主要包括以下四部分内容:配价型式(Valency Pattern)、框架内词汇关系(Frame Element)、框架间关系(Frameto-Frame)以及词汇与标注数据库(Database)。通过对大规模语料库(BNC)中词汇的语义与句法信息进行人工标注,结合一定的自动处理技术,提取、构建词汇语义数据库并在网络上加以呈现。框架网络最新版(R1.6)官方数据显示,截止到2015年7月,框架网络已形成了较大规模,包含1205个框架和情景(Scenario),13312个词汇单位(Lexical Unit),10333个框架元素。
3. 理论发展中的格“变”
通过对Fillmore语义学理论发展路径的梳理,本文发现Fillmore语义学理论始终坚持《格辩》中提出的句法语义关系研究主线,其对同一问题的不同范式取向导致了理论的不断演变。换言之,Fillmore对“格”问题的处理是其思想不断演变的主线。陶明忠、马玉蕾(2008)认为框架网络中使用的关键词语大多是从前期格语法发展而来的,并对相关术语做了扼要对比。本文在此基础上对核心术语进一步细分,分为初期格语法、二期格语法和框架网络三个阶段进行对比(见表1)。可以看出从格语法到框架网络中术语表述的主要变化:框架、底层结构、场景、视角等对应框架网络中的框架、深层格,核心与外围成分对应框架元素,框架特征对应句法配价型式。下文将分阶段系统整理格“变”的过程,并加以评述。
表1 格语法与框架网络术语对比①本表修改自陶明忠、马玉蕾(2008),本文作者调整了部分相关术语及呈现方式。
3.1 初期与二期理论中的格“变”
深层语义格是格语法解释语义和句法现象的基本工具。语句中谓词与名词短语的深层格决定了其表层句法形式,而这种深层格是存在于所有语言中的少量集合,具有普遍性(见表2)。在初期格语法理论中,Fillmore(1968)总结出了六种深层语义格,同时认为可能还存在其它的语义格,难以给出完备的格清单。Fillmore(1971)进一步完善了格语法理论:提出了确定深层格的具体原则,对原来的格表进行了增删和调整,认为新的格清单是相对令人满意的。然后,在二期格语法中Fillmore(1977)逐渐放弃了制定格清单的努力,只在分析句子时偶举格的名称,转而从场景、视角入手解释深层格与表层结构之间的语法关系。表2显示,在《再论格辩》中Fillmore仅仅提到了四种深层格。陈忠平、白解红(2012)认为Fillmore (1977)逐渐为格语法研究“画上了句号”,开始了一条从场景经由视角到句义再到语法功能的分析路径,即认知转向。本文认为,上述论断简明扼要地指出了二期格语法理论的核心思想,但是断言格语法的终结未免有失偏颇。虽然格的数目骤减,但是这一路径尚无法摆脱深层格的作用(见前文概述中的分析),而且新路径恰恰是为解决格语法问题而提出的。客观地讲,Fillmore解决格语法问题的新方案或新方法与初期格语法的范式已大有不同,开始由通过理性制定抽象深层格角色的做法逐渐转向对特定场景中参与事件的语义角色进行具体描写。在2010年的一次访谈中,Fillmore表示“自己在某个时间点上,意识到应该放弃格语法中对抽象格角色的定义,转而描写格框架、识别和确定框架中的语义角色”(Andor,2010)。本文有理由认为,二期格语法理论的提出可视作Fillmore所提到的某个时间点。
表2 语义格表①本表引自杨成凯(1986)。
3.2 框架网络中的语义角色
框架网络中语义角色(即框架元素)的确定由所在的具体框架决定。因此,在讨论之前,有必要先厘清框架的概念。框架网络中的框架是指对事件情形的图示表征,包括不同的框架元素,诸如参与者、道具以及其它概念角色,大致相当于框架语义学中的场景。在框架语义学中,框架与场景是两个相关但不相同的概念。场景是指事件情形的概念化,而框架则是场景的某种特定视角。因此,两者具有不同的抽象等级水平。在框架网络中,虽然表面上“框架”既指场景又指框架,但是内部结构中保留了不同的抽象等级。而这些框架通过不同抽象等级水平的关系相互连接在一起,形成框架网络。例如,Employment_ Scenario框架与Employer’s_Scenario和Employee’s_Scenario框架具有“视角”关系,同理可知Employment_start框架与get_a_job和hiring框架的关系。Hiring框架的上位框架是抽象等级水平更高的Intentionally_Affect框架(有39个下位框架)。更为复杂的框架间关系,参见图2。
图2 选自Baker 2006年在第四届构式语法国际会议上的报告
语义角色的确定由框架的不同抽象等级水平决定。较高等级水平框架中的框架元素基本涵盖了格语法理论中的高度抽象的格角色,而低级水平的具体框架则使用更为具体、与日常生活语言接近的普通词汇(一般与词汇单位相同或相近),具有较低的抽象等级。因此,框架网络继续沿用了格语法的抽象格角色(如Agent、Patient、Theme等),并增加在标注过程中不断增加(如Frequency、Duration、Entities、State等)。而在低级水平的具体框架中则使用具体的语义角色,对诸如时间、地点等非核心框架元素仍然使用格语法中的抽象格(如Time、Place等)。如hiring框架包含的框架元素包括:核心框架元素Employee、Employer、Field、Position、Task以及非核心框架元素Compensation、Contract_basis、Instrument、Manner、Means、Purpose、Time (见例句(2))。Hiring所继承的上位框架Intentionally_affect包含以下框架元素:核心框架元素Agent、Patient、Event以及非核心框架元素Degree、Event_ description、Instrument、Manner、Means、Place、Purpose、Time (见例句(3))。
综上所述,框架元素的确定取决于框架的抽象程度,与激活框架的词汇单位的抽象程度密切相关。那么,问题是如何确定框架或词汇单位的抽象度?是否需要避免高度抽象格与具体语义角色的混合使用?框架网络中的语义角色确定与格语法中深层格确定的范式不同,前者以经验为主,结合理性从大量真实的语言数据总结归纳,而后者以理性内省为主,难以确定格清单。本文认为,理性结合经验的做法虽然使得语义角色的确定更为全面和客观,但是显然难以克服格语法存在的缺陷。语言事实在不断增加,如何确定框架网络中的语义角色是全面的,框架网络项目是否有终点呢?
(1) [Last month TIME], [IBM EMPLOYER] HIRED [Mike Zisman EMPLOYEE] [as a manager POSITION] [to head up its storage software group TASK].
(2) [A professional dishwasher AGENT] doesn't DO [dishes Patient] [with a rag INSTRUMENT] [anymore TIME]!
4. 超越(Overcome)抑或过载(Overload)
格语法理论作为Chomsky(1965)理论的修正,深受理性主义哲学思想的影响,本质上是一个关于语言语义的普适性理论。然而,面对难以解决的理论问题,Fillmore不断将其发展。从格语法到框架网络的格“变”视角不难看出,该理论由最初的规定性普适理论逐渐发展为以描写语言现象为主的语义理论,由纯理论探讨发展为框架网络应用实践。可以说,Fillmore语义学思想从格语法时期的理性主义逐渐转向了框架网络时期的经验主义。这种哲学思想的变化可以在Fillmore(1992: 35)中得以印证:“我认为,无论语料库有多大,都不可能包含全部的词汇与语法信息;但是,任何一个语料库都可能包含我们无法想象的语言事实”。
毫无疑问,Fillmore后期经验主义为主的研究范式的重要性不言而喻。陆俭明(2006)认为,在自然语言处理和理解研究领域,词语特征的分析和描写被放到非常重要的位置,走上了“大词库,小规则”之路。词语携带了丰富的句法语义信息,它在很大程度上决定了它所在的句子的句法语义结构。因此,重视词语的句法、语义的特征的研究与描写,将是解决好句法语义接口问题的重要一步。Fillmore在框架网络中放弃了格语法试图制定少量深层格以及句法转发规则的做法,由规定到描写的范式转变对计算语言学和自然语言处理等研究领域有着重要影响。语义角色的细化及其语法功能信息的标注,比如,配价形式与句法实现所表示的信息(见表3),结合了语义与句法功能,尤其适用于自然语言处理研究中的自动问答研究与机器翻译(黄昌宁 张小凤,2002)。另外,基于经验主义的语义角色标注避免了定义格语法饱受诟病的格清单难以确定的问题(袁毓林,2007),同时还可以对名词、形容词、副词等词汇单位所激活的框架和语义角色进行概括。从上述两个意义上讲,以词汇语义为核心的框架网络超越了以句法语义为核心的格语法理论。
表3 词汇单位hire的配价型式示例及例句
纵然框架网络的范式在应用实践中产生了重要影响,其实践中的“过载”问题亦不能忽视。“过载”问题在框架网络最新版的基础数据表(表4)中可见一斑,主要体现在以下两个方面:首先,具体格的确定是主观的,与之密切相关的适度抽象和概括的语义角色也是主观的,而且格与语义角色的数量非常庞大,因此在人工标注时耗时耗力。其次,在数量庞大而且主观性强的语义角色标注中,确保团队成员之间以及个人内在的一致性非常重要,但是难度颇大。尽管可以通过计算机标注软件在一定程度上提高效率,但是无法彻底解决“过载”问题。框架网络团队试图通过网络“众筹”的方式解决这一难题,至今没有收到效果。本文认为,在现有的数据基础上开发语义角色训练集以及自动语义角色标注工具是解决“过载”问题的主要办法。
表4 框架网络基础数据节选
5. 结语
“格”问题的处理是Fillmore语义学思想演变的主线,格“变”是其主要表征,理论根源在于理性主义与经验主义研究方法的“摆钟”。Fillmore不断探索语言意义及其句法实现的真理,其思想经历了由规定到描写、由理性到经验、由理论到实践、由句法到词汇的演变。然而,框架网络在应用实践中的重要意义无法、也不能弥补其理论上的缺陷。在于格语法时期提出的情态(M)在框架网络阶段仍然如同一个神秘的“黑匣子”,至今难以打开。按照现行的研究方法,框架网络研究开始进一步关注并研究情态动词、否定、隐喻等词或短语所激活的语义框架、语义角色以及配价型式,微观上“过载”问题更为凸显。据此,本文大胆推测,格“变”未能彻底解决“格”问题,且有重蹈格语法“覆辙”的可能。
[1] Anderson, R. 1971. On the role of deep structure in semantic interpretation [J]. Foundations of Language, (3): 387-396.
[2] Andor, J. 2010. Discussing frame semantics: The state of the art: an Interview with Charles J [J]. Fillmore. Review of Cognitive Linguistics, (8): 157-176.
[3] Chomsky, N. 1965. Aspects of the Theory of Syntax [M]. Cambridge: MIT Press.
[4] Fillmore, J. 1968. The Case for case [A]. In E. Bach & R. Harms (eds.). Universals in Linguistic Theory [C]. New York: Holt, Rinehart and Winston, Inc.
[5] Fillmore, J. 1971. Some problems for case grammar [J]. Monograph Series on Languages and Linguistics, (24): 35-56.
[6] Fillmore, J. 1976. Frame semantics and the nature of language [J]. Annals of the New York Academy of Sciences, (1): 20-32.
[7] Fillmore, J. 1977. The Case for case reopened [A]. In P. Cole & J. Sadock (eds.). Syntax and Semantics: Grammatical Relations [C]. New York: Academic Press.
[8] Fillmore, J., R. Johnson & R. Petruck. 2003. Background to frameNet [J]. International Journal of Lexicography, (3): 235-250.
[9] Fillmore, J. 1992.‘Corpus Linguistics’ or‘Computer-aided Armchair Linguistics’[A]. In J. Svartvik(ed.). Directions in Corpus Linguistics[C]. Berlin: Mouton de Gruyter.
[10] Harris, D. 1985. Introduction to Natural Language Processing [M]. Virginia: Reston Publishing Co.
[11] Lakoff, G. 1972. Linguistics and natural logic [A]. In D. Davidson & G. Harman (eds.). Semantics of Natural Languages [C]. Netherlands: Springer.
[12] Huddleston, R. 1970. Some remarks on case-grammar [J]. Linguistic Inquiry, (4): 501-511.
[13] Schank, C. & M. Colby. 1973. Computer Models of Thought and Language [M]. San Francisco: WH Freeman.
[14] 陈忠平 白解红.2012.格语法式微中的认知转向:重读“再论‘格’辩”[J].外语学刊,(5):81-84.
[15] 程琪龙.1995.试论Fillmore格语法1971模式[J].解放军外语学院学报,(6):16-20.
[16] 冯志伟.2006.从格语法到框架网络[J].解放军外国语学院学报,(3):1-9.
[17] 黄昌宁 张小凤.2002.自然语言处理技术的三个里程碑[J].外语教学与研究,(3):180-187,239.
[18] 刘宇红.2011.从格语法到框架语义学再到构式语法[J].解放军外国语学院学报,(1):5-9+62,127.
[19] 陆俭明.2006.句法语义接口问题[J].外国语(上海外国语大学学报),(2):30-35.
[20] 潘艳艳.2003.框架语义学:理论及应用[J].外语研究,(5):14-18.
[21] 陶明忠 马玉蕾.2008.框架语义学——格语法的第三阶段[J].当代语言学,(1):35-42,93,94.
[22] 汪然 金延伟 胡逸君.2013.从“格语法”到“框架语义学”的演变之梳理[J].语言学研究,(1):112-121.
[23] 王玲玲.1994.格语法及其在汉语研究中的应用—“信息处理用语言理论讲话”第三讲[J].语言文字应用,(4):97-101. [24] 武仲波.2015.框架语义学和框架网络对格语法的继承与发展[J].外语研究,(6):22-27.
[25] 杨成凯.1986.Fillmore的格语法理论(上)[J].国外语言学, (1):37-41.
[26] 袁毓林.2007.语义角色的精细等级及其在信息处理中的应用[J].中文信息学报,(4):10-20.
The Change of“Case”: Towards Overcoming or Overloading?— On Fillmore’s Semantic Theories from Case Grammar to FrameNet
Fillmore’s semantic theories have undergone three stages of development, and are featured by case grammar and frame semantics, from which the latest development of FrameNet originated. Previous studies of Fillmore’s theories focus mainly on the linear development as well as the pros and cons of them from a macro perspective, and few researchers investigate Fillmore’s developing thoughts of semantics from a microperspective.
This paper firstly reviews the development of Fillmore’s semantic theories, and then systematically examines the change or development of core construct of“case”and frame elements from a new micro perspective. The findings show that the“case”problem is the main line of his ideological development, and that the methodological changes from prescriptivism to descriptivism, rationalism to empiricism, theory to practice as well as syntax to lexicology underlie the change of“case”. It is also concluded that it might not overcome the limitation of case grammar theory, and that instead it might become overloaded for the research of meaning.
case; case grammar; FrameNet; semantic role
H0
A
2095-4891(2017)03-0043-06
杨林伟,博士生,副教授。研究方向:语料库语言学
通讯地址:100089 北京市海淀区西三环北路2号 北京外国语大学中国外语与教育研究中心