汉语言说域框架层级的确定及框架式的构建
2015-03-20郭珊珊
郭珊珊
(湖南农业大学外国语学院,中国 长沙410128)
一、引 言
陶明忠(2008)在分析英语框架网络的结构时指出,英语框架网络在语义框架式之间建立了错综复杂的关系,像人体的神经系统一样,形成了一个四通八达的网络。抛开限定域框架式与其它域框架式之间的关系不谈,单在限定域内部的框架式之间就可能形成非常复杂的关系。这种复杂的关系来源于人类大脑中的知识。我们相信这些知识不是杂乱无章地堆放在一起的,而是按照一定的顺序分门别类地组织起来的。因此,有必要在为言说域设计框架式之前,先按照语义关系为其建立一个“自上而下”的框架层级。范开泰(2007)认为,框架层级的确定可以避免像英语框架网络那样由于完全采用“自下而上”的经验主义路线,而导致框架设计缺乏系统性,需要不断增补的弊端。陶明忠(2008)、马洪海(2008)、周领顺(2009)等在研究汉语身体域、交易域、移动域的时候,均确立了框架层级,体现了汉语框架语义研究“自上而下”和“自下而上”相结合的研究思路。本文拟沿用这一思路确定汉语言说域的框架层级,并以“告知”框架式为例展示言说域框架式的构建模式。
二、言说域的框架层级
范开泰(2005)在论述汉语框架语义分析的原则时指出,为了方便框架语义结构分析,显示语义框架的层级性,一般可以把一个限定域的框架区分为框架域、框架分域、框架类、框架式4 个层级类型。
(一)框架域
人们对经验世界的认知可以划分为不同的领域,反映在人类语言中,便形成一个个不同的语义域,如“交易域”、“认知域”、“情感域”、“时间域”、“空间域”等等。我们给各个域建立语义框架,便形成一个个语义框架域,如“言说框架域”(简称“言说域”)就是众多语义框架域的一种。按照我们对语义框架的理解,框架域可以看成是最高层级的框架,不同层级的框架通过“域”被组织起来。
(二)框架分域
根据言说场景中言说主体是否“以言行事”(To do things with words),即言说主体是否通过言语活动来实施言外行为,言说域可设立两个分域——“言语行为分域”和“言说活动分域”。大多数言说场景表现的是一种言语行为,其言说主体既有言说活动,又通过言说活动实施了某一言外行为。如“他赞美了小王几句”,其中“赞美”既表示了“他”实施的言说活动,而且“他”通过“赞美”这一言说活动向“小王”表明了自己的态度,属“言语行为分域”。而“他嘟囔了几句”中,“嘟囔”只是“他”所实施的一种言说活动,“他”并没有通过这一活动实施任何言外行为,属“言说活动分域”。两个分域的区分与词元的性质有关。多数言说域词元属传统上的言语行为动词,如“陈述、解释、报告、建议、命令、承诺、许诺、反对、称赞、声明”等,这些词元激活“言语行为分域”;少数言说域词元不是言语行为动词,主要有“唠叨、叨唠、絮叨、念叨、叨咕、嘀咕、嘟囔、嘟哝”等,这些词元激活“言说活动分域”。
(三)框架类
框架类是指把语义上密切相关的一个个框架式聚合在一起所形成的类。属于同一个框架类的框架式,激活的场景相似,场景的参与角色也大体相同。例如[劝说]、[命令]、[提议]、[催促]、[请求]、[叮嘱]等框架式,都可归入“指令”框架类。一个框架类一般包括几个框架式,这时,框架类和框架式之间是总分关系;一个框架类有时也可以只有一个框架式,这时,框架类和框架式之间是继承关系。根据场景的相似性和语义的相关性,我们将言说域中的言语行为分域分为“阐述”、“指令”、“询问-招呼”、“应答-允诺”、“主观表态”和“双向交流”等6 个框架类,将言说活动分域分为“唠叨”、“自语”2 个框架类。
(四)框架式
构成框架类的场景可以再细分为更具体的场景,如“主观表态”场景可以细分为“同意”场景、“反对”场景、“抱怨”场景、“赞美”场景、“批驳”场景、“吹捧”场景、“评议”场景、“讥讽”场景等,相应地也就构成了[同意]、[反对]、[抱怨]、[赞美]、[批驳]、[吹捧]、[评议]、[讥讽]等框架。这种处于框架类下一层级的框架,可称之为“框架式”。“框架式”就是具体的动词所能激活的语义框架的聚合体(陶明忠,2008)。它是对框架类的细化,是框架类的具体体现。
在框架语义分析中,框架式主要由框架元素和词元构成。每一个框架式都包含若干框架元素,框架元素有核心元素和非核心元素的区别。核心元素是指在一个语义框架中被凸显的前景成分,它是构成一个框架最基本的成分,可以显示框架的个性,如[告知]框架中的说话者、受话者和信息。非核心元素是指一个框架里没有被凸显的后景成分,它并不显示框架的个性,可以出现在多个框架中,如时间、处所、方式等元素几乎可以出现在每个框架中,有人称之为外围元素。框架式中还拥有至少一个或一群词元,同一个框架式的一群词元在语义上大体相当。一个具体词元跟相应的框架元素结合成“语义框架”。一群意义大体相当的词元跟大体相同的框架元素结合为“框架式”。
在上述四个框架语义层级中,框架式是最重要的一级。这是因为,框架式既比具体的语义框架更具概括性,又能够显示不同的框架类和框架式的特点与区别。因此,范开泰(2007)认为,框架语义的组合分析主要在“框架式”这一层级展现,框架式应该是框架语义分析的主要对象。言说域共有32 个框架式,其中“阐述”框架类包括[表述]、[解释]、[告知]、[宣布]、[介绍]、[反映]、[插话]7 个框架式,“指令”框架类包括[劝说]、[命令]、[提议]、[催促]、[请求]、[叮嘱]6 个框架式,“应答-允诺”框架类包括[应答]、[供认]、[承诺]3 个框架式,“主观表态”框架类包括[同意]、[反对]、[抱怨]、[赞美]、[批驳]、[吹捧]、[评议]、[讥讽]等8 个框架式,“询问-招呼”框架类包括[询问]、[招呼]等2 个框架式,“双向交流”框架类包括[辩论]、[争吵]、[交谈]、[商议]等4 个框架式,“唠叨”框架类只有[唠叨]1 个框架式,“自语”框架类只有[自语]1 个框架式。同一个框架类的框架式之间大多是平等并列的关系,也有两两相反相对的,如[同意]和[反对],[赞美]和[批驳]等。
通过以上分析,我们便可以绘制出汉语言说域的框架层级图:
以上框架层级的确定是逻辑分类和框架式归类的综合产物。从“域”到“分域”分类的逻辑性比较明显,这是自上而下的分类。然而,从“分域”再继续向下分,逻辑分类就派不上用场了。我们采取了自下而上的办法,把言说域中的32 个“框架式”划分为8 个“框架类”,再把这8 个“框架类”归并到两个“分域”中。在划分和归并当中,我们主要参考了信息处理中的词语语义特征分类系统(冯志伟,1996),同时以我们的世界知识为重要参考。
关于框架之间的关系,陆俭明(2006)曾提出了一个富有启发性的问题:“对于意义框架的研究是否可以采取从上而下和从下而上两头挤压的办法?”
研究表明,把从上而下的方法和从下而上的方法结合起来,的确是确定框架层级的一种可行的方法。从上而下,就是看一个上位框架可能控制哪些下位框架,这是一种内省的方法,内容往往有所遗漏,但可以帮助我们确定某一个上位框架可能控制的下位框架的大致范围;从下而上,则是以原始语料为依据,看具体的框架式可能属于哪个上位框架,这是一种归纳的方法。从下而上的方法需要从上而下的方法的指引,这样可以避免“盲人摸象”式的结论;从上而下的方法需要从下而上的方法的验证,这样可以补充内省当中所遗漏的内容。
三、言说域框架式的构建
框架式也就是框架,它既具有一定的抽象性和概括性,又能够充分展示框架的语义信息,是框架语义分析的主要对象,故框架式的构建也显得尤为重要(范开泰,2007)。
(一)框架式的构建方法
框架语义分析的应用目标之一是要建立框架语义数据库。从英语框架网络的结构我们不难看出,框架语义数据库一般包括框架库、例句库和词汇库。其中,框架式的聚合构成框架库。菲尔墨(1994)指出,框架库(FDB)是FrameNet 数据库的重要组成部分,它是构建例句库(Annotated Sentences)的基础,主要对词语义项的语义框架及框架元素进行细致的描述。一般来说,框架库中的单个框架式应包括如下内容(由丽萍,2006):
1.框架的定义描述;
2.框架元素的基本定义描述,多数定义带有例句说明;
3.该框架所涉及的词元;
4.框架-框架关系。
言说域共包含32 个框架式,由于篇幅和时间所限,本文无法展示言说域的全部框架式。我们将选取言说域中比较有代表性、词元使用频率较高的[告知]框架式为例展示言说域框架式的构建方法。[1]以下便是该框架式的结构:
言说-言语行为-告知(Telling)
定义:
?
框架元素:
核心元素(Core)说话者Speaker[spe] 指说出话语信息的人。有人把这个秘密计划告诉了李世民。信息Message[mes] 说话者向受话者所传递的有关话语内容。包括话语内容的直接描述和间接描述。当局通知我说我弟弟被拘留了。关于自己被拘留一事,他已经向父母报告了。受话者Addressee[ads] 接受话语信息的人。比尔告诉艾米他会回来参加聚会的。
依据Depend[depe] 告知行为所依从的原则、要求、标准或前提等。根据文件要求,录取结果当天就应该告诉本人。你就按我说的去通知他们吧。
词元:讲、说1、告诉、告知、报告、禀告、禀报、汇报、倾诉、通知、传达、传告、传话、透露
(二)框架式与例句标注
范开泰(2005)指出,框架式提供了该框架中所有可能出现的语义角色,其应用价值主要体现为它可以为例句库的框架语义标注提供参照。以[告知]框架为例,当框架式确立以后,我们便可以为“讲、说1、告诉、告知”等14 个词元在语料库中搜索一批例句,然后参照框架式中框架元素的描述对例句进行框架语义标注。下面是以“告诉”这个词元为目标词(target)搜索的10 个例句,[2]参照[告知]框架式就可以对例句作如下标注:
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
在框架语义分析中,词元与框架元素的搭配被称为框架语义结构。框架语义结构包含丰富的语义信息,其应用价值大大优于“格角色+谓词核心”的传统语义结构,因而是框架语义研究的重要内容(范开泰,2005)。上面10 个标有框架语义信息的例句就为我们展示了“告诉”作为词元所能形成的各种框架语义结构。按照框架网络工程的做法,当例句达到较大数量的时候,便可以利用相关软件自动抽取出例句的框架语义结构,并形成该词元的“语义搭配模式汇总表”。汇总表告诉我们:该词元可形成哪些框架语义结构,各种框架语义结构在例句库中出现的数量和频率是多少。词元的“语义搭配模式汇总表”是“词汇库”的重要内容,它既可以作为自动语义标注技术研究的形式化数据,也可以作为语言学者对句法和语义之间关系进行研究的基础性资源(由丽萍,2006)。
四、言说域框架式的选择性描述
对于一个框架而言,最重要的是描写框架的定义及框架元素和词元的呈现。因此我们的描写也依据这一思路进行。言说域共设计32 个语义框架式,下面我们主要以“指令框架类”和“双向交流框架类”为例,对下属的10 个框架式作一个简单描述。[3]
(一)[命令]框架式
框架式定义:发令人向受令人就某事项发出指令。例如:中国父母总命令孩子放学后学这学那。该框架的核心框架元素是发令人、受令人和事项,非核心框架元素有方式、手段、目的、原因、结果、身份、依据、事项时间等。[4]
该框架式的词元有:命、令、命令、下令。
(二)[承诺]框架式
框架式定义:承诺者向承诺对象就某项事务答应照办。例如:中国承诺不首先使用核武器。该框架的核心元素是承诺者、承诺对象和事项,非核心元素有话题、方式、手段、目的、原因、结果、身份、依据、动作次数、事项时间等。
该框架式的词元有:承诺、许诺、允诺。
(三)[请求]框架式
框架式定义:请求人向请求对象说明要求,希望得到满足。例如:我厚着脸皮请求他再容我几天。该框架的核心元素是请求人、请求对象和事项,非核心元素有方式、手段、话题、目的、原因、结果、频率、身份、动作次数、事项时间等。[5]
该框架式的词元有:求、乞求、哀求、央求、恳求、祈求、企求、请求、请教、求教、请示。
(四)[叮嘱]框架式
框架式定义:说话人担心受话人不重视或忘记,向受话人就某事项提出希望或要求。例如:老师叮嘱他,在新的环境里仍要继续努力。该框架的核心元素是说话人、受话人、事项,非核心元素有方式、手段、频率、目的、原因、结果、身份等。
该框架式的词元有:交代2、嘱咐、叮嘱、叮咛、提醒、提示。
(五)[劝说]框架式
框架式定义:说话人企图拿道理说服受话人,使受话人听从或做某事。例如:他身体不好,你应该劝他多休息。该框架的核心元素是说话人、受话人、事项,非核心元素有方式、手段、身份、目的、原因、结果、事项时间、动作次数等。
该框架式的词元有:劝、劝解、劝说、劝阻、劝告、劝导、奉劝、劝止、劝诱、劝化、劝勉、规劝、劝架、劝酒、劝降、劝驾、劝和、劝募、劝进、游说、安慰、劝慰、说服。
(六)[催促]框架式
框架式定义:催促人叫催促对象赶快行动或做某事。例如:图书馆打电话催他尽快还书。该框架的核心元素是催促人、催促对象、事项,非核心元素有方式、手段、原因、结果、目的、频率、动作次数、程度等。[6]
该框架式的词元有:催、催促、催办、催命、催逼、催迫、催收、催讨。
(七)[辩论]框架式
包括双向辩论和单向辩解。框架式定义:辩论人用一定的理由来说明自己对事物或问题的见解,揭露对方的谬误,以便得到正确的认识或维护自身的利益。例如:两位老师就历史分期问题辩论了半天。该框架的核心元素是辩论人,非核心元素有事项、方式、手段、原因、结果、目的、频率、动作次数、动作时间量等。
应该指出,该框架中的“辩论人”元素可分解为“辩论人1”和“辩论人2”,如:李老师和刘老师为历史分期问题辩论了半天。有时,“辩论人1”的主动性和意愿性明显高于“辩论人2”,如:这个问题我一定要跟他辩论一番。句中“我”的主动性和意愿性显然高于“他”。
该框架式的词元有:辩、辩论、辩解、辩白、辩驳、辩称、辩护、辩明、辩难、辩诉、辩诬、争辩、争论、分辩、诡辩、狡辩、申辩。
(八)[争吵]框架式
框架式定义:说话人之间由于意见不合或利益冲突而带有情绪地大声说话。例如:夫妻俩为房子的事情吵了三次架。该框架的核心元素是争吵人,非核心元素有原因、结果、方式、手段、目的、频率、身份、动作次数、动作时间量等。
同理,该框架中的“争吵人”元素也可分解为“争吵人1”和“争吵人2”,如:丈夫和妻子为房子的事情吵了三次架。有时,“争吵人1”的主动性和意愿性明显高于“争吵人2”,如:为了房子的事情,他一下班就跟妻子吵。句中“他”的主动性和意愿性显然高于“妻子”。
该框架式的词元有:吵、吵架、吵嘴、争吵、争执、斗嘴、扯皮。
(九)[交谈]框架式
框架式定义:说话人之间互相传递话语信息。例如:他们就孩子的学习交谈了很久。该框架的核心元素是说话人,[7]非核心元素有话题、方式、手段、原因、结果、目的、动作次数、动作时间量、频率等。
该框架式的词元有:交谈、谈话、谈天、聊、聊天、谈论、畅谈、畅叙、谈心、交心、扯3、扯淡。
(十)[商议]框架式
框架式定义:说话人之间为了对某些问题取得一致意见而进行讨论。例如:几个强盗在商量怎样分配抢来的布匹。该框架的核心元素是商议人和事项,[8]非核心元素有方式、手段、原因、结果、目的、动作次数、动作时间量、频率、身份等。
该框架式的词元有:商量、商议、商谈、商讨、商定、磋商、协商、讨论、交涉、商酌、商榷、谈、谈判。
五、结 语
本文借鉴前贤对汉语限定域进行框架语义分析的范式,采用“自上而下”和“自下而上”相结合的思路确立了汉语言说域的框架层级,并以[告知]框架为例展示了框架式的构建方法,探讨了框架式的应用价值,并选择性地描述了言说域10 个框架式的内容。限于篇幅,本文的目标并不是为汉语言说域建立起服务于应用的完整的框架库,因此没有展示全部的框架式,只是提供了一个范例。
注释:
[1]由于这里只展示单个框架式的构建,所以框架式中暂不涉及框架与框架的关系。
[2]根据FrameNet 所提供的标注规则,词元在例句库中被称为目标词,标注为“tgt”。
[3]描述框架式时均不列通用非核心元素“时间”和“处所”。
[4]“角色事件时间”不是词元本身所表示的动作行为发生的时间,而是词元所涉及的另外的事件发生的时间。如:今天晚上,我命令你们再进攻一次。“今天晚上”可以理解为不是“命令”的时间,而是“再进攻”的时间,称之为“事项时间”。
[5]“频率”和“动作次数”不一样,“频率”是相对的,“动作次数”是绝对的。比如“我一天求了他三次”,其中“一天三次”表示“频率”;“这件事我求了他好几回了”,其中“好几回”表示“动作次数”。
[6]“程度”元素描述催促事件有层级差别的属性,表示催促的紧急程度。如“上面催得很紧”中“很紧”即“程度”元素。
[7]“说话人”元素同样可分解为“说话人1”和“说话人2”,分析思路同“辩论人”和“争吵人”。
[8]“商议人”元素同样可分解为“商议人1”和“商议人2”,分析思路同上。
范开泰等:《汉语框架语义分析系统研究》,《自然语言理解与大规模内容计算》,北京:清华大学出版社,2005年。
范开泰:《汉语框架语义分析若干问题》(未刊稿),上海师范大学,2007年。
陶明忠:《汉语框架网络身体域框架语义研究》,上海师范大学博士学位论文,2007年。
陶明忠:《框架语义学—格语法的第三阶段》,《当代语言学》,2008年第1 期。
马洪海:《汉语交易域框架语义系统研究》,上海师范大学博士学位论文,2008年。
周领顺:《汉语移动域框架语义系统研究》,上海师范大学博士学位论文,2009年。
冯志伟:《自然语言的计算机处理》,上海:上海外语教育出版社,1996年。
由丽萍:《构建现代汉语框架语义知识库技术研究》,上海师范大学博士学位论文,2006年。
陆俭明:《句法语义接口问题》,《外国语》,2006年第3 期。
Charles J.Fillmore.Starting where the dictionaries stop:The challenge of corpus lexicography,In Computational Approaches to the Lexicon.Oxford:Oxford University Press,1994.349-393.