参照生成词库理论对动名兼类现象再讨论
2020-07-16俞士汶朱学锋刘扬
俞士汶 朱学锋 刘扬
摘要词的兼类问题及其处理策略是历久弥新的现代汉语词类研究中重要而又困难的课题之一。文章简要介绍汉语语法学界关于兼类的研究,然后参照生成词库理论,对其中最受关注的动名兼类现象再次进行讨论。根据陆俭明教授从汉语教学需要出发对兼类词下的定义,认识到字形和读音相同的动词与名词互为兼类词的条件是它们互为语义角色。文章还从语义层面论述了名动词不处理为动名兼类的合理性。文章在融合语法研究与语义研究方面是一个尝试,最后提出与兼类相关的一些语言学问题及语言工程任务。
关键词生成词库理论兼类词动名兼类名动词语义角色
一、 兼类词暨动名兼类研究概述
词的兼类问题及其处理策略是历久弥新的现代汉语词类研究中重要而又困难的课题之一。吕叔湘、朱德熙、邢福义等语言学大师都有所论述。关于兼类研究的全面且翔实的综述当属胡明扬先生(1996)的《兼类问题》,他认为动名兼类是兼类现象中最受关注的,研究得最多,且有计量研究成果。陆俭明教授对兼类问题的分析言简意赅,为解说兼类问题,他列举了以下八种语言现象,其中“锁”“代表”“报告”“研究”是关于动名兼类的。
a. 锁把门锁1上/买了一把锁2
b. 代表他代表1我们班发言/他是人民的代表2
c. 报告现在报告1大家一个好消息/这起事故你给写个报告2
d. 死他爷爷死1了/这个人脑筋很死2
e. 白那墙刷得很白1/我白2跑了一趟
f. 方便这儿交通很方便1/大大方便2了顾客
g. 正式他是正式1代表/我正式2提出申请
h. 研究他研究1人类史/这笔研究2经费只用于艾滋病研究3
并给出了三种不同 的“兼类词”的定义(陆俭明2003):
(1) 从本体研究需要出发——同一个概括词兼有两种词类特性的词,即指同音同义而词性不同的词。按此定义,“锁”“代表”“报告”“死”“白”不是兼类词;“方便”是兼类词:“方便1”是形容词,“方便2”是动词;“正式”是兼类词:“正式1”是区别词,“正式2”是副词。“研究”应该是兼类词,但在朱德熙先生的词组本位语法体系中,不处理为兼类词,而将它们看作是动词中的一个小类,称为“名动词”(请见下文第四节的详细论述)。
(2) 从汉语教学需要出发——同字形、同音且意义上有极为密切关系而词性不同的词。按此定义,“锁”“代表”“报告”“死”“白”“方便”“正式”都是兼类词;“研究”仍归属于名动词。
(3) 从中文信息处理的需要出发——同字形、同音而意义不同或词性不同的词。按此定义,上述a—h八种现象都可以处理为兼类现象。
在这三种定义中,第二种从汉语教学需要出发的定义宽严适度,符合多数人的语感。这个定义与全国科学技术名词审定委员会公布的《语言学名词》中的“兼类词”定义“兼有两种或两种以上词类性质的词。即同音、同形、词汇意义上没有明显区别但语法功能不同的词。例如,‘报告兼有名词和动词的特性,是兼类词”殊途同归。本文基于这个定义讨论兼类词。 不过,无论“意义上有极为密切关系”还是“词汇意义上没有明显区别”,都是一种模糊的表述,不适合作为兼类词的判别条件,而把“研究”之類的名动词不处理为兼类的理由也显得牵强。本文针对性地探讨以下两个问题:
(1) 动名兼类的判别条件;
(2) “研究1”和“研究2”“研究3”不处理为兼类词的语义理据。
因为词类是指词的语法分类,在语法研究中词类是按照词的语法功能的不同而分出来的类别,所以历来关于兼类的讨论基本上只局限于语法层面。但词的识别与归类实际上又不可能脱离词义,上述兼类词的定义中都涉及词义。语言研究需要融合语法研究和语义研究,本文第二至第四节尝试参照生成词库理论(Generative Lexicon Theory),从语义层面来考察、探讨语法层面的动名兼类问题。
二、 生成词库理论有关内容简介
Pustejovsky等学者创建的生成词库理论提出词有四种语义结构: (1) 论元结构(argument structure),(2) 事件结构(event structure),(3) 物性结构(qualia structure),(4) 词汇继承结构(lexical inheritance structure),后期发展为词汇类型结构(lexical typing structure)。(宋作艳2015;张秀松,张爱玲2018)以下概要介绍与本文相关的论元结构和物性结构。
论元结构描述论元的数量、类别及其句法实现。例如:
(1) John arrived late.
(2) John built the house out of the bricks.
(3) John drove down to New York on Tuesday.
其中,John是arrived的施事,bricks是built 的材料,Tuesday是drove down 的时间,John、bricks和Tuesday都是句中相关动词的论元(argument),施事、材料、时间等就是论元所承担的语义角色,可称为论元角色,通常又叫论旨角色(thematic role)。
物性结构从形式角色(formal role)、构成角色(constitutive role)、施成角色(agentive role)和功用角色(telic role)四个方面描写词所指的对象。形式角色指对象在更大的认知范围内区别于其他对象的属性,包括方位、大小、形状和维度等。构成角色指对象与其组成部分之间的关系,也说明对象在更大的范围内是哪些物体的组成部分,例如桌子的组成部分之一是桌腿,而手是身体的组成部分。施成角色指对象是怎样形成或产生的,如创造、因果关系等,例如桌子的施成角色是“制作、做、加工”等。功用角色指对象有什么功能和用途(或目的)。功用角色又分直接功能角色和间接功能角色。例如:
(4) drink beer
(5) cut with a knife
这里,drink是 beer的直接功能角色,cut是knife的间接功能角色。
论元结构的基本内容不算新颖,以动词为中心的诸多语言学理论都有所论及。在论元结构理论的指导下,已有若干语言工程的实践,即在一定规模的语料上标注动词的论元角色。(詹卫东等2016;Xue & Palmer 2009; Shao & Zheng 2016)生成詞库理论的重要创新之一是提出物性结构以丰富名词的词汇表征。“物性结构之于名词,就像论元结构之于动词。物性结构决定了名词的语义,就像论元结构决定了动词的语义。”(宋作艳2015)在了解动词的论元结构的基础上,基于生成词库理论,现在又增加了对名词的物性结构的了解,当然也就能更深刻、更全面地理解语句的语义。例如在“喝啤酒”“用刀切菜”“建造房子”这些短语中,名词“啤酒”“刀”“房子”分别是“喝”的受事、“切”的工具、“建造”的结果;而动词“喝”是“啤酒”的(直接)功用角色,“切”是“刀”的(间接)功用角色,“建造”是“房子”的施成角色。概括地说,“喝”与“啤酒”之间、“切”与“刀”之间、“建造”与“房子”之间存在互为语义角色的关系: 名词是动词的论元角色,动词是名词的物性角色。这些知识为语言自动理解研究提供了重要支撑。
关于论元结构和物性结构的研究和认知,现在都有所深入和精细化。詹卫东教授等(2016)提出了现代汉语谓词的论元角色体系。请见下文图1,图中称论旨角色。本文接下来谈及论元结构,将参照图1的体系。
袁毓林教授(2018)根据汉语名词在文本中基本的组合方式、搭配习惯和语义解释,提出了一个汉语名词的物性结构描写体系,定义了10种物性角色: 形式、构成、单位、评价、施成、材料、功用、行为、处置和定位。本文接下来谈及物性结构,将参照袁毓林的体系。
三、 兼类的动词与名词互为语义角色
正是物性结构概念启发了我们进一步考察、思考汉语中的动名兼类现象。首先用第一节中的例词“锁”“代表”和“报告”各造一个句子,考察兼类词所担任的语义角色。
在“用锁2锁1门”中,名词“锁2”是动词“锁1”的工具;动词“锁1”是名词“锁2”的功用角色。
在“居民推选出来的代表2正代表1广大居民同开发商谈判”中,名词“代表2”是动词“代表1”的施事;动词“代表1”是名词“代表2”的行为角色。
在“请你把刚才报告1的情况整理成书面报告2交到学院办公室”中,名词“报告2”是动词“报告1”的内容;动词“报告1”是名词“报告2”的功用角色(请见《现代汉语词典》第7版对动词“报告”的释义“把事情或意见正式告诉上级或群众”)。
这三个例词提示我们: 对于动名兼类词,名词在相应动词的论元结构中充当某种角色;反之,动词在相应名词的物性结构中也充当某种角色。兼类的名词与动词之间在意义上有极为密切的关系,体现在兼类的名词和动词互为语义角色。换句话说,字形和读音相同的动词与名词是否为兼类词,可以通过它们是否互为语义角色进行检验。
再看反例。“花1钱”中的“花1”是动词,“一朵花2”的“花2”是名词。按照从汉语教学需要出发的定义,不是兼类词,因为它们虽然同形同音,但意义上毫无联系。(陆俭明2003)单纯判断意义上有无联系是困难的。只考察“花1钱”和“一朵花2”,难以联想它们之间意义上的联系,但如果联系到“花花公子”“花花世界”“花天酒地”这些词语,其中的“花”的意义分野就不那么清晰了。然而,意义上毫无联系可以从名词“花2”不能成为动词“花1”的论元角色,动词“花1”也不能成为名词“花2”的物性角色这个事实得到验证。
参照《现代汉语词典》第7版,“锁”作为动词,有两个义项: 义项②“用锁把门窗、器物等的开合处关住或拴住”,上面举例用的动词“锁1”是这个义项,与名词“锁2”兼类。再看义项⑤“缝纫方法,用于衣物边缘或扣眼上,针脚很密,线斜交或钩连”,很难说义项⑤和义项②一点关联没有,因为它们都是指把分开的东西合在一起,使其不再能分开。既然义项⑤和义项②有所关联,那义项⑤和名词“锁”也有关联了,至于是否密切,就模糊了。但名词“锁”不是“锁”义项⑤这个动词的工具,“锁”义项⑤这个动词也不是名词“锁”的功用,互不构成语义角色,因此,可以判断“锁”义项⑤这个动词与名词“锁”不是兼类词。
再举一些例词做进一步的考察。例词拼音后的数字代表声调,5表示轻声;n代表名词,v代表动词。◇之后的是例句,标有*者的例句用于说明名词与动词互为语义角色,可能不是真实存在的。若将要考察的词替换为括号中的词,句子就成立了。
摆bɑi3v摆动,摇摆;n机械装置。n是v的当事,v是n的行为。◇自鸣钟的摆总是摆个不停。
包车bɑo1che1n是v的结果,v是n的施成(因果关系)◇我们包车去旅游,包车已经来了。
编辑biɑn1ji2n是v的施事,v是n的行为◇张编辑正在编辑一本诗集。
表情biɑo3qinɡ2n是v的方式,v是n的功用◇*演员善于用面部表情(肢体动作)表情传意。
炒饭chɑo3fɑn4n是v的结果,v是n的施成◇用鸡蛋、虾仁、葱等食材炒饭可以做出美味的扬州炒饭。
存款cun2kuɑn3n是v的结果,v是n的施成◇不论多少,每月坚持存款,时间长了,你一定会有很多存款(钱)。
发明fɑ1minɡ2n是v的结果,v是n的施成◇爱迪生发明了留声机、电灯、电报等很多重要的发明。
坑kenɡ1n是v的处所,v是n的处置◇电信诈骗分子挖了一个坑,坑了很多老年人。
领导linɡ3dɑo3n是v的施事,v是n的行为◇学校领导正领导全校师生争创一流。
奶nɑi3n是v的材料(食物),v是n的功用◇*她用自己的奶奶(喂)别人的孩子,太了不起了。
漆qi1n是v的材料,v是n的功用◇中国古时人们喜爱用红色的漆漆大门。
药yɑo4n是v的材料,v是n的功用◇用药药蚂蚁、蟑螂的效果不错。
这些实例进一步验证了“兼类的名词与动词之间在意义上有极为密切的关系,体现在兼类的名词和动词互为语义角色”这一论断的可靠性。因“意义上有极为密切的关系”的表述模糊,不易把握,定性地考察同形同音的名词与动词是否互为语义角色则是一件相对简单明确的任务。由此得到结论: 同形同音的名词与动词为兼类词的条件是它们互为语义角色。
四、 名动词不划为兼类词的语义理据
按照中文信息处理需要出发的定义“同字形、同音而意义不同或词性不同的词”,不仅第一节中的研究1和研究2、研究3要处理为兼类,甚至还认为“花1钱”和“一朵花2”中的动词“花1”和名词“花2”也是兼类词。(陆俭明2003)不过,这里所说的中文信息处理需要并非指所有的中文信息处理技术都需要这么做。实际上,动词“花1”和名词“花2”算不算兼类词无关紧要,它们都是客观存在的,可能用“多类词”这个术语指称它们更恰当。服务于语言信息处理的词库都不应缺失这两个词。这样当需要对文本中出现的具体的“花”进行词性标注或深入分析时,就不会遗漏潜在的选择。而对于研究1和研究2、研究3,则存在不同的处理策略。
按照本体研究需要出发的定义“同音同义而词性不同的词”,也认为“‘研究1和‘研究2‘研究3似应处理为兼类词。但是,考虑到‘研究这种双音节动词所占比例很大,……,把这些词看作兼类词,就不合适了。朱德熙先生……把‘研究这样的动词看作动词中的一个小类,称为‘名动词”(陆俭明2003)。
这样,对“研究”之类的动词存在两种处理策略: 一种处理为兼类词,兼属动名两类;另一种则认为仅为动词。既是策略,只是孰好孰差一些而已,并非对错之分。
因“所占比例很大”就不把“研究”之类的动词处理为兼类词的理据,可参见朱德熙先生的论述:“当我们把A、B两类词分开的时候,可以允许一部分词兼属A、B两类。但是兼类的词只能是少数,如果把A和B分为两类之后,大部分A类词兼属B类,或大部分B类词兼属A类,那只能说明我们当初把A和B划分为两类词本身没有多大意义。”(《朱德熙文集》编辑小组1999)胡明扬先生(1996)也认为汉语语法学界“在兼类问题上有一个共识,那就是如果某一类词的多数成员同时是另一类词的成员,那样,类和类之间的界限就模糊了,这样的分类是不可取的”。不过,比例的大小又是个模糊的概念,即便胡明扬先生给出统计数字,“书面语双音节动名兼类词占书面语动词总数的17.39%—40.64%”,陆俭明教授的数据“31%”也在其区间内,但胡明扬先生认为“可以说只是少数”,而陆俭明教授却认为“所占比例太大”。由此可见,用所占比例的大小作为是否把“研究”之类动词处理为兼类词的理据是模糊的,不容易达成共识。
我们认为朱德熙先生把“研究”之类的动词处理为“名动词”是睿智的。在语法层面,朱先生给出了多种理据。(《朱德熙文集》编辑小组1999)现在基于生成词库理论,补充语义层面的理据。根据上文第三节中的“同形同音的名词与动词为兼类词的条件是它们互为语义角色”这一论断,如果把“研究”之类的动词处理为动名兼类词,则动词“研究”和名词“研究”也应当互为语义角色;请看下面的实例:
他正在研究1新冠病毒,最近获得了一笔研究2经费,将用于疫苗研究3。
“研究1”是动词,若将“研究2”“研究3”归入名词,则“研究”动名兼类。不过,在这个例子中,动词“研究”和名词“研究”的词汇意义没有区别,动词“研究”既不是名词“研究”的物性角色,名词“研究”也不是动词“研究”的论元角色,因此按照第三节的判别条件,从语义层面看,把“研究”之类的动词处理为动名兼类词是不恰当的。
另外,黄居仁教授等在研制中文词库时,建立了一个多层次的汉语词类体系。在这个体系中,黄居仁教授也主张不把“他主张完成那两项研究”中的“研究”归入名词,即“研究”只归入述词(verb)。黄居仁教授这样处理的理由是他认为这个例句中的“研究”的语法表现(syntactic behavior)虽然改变了,但其论元结构(argument structure)却没有改变。(Huang,Hsieh,Chen 2017)
面向语言信息处理,北京大学计算语言学研究所研制了“综合型语言知识库”(以下简称CLKB,俞士汶,穗志方,朱学锋2011)。《现代汉语语法信息词典详解》(俞士汶,朱学锋,王惠等2003)和大规模基本标注汉语语料库(俞士汶,段慧明,朱学锋等2002)是CLKB包含的两项重要成果,它们的研制都受惠于朱德熙先生的词组本位语法体系的理论指导(俞士汶,朱学锋2019),一个具体的例证就是关于名动词的处理。
在《现代汉语语法信息词典详解》中,像“研究、影响、剥削、分析、保证、发现”之类的动词收入动词库文件,在动词库文件的诸多语法属性字段中有“准谓宾”(该动词可否做准谓词性宾语)、“有宾”(可否做形式动词“有”的宾语)、“前名”(可否受名词直接修饰构成定中结构)、“后名”(可否直接修饰名词构成定中结构)这四个字段,描述动词在实际文本中可能有的名词语法表现。由于这些名动词不是兼类词,名词库文件中就不收入。这样的词典結构既充分描述了词的语法属性,又最大程度地减少了冗余信息。基本标注语料库的词性标注规范规定,当动词在句子中具有以下四种语法功能之一时,标为vn(名动词),从而把名动词在真实文本中的语法表现显性化:
a. 做形式动词“有”的宾语;
b. 充当了形式动词或其他准谓宾动词的准谓词性宾语;
c. 直接充当体词性短语的中心语;