施事的语义分布考察与动词的语义特征
2019-02-25詹卫东
陈 龙,詹卫东,2,3
(1. 北京大学 中国语言文学系,北京 100871; 2. 北京大学 中国语言学研究中心,北京 100871;3. 北京大学 计算语言学教育部重点实验室,北京100871)
0 引言
语义角色标注是自然语言处理中比较重要的任务之一,它有助于机器理解自然语言的语义,对自然语言处理领域的很多其他任务,如机器翻译、信息抽取等均有帮助[1]。语义角色标注工作以语言学中的语义角色理论为基础,相关理论中涉及语义角色(semantic role)、论元角色(argument)、语义格(deep semantic case)、题元角色(thematic role)等名词,它们指称的概念基本相同,本文中我们使用语义角色这一术语。
计算机的语义角色标注任务通常需要一个语义角色的列表。从Fillmore的格语法理论[2]起,大量中外学者基于语言学理论或者面向语义角色标注任务构建知识库,提出了各自的英语和汉语的语义角色系统。
在英语的相关理论中,Fillmore的格理论列出了6个基本的格,包括Agentive(施事)、Instrumental(工具)、Locative(处所)等[2];Dowty提出原型施事受事理论,将语义角色分为原型施事和原型受事两类[3]。在英语的相关知识库中,VerbNet设立了23个语义角色,包括Agent、Patient、Experiencer、Theme、Material、Instrument等[4]。PropBank用Arg0,Arg1,……,Arg6来代表动词的语义角色,Arg0相当于原型施事的角色,Arg1相当于原型受事的角色,其余的相当于外围的语义角色[5]。
在汉语的相关理论中,鲁川提出的语义角色分为26个小类,包括施事、当事、领事、对象等[6]。袁毓林设立了四级论元层级体系,包括施事、感事、致事和主事这四个主体论元,以及受事、与事等17个论元角色[7],其中“施事”满足“不~”和“没有~”两个语法判别格式,其余主体角色只能满足其中一个格式或者两个都不满足。在汉语的语义角色标注系统和相关的知识库中,袁毓林的“北大中文网库”中包括了施事、与事、材料等21个语义角色标签,包括施事、感事、经事、致事、主事这5个主体论元[8];北京大学国家重点基础研究发展计划(973)项目“融合三元空间的中文语言知识与世界知识获取和组织”(项目号2014CB340504)中涉及的语义角色标注的标注规范(内部资料,以下简称为973语义角色标注规范)包括施事、当事、受事、结果、工具等26个论旨角色,其中施事和当事是主体[9],“施事”满足“去~”的语法判别格式,而“当事”不满足。
袁毓林[8]将语义角色分类系统按精细程度分为微观、中观、宏观三个层级。上述语义角色系统中,Dowty的原型施事受事理论及PropBank的Arg0的标注方式属于宏观层级,Framenet属于微观层级,其余的大多数处在中观层级。目前的语义角色标注也基本采用中观或宏观层级的标签来进行标注。
上述的语义角色的设置各有合理性和优点,同时也存在着普遍性的问题。例如,袁毓林[8]指出,在语义角色标注工作中,衡量标注质量的最重要指标是角色标记的一致性,这个一致性的最低标准是“在不同的语句实例中,相同的谓词及谓词性短语的相应的各个论元成分的论旨角色应该一致”。例如,对于动词“睡觉”,在不同的话语中,它的主体都符合施事的定义,可以一致地标为施事。其他的语义理论和知识库即使没有明确指出这一点,但实际上也都隐含或默认了这一要求。例如,论元结构理论认为,一个动词的一个义项有它的论元结构,这个论元结构是其内在的词汇属性[10],如“学习”的论元结构是[施事,受事]。如果一个动词的一个义项的主体语义角色不是一致的或固定的,而是会随着动词所在的句子而变化,那就不能认为论元结构是动词本身的属性,而且不得不说该动词的某个义项有多个论元结构。袁毓林[7]的方案提到,四个主体角色是不同现的,没有对立的价值。由此可以推断,一个动词的主体角色在不同话语中都是一致的。VerbNet为每个动词标注了语义角色的框架,也是默认了动词的语义角色的一致性。
对于语义角色标注任务而言,语义角色的一致性可以降低标注的难度。计算机只需识别出一个成分是动词的主体,即可根据一致性,正确地标注出该成分具体是哪个角色。而在语言学上,语义角色的一致性保证了一个动词的一个义项的语义角色是由这个动词本身决定的,不会受上下文语境的影响。那么动词的语义角色就可以在一定程度上准确地反映动词的语义,区分开语义特征不同的动词。
但是,我们发现,在动词的实际用例中,要贯彻这种语义角色标注一致性的原则,并不容易。例如,以下三个例句中,“改变”的主体是否应该标为同一个语义角色,可能是存在争议的。
例1他改变了他的志向。
例2这件事改变了他的志向。
例3他改变了中国。
在中观层级上,这三个例句中,“这件事”和“他”是“改变”的必有论元,因此标注为原因这一外围论元并不合适。根据上文列出的袁毓林[7]和973语义角色标注规范的语法判别格式,例1中“他”完全符合施事的性质,而例2中“这件事”更符合主事和当事的语法性质。对于例3,“他去改变中国”“他不改变中国”从语感上难以判断是否合法,因此很难确定例3中“他”是否是施事。
从语义上看,袁毓林[7]指出,施事具有“使动性”,主事具有“变化性”,那么三个例句中“这件事”和“他”更接近施事的定义。973语义角色标注规范[9]则认为,典型的施事有主观意愿性,典型的当事无主观意愿性。从这一角度看,例2中的“这件事”也更接近主事或当事,例3中“他”的语义角色仍然难以判断,既有可能是“他”自主地去“改变中国”,也有可能是“他”并没有自主地去“改变中国”的意愿,但“他”的一些行为客观上“改变了中国”。由此可见,同一个谓词的语义角色在不同实例中保持一致,这一要求在中等颗粒度的语义角色系统中并不容易达到。
本文主要考察同一个谓词的施事不一致的问题,根据语义角色标注语料库,统计动词施事的语义分布,得到存在施事角色内部不一致现象的动词,并进一步分析产生不一致现象的原因。
1 动词施事不一致的具体表现
我们观察到,按照各语义角色系统对施事和其他主体的定义,有一批动词的主体实际上很难满足语义角色的一致性。除上面提到的“改变”的例子,还有像“破坏”“证明”和“限制”等不少例子也有类似情形。
例4a. 他破坏了他的家乡的自然环境。
b. 地震破坏了他的家乡的自然环境。
例5a. 马克思证明了社会主义制度的优越性。
b. 事实证明了社会主义制度的优越性。
例6a. 防守队员限制了他的发挥。
b. 电子商务不受地域、国别限制。
例4(a)中“他”显然有[+自主]、[+致使]、[+施动]等语义特征,通过句法判别标准也可确定“他”是“破坏”的施事。而例4(b)中的“地震”并没有[+自主]、[+施动]的特征,只有[+致使]的特征,因而更接近袁毓林[7]的主事、973语义角色标注规范[9]的当事等角色。将例4(b)中的“地震”视作“破坏”的原因、工具角色也不合适,因为原因、工具只是外围语义角色,例4(b)中如果“地震”是“破坏”的原因或工具,那么“破坏”就没有主体这一必有角色。而且“原因”角色语义应该是主体进行“破坏”行为的原因,“工具”是主体进行“破坏”所使用的工具,显然也和“地震”的语义不符。因此,例4(b)中“地震”是“破坏”的主体而非外围论元。其余两组例句也是同理。
如果认为“破坏”等动词每个词都分别有两个义项,一个是有[+自主]语义特征的义项,另一个是[-自主]的,那么语义角色标注的不一致性看起来就不存在了,因为有自主性的义项的主体是施事,没有自主性的主体是当事。但从动词的语义来看,把这些动词看作有两个义项并不合适。马庆株[11]指出确定动词义项常用而有效的办法是看宾语,而如例4(a)和例4(b)所示,“破坏”在主体是自主和非自主的情况下都可以带相同的宾语,因而没有必要分为两个义项。而且即使分为两个义项,那么这两个义项之间的差别也仅仅是是否有自主性。有大量的、成批的动词会出现这样的语义差别,说明这样的差别是系统性的,不宜采用为每个动词增设义项的办法处理,而应该认为施事的不一致性是客观存在于这批动词上的。[注]也存在这样的情况:有的动词语义角色不同,对应着可以区分为不同的义项。比如“说明”在《现代汉语词典》中有两个义项,一个是“解释明白”,是有自主性的,另一个是“证明”,对应的是“证明”的无自主性的情况。“说明”之所以能区分出两个动词义项,是因为第一个义项的“说明”中有“说”的意义(可能是字面的,也可能是隐喻的),而第二个义项中“说”的意义基本消失。像这样的差别只在个别的动词上出现,没有系统性。
从大规模真实语料的语义角色标注实践中也可以观察到上述不一致现象。
基于973语义角色标注规范[9],何保荣[12]开展了中文语义角色标注语料库的建设,得到了规模为20 000句的语义角色标注语料库,语料来源为《人民日报》。语料库中包含了9 168个谓词(包括动词和形容词)及它们在句子中的语义角色。该语料库以下简称为《人民日报》语料库。
《人民日报》语料库对动词主体的判定借助了《知网》的语义角色系统来确定动词的语义角色。《知网》[13]是董振东建设的中英文知识库,通过义原来定义词的义项。《知网》的义原分为事件、实体、属性、属性值、语义角色等10大类,每个义原可能有若干下位的义原,由此构成了义原的树状结构。例如,“Entity|实体”义原下位有“thing|万物”、“time|时间”、“space|空间”和“component|部分”这四个义原,“thing|万物”下位又有“physical|物质”、“mental|精神”和“fact|事情”三个义原,它们的下位又分别有一层或多层义原。例如,在《知网》中动词“证明”属于义原“prove|证明”,该义原在《知网》的事件分类体系中表示为{prove|证明} {MakeOwnKnowledge|使自我感知:agent={*},content={*}},即该义原是“MakeOwnKnowledge|使自我感知”的下位义原,该义原下的动词有agent和content两个必有语义角色,即“证明”的主体是施事。
在这种标注方式下,语料库中“证明”的主体都被统一成了施事,虽然满足了一致性的要求,但是并不符合“事实证明”中“事实”的实际语义。所以在这种标注方式下,本质上依然存在施事不一致现象。
中文PropBank是在宾州大学中文树库基础上构建的一个中文的语义角色标注语料库,包括11 000个动词的超过80 000个实例[14]。中文PropBank语料库标注方式与英语的PropBank相同,用Arg0,Arg1等标签来标注。除了语料库之外,中文PropBank还为每个动词标注了框架集合(Frameset),动词的每个语义角色的具体语义都可以从这个框架集合中获取。
根据PropBank的标注方法,上述的不一致性现象看似被轻松解决了,因为不论是否满足施事的定义,动词的主体都会被标为Arg0,而通过框架集合又可以得到更具体的Arg0的语义。但本文统计了中文PropBank[12]中的超过25 000个动词的框架集合,发现施事不一致的问题依然存在。
中文PropBank中,有的动词不止一个义项,一个义项也不止一个框架集合,而有些动词的框架集合中并没有Arg0,因此中文PropBank中总共有26 534个包括Arg0的框架集合。在这26 534个框架集合中,有13 624个Arg0的具体语义为“agent”,还有13个Arg0的语义为“agents”,有124个Arg0语义为“experiencer”,有504个Arg0语义为“theme”。这意味着从中文PropBank的框架集合中所获取的大部分Arg0的语义仍然是很抽象的,与按照973语义角色标注规范中的标注方式中得到的语义角色的粒度相同。另一方面,有超过1 000个框架集合中的Arg0的具体语义被记为了“agent/cause”、“agent,cause”、“agent or cause”、“cause,agent”及其同类。它们对应的动词有一些是Arg0,既有施事的性质,又有原因的性质,例如,“穿孔”。但也有不少是和“证明”等动词一样有不一致现象的动词。例如,“破坏”的Arg0被记为了“agent,cause”。那么虽然例4(a)和例4(b)被一致地标为了Arg0,但从框架集合上看,它的实际语义仍然是不一致的,例4(a)中的Arg0应取“agent”的语义,例4(b)应取“cause”的语义。因此这种标记方式也只是在粗颗粒度标注的层面上避免了不一致的现象,到了更具体的语义中仍是不一致的。
综上,语义角色标注一致性的要求在“破坏”“改变”“证明”等一批动词上都无法得到满足。《人民日报》语料库和中文PropBank两个语义角色标注语料库也只是通过一定的标注方式回避了施事不一致现象(客观上掩盖了实际存在的施事不一致的语言事实)。以下将通过对语义角色标注语料库的分析,得到常见的、典型的施事的语义类别,并找出存在施事不一致现象的动词。
2 本文的考察方法
2.1 从标注语料库中提取存在施事不一致现象的动词
根据第1节中对《人民日报》语料库和中文PropBank的介绍,在这两个语料库中,都不能直接观察到施事不一致现象。所以为了探究和分析施事不一致现象,只能通过间接的手段来分析这两个语料库中的语料。
《人民日报》语料库中标注了“施事”“当事”等语义角色,对于有施事不一致现象的动词,它们的主体都被统一标为了施事。因此本文统计的对象是那些全部或大多数主体被标为施事的动词。
袁毓林[7]指出,论元角色难免有一定的模糊性,可以用原型理论给出不同论元角色的典型句法、语义特征,然后通过类比确定特征不明显的语义角色成分。973语义角色标注规范对施事和当事的定义也有类似的思想[9]。根据原型的观点,对于动词而言,如果它的施事中大部分是“典型的施事”,那么可以认为,其余的个别不属于这些义原的主体是特征不明显的语义角色成分,可以通过类比标为施事。但如果它的施事中“典型的施事”比例不高,那么它的主体是否应该全部被标为施事值得讨论。也就是说,这个动词有可能存在施事不一致现象,它在一些实例中的主体可能只是为了满足一致性而在操作上被标为了施事。
在得到“典型施事”后,对语料库中每个动词,统计该动词的施事中“典型的施事”的比例。如果该比例低于一个特定的经验值,那么它就有可能是存在施事不一致现象的动词。
值得说明的是,这样获取的“典型的施事”可能不够精准,所以在最后得到可能存在施事不一致现象的动词之后,还需要人工筛选,根据语感判断一个动词是否确实存在施事不一致现象。此外,由于“典型的施事”比例不高只是动词施事不一致的一个充分条件,因此根据上述方法找出的动词也难免会有一些遗漏。
2.2 “典型的施事”及其获取
根据上述论述,为了找出有施事不一致现象的动词,需要首先对两个语料库中统计对象的全体施事进行语义分析,得到“典型的施事”。
“典型的施事”可以依据人的语言学知识和经验来判定,例如,大量语义角色理论认为“典型的施事”是人或有生命的物体[2,7,9]。通过这种方式得到的结论比较主观,有可能和实际的语言现象相比有一定偏差。因此本文采取了通过统计语义角色标注语料库中施事的语义类别的方式来确定哪些类别的词是“典型的施事”。
具体地,“典型施事”可以借助《知网》的义原分类来获取。对于语料库中每个动词的每个施事,根据它的句法树信息得到它的核心词,并记录它在《知网》上的义项对应的义原。有些词可能在《知网》上不存在。据观察,这些词多数是人名,也有少量地名和公司、机构名称。本文暂时用“未登录词”来标记它们。
3 施事不一致的动词及其语义特征
3.1 语料中动词施事的语义分布
在语料库中有很多低频动词,它们的施事个数较少,如果计算低频动词的施事的分布可能不够有说服力,而且它们对标注错误比较敏感,一个施事的标注错误就可能导致施事属于某个义原的比例有较大变化。因此本文分析的是语料库中施事个数大于10的动词。《人民日报》语料库中符合条件的有545个动词、23 723个施事。由于PropBank将动词的主体都标为Arg0,并不能从中直接知道主体对应到汉语的语义角色系统中是否为施事,因此在PropBank上本文也只统计了这545个动词的施事的语义分布情况,这些动词在PropBank中有18 425个Arg0。
图1反映了两个语料库中的动词的施事在一些义原上的分布情况,其中深色的为《人民日报》语料库上的分布,浅色的为中文PropBank上的分布。图中选取了一些包含施事个数较多的义原,包括“human|人”“group|群体”“inanimate|无生物”“component|部分”“fact|事情”“Attribute|属性”。其余的义原包含的施事个数不多,所以并没有呈现在图中。这些义原包括了“time|时间”“space|空间”等义原,以及动词、形容词等其他词性的词对应的义原。两个语料库中,“human|人”“organization|组织”义原下的名词在施事中占了多数。此外,两个语料库中还各有4 000个左右的未登录词(分别占施事总数的15.0%和20.3%),由于无法对应到《知网》上的义原,因此没有呈现在图中。
各语义角色系统中一般都认为,典型的施事是人或有生命的物体。但以上数据表明,虽然“human|人”义原下的施事数量最多,但即使加上未登录词,个数也不到全体施事的50%。而其余义原下的词或其余词类的词都不能表示人类,即动词的施事中有一半以上并不是表示人类的词。
图1 动词施事所属的义原分布
图2、图3中,横坐标代表动词的施事“human|人”义原下的词或未登录词的比例,最低为0,最高为1,等分为了20段。纵坐标代表相应比例的词的个数,例如,施事为人类的比例在[0,0.05)区间的动词的个数是9个,比例在[0.05,0.1)的动词有12个。如图2所示,施事中人类的比例超过50%的动词还不到半数,仅有37个动词的施事中人类的比例超过了90%。因此,说典型的施事是人或有生命的物体并不完全合适。图3表明,在PropBank中,同样也有类似现象,大多数的动词施事中人类的比例都不超过55%,仅有44个动词的施事中人类的比例超过90%。从动词的角度看,如果动词的典型的施事是人或有生命的物体,那么“human|人”义原下的词和未登录词在大多数动词的施事中的比例应该很高。由图2、图3表明,《人民日报》语料库中,并非大多数动词的大多数施事都是人类。
图2 人民日报语料库的施事中人类比例与动词个数的关系
图3 PropBank的施事中人类比例与动词个数的关系
除了代词、未登录词和“human|人”义原下的名词之外,剩余的类别中“organization|组织”、“component|部分”、“inanimate|无生物”、“fact|事情”、“information|信息”等义原下的名词充当施事的个数较多。由于语料来源是《人民日报》,其中政治、经济新闻类文章中组织、机构、部门、公司、国家、报纸、会议等名词经常发生转喻现象,可以像人类一样充当施事,比如组织、机构、政府、公司类的名词都属于“group|组织”义原,部门类的名词都属于“component|部分”义原,国家、省市、报纸、文章类的名词和属于“inanimate|无生物”义原,会议类名词属于“fact|事情”义原。
图2、图3表明多数的施事并非仅仅是人类,还有不少可以转喻为人的词可以充当施事。在图2、图3的统计方法的基础上,将“component|部分”“group|群体”这两个包含较多经常转喻为人类的词的义原也考虑在内,可以得到图4和图5。根据图4和图5,显然大多数动词的大多数施事属于人类和上述几类义原,仅有72个动词的施事中这几类名词的比例不到50%,这一比例低于70%的动词有208个。PropBank中这几类名词的比例低于50%的也只有91个,低于70%的有221个。在两个语料库中施事为这几类名词的比例均低于70%的动词恰好有200个。本文将对这200个动词进行人工筛选,找出有施事不一致现象的动词。
图4 人民日报语料库的施事中典型施事比例与动词个数的关系
图5 PropBank的施事中典型施事比例与动词个数的关系
由图4和图5可见,多数动词的多数施事集中在“human|人类”“component|部分”“group|群体”这三个义原下。可以认为,典型的施事是有生命物体及拟人物。
3.2 有施事不一致现象的动词
根据考察,3.1节中找出的200个“典型的施事”比例低于70%的动词中,包括“建交”、“建设”等动词,它们的施事多是“国家”“会议”等不属于上述三类“典型施事”所属义原的名词,因此它们虽然在施事中“典型施事”比例较低,但并没有施事不一致现象。这样的动词共有115个。其余85个动词都存在施事不一致的现象,例如,在《人民日报》语料库中,“证明”的施事中“典型施事”的比例为14.3%,“改变”的施事中“典型施事”的比例为56.3%。这些动词分属于表1所示的《知网》上的若干类义原(或它们的下位义原)。为方便表示,表中义原只列出中文,不列出对应的英文名称。
再来看这85个动词在PropBank中的情况。这些动词在PropBank的框架集合中的Arg0主要被标为了以下几种类型:(1)“agent,cause”及与它相似的标记,如“破坏”“振兴”的Arg0;(2)“agent”,如“改变”“改进”“带动”的Arg0;(3)动词的具体语义,如“违反”的Arg0: violator和“促使”的Arg0: entity prodding。
事实上,存在施事不一致现象的动词数量不止85个。有一些动词虽然语义上会出现施事不一致现象,但在实际语料中“典型施事”的比例很高,如“帮助”等,没有被归入上述列表。还有一些动词由于在标注语料库中非自主的主体很多已经被归为了当事,或者是因为词频较低,所以也无法按上述方法直接找出,如“阻碍”“证实”等。
表1 存在施事不一致现象的动词
3.3 动词施事不一致的原因
多数语义角色系统都将自主性作为定义施事角色的一个重要性质,有的系统中还将致使性等其他语义性质列为施事的性质。以下将从动词的自主性的角度分析“证明”等85个动词施事不一致的原因。
马庆株[11]通过语法性质,将动词分为自主动词和非自主动词两类,其中自主动词是可以进入来/去+V+O等8种格式中的一种动词,并指出,自主动词有[+自主]、[动作]的语义特征,非自主动词有[-自主]、[变化]/[属性]的语义特征,如“帮助”就是自主动词,“生病”是非自主动词。
马庆株还提到,一些自主动词的[+自主]特征极不稳定,如“咳嗽”“眨眼”,并将这类动词非自主的情况记为“自主动词的非自主用法”。这类现象与本文讨论的现象并不相同,马庆株[11]并没有提及本文关注的“帮助”“证明”等动词主体有时自主有时非自主的情况。
对于“破坏”“证明”这些动词,根据句法格式可以判定它们为自主动词,有[+自主]特征。然而在“地震破坏”这样的短语中,“地震”的语义特征显然是[-自主],与“证明”的[+自主]特征相冲突。而一个词的语义特征应该是稳定的,并不应该随上下文而变化。用名词的类似现象来类比,“公鸡”有[+雄性]的语义特征,“母鸡”有[-雄性]的语义特征,而“鸡”并没有[+雄性]、[-雄性]的特征,在“鸡打鸣了”和“鸡下蛋了”这样的句子中,“鸡”分别体现出了雄性和雌性的语义,但这也不意味着“鸡”有时有[+雄性]的特征,有时有[-雄性]的特征,“鸡”只是既能与有[+雄性]特征的词搭配,又能与有[-雄性]特征的词搭配,可以用[±雄性]来表示“鸡”的这一语义性质。同理,实际上“破坏”也并没有[+自主]或[-自主]的语义特征,可以说它有[±自主]的性质,不论与有[+自主]特征的主体搭配还是与有[-自主]特征的主体搭配都是合理的。所以“证明”等动词表示的事件既可以是有自主性的,也可以是无自主性的,它们被归入自主动词一类或者非自主动词一类都有些不合适。
根据原型施事的理论,虽然上述85个动词的主体不一定有自主性,但是它们有一定的原型施事的性质,即满足自主性、感知性、致使性、移动性中的一些性质。这些动词的主体不一定是生物,而非生物一般没有感知性和移动性。因而这些动词的主体作为原型施事,应该具有致使性,所以这些动词也应该有[+致使]的特征。这些动词所属的义原也同样反映出它们有致使性。例如,“使动”“阻动”“变属性”等义原,从义原的名称上就可以看出致使性或变化性。从更上级的义原的角度来观察,这些动词多属于“CauseToExist|使存现”、“CauseToGrow|使成长”、“MakeBetter|优化”、“MakeBad|加害”、“CauseToBeHidden|使消失”、“MakeAct|使之动”等义原,也有明显的致使性。
综上,这些存在施事不一致现象的动词是一类有[+致使]语义特征、无[+自主]语义特征的动词。从语义上看,当这类动词表示的是自主性的事件时,它们的主体应为施事;当它们表示的是非自主的事件时,主体是当事/主事等角色。从语法上看,相应的判别格式也可以接受这类没有自主性的动词。这两方面的原因导致了在上述85个动词上主体的判定产生不一致的现象。
4 结语
语义角色标注任务中,一致性要求是一个重要的评价标准,但根据现有的语义角色体系,有一批动词很难满足一致性。这是因为有一部分动词有致使性,但并没有自主性,可以同时接受自主的主体和非自主的主体,导致在不同语句实例中,这些动词的主体有时符合施事的定义,有时不符合。这些动词的主体属于原型施事,没有自主性的名词一般也没有位移性、感知性的性质,所以这些动词的施事不一致现象是[+致使]特征导致的。
本文对语义角色标注语料库的考察也能证明这一点。借助《知网》的义原分类,本文首先统计了两个语义角色标注语料库中施事的语义分布,指出典型的施事并非仅仅是人类或者有生命的物体,而是包括了一些常见的可以转喻为人的名词,如组织、群体、国家、会议等。进而,本文考察了200个典型的施事的比例低于70%的高频动词,通过人工筛选,得到了85个存在施事不一致现象的动词。这些动词在《知网》上所属的义原反映出这些动词的确有致使性。
事实上,不仅动词的施事上存在不一致现象,在客体角色及外围角色上有同样的,甚至更为严重的问题。本文分析了施事不一致的现象及其原因,对客体的类似问题的解决可能有一定帮助。
施事的不一致现象可能还有其他类型,也可能有别的原因会导致施事的不一致现象。例如,“理发”“洗澡”等和主体自身相关的动词也会产生施事不一致现象。这样的问题还有待于进一步的考察和研究。