评价动词—评价对象智能计算构式研究
2022-06-07周红照侯敏滕永林
周红照,侯敏,滕永林*
(1.许昌学院 文史与传媒学院,河南 许昌 461000;2.中国传媒大学 国家语言资源监测与研究有声媒体中心,北京 100024)
0 引言
评价计算是一项让机器智能理解人类言语中评价信息的工程,与情绪计算共同构成情感计算的两大分支。评价计算是竞选预测、网络舆情监测、聊天机器人、文献声誉追踪等诸多应用系统的关键技术,持续成为自然语言处理领域的研究热点。2006年美国国家标准与技术研究院(NIST)最早举办“博客领域的评价计算评测”[1],历经十余载发展,评价计算已经从浅层粗粒度的评价句识别与观点极性判定研究,进入到深层细粒度的评价对象抽取研究。例如“杨洁篪在接受媒体采访时说,这次中美高层战略对话是有益的,有利于增进相互了解。”(新华网2021/03/20),计算机判断出这是一个正面评价句之后,怎样进一步判断评价词“有益”“有利于”的评价对象是“这次中美高层战略对话”,而非其他句子成分呢?近年来,随着数据、算力、算法“三驾马车”迅猛发展,人工智能在图像识别、语音识别与合成、浅层句法分析等领域进步斐然,然而在涉及深层语义理解的评价对象抽取领域却进展缓慢。
已有评价对象抽取系统主要采用以下4种方法:(1)最短距离法——认为评价对象与评价词在距离上呈负相关,距离评价词越近的名词越有可能成为评价对象[2];(2)候选加过滤法——首先抽取句子中的名词和名词短语作为候选评价对象,然后根据词频、与主题词的点互信息(PMI)、冗余度、剪枝算法等对候选评价对象进行过滤[3-6];(3)句法规则法——利用Stanford Parser、哈工大语言技术平台(LTP)、人工归纳的词性组合模板等对评价句作短语结构文法或依存句法分析,抽取与评价词具有直接组成成分关系或句法依存关系的词语为评价对象[7-14];(4)机器学习模型法——将评价对象抽取视作序列标注任务,采用有监督的条件随机场模型(CRF)或无监督的神经网络模型(CNN/RNN),让机器从训练语料中学习评价对象的概率分布[15-22]。候选加过滤法由于缺乏评价词与评价对象的关联分析,难以有效去除噪声;最短距离法、短语结构文法与依存句法规则法在近距离搭配上比较有效,但低估了评价意义语言表达形式的复杂多样性,过于理想化和简单化,覆盖率较低;机器学习模型法理论上可行,但从历届中文倾向性分析评测(COAE)和自然语言处理与中文计算会议(NLPCC)组织的评价对象抽取评测结果看,效果并不理想,机器从大规模语料中挖掘评价对象的分布规律犹如“大海捞针”,若缺乏方向性的理论指导,很容易迷失方向,甚至可能会“误入歧途”,此外深度学习的不透明性、可解释性差等问题影响系统的自我纠错与持续改进。
陆俭明先生指出[23]:“语言学在当今飞速发展的、基于人工神经网络的‘计算机深度学习’的人工智能事业中,逐渐被边缘化。不是人工智能不需要语言学知识,而是已有的语言研究成果不怎么适应人工智能研究的需要。”我们认为,汉语评价对象抽取任务之所以近年来迟滞不前,难有突破,“症结”在于与汉语评价知识本体研究缺乏有效、深度的结合,缺少有效的、特征化的语言学知识这驾“数据”马车的有力驱动。而在各种特征化的语言学知识中,对评价对象抽取工作最有效的是系统化、形式化的评价构式知识。正如王寅先生所言[24]:“从构式角度来研究语言的意义在于:可望实现语言理论的充分性(兼顾中心和边缘现象)和统一性(将语法的认知研究都归结为构式),深化句法与语义的接口研究(以形义配对体为基点)。”从构式的角度研究评价对象抽取,有助于从根本上扭转当前最短距离、依存关系、机器学习模型等方法只考虑局部关系义、未考虑全局整体义,只考虑浅层字面义、未考虑深层语用义的不利局面。例如“孔子学院不仅让汉语成功走出国门,它也成为传播中国文化的重要力量。”(《新闻联播》2011/12/04)从浅层字面义和局部关系义看,评价词“成功”描述的对象是“汉语走出国门”,但从深层语用义和全局整体义看,这一“致使构式”真正的评价对象是汉语成功走出国门的推动者“孔子学院”,整个句子的语用目的,即说话者的交际意图是夸赞“孔子学院”。
评价词包括评价动词、评价形容词、评价名词、评价副词4类。本文以评价动词为研究对象,以智能识别评价动词的评价对象为研究目标,以评价动词与评价对象配对构式为研究内容,找出帮助计算机自动识别评价动词的评价对象的形式化特征标记,探索陆俭明先生倡导的“构式语法为人工智能服务”[25]的实现路径,为其他评价词类的评价对象抽取研究提供案例参考。
本文的研究思路如下:首先,从《现代汉语常用词表》中选取使用频率最高的10个评价动词作为样本词(支持、反对、批评、促进、值得、破坏、满意、犯罪、改善、感谢);然后,从2021年3月1日至2021年3月10日百度资讯——新闻网站中检索出200个评价句(每词20句)作为样本语料;其次,具体考察样本语料中评价动词与评价对象的配对情况,抽象概括评价构式的基本类型,并精准找出区分各类评价构式的特征标记;再次,把评价构式类型与特征标记理论研究结果转化成机器可读的形式语言,建立评价动词—评价对象智能抽取规则簇;最后,选取新的测试词与测试语料,实验检验规则簇的信度与效度,根据实验结果的反馈情况修正、补充和完善规则簇。
1 评价动词与评价对象配对构式类型及特征
计算机要想准确抽取评价动词的评价对象,需要兼顾评价动词本身的词义特征与评价动词所处构式的特征。上述10个样本评价动词根据词义本身的特征可划分为两类:“支持、反对、批评、满意、感谢”属于一类,与其配对的评价对象是评价的承受者,即评价动词所针对或涉及的事物(受事角色);“促进、值得、破坏、犯罪、改善”属于一类,与其配对的评价对象是评价触发者,即触发评价主体做出褒贬评价的事物(施事角色)。文献[14]把第一类评价动词称作“后指动词”,认为其后面的宾语即评价对象,但我们考察100句后指动词样本语料发现,动词宾语为评价对象的句子只有55句,简单地把两者画等号只能获得55%的召回率。文献[14]把第二类评价动词称作“前指动词”,认为其前面的成分为评价对象,但文章并没有具体指明是前面的哪种成分,若动词前面既有主语成分又有状语成分,既有名词性成分又有谓词性成分,或同时出现多个名词性成分,机器该如何从中做出选择?句法与语义是两个不同的平面,句法关系与语义关系并非一一对应(宾语≠受事角色、主语≠施事角色)。吕叔湘先生很早就注意到句法与语义的不对称性[26]:“论结构关系,A应该属于B,但是在语义上A指向C。”因此,我们应充分意识到句法与语义的区别,不能将两者混为一谈,抽取评价动词的评价对象旨在解决评价动词与评价对象之间的语义(或语用)指向关系,而非句法结构关系;同时我们也要意识到句法与语义之间的联系,抽象的、深层的评价意义必须要通过具体的、表层的句法形式来体现。作为句法与语义这对矛盾统一体的“评价构式”,正是下文所要论述的对象。
1.1 后指评价动词与评价对象(受事角色)配对构式
考察100句样本语料中后指评价动词“支持、反对、批评、满意、感谢”与评价对象(受事角色)的配对情况,共归纳概括出8种评价构式(例句中带下划线的为评价动词,带波浪线的为评价对象,加着重号的是计算机据以定位评价对象的特征标记)。
构式1后指评价动词+×××+评价结束标记(占比55%):
(1)多国代表在联合国人权理事会发声支持中国。(新华网2021/03/02)
(2)有欧盟官员批评意大利的决定,认为这将引发“疫苗争端”。(《西宁晚报》2021/03/07)
(3)总而言之,以目前咱们国家教育资源的分布情况,我坚决反对在中小学取消英语的主课地位。(腾讯网2021/03/09)
若后指评价动词前面没有出现其他特征标记,则计算机默认评价动词与评价结束标记(包括标点符号、语气词和叹词)之间的内容为评价对象。把“支持、批评、反对”等收录到语义词典,赋予其“hzv”(后指评价动词)的语义标记,把标点符号、叹词、语气词宏命名为“JSB”(结束标记)。计算机匹配语料时若遇到hzv,则抽取hzv与JSB之间的内容作为评价对象。
构式2对/对于/向+×××+动词/副词/“的”+后指评价动词(占比14%):
(4)据悉,在收到中国疫苗的第二天,塞尔维亚总统武契奇再次在公开场合向中国表示了感谢。(网易新闻2021/03/10)
(5)四川成都某酒店房间内,市民刘先生隔离结束前用近80个矿泉水瓶摆成心形,以表达对防疫工作人员的感谢。(腾讯网2021/03/09)
(6)据西班牙《阿斯报》报道,皇马对于塞尔维亚前锋约维奇的外租表现不满意,球员最近陷入了进球荒中。(腾讯网2021/03/08)
例(4)中的后指评价动词“感谢”充当谓词宾语,例(5)中的后指评价动词“感谢”充当定语中心语,例(6)中的后指评价动词“满意”充当谓语中心语,但3个句子的评价对象均为后指评价动词前面的介词宾语。也就是说,三种不同的句法形式表示了基本相同的评价语义关系,都可以归入构式2中。
构式3对/对于+×××,+后指评价动词+评价结束标记(占比3%):
(7)不过对于训练中这样的表现,库里本人似乎并不满意。(腾讯网2021/03/08)
(8)对国网尉氏供电公司大力实施的机井通电工程,尉氏县永兴镇高标准农田建设项目负责人很是满意。(人民网2021/03/05)
(9)对于上诉法院要求“重新考虑恢复三级谋杀指控”的裁定,8日当天,肖万的律师提出反对,并表示将向明尼苏达州最高法院要求撤销这项裁定。(中国青年网2021/03/09)
汉语与英语、俄语、日语等具有丰富形态变化的语言相比,缺少形态变化,表示语法意义的主要手段是语序和虚词,具有“重意合不重形合”“形散而神不散”的特点,句式灵活多变,同一种语义关系,说话者出于不同语用目的可以采用不同的句法形式。第3种评价构式可以看作第2种评价构式的变体,说话者把介宾状语前置于句首,作为所要谈论的话题。
构式4×××+被动词+后指评价动词(占比13%):
(10)拜登政府这种“跟中国硬拼”的政策,遭美国社会反对!(网易网2021/03/09)
(11)作为全球最大的零售商,沃尔玛此前一直饱受美国国内的批评。(腾讯网2021/03/04)
(12)李子柒三次拒回记者提问,引60万人支持:分寸感,每个人都要懂。(腾讯网2021/03/07)
这种构式属于被动型评价构式,其语义结构是评价对象(受事)+被动词+评价主体(施事)+后指评价动词。被动词指“遭、受、引、引发、引起、被、让、令”等表示被动意义的词,可将其收录到语义词典并赋予其“bdc”(被动词)的语义标记。计算机在匹配语料时,若匹配到“bdc+hzv”,则抽取被动词的前邻主语为评价对象。
构式5×××+是+必要词/主体词+后指评价动词+的(占比3%):
(13)赵冬苓:我觉得抄袭无疑是应该坚决反对的。(《南方都市报》2021/03/08)
(14)振兴农村,有哪些投资要不得?这几项是必须要反对的!(腾讯网2021/03/09)
(15)配置方面真的是我最满意的地方,这售价能够买到多一倍的豪华配置。(艾瑞网2021/03/08)
构式5与构式4的评价对象都是评价动词的前邻主语,但特征标记有所不同。构式5必须同时出现“是”“必要词或主体词”“的”3要素,才能断定评价对象是前邻主语。例(16)虽然出现了“是”和“的”,但没有出现“必要词或主体词”,所以评价词“反对”的前邻主语“我们”并非评价对象,真正的评价对象是句首话题。必要词指“应、应该、应当、要、必须”等表示必要性意义的词,可在语义词典中赋予其“byc”(必要词)的语义标记,主体词主要包括人称代词、人名、组织机构等。
(16)邀请达赖去台湾,我们是坚决反对的。(中国青年网2016/03/07)
构式6后指评价动词+的+是+×××(占比3%):
(17)而升职之后最应该感谢的,是提拔我们的领导,毕竟古人说过:“滴水之恩,涌泉相报”。(腾讯网 2021/03/07)
(18)最满意的还是女儿的公主房了,因为满满都是少女的色彩。(搜狐网2021/03/09)
(19)兰英说创业的过程是艰辛的,她最想感谢的是跟她一起创业的团队和员工们,因为有了他们的不离不弃,才有了公司的今天。(澎湃新闻2021/03/08)
构式6与构式5互为变体,通过调换主语和宾语的位置,两者可以相互转化。例(13)抄袭无疑是应该坚决反对的⇔应该坚决反对的无疑是抄袭;例(17)升职之后最应该感谢的是提拔我们的领导⇔提拔我们的领导是升职之后最应该感谢的。调整语序之后句子的基本语义不变,这再次体现出汉语表达的灵活性,同一种语义关系可以根据语用需要采用不同的句法形式来表示。
构式7名词1+建议词+×××+标点符号+名词2+后指评价动词+评价结束标记(占比3%):
(20)委员建议对996工作制监管:网友一边倒支持。(和讯科技2021/03/10)
(21)专家建议对996工作制监管:网友直呼支持!(中关村在线2021/03/10)
(22)专家建议产假延长至3~6年,为何女性集体反对,几乎吵翻了天?(腾讯网2021/03/08)
这种评价构式的评价对象是前句宾语,在100句样本语料中仅出现了上面3例,是一种边缘型评价构式。判断这种评价构式的特征标记是前句中的谓语动词“建议”,与“建议”类似的词有“提议、倡议、倡导、提出、提倡、发起、号召、呼吁”等,可统称为“jyc”(建议词),这类词具有引出新对象的功能,且引出的新对象往往成为下文评价主体(名词2)所要谈论的对象。
构式8×××+交出/交上+满意(占比6%):
(23)我们党向人民、向历史交出了一份满意答卷。(《北京日报》2021/03/01)
(24)中国政府交上了一份令中国人民满意的答卷,也给国际社会留下深刻印象。(搜狐网2021/03/06)
(25)李克强在政府工作报告中指出,过去一年我国交出一份人民满意、世界瞩目、可以载入史册的答卷。(新华网2021/03/05)
这是一种专门为某个评价词制定的特殊评价构式。任何事物都是既有普遍性又有特殊性,评价词也一样。“满意”既有后指评价动词的普遍特征,也有自身的特殊特征,例如评价构式“×××+交上/交出+满意+答卷”中的“满意”不能替换为“支持、反对、批评、感谢”等同类评价动词,这启示我们要想全面提升评价对象抽取系统的性能,需要关注评价词典中的特殊评价词,为其制定专门的评价构式,最终实现一般评价构式、边缘评价构式和特殊评价构式的统筹兼顾。
1.2 前指评价动词与评价对象(施事角色)配对构式
考察100句样本语料中前指评价动词“促进、值得、破坏、犯罪、改善”与评价对象(施事角色)的配对情况,共归纳概括出5种评价构式。
构式9×××+助动词/介词/副词/引号/动词/形容词/致使词+前指评价动词(占比84%):
(26)烧荒会破坏土壤结构。(腾讯网2021/03/07)
(27)这节课在情境与对话中促进学生发展。(澎湃新闻 2021/03/09)
(28)幼儿园多了收费少了,学前教育三大难题正在改善。(《人民日报》2021/03/02)
(29)“以中高考成绩奖励教师和学生”破坏教育生态,难怪教育部要禁止。(腾讯网2021/03/06)
(30)接受《法治日报》记者采访的专家认为,“高考移民”问题牵涉到多方利益,破坏了高考公平。(《法治日报》2021年03月07日)
(31)在她看来,当下“教育商业化”现象严重破坏了当前基础教育生态,要以治理环境生态的力度综合破解教育生态难题。(《重庆晨报》2021/03/09)
(32)从人拉驴驮到“活水”入户,从“饮水难”到“饮水甜”,农村饮水安全工程不仅让干旱山区的人民改善了苦涩的日子,更为甘肃人民迈进小康社会注入了强劲动力。(人民网2021年03月02日)
例(26)—例(32)代表7种不同的句法形式,评价对象均是特征标记前面的句子主语,我们“求同存异”将其抽象概括为一条评价构式。在100句前指评价动词样本语料中,共有84句语料符合这种构式,占比84%,可将其视为前指评价动词与评价对象的常规配对构式。机器匹配到“qzv”(前指评价动词)时,若该句不符合其他构式类型,则默认句子主语为评价对象。
构式10非致使动词+×××+前指评价动词(占比7%):
(33)安康公安征集李俊丁等人违法犯罪线索!(腾讯网 2021/03/10)
(34)英国BBC曝光美国Facebook:破坏“地球之肺”亚马孙雨林的帮凶。(腾讯网2021/03/05)
(35)15万左右论紧凑型SUV,日产逍客相比柯珞克谁更值得选择?通过上述介绍来看,显然是出自德系的斯柯达柯珞克更值得。(搜狐网2021年3月8日)
这种评价构式的评价对象是非致使动词后面的名词性成分,其特征标记是“非致使”动词。如果替换为“致使”动词(如“让、使、造成、导致”),评价对象就变成了动词前面的句子主语:例(36)真正的评价对象是致使动词“让”前面的句子主语“共享轮椅”,而非“让”后面的“医院基本民生”。由此可见,要想辨别这两种不同的评价构式,有必要区分致使/非致使动词。
(36)共享轮椅让医院基本民生得到改善!(财讯网2021/03/10)
构式 11将/把+×××+列入/纳入/列为+犯罪(占比5%):
(37)国家正式将这十种行为列入犯罪!重罚!判刑!(澎湃新闻2021/03/07)
(38)此次刑法修改,明确将侮辱、诽谤英雄烈士的行为纳入犯罪。(搜狐网2021/03/01)
(39)刑法修正案(十一)增设新罪名,再次明确将未经批准进口、销售国外药品的行为列为犯罪,但同时也设置了“足以危害人体健康”的前提要件。(网易网2021/03/01)
这是专为评价动词“犯罪”制定的特殊评价构式。“促进、值得、破坏、改善、犯罪”5个样本前指评价动词中能进入这一评价构式充当“列入、纳入、列为”宾语的只有“犯罪”。虽然这5个词在《现代汉语词典》中均标注为动词,但“犯罪”除了有“做出危害国家和社会、依法应处以刑罚的事”的动词意义,还有表示所做事情的违法性质的名词意义。这再次表明,要想准确抽取评价对象,既要考虑同类评价词的普遍特征,也要考虑其中个别成员的特殊特征。
构式12×××+的+前指评价动词(占比2%):
(40)另一方面,出口市场的改善抑制了这种下滑。(金投网2021/03/09)
这种评价构式在100句样本语料中只有2例,虽然出现频率极低,但也代表一种类型。其形式特征是评价对象与前指评价动词构成以结构助词“的”为标记的定中短语,定中短语充当话题主语。通常情况下,作定语中心语的前指评价动词(“改善”)语义前指作定语的施事/领事(“出口市场”);但在句子谓语部分再次出现评价词语的特殊情况下(例41),则“评价对象+的+前指评价动词”整体充当谓语评价词语(“未获青睐”)的评价对象,这体现了构式的套叠性。
(41)台湾《中国时报》26日发表社论指出,离岛交通的改善未获台当局“行政院”“前瞻计划”青睐。(中国台湾网2017/04/26)
构式13前指评价动词+的+是/非+×××(占比2%):
(42)要说今年最值得买的一款MPV非上汽大众威然Viloran莫属。(车讯网2021/03/10)
这种评价构式在样本语料中也只出现了2例。判断这种评价构式的特征标记是助词“的”和判断词“是”(肯定判断)或“非”(否定判断)。“前指评价动词+的”构成大颗粒度、表泛指概括性意义的评价短语,充当被陈述的话题主语,判断动词“是/非”后面表具体意义的宾语是所要抽取的评价对象。这种评价构式与构式6的形义关系基本一致,两者可以合并。
2 系统实现与实验
2.1 系统实现
把“评价动词与评价对象配对构式类型及特征”理论研究的结果,用机器可读的形式语言进行表示,就形成了“评价动词与评价对象智能配对规则簇”(见表1)。规则使用的词性标记符号及其含义参见《中国传媒大学分词标注系统(CUCBst)词性标记集》(共76个标记),语义标记符号(共11个)及其含义具体如下:hzv——后指评价动词、qzv——前指评价动词、bdc——被动词、byc——必要词、rr——人称代词、jyc——建议词、uv——助动词、zsv——致使动词、QSB——评价起始标记、JSB——评价结束标记、NP——名词性词语。规则按照先特殊后一般的顺序排列,即限定条件多的特殊评价构式与边缘评价构式在前,限定条件少的一般评价构式在后,以获得最佳匹配效果。
我们把11种语义标记符号及具体词语添加到用Python语言编程研发的评价分析系统CUCsas2.0的语义词典,把表1中的12条评价构式规则簇添加到CUCsas2.0的评价对象抽取规则库,期望能够提升系统对评价动词评价对象的抽取准确率和召回率。
表1 评价动词与评价对象智能配对规则簇Table 1 Rules cluster of intelligent pairing between opinion verbs and opinion targets
CUCsas2.0系统运行的完整流程如下:①加载语料→②调用分词词典和分词规则对语料作分词及词性标注→③调用评价词典和语义词典对语料作情感和语义标注→④调用短语和句子情感计算规则库对分词标注语料作情感值计算→⑤调用评价对象规则库抽取评价句中的评价对象。
上述流程可简要概括为加载语料→分词标注与情感计算→抽取评价对象三大步,我们以例(43)具体说明CUCsas2.0系统的语料处理过程。
(43)多国使节对中国全国人大完善香港选举制度表示支持。(新华网2021/03/06)
第一步:加载语料。把句子“多国使节对中国全国人大完善香港选举制度表示支持。”加载至评价分析系统CUCsas2.0;
第二步:分词标注与情感计算。系统调用分词词典Lexicons和分词规则MODIRULE对语料进行分词及词性标注,调用评价词典UsrDic0和语义词典UsrDic1对语料进行褒贬情感和语义特征标注,调用短语和句子情感计算规则库PhraseRule对语料进行情感值计算。语料分词标注与情感计算结果为:多/m国/n使节/n对/p中国全国人大/nt完善/v&po&qzv(0.625)香港/ns选举/v制度/n表示/v支持/v&po&hzv(0.25)。/w ;
第三步:抽取评价对象。系统调用评价对象抽取规则库匹配经分词标注与情感计算后的语料,抽取语料中的评价对象。例(43)满足规则库中“评价动词与评价对象智能配对规则簇”中第5条规则“对|对于|向/p+#+*/v|d|u+*/hzv=N2”左部的匹配条件——N1:对/p N2:中国全国人大/nt完善/v&po&qzv(0.625)香港/ns选举/v制度/n N3:表示/v N4:支持/v&po&hzv(0.25),系统自动抽取规则左部的第2项(N2)作为评价对象,并赋予其褒义(POS)的情感极性——“中国全国人大完善香港选举制度(POS)”。
2.2 实验
为了检验上述研究所得12条“评价动词与评价对象智能配对规则簇”的信度与效度,检验系统相较于基准系统(Baseline)的性能变化情况,我们开展了下面3项实验。
实验一(信度测试):我们仍然以《现代汉语常用词表》中10个最高频的评价动词“支持、反对、批评、促进、值得、破坏、满意、犯罪、改善、感谢”为检索词,从2021年3月20日至2021年3月30日的百度资讯——新闻网站中检索出500个评价句(每词50句)作为测试语料,实验检验基于500句样本语料为10个样本评价动词撰写的评价对象抽取规则,是否适用于这10个样本评价动词所出现的其他语料。
实验二(效度测试):我们以《现代汉语常用词表》中词频排名第11—第20的10个评价动词“改进、牺牲、违法、信任、爱国、损害、危害、优化、适合、奉献”为检索词,从2021年3月20日至2021年3月30日的百度资讯——新闻网站中检索出500个评价句(每词50句)作为测试语料,实验检验基于词频排名第1—第10的样本评价动词的使用情况撰写的评价对象抽取规则,是否适用于其他评价动词。
实验三(Baseline):我们以基于后指动词、前指动词语义分类和浅层句法分析的评价对象抽取系统CUCsas1.0(第二届自然语言处理与中文计算会议“中文微博观点要素抽取”评测第一名[14])为基准系统,以实验一和实验二的1 000个评价句为实验语料,对比检验系统性能的变化情况。
以国际普遍采用的准确率(P)、召回率(R)和F1值为评价指标,实验结果如表2所示。
表2 评价动词与评价对象智能配对规则簇信度与效度测验Table 2 Reliability and validity test of intelligent pairing rules cluster between opinion verbs and opinion targets
实验结果表明:本文基于“评价动词与评价对象配对构式类型及特征”本体研究,构建的CUCsas2.0“评价动词与评价对象智能配对规则簇”的信度与效度达到80%左右,规则基本吻合语言规律,具有较强的泛化能力。与Baseline相比较,新系统的准确率和召回率均有显著提升,F1值提高约13个百分点,证明基于评价构式本体研究所得语义特征和构式规则对推进评价对象智能计算工程有明显帮助。
分析系统评价对象抽取错误和未召回的语料,主要有以下3点原因:
第一,难以找出形式标记。
(44)部分西方媒体对真相视而不见、见而不报,华春莹点名批评:要有良心!(《中国青年报》2021/03/30)
(45)中消协回应“H&M事件”:损害消费者合法权益。(腾讯网2021/03/25)
(46)为感谢追回被盗手机,恩师给民警学生送锦旗。(澎湃新闻2021/03/30)
例(44)—例(46)中评价动词“批评”“损害”“感谢”的评价对象分别为前句主语“部分西方媒体”、前句宾语中的定语“H&M”、后句介词宾语“民警学生”,计算机目前缺乏判断的形式依据。
第二,缺少对实义动词的词义分类研究。
(47)熬夜的危害比你想象还要大!(网易网2021/03/23)
例(47)中评价动词“危害”的评价对象是前面的定语“熬夜”(动词),但规则9“*/NP+的/u+*/qzv=N2”把定语限定为名词性词语,没有考虑到有些实义动词也可充当定语评价对象。哪些实义动词可以充当评价对象,哪些实义动词不能充当评价对象,两者的区别特征是什么,尚待研究。
第三,难以辨析“同形异构”评价构式。
(48)作为一种新型的持久性污染物,PFAS对·于人体的危害越来越令人担忧。(澎湃新闻2021/03/23)
“同形异构”评价构式指一种评价构式形式具有两种或两种以上的潜在结构意义。例(48)“A+对于+B+的+危害”这一构式的评价对象有A或B两种可能,目前匹配的是规则9“*/NP+的/u+*/qzv=N2”,抽取定语B“人体”为评价对象,但正确评价对象是主语A“PFAS”。“同形异构”评价构式的辨析方法有待研究。
3 结论
评价对象抽取是一项语言学与计算机科学交叉融合的语义计算工程,需要数据、算力和算法“三驾马车”共同驱动。当前汉语评价对象抽取的算力已经不成问题,算法方面也已经做了大量研究,各种统计方法和机器学习模型(包括基于深度学习的神经网络模型)均有所应用,但是评价对象抽取的效果还远未达到令用户满意的程度,其“症结”在于缺乏对语言本体的深入研究,缺少“数据”这辆马车的有力基础支撑。评价对象抽取这项细粒度的语义计算任务要想取得实质性进展,需要改变“重计算、轻本体”的偏颇现状,加强对语言本体的深入研究,尽快从构建评价词典的基础词汇层研究,转向以“评价构式”为核心的词汇—句法—语义融合机制研究。
汉语评价构式大致分为评价动词构式、评价名词构式、评价形容词构式、评价副词构式4种基本类型。本文以评价动词构式为研究对象,选取《现代汉语常用词表》中使用频率最高的10大评价动词作为样本词,以小规模的媒体新闻报道语料为样本语料,对后指评价动词与受事评价对象配对构式、前指评价动词与施事评价对象配对构式进行了分类研究,共归纳概括出13种评价动词构式,并且精准找出了识别每一种评价构式的特征标记,建立了较为完善的评价动词构式体系,并转化为机器可读的形式语言,构建起评价动词与评价对象智能配对规则簇。实验结果表明,规则簇具有较高的准确率和召回率,F1值可以达到80%左右(比基准系统提升约13%)。论文基于小规模语料,初步探索了构式语法为人工智能服务的可行性,提供了构式语法与情感智能计算相结合的研究思路和研究案例,我们下一步将基于更大规模的语料开展实验,修正、补充和完善评价动词构式理论体系和规则簇;同时,对另外3类评价词与评价对象的配对规律展开研究,最终建立全面系统的汉语评价构式知识体系。