基于情感语义的服务质量测评研究
2022-08-23任硕实
任硕实,符 琛
(1.河北政法职业学院,河北 石家庄 050061;2.宁夏大学,宁夏 银川 750021)
一、框架语义理论
美国语言学家菲尔墨提出的研究词语意义和句法结构意义的理论方法,被称为框架语义学①。这一理论源于经验主义语义学传统,并非形式语义学,它与形式语义学的主要区别在于前者强调语言与经验之间的连续性,而形式语言学是不连续的②。框架语义学与形式主义之间并不矛盾,Fillmore认为,框架语义学应该是“在形式化之前的”,而不是“非形式化的”。
美国加州大学伯克利分校开发了一个英文的框架语义词典Frame Net③。中文框架语义词典研究开始于2004年,收词数量不多。通过研究我们可以看出现有的框架语义词典的构建没有情感语义描述所需要的极性、情感强度等信息。对词汇进行分类的结果,肯定词和否定词由于有共同的理解图式和共同的框架元素集,可以被归入同一个框架范畴。对于情感语义分析,显然需要添加一些情感标签。
二、情感框架语义词表的构建
本研究保留评论数超过5次的评论(2次/1000条,5次/5000条)。相似度:在同一框架下,将主题词(后一词)进行HowNet相似度计算,相似度大于0.8的适于归为一类,所得结果有效比例各框架平均为88%(经人工判定属于同一个评价主题的词语/相似度为0.8以上的词语)。但是受到HowNet词典规模的限制,覆盖面为75%,另有25%的主题词不能计算。在初步处理的基础上,运用层次聚类法的思想进行人工整理,确定评价体系。从以往特征抽取和分类的研究,注重特征词(也就是我们说的主题词),而忽略评价词的语义。参看以下2个评论语句:
这个酒店有点贵。
酒店挺宽敞。
特征词都是“酒店”,但第一句评价的主题是价格,第二句是空间,显然不同。仅依据特征词并不能准确表达这两句的评价主题,评价词(贵和宽敞)对评价主题有更重要的区分价值。正是因为这类现象的存在,许多特征提取的研究,结果往往是“整体”评价占了很大的比重。因为有很多评论句的主语(特征词所在位置)为评价对象名称,如本文酒店评论主语多数为“酒店”;有些研究的手机商品评论,主语多为“手机”。但事实上,整体的评价并没有像研究所示比重那么大。
再看两个评论句:
服务很好。
环境很好。
这两句的评价词一样,都是“好”,但主语不一样,一个是“服务”,一个是“环境”。这两个词对评价主题的确定更有区别价值。可见,单纯依靠评价词,也不能获得准确的主题类别信息。我们采取的主题分类依据是主题词加评价词所在框架(即评价词的语义)两方面信息。
我们的顾客价值体系区分了实体和顾客价值要素。顾客价值作为一种心理体验,与作为客观存在的物体(评价对象或其某部分)是有区别的。例如,有的顾客价值研究,将酒店的位置作为一个顾客价值要素,但实际上“位置”本身是“酒店”的一个客观存在的属性,而顾客体验到的位置是否便利,是否满意,这些内容才是顾客的心理体验。因此,就“位置”来说,真正能够作为顾客价值要素的是位置的便利性、位置的满意感等。描述为某某实体的某某属性,为一条评价属性。本研究以酒店服务质量评论为例,归纳为49个评价属性,见表1。
在以上体系中,二、三、四级为实体部分,右面文字部分为属性部分。实体部分根据事物自身的整体和部分关系划分为层级体系,在体系划分的时候,参照其他相关研究给出的指标体系。节点内容及其细化程度由在线评论内容决定。可以看出,有的实体层级多一些,内容比较繁杂,如客房及下位各部分。但有的实体层级少一些,如周边状况。这并不取决于客观事物的结构如何,而是由在线评论内容决定的。也就是说,酒店顾客因为更多地关心客房内容的空间、设施等,因此,会评价比较细,而周边状况仅仅涉及环境和周边餐饮等内容。右面的属性部分,是针对实体所评价的属性、方面。属性既有对应实体上层的,如“酒店”、客房、服务,也有对应具体物的,如“设施”,甚至具体到“床”。属性及其实体之间的关联也完全取决于是否存在对应的评论句。有些实体虽然也有其他方面的属性,但我们通过大规模评论句分析,未见对该属性的评价,则不予构建。
与上层对应的评论语句往往是比较笼统地表达顾客整体上是否满意,如“酒店挺好”“酒店不错”等,甚至更简略为“好”“很好”“赞”等。这种从整体上给出一个总体评价的情况很常见,从500条评论中统计,总体上表达对“酒店”整体的满意感的,占299条。这类笼统的评价虽然从信息量上来看,并没有具体评价的参考意义大,决策价值高。但我们始终采取评论语句为客观依据,依据“存在即合理”的观点,并且依据其出现次数定权重来确定。因此,这类总体评价不光存在,权重还会比较高。这也是为什么有些情感分析研究,将这类评价剔除后,研究结果是越好的产品,“有用”的评价数量越少。因为好产品,顾客就不再针对具体某方面评价了,而往往总体给一句“好”“不错”这类的评价。因此,这些评价不能忽略,而且在统计上还比较重要。
表1 酒店服务质量实体评价属性知识库
在属性中,“满意感”指的是顾客对某实体或其组成部分给出的是否合意的评价,往往用“好、不错、还可以”等表达,如“服务不错”“设施还可以”。这种对“好”与“坏”的评价,实际上并没有一个客观标准,也无法测量。是顾客依据自己的经验给出的,实际上也就是顾客感觉是否满足自己的期待和要求。“满意感”属性几乎在每个实体节点中都有,是最常见的评价属性。其他属性如“大小、高低、面积、新旧”等含信息量更多一些,它们所依据的评论语句在表达上更具体一些,如“床有点小”(大小),“家具挺新的”(新旧)等。
该知识库不同于以往的电子商务客户满意度研究方法,知识库提供的评价属性体系将实体划分为五个层次,其中一些属性与特定商品密切相关,而建立这样的评价体系十分重要④。
三、情感值计算
情感值是词块中情感框架的情感体现,价值范围在0.0—1.0之间,与词汇的情感值相同。然而,词汇成分的情感价值是其意义的内在属性,不随语境的变化而变化。它的值在静态字典中给出。语块的情感价值是指整个语块在特定语境中的属性。一方面,当一些单词独立出现时,它们的极性值为0.5,即中性词,例如“大”“低”“小”等,但具体到一定的上下文,却有了褒贬倾向。例如,语块“床大”,可能就比较符合顾客的需求,是褒义0.6;而语块“噪声大”,则又是贬义0.4。另一方面,当语块中存在否定词或程度修饰词时,语块的情感价值与评价词的情感值不同。如果褒义成分前面有否定词,整个语块的值可能会变为贬义,而一个强度为“中”的成分前面有“相当”和“太”等程度修饰词,词块的强度会变为高或极高。对于情感值为0.5的中性词,语块的情感值是根据主题信息来确定的。例如,当词块中的中性词“小”是“床”时,意味着住户感觉床狭小,因此这是一个贬义的评价,区块的情感价值是(-0.1),见图1。
按照图1表示,第一步,输入评价词的情感值x0;第二步,判断x0是否为0.5,当x0=0.5,查阅中性词主题增量知识库,得到新的情感值;x0≠0.5。第三步,检查副词b,若有,依据增量,判断或大于1,或小于1,若x0>1则以1计。若无副词,则继续查看是否存在否定词,存在否定词,x0=1-原情感值,即原来由褒义变为贬义,若没有否定词,保留原值,作为最终值输出。
图1 情感值算法
四、结语
本研究从评论文本中识别情感词,根据语境中所包含的否定词和程度副词,得到语块的整体情感值,并根据相应的实体和属性计算整体评价值,达到服务质量评价的目的。根据细分的情感类别计算评价属性的情感值,得到更详细的评价结果,更准确地反映客户体验。评价结果基于对场景语义分类的识别,基于语义分析,并在语义分析的基础上,对每个属性的评价值进行统计。本文将汉语语义分析和管理决策的统计分析的本质进行了浓缩。针对酒店服务质量指标不平等、数据支持不到位、评价指标分类粗糙、评价准确性和可信度低等问题,提出了酒店服务行业的基于情感语义的服务质量评价方法。对在线评论专业词汇细分为几十个语义类,在服务质量评价领域,尚属少见。有效地解决了以往评价指标过于笼统,对决策参考价值不高的问题。指标的计量基于文本的语义分析,统计分析情感值,准确反映了顾客体验,解决了以往评价结果可信度不高、参考意义有限的问题。
注释:
①Charles J.Fillmore.Topics in lexical semantics[M].Bloomington,Indiana University Press,1977.
②Charles J.Fillmore.Frame semantics[J].Seoul,Hanshin Publishing Co,1982,111-137.
③美国加州大学伯克利分校.FrameNet[DB/OL]:https://framenet.icsi.ber-keley.edu/fndrupal/.
④Cruz,Fermin L.;Troyano,Jose A.;Enriquez,Fernando.Long Autonomy or Long Delay?'The Importance of Domain in Opinion Mining[J].Expert Systems with Applications,2013,40(8):3174-3184.