考虑在线评论可靠性的酒店顾客满意度评价方法
2021-03-11马玉梅李铭洋
马玉梅, 李铭洋
(辽宁大学 商学院,辽宁 沈阳 110136)
顾客满意度是酒店运营管理中需要考虑的重要因素[1-2],顾客满意度的高低直接影响到酒店的口碑和业绩,是酒店寻求长期经营优势的关键考量[3].顾客满意度高的酒店通常拥有较高的顾客忠诚度和顾客保留率,入住过的顾客更愿意将其推荐给其他消费者[4].因此,准确地度量顾客满意度对酒店管理具有重要意义.
传统的酒店顾客满意度研究通常借助期望失验理论[5-6],该理论是指顾客在购买某一产品或者服务前,会对该产品或服务产生预期,在购买或者体验后顾客将实际感受和预期进行比较.若实际表现优于期望,则产生正面的失验;若等于期望,则无失验产生;若低于期望,则产生负面的失验.其中无失验和正面的失验导致顾客满意,负面的失验导致顾客不满意.在已有研究中,获取期望失验程度的方式有调查问卷[7-8]、访谈[9]等,但这些方式可能会因顾客不情愿配合或调查过程中存在外界因素干扰,导致顾客所做出的评价不能真实反映其住宿后的满意情况.
近年来,互联网技术的发展改变了顾客的消费行为,顾客更倾向于在网上预订酒店,并在消费后对住宿经历发表评论,这些评论信息反映了顾客的期望失验程度,而且会影响潜在顾客对酒店的预定决策.相比于问卷、访谈等方式获取的信息,在线评论是顾客自发生成的,更能体现顾客对住宿满意程度的真实感受.目前,已有一些国内外学者借助酒店在线评论进行顾客满意度评价研究.其中,一些学者通过分析文本评论来识别酒店服务的关键维度,进而分析顾客满意度.例如,Berezina等[10]采用文本挖掘方法,对顾客消费后满意和不满意的在线评论进行分析.Bi等[11]运用潜在狄利克雷分析方法(LDA),从在线文本评论中提取顾客关注的服务属性进行IPA分析.Guo等[12]利用LDA分析Tripadvisor上的文本评论,以构建酒店顾客满意度的多个维度.刘岩等[13]借助TF-IDF算法和文本聚类方法基于文本评论构建酒店顾客满意度评价的指标体系,然后运用线性回归分析构造满意度评价模型.Xu等[14]利用潜在语义分析方法(LSA)分析顾客的文本评论,以调查顾客对酒店产品和服务属性的满意度和不满意度.需要指出的是,顾客在发表文本评论时只会针对所关注的属性进行评价,因此不同的评论所涉及的属性可能不同,一些涉及属性较少的评论转化得到的结构化数据也是稀少的[15].在此情形下,利用文本评论进行顾客满意度评价比较困难.事实上,一些网站会事先设定若干个属性,让顾客针对不同的属性进行打分.Geetha等[16]通过研究发现,文本评论与评分在情感上是一致的,因此可以利用在线评分进行顾客满意度评价.目前已有一些学者对此进行研究,例如,Liu等[17]基于酒店在线评分,给出了使用不同评论语言的顾客满意度评测方法.利用PROMETHEE-Ⅱ方法,李铭洋等[18]提出了一种基于在线评分的酒店服务质量评价的方法.Ahani等[19]以加那利群岛的酒店为例,运用多准则决策方法来确定顾客的满意度和偏好.
需要指出的是,旅游评价网站中的评论信息来自不同的评论者,由于评论者所具有的知识、经验和偏好不同,评论的可靠性也存在差异.在评价顾客满意度的过程中,若忽视在线评论可靠性的差异,将不同评论信息一视同仁,则会降低评价结果的准确性.鉴于此,本文提出了一种考虑在线评论可靠性的酒店顾客满意度评价方法.在该方法中,首先计算在线评论的可靠性,并依据可靠性对在线评论进行处理以获得基本可信度分配.其次,利用D-S证据理论将不同属性的评论信息进行融合,从而在总体上评价酒店的顾客满意度.最后,利用效用函数计算各评价属性对应的满意度效用值和总体效用值,进而确定同类型酒店针对不同评价属性和总体满意度的评价结果.
1 问题描述
顾客在旅游评价网站中发布针对酒店的在线评论,这些评论信息在一定程度上反映着顾客对住宿经历的满意情况.如图1所示,旅游评价网站中的评论信息通常包括评论者等级、在线评分、评论时间、评论有用数.然而,不同评论信息在评论时间、评论者等级和评论有用数3个方面存在差异.首先,酒店在经营过程中可能对服务、设施等方面进行改进,故评论时间越临近越能体现酒店当前的顾客满意情况,即评论的可靠性越高.其次,评论者的等级越高,说明评论者的住宿经历和评论经验越多,那么他做出的评论越客观可靠.此外,每条评论都有有用数投票,这代表着顾客对该条评论的认可程度,有用数越大,认可程度越高,则该条评论在满意度评价过程中的可靠性越高.本文所要解决的问题是在考虑在线评论可靠性的前提下对酒店的顾客满意度做出客观评价,同时确定酒店针对各属性的顾客满意度提升顺序.
图1 去哪儿网酒店在线评论界面Fig.1 The interface of hotel review of Qunar.com
为便于下文表述,用下列符号表示问题中所涉及到的集合与变量:
A={A1,A2,…,Ar}:同类型酒店的集合,其中Ai表示第i个酒店,i=1,2,…,r;
E={E1,E2,…,Es}:酒店评价属性的集合,其中Ej表示第j个属性,j=1,2,…,s;
H={H1,H2,…,Hn}:顾客满意度评价的等级集合,其中Hv表示第v个评价等级,v=1,2,…,n,v越大所对应的评价等级越高;
Q={Q1,Q2,…,Qr}:酒店在线评论数量的集合,其中Qi表示第i个酒店的在线评论总数量,i=1,2,…,r;
L*:网站所设置的评论者最高等级数;
2 研究方法
为解决上述问题,下面基于D -S证据理论给出一种考虑在线评论可靠性的酒店顾客满意度评价方法.首先,从旅游评价网站收集相关酒店的在线评论,并利用评论者等级、评论时间和评论有用数计算评论信息的可靠性;其次,基于评论信息的可靠性以及在线评分,获取顾客满意度评价的基本可信度分配;然后,基于离差最大化方法计算各属性的权重,并在考虑属性权重的情况下,根据Dempster合成法则将不同属性上的基本可信度分配进行合成;最后,将酒店在不同评价属性上的基本可信度分配和总体可信度分配转化成效用值,根据效用值,对各酒店进行顾客满意度排序,以便酒店制定相应的顾客满意度改善方案.
2.1 评论信息可靠性的计算
1) 评论者等级
(1)
2) 评论时间
(2)
3) 评论有用数
(3)
(4)
2.2 评论信息的信度表示
在依据D-S证据理论进行证据合成之前,将收集的酒店在线评论表示成信度形式.为了便于理解,首先对D-S证据理论的基本概念进行简要介绍.
定义1(识别框架)[20]针对一个判别问题,人们所能认识到的可能结果用集合Θ表示,那么人们所关心的任一命题都对应于Θ的一个子集.Θ被称为识别框架,是一组有限的相互排斥且详尽的命题.例如,在评价酒店的顾客满意度时,顾客满意度评价的等级集合H={H1,H2,…,Hn}为识别框架.
定义2(基本可信度分配)[21]设Θ为识别框架,2Θ是Θ的幂集.如果集函数m:2Θ→[0,1]满足:
式中,φ为空集,则称函数m为基本可信度分配,称m(B)为命题B的基本可信数,表示对命题B的信度.
顾客针对酒店入住经历发表在线评论时,会为每个属性给出评分.设酒店Ai的第q条在线评论中,顾客评价属性Ej为等级Hx,则顾客给出的在线评论可表示为
(5)
于是,基本可信度分配βv,j,i为
(6)
2.3 属性权重的确定
本研究旨在基于顾客所给出的在线评论对酒店的顾客满意度做出较为客观准确的评价,所以在属性确定方法的选取上要考虑客观性.此外,还需要考虑各属性在不同评价对象上的差异性.若某项属性的属性值在不同对象之间差异较大,说明针对该属性顾客的意见出现较大分歧,对顾客满意度评价的贡献越大,则应被赋予的权重越大.相反,若差异较小,说明顾客的意见趋于一致,对顾客满意度评价的贡献越小,则应被赋予的权重越小.鉴于此,采用离差最大化方法来确定评价属性的权重[22-23].相比主观赋权方法[24],应用该方法得到的结果更加客观.
1) 对总体识别框架的每个评价等级进行赋值,即设置每个评价等级的效用值
(7)
2) 对于酒店Ai,计算评价属性Ej的期望效用Uj,i,即
(8)
式中,βH,j,i表示不属于任何一个等级的基本可信度分配.
3) 对于属性Ej,计算酒店Ai与其他酒店的加权离差Dj,i,即
(9)
4) 对于属性Ej,进一步计算各酒店与其他酒店的加权总离差Dj,即
(10)
5) 基于离差最大化思想,以所有属性的离差最大化为目标,构建优化模型如下:
(11)
6) 对式(11)求解,得到的ηj并进行归一化处理,得到属性权重ωj,j=1,2,…,s,即
(12)
2.4 多属性评论信息的合成
本节将利用Dempster合成法则融合同一酒店的多属性评论信息从而获得顾客对酒店满意度的总体评价.Dempster合成法则是D-S证据理论的核心,可以对基于不同证据的信度函数进行合成.在顾客满意度评价问题中,酒店的评价属性集合E={E1,E2,…,Es}为证据集.通过融合同一酒店不同评价属性的基本可信度分配βv,j,i得到顾客满意度评价的总体可信度分配.设mv,i表示酒店Ai被评价为等级Hv的总体可信度分配.具体的合成过程如下:
(13)
式中,
(14)
2.5 顾客满意度的效用值计算及排序
基于酒店在各属性上的基本可信度分配βv,j,i和酒店的总体可信度分配mv,i,计算酒店关于各评价属性的效用值以及酒店的总效用值.利用式(7)和式(8)分别计算每个评价等级的效用值和各评价属性的效用值.同理,酒店的总效用值计算过程为
(15)
其中,mH,i表示不属于任何一个等级的总体可信度分配.
通过比较式(8)和式(15)计算得到的效用值进行顾客满意度评价.例如,若
Ug,i>Uh,i,g≠h,g,h=1,2,…,s;i=1,2,…,r.
则对于酒店Ai,属性Eg的顾客满意度优于属性Eh的顾客满意度,如果想要提升该酒店的顾客满意度可以先从属性Eh进行改善.同理,若
Ub>Uc,b≠c;b,c=1,2,…,r.
则表示酒店Ab的总体顾客满意度优于酒店Ac的总体顾客满意度.
3 实例分析
为了验证上述方法的可行性,本节选取JL酒店、HI酒店、GL酒店和CB酒店为目标酒店进行顾客满意度评价.相关数据均从携程网上收集.这4家酒店地处北京国贸商圈,属于高端商务酒店,且4家酒店在携程网上的总评分相同,均为4.7分,在线评论总数量均在3 000条左右.
首先,利用爬虫工具集搜客从携程网上抓取JL酒店(A1)、HI酒店(A2)、GL酒店(A3)和CB酒店(A4)的在线评论.选取服务(E1)、设施(E2)、卫生(E3)和环境(E4)作为顾客满意度评价属性.携程网的在线评分采用5分制,从1分(非常不满意)到5分(非常满意),所以识别框架为H={H1,H2,…,H5}.
图2 携程网在线评论示例Fig.2 An example of online review on Ctrip.com
依据式(5)和式(6)计算基本可信度分配βv,j,i,计算结果如表1所示.
表1 各酒店在不同属性上的基本可信度分配Table 1 The basic probability assignments for different attributes of each hotel
表2 各酒店在不同属性上的期望效用值
依据式(7)计算得到不同评价等级的效用值分别为u1=0,u2=0.25,u3=0.50,u4=0.75,u5=1.00.依据式(8)计算得到各酒店属性的期望效用值,如表2所示.
依据式(9)~式(12),计算属性权重:ω1=0.282 6,ω2=0.319 4,ω3=0.139 2,ω4=0.258 8.然后,根据式(13)和(14),将4个属性上的信息进行合成,计算结果如表3所示.
表3 各酒店的总体可信度分配Table 3 The overall probability assignments of hotels
图3 酒店顾客满意度的效用值Fig.3 The utility values of hotel customer satisfaction
依据式(15),计算酒店的总效用值.然后将各属性的效用值和酒店总效用值绘制成图3.如图3所示,从整体上看4家酒店在环境和卫生2方面的满意度情况普遍较好,其中在卫生方面各酒店的表现差异不大.而对于服务和设施,各酒店的满意度情况普遍较差.4家酒店中HI酒店在服务属性方面效用值最大,其顾客满意度最好,但是在设施、卫生和环境3个方面的效用值最小,其顾客满意度情况最差.因此,相对于其他酒店,HI酒店需要针对这3个方面进行改善.此外,GL酒店在设施和卫生方面满意度最好,但是服务和环境方面表现较差,尤其是服务方面,GL酒店是四家酒店中满意度情况最差的,所以如果GL酒店希望提升其顾客满意度以提高竞争力可以从服务方面着手.各酒店的总体满意度水平上由高到低为:JL、GL、CB、HI.因此,4家酒店中JL酒店的总体顾客满意度最好,而HI酒店的最差.
4 结 论
基于D-S证据理论提出了一种考虑在线评论可靠性的酒店顾客满意度评价方法.该方法从旅游评价网站收集酒店评论信息中的在线评分、评论者等级、评论时间和评论有用数.依据评论者等级、评论时间和有用数计算评论信息的可靠性,基于计算得到的可靠性和在线评分,获取酒店顾客满意度评价的基本可信数.然后,借助离差最大化方法计算各属性权重,并进行多属性的信度合成.最后,计算不同属性的效用值和各酒店的总效用值,利用这些效用值分析酒店的顾客满意度.
与已有研究相比,首先,本文考虑了不同评论信息在可靠性方面的差异,并利用不同评论信息在评论时间、评论有用数和评论等级3个方面的差异来衡量可靠性.评论时间越临近,评论内容越符合酒店当前的实际情况,则该条评论在顾客满意度评价问题中的可靠性越高.另外,评论信息获得的有用数越多,其他顾客对该条评论的认可度越高,则该条评论信息的质量越高.而评论者通过编写大量评论和高质量评论获得较高等级,则等级越高的评论者做出的酒店评价越可靠.所以在评价酒店的顾客满意度时,需要考虑这3个方面的信息来衡量在线评论的可靠性.其次,本文借助D-S证据理论在信息融合方面的优势,将不同属性的信息进行融合以获取更加完整的信息进行顾客满意度评价.
本文提出的方法能够帮助酒店管理人员评价酒店的总体顾客满意度和各属性的顾客满意度情况.由于互联网的开放性,酒店管理人员同样可以获取竞争酒店的在线评论信息,从而利用本方法分析竞争酒店的满意度情况.通过与竞争酒店的比较,酒店管理人员可以识别酒店在不同属性上的优势和劣势,以便在进行有限资源分配决策时做到有的放矢,提高其在同行业中的竞争力.