APP下载

基于在线评论的餐饮业消费者满意度研究

2023-03-16厉兆通杨潇徐毅廖昕

经济研究导刊 2023年3期
关键词:在线评论文本挖掘餐饮企业

厉兆通 杨潇 徐毅 廖昕

摘   要:当前,餐饮消费不仅是消费者一日三餐的刚需,也是重要的社交方式。在餐饮业规模不断壮大的背景下,测度消费者满意度对提高餐饮企业的产品和服务质量,帮助其可持续发展具有重大意义。以呷哺呷哺为例,运用Python编程在美团团购与大众点评APP上1 071家呷哺呷哺店铺爬取了2017—2020年间510 000多条评论数据,采用词频统计、SKEP情感加强预训练与层次分析法,以评论星级为基础,引入配图数量、被浏览量、情绪词频三个维度的偏离度校正后得到消费者满意度模型,并计算消费者满意度偏差。结果表明,呷哺呷哺在样本期间消费者满意度偏低,需要反思自身存在的问题并进行调整。而消费者满意度偏差较为稳定,表明没有出现刷单或控评的不良行为。此研究结果可以为餐饮企业更准确地掌握消费者满意度,以及监管部门监管餐饮企业刷单、控评行为提供参考。

关键词:餐饮企业;消费者满意度;在线评论;文本挖掘;层次分析法

中图分类号:F83        文献标志码:A      文章编号:1673-291X(2023)03-0061-05

引言

随着我国城镇居民和农村居民生活水平达到富裕和小康水平,居民的餐饮消费逐渐从一日三餐的刚需升级到感受餐饮文化以及社交的重要方式,我国餐饮业也进入成熟阶段,市场规模不断壮大。国家统计局数据显示,2019年我国餐饮业收入为4.7万亿元,同比增长9.4%。2020年,我国餐饮业收入有所下降,为3.95亿元。为走出困境,大量餐饮企业通过“互联网+”,开始建立线上线下一站式服务模式,以增强自身市场恢复能力。《中国餐饮大数据2021》报告指出,2020年5—12月,餐饮业整体线上订单阿量同比增长107.9%。而伴随数字化转型的深入,在线评论也大量产生。作为消费者反馈的重要渠道,在线评论包含丰富信息,不仅能表达观感,帮助潜在消费者做出购买决策,还能帮助相关餐饮企业提高服务质量。

一、相关研究文献评述

随着餐饮业迅速发展,学术界从不同角度对餐饮业消费者满意度进行了研究。林峰利用因子分析法,研究某老字号餐饮企业消费者满意度,发现环境因素对该企业消费者满意度影响程度最高[1]。黄生权和文雅则基于ECSI模型构建了我国餐饮团购顾客满意度模型[2]。牛兰兰和张伟、杨延风使用IPA分析法分别研究了美食街和乡村旅游餐饮的游客餐饮满意度[3,4]。张艳和王喜庆则采用模糊层次分析法,构建了餐饮街区的消费满意度评价指标体系[5]。

目前,还没有文献通过在线评论研究我国餐饮业消费者满意度。但在其他领域,基于在线评论研究消费者满意度的成果較为丰富。部分学者针对在线评论中的评论星级、评论数量等数值属性进行了研究。高宝俊等使用Tripadvisor.com的酒店数据,指出消费者对酒店位置的评分能显著提高酒店的订满率[6]。李红柳和王兴元则研究发现评论数量对顾客价值创造有正向影响[7]。考虑到消费者满意度是一种心理状态和情感表达(Hunt;张胜亮和李小东),也有学者从在线评论的文本关键词、文本情感倾向等文本属性着手[8,9]。例如,马凤才和李春月通过对京东生鲜在线评论进行文本分析,研究发现物流、品质、包装、服务以及价格都是影响生鲜产品满意度的特征因素[10]。吴维芳等对Tripadvisor.com酒店评论提取的特征词进行情感分数计算,并进一步构建计量经济模型,分析了酒店特征的情感倾向与消费者满意度的关系[11]。尹丽春和王悦则在研究图书消费者满意度时,指出当读者评论对图书内容表达出不同情感时,其他影响因素对满意度的影响模式和程度有所不同[12]。

综上所述,在线评论作为消费者体验后所给出的信息反馈,包含数值属性和文本属性多方面的信息,能够在一定程度上反映消费者对产品和服务的满意程度,有利于营造公平、诚信、放心的消费环境。但是目前还没有文献利用在线评论研究餐饮业消费者满意度,并且结合在线评论的数值属性和文本属性来研究消费者满意的研究文献也相对较少。因此,本文运用情感分析方法,以在线评论的评论星级为基础,结合配图数量、被浏览量和情绪词频进行修正,构建餐饮企业的消费者满意度模型。

二、研究设计

本文包括文本语料预处理、词频统计、SKEP情感强化预训练训练、层次分析法。首先通过文本语料预处理,得到评论中评论星级、被浏览量、配图数量,并进一步采用SKEP情感训练对每条评论进行情感分类,得到情绪词频。然后以评论星级为基础,初步计算消费者满意度。接着根据被浏览量、配图数量和情绪词频分别构造偏离度,采用AHP层次分析法计算三个偏离度的权重。采用被浏览量、配图数量和情绪词频偏离度校正基于评论星级计算的消费者满意度之后,得到最终消费者满意度模型,并将校正前后消费者满意度之差称为消费者满意度偏差。具体研究框架如图1所示。

(一)以评论星级为基础的消费者满意度测算

由于每条评论星级是消费者满意程度的直观表达,本研究采用每条评论星级(Si)作为每位消费者满意度的直接体现,初步定义消费者满意度(CS)为N条评论的平均星级与未校正前的星级上限(Smax)之比,即:

(二)构建三种偏离度及权重计算

1.引入偏离度

2.偏离度权重计算

由于上述三种偏离度的要素特征不尽相同,其对消费者满意度的校正能力也存在差异,因此,需要对其赋权,设α为配图数量偏离度权重,β为被浏览量偏离度权重,γ为情绪词频偏离度权重。由于三种偏离度的校正原理为:当一条评论为积极评论时,该评论配图数量大于平均配图数量,则将加强该评论的积极情绪,表现为满意度的增加,反之则减少;当评论为消极评论时,该评论配图数量大于平均配图数量,则也会加强该评论的消极情绪,表现为满意度的减少,反之则增加。被浏览量的作用原理相同。当一条评论为积极评论时,该评论积极词频大于平均积极词频,则将加强该评论积极情绪,表现为满意度的增加,反之则减少,而该评论消极词频大于平均消极词频,则会减弱该评论积极情绪,表现为满意度的减少,反之则增加。因此,当评论为积极评论时,有α,β,γ>0;当评论为消极评论时,有α,β<0,γ>0。三者绝对值之和为1。

参考已有文献,采用层次分析法计算偏离度权重。根据实际情况,考虑各种因素关联度和重要性,确定三种偏离度影响因素评价指标体系,构建递阶层次结构模型,如图2所示。其中,数量性定义为判断该项偏离度中影响因素数量变化对评论质量的影响是否显著,生动性定义为判断该项偏离度的量化方式对影响因素作用于评论质量的刻画是否直观,功能性定义为判断该项偏离度对评论质量产生影响的作用机理是否正确有效。

通过查阅资料,结合餐饮行业专家打分,得到递阶层次结构模型中准则层各指标之间的重要程度、准则层与方案层各项因素重要程度,基于九标度法,得到判断矩阵,然后对所给出重要性得分结果进行一致性检验。通过一致性检验后,运用SPSS计算三种偏离度权重。

(三)基于不同情绪的消费者评论分类

如前文所述,本文在构建情绪词频偏离度时,分别构建了积极词频偏离度和消极词频偏离度,并且偏离度权重系数的正负性也取决于评论的情绪。因此,需要将消费者评论根据积极情绪和消极情绪进行分类。

定义传达正面情感的词语为积极词语,在消费者评论中所出现的次数称为积极词频,用Wpi来表示;传达负面情感的词语为消极词语,其在消费者评论中所出现的次数称为消极词频,用Wni来表示。首先去除评论中无实际意义的停用词,再进行分词处理,参照python3.9.1中的SnowNLP词典,统计出每条评论的积极词频与消极词频。在不考虑词语以外因素的情况下,简单地,当积极词频大于消极词频时,可认为该评论为积极评论(positive);当积极词频等于消极词频时,可认为该评论为中性评论(neutral);当积极词频小于消极词频时,可认为该评论为消极评论(negative),即:

但是,上述模型无法正确反映全部评论情绪,误差较大。第一,本文所获取的样本中超过半数为空白评论,即只有星级评价而不具有文本的评论,简单依靠情绪词频的比较无法判断该评论情绪。第二,由于语义表达的丰富性,词典匹配法存在无法判断一些中性词或正词反用的情况。因此,本文在此基础上运用Tian等[14]提出的SKEP模型(Sentiment Knowledge Enhanced Pre-training for Sentiment Analysis),即情感强化预训练法,对评论情绪的分类进行优化改进。相较于词典匹配法,该方法不但能够区分文本的情感程度,如“非常好吃”与“好吃”的情感判别概率分数是不同的,而且精准度更高。例如,“花销减少了”,在词典匹配法下,“减少”即是消极词语,但该评论所传达的是积极情绪,SKEP能够减少此类错误。

(四)构建消费者满意度模型

配图数量、被浏览量均与评论质量正相关,即该评论配图数量越多,被浏览量越高,该评论质量越高,进而评论所传达的该种情绪越可信。因此,本文引入配图数量偏离度、被浏览量偏离度与情绪词频偏离度作为影响因素對(1)式进行校正,得到消费者满意度模型:

(五)构建消费者满意度偏差

三、实证结果和分析

(一)数据采集

美团团购与大众点评APP作为美团旗下发展较早的线上餐饮平台,线上餐饮企业与消费者用户体量庞大,遥遥领先于其他。同时,二者为消费者创造了更为详细的信息反馈机制,除星级评价与文本评论外,还设有配图与被浏览记录等不同维度的评论信息。因此,本文选取美团团购与大众点评APP作为消费者在线评论的信息来源。北京呷哺呷哺连锁快餐管理有限公司(以下简称“呷哺呷哺”)是一家源自台湾的连锁餐饮企业,目前线上餐饮店铺数量超过1 000家,遍布国内30多个城市,年累计接待总人次超过1个亿,消费者在线评论规模庞大。本研究选取的评论数据样本来自美团团购与大众点评共1 071家呷哺呷哺510 000多条在线评论,包括评论星级、评论文本、评论配图数量及评论被浏览量。样本区间为2017年1月1日至2020年12月31日。

(二)测算结果及分析

1.基于AHP层次分析法偏离度权重计算结果

使用餐饮行业专家打分整理后得到的判断矩阵,运用SPSS软件计算出餐饮业在线评论三种偏离度的总排序权值,详见表2:

CR值小于0.1,表明通过一致性检验。可以看出,配图数量偏离度权重数值最高,被浏览量偏离度权重数值最低,这与实际情况相符。质量较高的评论往往配有一定数量的、能够直观表达消费者情感的图片。而刷单、控评行为更容易通过简单的文本评价和增加浏览量实现,所以配图数量对评论质量的影响力度最大,情绪词频对评论质量的影响次之,被浏览量的影响最弱。判断矩阵及具体计算过程备索。

2.消费者满意度测算结果及分析

在对2017—2020年1 071家呷哺呷哺在美团团购与大众点评APP上的消费者评论进行处理后,将情绪分类前的评论数据带入(1)式,并将情绪分类后的评论数据及各偏离度权重代入(2)式后得到呷哺呷哺消费者满意度,所得结果见表3。

由表3可以看出,校正前后的消费者满意度都呈现出先降后升的趋势,2020年的消费者满意度最高。而2018年的消费者满意度最低,这可能与呷哺呷哺在2018年出现食品安全问题有关,随后按照监管部门要求进行整改,服务质量与食品质量的提高使消费者满意度有所回升。比较校正前后的消费者满意度可知,校正前的满意度普遍较高,而在结合配图数量、被浏览量、情绪词频进行校正后,消费者满意度有所降低。校正后的消费者满意度更符合实际情况,呷哺呷哺自2017年宣布效仿海底捞进行高端化战略转型开始,客单价从2017年的48.4元上升到2020年的62.3元,而翻台率则从3.3降低到2.3。由于服务和菜品质量并没有随着客单价的增加而提高,因此消费者满意度始终不高。进一步对比2017年与2019年的消费者满意度,可以发现,2017年呷哺呷哺校正前的消费者满意度高于2019年,而校正后的满意度情况则恰恰相反。这是由于呷哺呷哺2017年在线评论质量低于2019年导致的,2017年呷哺呷哺在线评论的配图数量平均值为0.136,配图评论占比仅为4.55%,而2019年配图数量平均值为0.4378,配图评论占比高达17.62%。这说明在线评论星级不能准确地反映消费者的观感,而配图数量、被浏览量、情绪词频能够体现评论质量,通过这三个维度的校正有助于提高消费者满意度的测量精确度,测算出更符合实际情况的消费者满意度。另外,2017—2020年间呷哺呷哺的消费者满意度偏差均位于负25%左右的较稳定区间,表明该时段内消费者评论特征无明显变化,呷哺呷哺在样本期间存在刷单、控评等欺诈行为的可能性较低。

结语

本文以呷哺呷哺的在线评论为样本,使用词频统计、SKEP情感加强预训练与层次分析法,在评论星级的基础上引入配图数量、被浏览量和情绪词频三种偏离度构建餐饮业消费者满意度模型,能够更准确地反映消费者偏好和观感。而消费者满意度偏差有助于刷单、控评等欺诈行为的识别。呷哺呷哺在线评论的测算结果表明,2017—2020年间消费者满意度持续偏低,呷哺呷哺需要考虑调整企业战略,提高服务质量,以提高消费者满意度。本文从在线评论入手测算消费者满意度,有助于餐饮企业更为便捷、准确地掌握消费者的总体评价,并提出消费者满意度偏差,为监管部门对刷单、控评等欺诈行为提供了一个新的参考指标。

根据上述分析结果,对餐饮企业提出如下建议:一是实时关注消费者满意度情况。餐饮企业应对消费者满意度进行持续的动态测评,参考消费者满意度,督促自己积极审查自身存在的问题,并对应进行菜品、服务或者企业战略的调整,在提高消费者满意度的同时,实现企业的可持续发展。二是杜绝刷单等欺诈行为的发生。借助消费者满意度偏差的测算,监管部门可以对餐饮企业的刷单、控评等欺诈、非正当竞争行为进行监管,有助于维护良好健康的餐饮市场秩序。

本研究的不足在于样本的选择不够全面,数据采集时只选取了2017—2020年的消费者评论,而美团团购和大众点评作为评论的数据来源,其在2020年后推出了新的消费者评论维度,比如点赞数等,这些因素也会对评论质量造成影响,但本文的消费者满意度模型并未涉及。未来研究可将新出现的评论质量影响维度加入模型中以进行更加全面的分析。

参考文献:

[1]   林峰.基于因子分析的老字号餐饮企业顾客满意度实证研究——一个个案研究的启示[J].旅游学刊,2009,24(7):53-58.

[2]   黄生权,文雅.基于ECSI的餐饮类团购顾客满意度测评模型研究[J].企业经济,2016,(5):157-162.

[3]   牛兰兰,张伟.基于IPA分析法的美食街游客餐饮满意度研究——以济南芙蓉街为例[J].美食研究,2016,(3):53-58.

[4]   杨延风.基于IPA分析的乡村旅游餐饮服务满意度评价实证研究——以陕西袁家村为例[J].旅游资源,2018,34(3):408-412,366.

[5]   张艳,王喜庆.基于模糊层次分析法的餐饮街区顾客满意度评价研究[J].美食研究,2018,(1):57-59.

[6]   高宝俊,孙含琳,王寒凝.在线评论对酒店订满率的影响研究[J].旅游学刊,2016,31(4):109-117.

[7]   李红柳,王兴元.在线用户评论对顾客价值创造的影响研究——基于对消费者价格决策的考量[J].价格理论与实践,2018,(1):150-153.

[8]   Hunt H. K.Consumer satisfaction:discussant comments[J].Advances in consumer research,1983,10(4):262.

[9]   張圣亮,李小东.网上购物顾客满意度影响因素研究[J].天津大学学报:社会科学版,2013,15(2):109-115.

[10]   马凤才,李春月.消费者对电子商务平台销售生鲜产品满意度测算研究——基于京东生鲜在线评论的分析[J].价格理论与实践, 2020,(5):117-120.

[11]   吴维芳,高宝俊,杨海霞,孙含琳.评论文本对酒店满意度的影响:基于情感分析的方法[J].数据分析与知识发现,2017,1(3):62-71.

[12]   尹春丽,王悦.基于在线评论的图书消费者满意度影响因素与作用机理[J].图书情报工作,2019,63(22):106-117.

[13]   黄恒君,庞智强.极端值影响下总体均值估计量的调整[J].统计与信息论坛,2007,(6):16-18,48.

[14]   Tian H.,Gao C.,Xiao X.,Liu H.,He B.,Wu H.,Wang H.,Wu F.SKEP:Sentiment Knowledge Enhanced Pre-training for Sentiment Analysis[J].Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics,2020.

[责任编辑   白   雪]

猜你喜欢

在线评论文本挖掘餐饮企业
成本会计在餐饮企业财务管理中的应用
成本会计在餐饮企业财务管理中的应用
连锁餐饮企业区位选择
连锁餐饮企业区位选择
高档餐饮企业成本控制的探索与思考
数据挖掘技术在电站设备故障分析中的应用
基于LDA模型的95598热点业务工单挖掘分析
在线评论情感属性的动态变化
从《远程教育》35年载文看远程教育研究趋势
慧眼识璞玉,妙手炼浑金