在线评论视角下生鲜水果消费者满意度研究
2020-11-06李春月
李春月
(黑龙江八一农垦大学,大庆 163319)
随着我国互联网技术的不断进步,电子商务也在快速的发展。且相比于线下的实体店而言,电商平台的产品种类更为丰富,产品价格也相对较低,这些优势也就吸引着越来越多的消费者尝试在线上进行购物。根据中国互联网络信息中心(CNNIC)所发布的互联网络发展报告显示,截至2019年6月,我国网络购物的用户规模已达到6.39亿,占网民总数的74.8%。由此可知,线上的电商平台已经成为了消费者购物的主要渠道。而在线评论作为消费者在制定购买决策时所要参考的内容,其中包含着大量的信息。这些信息也能够帮助电商企业了解消费者对产品及服务的关注情况以及满意度的情况,从而能够及时优化自身服务进而提高消费者对商家的整体满意度,提高消费者的购买率,促进企业更好更快的发展。
1 文献综述
1.1 在线评论相关研究
评论信息已然成为了口碑传播的重要方式,通过在线评论,消费者能够对生鲜电商提供的各项服务情况有着更为准确的了解,同时,电商企业也能够通过消费者的在线评论了解消费者的需求,以优化自身的服务。近年来学者对在线评论的相关研究在不断地增多。通过整理发现,现有对在线评论的研究主要集中在两个方面。
一为从评论区中所获取的数值型信息,如Dellarocas[1]对评论数量进行研究,结果表明,产品评论的总体数量会对产品的销量产生显著的影响;Liu[2]对Yahoo网站上的电影评论进行分析,研究的结果证明了在电影行业中评论的数量会对电影票房产生显著的正向的影响作用;Susan M.Mudambi[3]对亚马逊网站产品评论的研究,证明评论深度、产品类型会对消费者的购买行为产生相应的影响;廖俊云[4]从产品质量的视角出发,以团购网站的酒店销售为研究对象,通过研究表明评分的偏差会对酒店销量产生负向影响;陈少龙[5]通过对产品的在线评论进行研究,表明在线评论及卖家回复皆会对产品的显著影响。另一种为对评论内容的分析,如刘灵芝[6]以水禽熟食为调查对象,通过分析的方法表明消费者在熟食购买过程中最为注重的为产品的质量属性和安全属性;吴维芳等[7]运用情感分析的方法,对消费者对酒店的满意度进行研究,研究结果表明消费者对不同类型的酒店间的特征关注情况有着显著的差异;Wenjing Duan[8]通过对电影行业的研究,证明电影评价能够对电影起到宣传的效果进而影响电影的票房;刘逸等[9]通过对中国游客评论数据的分析得出中国与国际游客之间关注特征的差异;赵杨等[10]通过对海淘APP评论数据的研究得出消费者最为关注的特征及对各特征的满意度情况。
1.2 消费者满意度研究
营销大师Kotler[11]将消费者满意度定义为:消费者对购买产品的实际感知与其期望值相比较后形成的一种感知态度。现对消费者满意度的研究较为丰富,Celik等[12]将满意度理论与交通情况相结合,并提出一种新的方法以提高客户对伊斯坦布尔交通情况的满意度;王蓉[13]建立了三方物流企业的顾客满意度模型,并将客户的满意度作为衡量物流服务质量的重要指标;黄生权和文雅[14]则是以欧洲消费者满意度指数模型为理论基础,建立了适用于餐饮行业特征的消费者满意度模型,并将其进行实际应用。
随着网络交易的兴起,网络购物消费者满意度也得到了重视。Tandon等[15]用北印度各州的410名在网络购物的消费者的数据分析了网购环境中的消费者满意度的影响因素,揭示了网站功能、网站设计以及交易安全性等都对网络购物消费者满意度有一定程度的作用;Alam[16]认为网站设计、可靠性、产品种类和交付性能皆会对消费者网络购物的满意度产生影响;查金祥等[17]通过建模的方法验证了产品的价格及质量对网购消费者的满意度影响最为显著;李玉萍等[18]证明了产品品质、服务态度及物流等因素会对网购消费者的满意度产生影响;陈梅梅等[19]运用多重对应分析方法证明了在情绪效应下,商品描述的详细程度会影响消费者对产品的满意程度;孙长伟[20]证明了酒店设施及前台服务会对消费者对酒店的满意度产生影响。
1.3 研究综述
通过对文献的梳理可以看出,学者对消费者满意度的研究较为丰富,且涉及的领域众多。但以往对消费者满意度的研究多集中在旅游、企业发展、服装等方面,对生鲜产品的网络评论的研究相对较少。因此,运用python编程获取网购消费者对四种不同类型生鲜水果的评论信息,运用情感分析等方法,探究消费者对不同类型的生鲜产品的满意度情况。
2 研究方法
2.1 特征词权重计算
权重能够反映消费者对某一特征的关注程度,TF-IDF作为一种加权技术已被广泛的运用到数据挖掘领域。因此,采用TF-IDF方法计算各特征的权重,其计算方式是将文本中的词转换为向量,再计算向量的权重,这一方法保证计算结果的准确性。
TF-IDF是由词频及逆文档频率两个部分结合起来对权重进行计算。其中词频表示某个词语或者某个短语在文本中出现的频率。某个词语出现的次数多,也就说明这个词语能够描述文本内容的可能性越高,词语也可能会更为重要。计算公式为:
其中ni,j是词语ti在文档dj中的出现次数,分母则是在文件dj中所有词语的出现次数之和。但在文档中某些词如语气助词等无用词的出现次数也较多,因此词频计算并不是绝对的,因此需要逆文档频率的配合,逆文档频率是指:一个词若只在少量文本中出现会比一个词大量出现在大量文本中更具有代表性,若包含词语t的文档越少,也就表示词语t的文本区分程度更高,IDF值越高。由此可以看出,IDF能够减少文本中无效词对权重程度的影响,加强特征词的重要程度,其计算公式如下:
其中|D|表示语料库中的文件总数,{j∶ti∈dj}表示包含词条t的文件数,为避免词语不在语料库中使得分母为0的情况出现,因此一般使用 {j∶ti∈dj}+1。然后再计算TF与IDF的乘积,TF-IDF的值越大,则词语的权重越高。
TF-IDFi,l=TFi,j*IDFi
2.2 情感分析
选用Python程序的SnowNLP模块进行情感分析,SnowNLP模块的计算原理为朴素贝叶斯分类算法,计算方法为,首先选取部分评论内容进行标记作为训练集,对模型进行训练,将训练后的模型进行保存,对待处理的评论内容进行分析,计算并返回每一条评论的情感倾向分值用于后续的研究。对于类别C1的贝叶斯模型的基本运算过程如下:
SnowNLP模块的情感倾向计算方法为当返回的评论计算分值大于0.5时,意味着这条评论为正向评论,当返回的评论数值小于0.5时则以为这这条评论的总体情感倾向较低为负面评论。在研究过程中将特征评论内容进行提取并存入不同的文件中,随后通过SnowNLP模块对各特征的情感倾向进行计算,计算出各特征情感倾向的平均值。这数值意味着消费者对生鲜电商企业中某一项特征的满意情况。
3 研究过程
3.1 数据采集
信息来源于网站上消费者对生鲜水果的评论,京东平台作为我国三大电子商务平台之一,其销售的产品众多,有着较为完整的评价系统及消费群体,因此选取京东平台的生鲜水果的评论信息作为研究对象,通过python爬虫的方法对橙子、芒果、樱桃、香蕉四类水果的评论文本信息进行了爬取。
3.2 数据与处理
通过对所获取的评论内容的观察发现,评论中含有部分重复及消费者未进行评论的信息,这些内容可能会对后续数据分析的效率及分析结果产生影响。因此在对文本数据进行分析前,需先对其进行预处理工作。首先删除评论中的重复及消费者未评论的信息内容,得到有用的评论文本信息;运用jieba模块,对文本评论进行分词处理;创建停用词词表,将连词、标点符号及无用的低频词纳入其中,对分词后的评论进行遍历,去除评论中的停用词,最终获得有效的评论内容。
3.3 特征词选取
对消费者生鲜水果的满意度进行研究,为准确了解消费者的需求,了解消费者对各特征的满意度情况,因此对评论中的特征词进行提取。通过对分词后的评论进行词性标注可知,满意度的特征词是由名词及动词构成,因此对评论文本信息中出现的名次及动词进行提取,由于所提取到的特征词过多,因此仅选取各类产品评论中词频排名前20的词汇。提取结果如下图所示:
表1 生鲜水果特征词词频汇总Table 1 Frequency summary of characteristic words of fresh fruits
续表1 生鲜水果特征词词频汇总Continued table 1 Frequency summary of characteristic words of fresh fruits
3.4 特征权重计算
通过表1对高频词的提取选取消费者较为关注的几项特征,然而,由于词频并不能完全表明消费者对生鲜水果各项特征的关注度情况,因此,对评论进行了进一步的分析,运用上文所提到TF-IDF的方法计算所提取特征词的权重情况,各类产品特征词权重计算结果如下所示:
为更直观的观察消费者对各类产品特征的关注度情况,将上表所得结果绘制成雷达图,如图1所示:
表2 各类生鲜水果特征词权重情况汇总Table 2 Summary of the weights of characteristic words of various fresh fruits
图1 各特征权重雷达图Fig.1 Radar chart of each feature weight
从表2与图1可以看出,消费者对不同种类生鲜水果的特征的关注程度有所不同,消费者对芒果最为关注的5项特征分别为物流、包装、味道、客服及发货;对香蕉最为关注的5项特征分别为物流、味道、包装、发货及品质;对樱桃最为关注的5项特征分别为物流、味道、个头、包装及发货;对橙子最为关注的5项特征分别为物流、包装、味道、个头及发货。虽然消费者对这四项产品的各项特征关注度情况上有所差异,但从总体上看,生鲜水果消费者较为关注的产品特征为物流、包装、味道及发货上。
3.5 特征情感分析
为准确计算出消费者对各特征的满意度,在进行情感分析前依次遍历每一条评论中的每个词语,定位评论中的特征词,识别提取特征词前后[-u,u]区间的词语,将针对某一特定词所提取出的评论内容保存到新的文件中,运用上文所提到的snownlp算法计算各类产品各特征的情感得分,计算结果如下:
表3 各类生鲜水果特征情感分析Table 3 Emotional analysis of the characteristics of various fresh fruits
从上表可以看出,消费者对芒果的满意度最高的前三项分别为价格、味道及口感;对香蕉的满意度最高的前三项分别服务、物流及包装;对樱桃的满意度最高的前三项分别服务、物流及包装;对橙子的满意度最高的前三项分别服务、味道及物流;虽然消费者对各类水果的极限满意度间有所差异,但对客服及发货的满意度皆相对较低,造成这种结果的原因可能为由于为保证水果的新鲜程度,卖家会在消费者下单后的一段时间内统一进行采摘、发货,使得生鲜水果的发货时间要长于其他类型产品,因此消费者对生鲜水果发货的满意度整体相对较低。对于客服而言,可能是由于消费者来说,客服回复的及时性及产品的描述情况不足使得消费者对客服的整体满意度相对较低。
4 结论及建议
通过对这四类生鲜水果在线评论的分析可以看出,消费者对生鲜水果电商所提供的物流、包装、味道、品质、发货、个头、价格、服务、售后、口感情况较为关注,但不同类别的水果对各类特征的关注度及满意度均有所差别。但总体看来消费者最为关注的为物流、包装、味道及发货这四项特征。从满意度的计算结果看来,消费者对商家所提供的客服及发货情况较为不满,针对这一结果对生鲜水果电商提出了相应的意见及建议。
对于产品的发货情况,商家应每日进行库存清点,并根据以往的销售数据判断现有库存是否充足,发现库存不足的情况,及时对产品进行补充,以保证订单出现时,能够及时进行发货,减少消费者的等待时间,增加消费者对发货方面的满意度。
对于电商的客服情况,商家可对电商的客服进行培训使其了解电商企业对消费者所提供的各项服务情况。并做到针对消费者所提出的问题能够及时准确的进行解答,降低消费者的感知风险。沟通时注意服务态度,减少消费者的不适,增加消费者的购买意愿。
通过分析计算结果,消费者对不同种类生鲜水果各特征关注情况有所不同。电商企业可根据销售的产品对所提供的服务进行进一步的改进,以提高消费者对各项特征的满意程度,吸引消费者再次进行消费促进生鲜电商更好更快的发展。