生鲜电商平台消费者购物满意度影响因素研究
——基于在线评论的文本分析
2023-11-03殷静蔚
房 琳,殷静蔚
(1.商洛学院经济管理学院,陕西商洛 726000;2.陕西高校新型智库商洛发展研究院,陕西商洛 726000;3.陕西高校青年创新团队,陕西商洛 726000)
随着“互联网+”农产品上行和“数商兴农”工程的持续实施,农产品线上交易市场蓬勃发展。据农业农村部发布的数据,2022 年上半年农产品网络零售额2 900 亿元,同比增长12.4%[1]。生鲜电商成为消费者购买生鲜产品的重要渠道,而消费者满意度是购买决策行为的重要前置变量,会驱动顾客在电商平台的重复购买意愿[2],生鲜农产品消费者的网购满意度对网购忠诚具有显著的正向影响[3],因此提高消费者满意度以提升生鲜电商交易依赖,提高平台黏性,是值得研究的问题。有关生鲜电商平台消费者满意度影响因素的研究表明,物流服务体系如冷链、“最后一公里”配送是生鲜电商发展、决定消费者满意度的主要因素;其他如生鲜电商平台产品的质量、种类、定价、展示宣传、售后服务等是影响消费者满意度的关键因素[4];网商声誉、感知价值和质量,质量追溯、网购操作[5]等因素也会显著影响消费体验。
已有研究通常基于某种理论如期望-实绩理论模型[6]、中国消费者满意度指数模型(CCSI)[7]等,设计调查问卷对生鲜产品网络消费者进行调研;基于调研数据运用如主成分分析、回归分析等方法讨论消费者满意度的影响因素。而事实上,由于调查问卷需要预设问题,容易受到所使用模型和研究者自身知识的影响,数据可靠性也会受到调研设计的影响,其研究结论具有一定的主观性。随着在线评论习惯的养成,消费者更加乐于通过在线评论分享真实的购物体验[8],生鲜农产品在线评论质量[9]、数量及可视化评论[10]显著影响消费者购买决策;负面评论质量对消费者对产品的满意度以及购买选择具有显著影响[11]。
随着文本挖掘技术的发展,在线评论的文本分析被广泛应用于电商平台的消费者购物体验、满意度分析等问题。常用的方法有主题分析、情感分析等。张红霞[12]基于在线评论进行文本挖掘,提炼出生鲜农产品电商消费者关注的主要因素包括产品质量、价格价值、包装物流、客户服务四大类。马凤才等[13]通过词频统计京东生鲜在线评论得到影响消费者满意度的关键因素,构建特征词表,结合TFIDF 方法计算特征权重,分析消费者总体满意度情况;冯坤等[14]基于LDA 模型提取生鲜电商平台在线评论的主题,构建情感词典计算顾客情感倾向得分判断顾客满意度。本研究基于生鲜平台顾客评论文本,通过主题分析方法提取影响消费者满意度的关键因素,并进行在线评论文本的情感分析,在已有研究基础上,进一步对消费者情感倾向得分进行回归分析,对所提取的消费者满意度影响因素进行验证并排序,继而为生鲜电商平台提供有针对性的提升消费者满意度的建议,以助力“数商兴农”工程更好的实施。
1 研究设计
1.1 数据获取
选择京东商城生鲜频道的产品评论为数据来源。考虑生鲜农产品的种类丰富繁杂,选取蔬菜、水果、肉类、海鲜四大品类比较有代表性的生鲜产品,分别以这4 个品类为关键词搜索顾客评论,使用八爪鱼网页数据采集器,收集各种产品2022 年4—5月的文本评论19 472 条,以此为基础进行在线评论的文本分析。
将采集到的评论数据导出为excel 格式,代表性评论数据如表1 所示。四大类别产品汇总的评论数量如表2 所示。
表1 京东商城评论数据部分示例
表2 四大类别产品汇总评论数量
1.2 数据清洗
由于可能存在重复值、无效值等错误,影响后续分析结果,所以首先进行数据清洗。数据清洗是对数据进行检查和校验,消除重复、无效和异常信息,确保数据的一致性。主要是通过Excel 软件的分类和筛选机制删除诸如“用户未填写评价”“默认好评”“+vx 领取优惠券”等评论。删除的4 类无效评论如表3 所示。数据进行初步清理后,得到16 835条有效评论。
表3 无效评论示例
1.3 数据分词
ROST ContentMining 软件是由武汉大学ROST虚拟学习团队开发的用于辅助人文社会科学研究的免费内容挖掘系统,具有强大的分词和分析功能,可以实现网站分析、微博分析、期刊分析等一系列文本的功能性分析及可视化分析。
1.3.1 更新分词自定义词表 分词是将整句划分为词,以便进行下一步的词频统计。由于消费者的在线评论偏口语化,使用ROST 软件自带的分词系统可能存在分词不够精确的问题,可以通过加入自定义词来提高分词的准确性。在ROST 软件中,将自定义词加入分词自定义词表。自定义词表更新内容示例如表4 所示。
表4 自定义词表更新内容示例
1.3.2 更新停用词表 对已经完成分词的文本进行词频统计,由于初步的词频统计结果中存在无效高频词,会影响分析结果,因而使用停用词表再次清洗。在ROST 软件中,将停用词加入词频统计过滤词表,如“的”“啊”“了”等无实际意义的语气词和“非常”“还”等高频率出现的程度词;由于本文研究对象为生鲜农产品的在线评论,将生鲜农产品的品名也加入停用词表,如“苹果”“橘子”“土豆”“猪肉”等。
1.3.3 更新归并词表 在词频统计结果中存在一些同义词或近义词,需要将这些词与出现频率更高、概括性更强的同义词或近义词合并起来,使词频统计结果更加准确。在ROST 软件中,将归并词加入分词自定义词表。归并词内容如表5 所示。
表5 归并词表更新内容示例
2 在线评论文本内容分析
2.1 语义网络分析
语义网络图通过可视化技术反映评价对象与评论观点之间的联系。充分挖掘评价对象与评价观点之间的联系,可以挖掘出评论主体背后潜在、隐藏的信息。通过语义网络分析,将生鲜农产品的评论数据以网络的形式连接为一个整体,从而直观地反映出评论关键词之间的联系,如图1 所示。
图1 评论数据语义网络分析
从图1 可以直观地看到,评论文本内容围绕关键词“很好”和“新鲜”展开,而根据全文数据清洗定义,“很好”一词在消费者满意度影响因素提取中属于无效词。因此文本内容以“新鲜”为中心展开,说明产品的新鲜度是消费者的首要关注点,而“物流”“很快”处于副中心节点,说明除了新鲜度以外,产品的物流配送也是消费者比较关注的;除此之外,“包装”“味道”“质量”都属于文本内容中关联度较高的关键词。
2.2 高频词分析
在词云中,词汇的大小代表关键词出现的频率,越大说明关键词出现的频率越高,越能体现消费者的关注点。图2 和图3 分别是数据清洗前后的评论文本数据词云图,可以看到数据清洗后词云中的关键词更能够代表生鲜产品的评价,数据清洗效果较好。
图2 数据清洗前词云图
图3 数据清洗后词云图
对数据预处理完成后得到的词频统计结果进行降序排列后,选取前14 位高频词,如表6 所示。
表6 排名前14 位高频词
2.3 特征词选取
结合语义网络分析、词云、高频词统计,能够直观地为消费者满意度影响因素的研究提供整体思路。由图3 可以看出,生鲜农产品消费者评论关注的重点主要在口感、物流、外观、包装、新鲜、质量、服务7 个方面。
对消费者评论的关注点进行整合,将表示相似属性的特征词归为一类,将“外观”“新鲜”“重量”归入质量因素,将“速度”归入物流因素,将“性价比”归入价格因素。合并后确定口感、物流、质量、包装、服务、价格6 个方面是影响生鲜电商消费者购物满意度的主要因素。合并后特征词情况如表7所示。
表7 合并后特征词情况
3 消费者满意度影响因素分析
3.1 研究假设
基于以上对在线评论文本的语义分析,结合所提取的生鲜电商消费者满意度的特征词,提出研究假设。
生鲜农产品的口感是其品质的重要外在表现,会受到生产过程、地域环境的多重影响。随着消费水平的提高,消费者对生鲜产品的口感要求也越来越高。研究表明,口感是影响消费者购买桃子等水果的首要因素,其次才是价格和健康属性[15];消费者对生鲜农产品口感的重视程度接近于其对与营养健康相关的属性的关注[16]。因此提出假设1:口感对生鲜电商平台消费者满意度存在正向影响。
对于生鲜农产品而言,仓储、运输等物流保障设施和设备的完善尤为重要,物流服务质量正向影响消费者对生鲜农产品的购买意向[17]。生鲜产品会因为缺少冷链等储存设备和运输环境损失新鲜度;高效率的物流配送及优质的服务可以极大地改善消费者的购物体验,缩短等候时间也能提升消费者的满意度。因此提出假设2:物流对生鲜电商平台消费者满意度存在正向影响。
消费者对网购农产品的产品品质满意度和关注度相对较高[18]。生鲜商品具有易腐性,基于对食品安全的考虑,消费者对生鲜农产品的新鲜度、绿色度等质量要求更高,生鲜平台产品的顾客感知质量对其重购意愿有正向影响[19]。严把生鲜商品质量,保证生鲜农产品的新鲜度,将确保网购消费者满意度,也是商家区别于其他竞争者的重要因素。因此提出假设3:质量对生鲜电商平台消费者满意度存在正向影响。
对新鲜果蔬类产品进行包装预处理可以提高商品附加值[20],有效解决生鲜农产品流通中的损耗问题[21]。有研究认为,包装、新鲜度是影响顾客满意度的关键因素[14],且包装给予消费者收到网购产品的第一印象,包装上的不足更容易使顾客感觉购买到的商品与其预期不符。因此提出假设4:生鲜农产品的包装对消费者满意度存在正向影响。
天猫生鲜、盒马鲜生等电商平台为消费者提供短期配送、货损赔付等多样化和个性化的服务,极大增强了消费者的体验感[22];随着服务需求弹性的增大,增值服务对消费者需求带来的正向影响也越大[23];商家与消费者的良好交流、稳定的售后保障等售中售后服务在提升顾客满意度中也扮演着重要角色。因此提出假设5:服务对生鲜电商平台消费者满意度存在正向影响。
由于生鲜产品的易腐性和时效性,且电商平台突破时空限制,汇聚各地生鲜产品,扩大了销售受众,带来了与线下市场一定的价格差异;相比于线下市场,消费者对线上渠道的生鲜产品价格感知、财务风险感知更加突出[24],生鲜店铺的价格形象有利于提升消费者满意度[25]。因此提出假设6:价格对生鲜电商平台消费者满意度存在正向影响。
3.2 情感分析
中文文本情感分析主要分为3 个类型,分别为根据情感词典进行分析;根据机器学习进行分析,如SVM;根据深度学习的方法进行分析,如LSTM、CNN。选取基于情感词典对文本进行情感分析。
3.2.1 构建情感词典 文中情感词典由正负面情感词典、否定词词典和程度词词典组成,是将中国知网情感词典与网络常见的情感词典进行整合处理并加入一些自定义情感词而形成。将正面评价词和正面情感词合并为正面情感词典,设分值为1;将负面评价词和负面情感词合并为负面情感词,设分值为-1。否定词可以使文本和特征词的情感倾向发生转变,整理的部分否定词包括不是、不能、不好、几乎不、不要、禁止、没有、很少、绝不、木有、永不、从不、不可能等,设分值为-1。程度副词会使情感倾向增强或减弱,而不同程度词如“比较”和“非常”表达的情感强度也不同,按照所表达的情感强度将程度词分为5 类,并分别赋值,如表8 所示。
表8 程度词及其强度赋值
3.2.2 计算情感得分 首先计算评论的整体满意度情感值得分。情感得分是基于标注好分值的情感词典来计算的。根据前文设定,定义正负面情感得分SE、否定词分值SN、程度词分值SD的算式如下。
某条评论的情感得分S的计算式如下。
若评论的总得分S为正值,则该条评论为正面评论;若评论的总得分为负值,则该条评论为负面评论;若评论的总得分为0,则该条评论为中性评论。
其次计算各影响因素的情感值得分。每条评论按逗号分句,判断分句涉及的影响因素,根据式(2)计算其情感得分,评论中没有出现的影响因素,使其情感得分为0。
根据情感词典和情感值算式,计算出每条评论i(i=1,2,3…)的整体情感得分和每个影响因素的情感得分,任选5 条评论的情感得分结果如表9 所示。
表9 评论情感得分
3.2.3 数据标准化 进行数据分析时,首先要对数据进行标准化,使用Min-max 标准化法(极差标准化法),将所有的原始数据转化成无量纲化指数评估值。数据处理后,原始数据无论正负,该指标各观测值的数值变化范围均为0≤X′≤1。具体转换算式如下。
其中X′为标准化后的值,X表示观察值,Xmax是该指标中的最大值,Xmin是该指标中的最小值。标准化后的数据如表10 所示。
表10 标准化后数据
3.2.4 情感倾向得分描述性分析 利用SPSS 26.0软件对数据进行描述性统计,了解数据特征和数据之间的基本关系,描述性统计结果如表11 所示。由表11结果可知,消费者满意度总得分均值为0.629 5,说明整体评论偏积极,评论中好评数量较多;各变量标准差值较小,说明数据分布比较集中,离散程度小。
表11 描述性统计结果
3.3 回归分析
建立多元回归方程。
描述消费者满意度y与自变量口感x1、物流x2、质量x3、包装x4、服务x5、价格x6之间的关系。回归分析结果如表12 所示。
表12 回归分析结果
由表12 分析结果可知,F为2 542.066,显著性均小于0.001,即生鲜农产品消费者满意度回归模型整体比较显著,且VIF均小于5,说明各变量之间无多重共线性关系。假设1 至假设6 均得到验证。生鲜农产品的口感、物流、质量、包装、服务、价格均对生鲜电商平台消费者满意度的正向影响显著。根据系数综合来看,影响程度由大到小分别为质量、口感、物流、价格、包装、服务。
生鲜农产品的质量(β=0.439,P<0.001)、口感(β=0.343,P<0.001)对电商平台消费者满意度影响较大。出于安全和品质的追求,消费者在食物原材料上追求更新鲜、更天然、更营养。口感是食用过程中产生的直观感受,也是产品质量的重要体现。基于中国农业生产现状,生鲜产品品类丰富,产地多样化,标准化水平低,无论是产品外观还是口感上都没有形成统一标准,影响消费体验。
此外,生鲜农产品的物流(β=0.324,P<0.001)、包装(β=0.229,P<0.001)也影响消费者满意度。严格意义上说,商品发货速度、运输方式、包装完好性、配送服务等环节都属于物流的范畴,其直接决定消费者收到的商品质量和感受到的服务质量,影响购物体验和满意度。将包装单独提取,是考虑到生鲜产品的特殊性,对密封、真空、保鲜等包装环境的要求更高,对消费者满意度的影响也更大。其他如配送、发货时间等归类到物流范畴,特别是配送业务,在物流配送时间与服务态度上同样重要。
生鲜农产品的价格(β=0.276,P<0.001)、电商平台提供的商家服务(β=0.181,P<0.001)对消费者满意度影响显著,但相较于其他因素影响较小,与已有研究结论一致。这也印证了消费者对高品质生鲜产品的价格弹性较小,愿意高质高价在电商平台购买生鲜产品。
4 结论与启示
通过文本挖掘方法,利用情感分析和多元回归分析对生鲜电商平台的在线评论进行分析,认为影响生鲜电商平台消费者满意度的主要因素依次为质量、口感、物流、价格、包装和服务。生鲜农产品电商平台可有针对性地采取对策以提高消费者满意度。
4.1 把控生鲜农产品质量
电商平台可以通过产品基地建设,或与产品生产商合作形成供应链,促进生鲜农产品追溯系统的使用,从源头上为消费者提供质量把控和保障服务。同时,平台可以适当提高生鲜产品的上架标准,为生鲜产品的产地、规格等具体参数制订上架描述规范,并对消费者实际所购商品与描述不符的商家予以惩罚。约束平台生鲜产品供应商,确保产品质量。
4.2 完善生鲜冷链物流服务体系
电商平台可充分利用自建物流优势,完善冷库仓储、冷链运输各环节的配合协调;在优质生鲜产品产地建设有温控系统的仓储设施,或选择租用高标准的冷库存储。针对不同种类、不同运输距离的生鲜产品制定较为详细明确的包装细则,以降低预处理和运输过程的损耗。从产地直接发货的生鲜产品,加强对其仓储、物流各环节标准要求的监督管控。与第三方物流合作中也需要明确生鲜产品的运输和配送要求,建立物流追溯服务机制。
4.3 提高服务水平,保障消费者权益
平台服务的提升可以从售前、售中、售后三方面展开。对生鲜电商平台而言,对商品的质量、上架描述、物流等环节的把控,都属于售前服务;通过制定产品品质分类标准,制定差异化价格策略,以满足不同消费者的需求。更重要的是建立完备的售后服务体系,加强售后管理,通过售后服务热线、平台客服、消费者与上架商家的沟通协调,高效解决消费者遇到的问题;也应明确赔付标准,在商家与顾客发生赔付纠纷时有据可循,保障消费者权益。
将在线评论与农产品电商结合起来对消费者满意度进行研究,利用文本挖掘方法和回归分析方法探究了影响生鲜农产品消费者满意度的因素,提出了提升消费者满意度的启示,但仍有一些不足之处,后续研究可扩大数据采集范围,使评论覆盖更多的平台和产品种类,细化不同品类、不同网络销售方式(平台电商、社区团购、社交电商等)下生鲜产品的消费者满意度分析,不断完善研究成果。