基于电商平台网购评论的云南鲜花物流服务质量评价研究
2024-02-01周常春
杨 凡,周常春
(昆明理工大学管理与经济学院,云南 昆明 650093)
一、引言
中国传统鲜花贸易流通途径主要集中在线下。通常,鲜花采摘下来后要经过诸多环节才能远销至国内中小城市,最后再到消费者手里。 商品流通环节过多,交易时间过长,鲜花在此过程中受到的损耗很严重,因此中间各层的鲜花批发商至少会提价15%至20%。 而花店则会在零售环节保证商店业务盈亏均衡的情况下,将价格至少提高60%,这些过程产生的额外成本都由购买鲜花的消费者承担。 但是现在随着科技的发展以及电子商务平台的出现,花农、花店和消费者之间的关系由于中间交易环节的减少变得紧密起来,线上鲜花电商没有线下门店经营产生的成本压力,同时也降低了区域局限对业务开发带来的困难。
云南省作为中国最大的鲜切花生产基地,鲜花出口总量位居全国第一,市场涵盖世界各地。 即使近年来遭受疫情的严重影响也没有改变。 电子商务交易是其最主要的交易方式之一,昆明国际花卉拍卖交易中心拥有花加、花立购、鲜花严选等电商平台,与京东、淘宝、抖音、拼多多等电商平台有深度合作,这些电商的花源70%都在云南。 同时,也通过对接云南花卉与全国消费者,实现了融资水平的大幅提升。 因此,本文选择淘宝、京东平台的产地、发货地均为云南的鲜花网购见网评进行研究,以期产生指导效应。
二、研究现状
(一)物流
Mentzer 等在物流工作中结合SERVQUAL 模型,提出时间性、可得性、完好性为实体分销物流服务质量主要的三个维度(1)。Mentzer 等通过分析发现,订单流程、信息品质、人员沟通品质、货物完好度、错误处理、 货物准确率等都会对顾客的整体物流服务品质有积极或消极的影响, 因此将实体分销物流服务质量与直接影响服务质量的各因素结合, 创建新的LSQ 量表(2)。 在国内学术界对物流服务质量的深入研究中,田宇认为,物流服务质量管理是物流企业营销的基础和关键环节, 因此从服务型企业的质量管理理论出发, 给出了物流服务质量管理研究的初步框架(3)。 郑兵等以服装行业为研究对象,采用问卷调查法对物流服务质量进行了实证分析, 最后确定时间质量、人员沟通质量、订单完成质量、误差处理质量、货品运送质量、灵活性和便利性为中国本土物流服务质量评价指标体系的7 个指标(4)。 刘丹在总结文献资料的基础上,对物流服务质量各维度的组成进行分析,最终确定网上购物物流服务质量构成的8 个维度为网店的物流信息质量、 订购质量、沟通回应质量、定制服务质量、交付质量、速度质量、个人信息安全质量、误差处理质量,并对这些维度进行操作性界定(5)。 从上述文献中可以看出,迄今为止, 国内外学者在这方面进行了大量且充分的研究,并根据各自的研究对象,对原有的SERVQUAL模型和LSQ 量表进行了借鉴和完善,为后续研究者进行物流服务质量评价方面的研究奠定了坚实的根基。
(二)文本情感分析研究现状
1.基于情感词典的文本情感分析。 最早的情感词典构建来自于Whissell, 他在研究中聘请148 位参与者为研究对象,他们在数学、物理等领域中运用了5 个词汇对该领域进行表达, 将它们与常用的情绪词进行了比较,并进行了扩展和修改(6)。 在后续的研究中,研究者们不断地扩展和完善情感词典,目前使用最多的是英语词典WordNet, 知网情感词典Hownet 以及中国台湾大学NTUSD 中文情感词典。朱嫣岚等以Hownet 为基础创立了词汇语义倾向性统计的新方法, 利用统计词汇之间的相似度来确定词汇的情感极性倾向(7)。柳位平等用TF-IDF 算法构造了一种中文情绪分析模型, 并用该模型对情感词进行了权重计算和对基础情感词词典的构建过程进行深入研究,提高了文本情感分类的精度(8)。 基于建立情感词典的方法是利用词汇的情绪倾向性, 将语言知识与统计相结合, 对文本的情绪进行多维度的分析,在此基础上,如果情绪词语的覆盖率和准确率较高,则可以更准确地进行情感分类。
2.基于机器学习的文本情感分析。 机器学习实际上是对研究数据进行学习, 使用机器学习算法对统计语言模型加以练习, 最后通过使用练习好的区分器对新文本情感类型进行识别。 1990 年,Hafner提出一种以规则为基础的文本内容解析方法(9)。Fersini 等(2014)在贝叶斯分类模型的基础上,引入了一种综合的文本情感分类算法, 并加入了一个贪心算法对分类器的准确性进行评价(10)。Xu 等为了解决情绪分类中数据不均衡问题, 提出一种以词嵌入为基础的采样方法,以获得有意义的均衡训练数据(11)。Khan 等建立了一种基于多目标模型选择(MOMS)的半监督模型,并与SentiWordNet 相结合,采用支持向量机(SVM)进行文本特征加权,最后使用建立的半监督模型提高情感分类效果(12)。 机器学习的重点是如何在描述层次上找到更好的情绪特性,并在相应的模型中合理地运用。 从上述研究结果可以看出,不同的机器学习方法在文本情感处理中得到了很好的应用,各研究学者通过大量的研究推动了文字情感处理技术的发展。
(三)指标体系
在上述学者研究的基础上, 本文建立基于电商平台的云南鲜花物流服务质量评价指标体系(表1)。
表1 基于电商平台的云南鲜花物流服务质量评价指标体系
三、研究设计
(一)数据来源
京东、 淘宝等网站上有大量的鲜花电商企业入驻,这些鲜花企业在淘宝、京东上的网购评论非常丰富。因此本文选取产地、发货地均为云南地区的线上鲜花花店, 运用八爪鱼采集器对店铺网购平台在线评论进行爬取收集,总共获取了26521 条评论。
(二)物流专业词汇词典与停用词词典的构建
获取评论文本数据之后首先需要对文本进行分词处理, 分词的目的是去除文本中的语气助词、标点符号、数字等无意义的文本数据。 同时,将一句话或者一个段落拆分成许多独立个体的词,方便数据进行聚类、提取关键词等工作。 分词需要构建物流专业词汇词典和停用词词库。 本文构建的物流专业词汇词典来源于搜狗细胞词库的 “物流词汇大全”以及国家行业标准《快递服务第一部分:基本术语》,将二者从网络下载后整合为一个文档,作为分词的物流专业词典。 停用词词典依次下载哈工大停用词表等表、词库并进行去重、整合,作为本文分词使用的停用词词库。
(三)数据的清洗
在评论数据分词之前要先进行筛选, 排除无效评论和评论字数少于5 的评论。剔除评论中空白、字母、表情、不规范语气词以及不文明用语等无用文本数据,清洗后剩余的文本数据为23827 条。
(四)研究方法
首先通过八爪鱼爬虫软件收集淘宝和京东平台上发货地、 产地均为云南的鲜花店铺网络在线评论数据, 采用数据处理与挖掘技术对物流关键词进行提取, 并将之映射到本文所构建的物流服务质量指标体系中。其次,使用word2vec算法对每个指标对应的物流关键词较少的部分进行扩展, 增加每个指标评论数据的丰富性, 然后对每个物流关键词进行TF—IDF 值计算,以每个指标所对应的物流关键词的TF—IDF 值的总和作为该指标权重值。最后,以每个物流关键词为条件, 提取对应的网购评论, 利用snowNLP 进行句子级情感分析, 记录每句句子的情感得分值。 本文最终从6 个方面结合不同维度下出现的问题1即可靠性、经济性、移情性、时间性、新鲜性、保证性六个维度。,提供针对性的管理措施和解决的办法。
四、网购平台云南鲜花在线评论数据情感分析
(一)高频词提取
本文采用python 软件里的jieba 分词模块对清洗后的数据进行分词并统计词频。首先编写分词代码程序,依次将要处理的文件、物流专业词汇词典、停用词词典加载到代码中。 运行代码后得到分词结果;然后编写词频统计代码,将分词之后的文本文件加载到该代码中, 得到词频统计结果。 本文选取词频最高的150 个词进行下一步研究分析(见表2)。
表2 网购平台云南鲜花评论高频词
(二)构建物流关键词库
根据表2 统计出的高频词, 选取与“物流”“质量”“快递”“服务”“满意度”相关的物流关键词作为初始关键词, 并将选取出来的关键词与评价指标进行映射,得到表3。
表3 物流关键词指标配对表
从表3 可以看出, 由于高频词只取了前150 个, 导致有的指标对应的关键词较少。 为使指标数据更为完善,本文使用python语言编写程序利用Word2vec 对较少指标的关键词进行拓展。 再人工筛选出相应的物流关键词,确保每个指标对应的关键词不少于5 个,以方便进一步研究(见表4)。
表4 拓展后的物流关键词指标配对表
(三)TF-IDF 特征词权值计算
TF-IDF 作为一种统计算法, 常常用来评估在语料库中某个词对于某份文档的重要性。 TF-IDF的基本概念是:在一篇文章中,一个词的使用频率较高,并且在其他文章中出现频率较少,对该篇文章来说可以认为该词有很强的辨别性,能被用来分类。本文用python 编程计算指标配对表里每个物流关键词的TF—IDF 值,每个指标的权重值等于该指标对应的物流关键词的TF—IDF 值总和(见表5)。权重值越高的指标,说明越受消费者重视。
表5 指标权重表
(四)基于snowNLP 的情感打分处理
以往学者采用构建情感词典的方法对网络评论进行评分,这种方法陈旧、耗时,并且在构建词典和分配单词的过程中比较随机, 影响评分结果。snowNLP 内置了一个功能强大的能对中文文本进行情感分析的模型,编写好python 语言程序后,可直接调用对本文获取的评论数据情感进行打分, 使用十分方便。 本文将运用以下步骤对snowNLP 鲜花商品评论情感打分的准确性进行检验:第一步,人工挑选出一百句正向鲜花网购评论和一百句负向鲜花网购评论,作为检验语料库。第二步,编写好代码,将检验语料库加载入代码中进行情感打分。第三步,对打分结果进行记录,人工判断准确性(见表6)。
表6 情感得分检验表 (单位:%)
从表6 可以看出, 直接调用snowNLP 进行情感打分准确率不高, 因此, 必须先对snowNLP 进行优化,才能进行下一步研究。 本文查阅了相关资料后作出以下更改:(1)把snowNLP 中分词的handle 函数改为jieba 分词的load_userdict 函数并设定常用词库,针对鲜花这一商品的属性添加常用词特别是否定词,增加分词对否定词的识别率。 (2)重新爬取大量鲜花的评论数据,替换其原有语料库,作为机器学习情感打分的依据, 本文共准备了35744 条好评评论和5356 条差评评论。 (3)由于语句中含有大量程度词,比如:很、超级、非常等词,去掉之后会改变原有语句的意思,因此停用。词中只设置标点符号、数字和英文字母,最大限度地保证句子的完整性,提高机器判别准确率。 (4)编写python 代码使snowNLP 重新学习,并保存相应数据,下次使用时可直接调用。 在完成上述步骤后, 本文重新对情感打分准确性进行检验,检验语料库不变(见表7)。
表7 优化后的情感得分检验表 (单位:%)
从表7 可以看出, 判断准确率已经大大提升,正向评论准确率由原来的87%提升到现在的93%;负向评论准确率由原来的64%提升到现在的88%;总准确率由原来的75.55%提升到现在的90.5%。 优化后的情感判断结果较好,可以进行下一步的研究分析。
在完成关键词库构建和snowNLP 情感打分优化的基础上,进行情感打分准确率检验:第一步,以各指标对应的关键词为条件, 利用excle 软件筛选出含有关键词的在线评论,作为各指标的情感打分语料库(见图1)。 第二步,编写好代码,将各个指标对应的语料库加载入代码中进行情感打分。 第三步,对评价结果进行整理,情感得分大于0.5 的评论为好评,小于0.5 的为差评,得到各指标情感得分汇总表(见表8)。
图1 筛选语料库
表8 各指标情感得分汇总表 (单位:%)
其中各数据的计算公式为:
好评率:
其中:Praise_rate 为好评率,h 为好评数量,m 为评论总数量。
差评率:
其中:Poor_rating_rate 为差评率,l 为差评数量,m 为评论总数量。
总评价得分:
其中:Total_score 为各指标总评价得分,score为每个句子的得分,i 为单个句子的排列序号, n 为该指标对应的评论总数。
情感平均得分:
其中:Average_score 为各指标情感平均得分,Total_score 为各指标总评价得分,n 为该指标对应的评论总数。
(五)电商平台云南鲜花服务质量情感评价结果
将前文得出的数据进行汇总,得到指标权重与情感得分汇总表(见表9)。
在表9 中,各维度权重值的计算公式为:
其中:Total_weight 为各维度权重值,weigthi 为各指标权重值,i 为各指标的排列序号,k 为各维度对应的指标总数。
各维度情感综合得分的计算公式为:
其中:Eve_score 为各维度情感综合得分,Average_score 为各指标情感平均得分,i 为各指标的排列序号,k 为各维度对应的指标总数。
各维度情感平均得分的计算公式为:
其中:Average_scoreDimension为各维度平均情感得分,Eve_score 为各维度情感综合得分, u 为各维度对应的指标总数。
从表9 中可以看出,6 个维度权重值从高到低依次为:可靠性(1.188647)、保证性(0.696026)、新鲜性 (0.273857)、 时间性 (0.240993)、 移情性(0.125802)、经济性(0.114361)。 从权重值来看,消费者对于网购云南鲜花的可靠性关注度最高;保证性其次;关注度最低的是经济性。
6 个维度的情感平均得分从高到低依次为:经济性(0.8540)、新鲜性(0.8459)、可靠性(0.8204)、时间性(0.8086)、移情性(0.7829)、保证性(0.6413)。从情感得分来看,消费者最满意的是网购云南鲜花的经济性;其次是新鲜性;情感得分最低的是保证性(0.6413)。
五、研究总结
本文采用数据处理与挖掘技术进行句子级情感分析,从情感分析的最终结果来看,消费者对云南鲜花电商在工作人员的专业性、物流服务人员的态度、物流服务人员的操作规范性以及配送速度这4 个指标感到非常满意, 情感评分均在0.89 以上。云南鲜花电商企业在这些方面要继续保持,并在此基础上突破,提供更好的服务。 与之相反,消费者对是否丢少件、个性化服务能力以及运输速度这3 个指标表示较为不满, 情感评分分别为0.2331、0.5596、0.6317。 从本文建立的16 个具体指标来看,有11 个指标的情感评分在0.8 分以上,这表示消费者对于云南鲜花电商企业物流服务质量是较为满意的,这对于成功打造云南鲜花品牌,提高消费者对云南鲜花的良好印象十分有帮助。