基于主题模型和情感分析的进口跨境电商顾客满意度评价研究
2023-02-13屈仁均
邢 丹, 屈仁均
(云南财经大学 商学院, 昆明 650032)
在新冠疫情蔓延、全球传统进出口贸易屡遭重创的背景下,消费者线上购物渗透率得以快速提升。同时伴随着国内网购消费升级,越来越多的消费者将目光转向了“海淘”,推动中国的进口跨境电商快速发展。截止到2021年上半年国内进口跨境电商市场交易规模就已达到6.05万亿元[1]。未来,不断增长的进口产品需求将会使跨境网购逐渐向常态化迈进。
然而,与发展和运营日渐成熟的国内电商相比,进口跨境电商平台还需要解决国内电商未涉及的跨境物流流通率低、消费者对品牌和产品信任度存疑、国际支付等难题,这些因素都极大影响着用户购买满意度。根据艾媒咨询数据显示,有62.8%的消费者在跨境网购时会将跨境物流速度、海关报关及国内配送等作为首要考虑的因素,其次注重其是否有“正品保障”[2]。因此对于大部分消费者而言,都希望在购买产品之前能够获得相关资讯来帮助他们进行购买判断。与此同时,在线推荐和顾客评论网站等数字渠道的兴起,使顾客和商家都能更容易、更快捷地从互联网上获取关于消费者满意与不满的信息[3],而各大跨境电商平台在长期运营中积累了大量的用户在线评论数据,通过对这些评论数据进行挖掘和情感分析,将有助于把握用户隐藏的真实偏好和需求,明确消费者对产品的关注重心,进而为跨境电商商家和平台提供有价值的参考。
1 进口跨境电商顾客满意度评价研究述评
目前被广泛接受的顾客满意度概念来自学者Oliver于1980年提出的理论,即用户在购买或享受商品和服务后,其现实感受与期望感知的对比就是顾客满意度的内涵[4]。当前已有不少学者对跨境电商顾客满意度及评价方法进行了研究,根据研究数据来源可分为用户主观问卷和基于在线评论的文本挖掘两种形式。
对现有相关问卷研究的回顾表明,顾客满意度评价研究可以分为两个方向。第一个方向注重理论和方法在新领域下的应用,如Oliver提出的期望-确认理论(ECT)是评估消费者对产品或服务满意程度的重要理论框架[4-5],同时也有学者将不同的评价方法应用到了此领域[6]。第二个方向重点关注特定因素对满意度和持续意向的影响,例如网络结构嵌入的影响[7]等。
随着文本挖掘和自然语言处理技术的广泛应用,大量学者开始利用顾客在国内电商或跨境网站消费后的在线评论文本研究其满意度,而所谓的文本挖掘就是指从大规模的文本中发现隐含的、以前未知的、潜在有用的模式的过程[8]。根据文本挖掘技术的不同业务算法,可将在线评论研究主要划分为评论主题挖掘和用户情感分析等方面。其中,针对消费者网购评论内容主题信息鲜明的特点,主题挖掘被广泛用于产品特征识别和用户关注点提取的分析中,目前常见的主题挖掘方法有词频-逆文本频率指数算法(TF-IDF)、k均值聚类算法(k-means)和潜在狄利克雷分布(latent Dirichlet allocation,LDA)主题模型。其中,作为应用最广泛的主题生成方法,LDA主题模型先后被不同学者应用于跨境电商消费者反馈信息的挖掘[9]、依据产品排名进行选择[10]等研究中,通过提取的关键词或主题可以帮助商家和平台快速把握消费者关注重心,从而根据潜在的用户需求更好地指导其进行设计、生产及运营。与此同时,通过对评论文本进行情感分析将有助于把握消费者对产品和服务的态度及商家的服务质量水平,目前学界根据文本探究的层次差异,将情感分析方法主要分为传统机器学习方法[11]、深度学习方法[12]和情感词典方法。尽管机器学习和深度学习方法都可以对海量评论文本的情感态度进行有效分析,然而,不同研究领域的用户情感关键词和情感表现都存在较大的差异性,因此通过构建相应的情感词典库可以较精确地识别出具体领域的情感极性。学者冯坤等[13]和Liu等[14]通过使用构建的情感词典对评论文本子句进行分析后发现,基于词典的情感提取是一种有效的情感分类方法。
综上所述,目前采用文本挖掘在线评论来研究跨境电商满意度的文献还较少,且使用情感词典分析情感值进而构建满意度评价指标的研究更是匮乏。因此,本文尝试通过LDA主题模型提取评论特征,接着采用情感词典构建进口跨境电商顾客满意度的评价流程和方法,以期为提升进口跨境电商服务管理质量提供帮助。
2 顾客满意度评价方法及流程
参考国内外电商顾客满意度评价指标构建方法,将满意度评价流程分为满意度的特征提取和满意度情感值评价两个主要部分,如图1所示。
图1 基于主题模型和情感分析的进口跨境电商顾客满意度评价流程
3 数据处理与分析:京东个护产品评价
3.1 文本数据的采集与预处理
受疫情限制出行影响,个人护理产品因人们宅家的日常需要保持着搜索量和零售额的迅猛增长。故本文采用网络爬虫软件八爪鱼数据采集器,选取京东全球购平台上个护领域具有代表性的洁面、爽肤水、面霜、眼霜4类模块产品的在线评论为研究数据。由于研究内容为进口跨境电商的用户满意度,故在样本采集时只选取海外旗舰店或者商品详情页内标有“跨境进口”的产品。截止到2022年1月5日共抓取到超过695个商品的90 126条数据评论,经去重等数据清洗后剩余81 499条在线评论数据。接着对清洗后的数据进行jieba分词、去停用词和词性标注等,为后续的数据分析奠定基础。
3.2 基于文本语义分析的顾客满意度评价
3.2.1 基于词云图的可视化分析
为使浏览者对用户关注的购买因素一目了然,通过调用Python中的WordCloud库绘制评论文本词云图(图2),词云图可以过滤掉部分低频的词语以此来着重强调整体文本中出现词频较高的词语,字体越大的词语表示其词频越高[15]。通过词云图可以看到“好用”“保湿”“滋润”的字体相对较大,说明产品质量是用户重点关注的因素;同时“京东”“正品”“划算”字体也较突出,说明消费者对京东平台的认可度较高、对其服务的评价也是积极正面的。
图2 个护产品在线评论文本词云图
3.2.2 TF-IDF文本特征提取
通过对文本进行词云展示可以直观展现消费者的关注重心,但是仅依据高频词进行衡量会产生属性提取的误差,因此需要引入TF-IDF算法。TF-IDF是一种结合词频(TF)和逆文档频率(IDF)计算特征权重的方法,它的基本思想是:如果一个词在一篇文档中经常出现但在其他文档中很少出现,那么则赋予它较高的分数;但是如果一个词出现在许多文档中,它就不是唯一的标识符[16],其计算公式为
(1)
式中:T代表文档总数;t代表特征词的文档数目;n代表特征词出现的次数;N代表文档库中的总词数。本文通过算法将提取的关键词按照TF-IDF值的大小进行排序,部分见表1。从TF-IDF的排序中可以看出,“效果”“正品”“喜欢”等特征词在整篇文档中出现的次数较多,说明消费者对于跨境电商个护产品的整体满意度较高;同时“保湿”“吸收”“补水”等特征词的TF-IDF值也排在前20名之内,反映了用户对于产品的护肤效果同样投入了很大的关注度。
表1 部分关键词TF-IDF值排序
3.3 基于LDA主题模型的顾客满意度评价
3.3.1 基于LDA模型的主题提取方法
作为一种生成概率模型,LDA(Latent Dirichlet Allocation,潜在狄利克雷分布)主题模型被用于描述文本或其他类型离散数据的集合,从而发现文档集合中的抽象“主题”。图3所示为主题词的生成过程,据此一篇文档中主题词的生成步骤如下[17]。
图3 LDA模型的贝叶斯结构示意图
第1步:为这篇文档生成一个关于主题的分布θ~Diriichlet(α),其中α是Dirichlet先验关于每次评论主题分布的参数。
第2步:将其分配给一个主题,从选择的主题中生成词语。在生成这篇文档的每一个词Wn的时候:①首先为这个词选择一个主题,Zn~Multinomial(θ);②选定该主题后,在其中选择一些词语作为特征词Wn~Multinomial(βk),其中k=Zn。
第3步:通过遍历整篇文档中的每个单词,就可以以p(Wn|Zn,β)的概率生成这个主题词,如式(2)所示。
(2)
3.3.2 最优主题数的确定
在实际的应用中,需要在提取主题词之前确定好指定评论文本主题的数量K[18]。K过大会致使主题间的重复率较高,K过小又会降低同一主题内特征词的关联程度,因此K的数目成为决定主题分析质量的关键因素之一。故本研究通过计算困惑度的方式来确定最优主题的数量,困惑度数值越小表示该主题模型的预测效果越强,因此通过绘制的困惑度折线(图4)可以看出,当主题数为5时,困惑度的数值最低,模型的最大似然率最高,即确定本文用户评论文本数据的最优聚类主题个数为5。
图4 主题模型困惑度折线图
3.3.3 LDA主题提取结果分析
通过困惑度计算确定了最优主题的个数,然后利用Python中的gensim模块得出文本数据中的主题高频词。表2展示了LDA模型提取的5个主题中按照权重排名前15的主题词。
根据各主题内的高频词,归纳出以下5大主题。
主题1:品牌信誉,由“正品”“牌子”“信赖”等可以看出消费者选择跨境购买个人护理产品,很大程度上依赖于对品牌的信赖。具体包括商品是否为正品、产品品牌的知名度、消费者对京东自营平台的信任程度等。
主题2:物流服务质量,由“物流”“快递”“速度”等反映出相比于国内网购物流,消费者对于跨境物流的服务更加重视。具体表现为包裹是否完好整洁、快递的发货和到货速度、清关和跨境物流的价格等。
表2 LDA模型提取的主题词及权重
主题3:商家服务质量,由“评价”“客服”“售后”等显示出消费者在购前得到的产品的咨询,和购后享受到的售后服务也对购买行为产生关键的影响。具体包括售前咨询的响应速度、退换货的承诺以及服务态度等。
主题4:感知价值,由“活动”“价格”“划算”等主题词可以反映出产品价格的高低对消费者购买意愿有较高程度的影响。具体包括商品的优惠折扣力度、促销活动是否频繁以及产品的性价比等。
主题5:产品质量,由“吸收”“保湿”“滋润”等可以看出个护产品的使用功效是消费者看中的重要因素。具体包括产品的性状(质地、外观、味道等)、使用过后的感受(吸收性、易用性、有效性)等。
3.4 基于情感分析的顾客满意度评价
3.4.1 顾客满意度评价方法
3.4.1.1 情感词典的建立
通过构建情感词典的方式对在线评论文本数据进行情感分析,并将情感倾向性词语分为积极、中性和消极倾向。以目前应用较广泛的NTUSD情感词典为基础,同时针对词典中不完善的情感词,从已抓取的文本中获取例如“正品”“划算”“推荐”等情感词并添加到相应的词典表中,同时为词典中的每个词语进行人工赋值,将积极和消极情感倾向的词语分别赋值为2、-2分。与此同时,通过手动搜集的方法建立否定词词典,将否定词赋值为-1分;并以知网程度副词词库为基础,根据本研究方向和特点手动增加相关的程度副词,为其赋予0.5~3分的权重。
3.4.1.2 情感值算法的设计
具体情感值计算操作如下:首先识别该子句是否存在情感词,如不存在则将该句的情感值设置为0;其次利用jieba分词模块对每一条评论进行分词预处理,接着遍历分词结果,根据导入的情感词典为对象定位情感词,并判断情感词之间是否有程度副词和否定词,然后赋予相应的值。其中,依据该情感词前2个词来判定否定的语气,如有多重否定出现时,则按照“负负得正”原则进行赋值。初始情感词权重(i)赋值为1,若出现否定词,下一情感词权重值取反(-i);若出现程度副词,下一情感词权重为乘以程度副词权重(b),情感得分为F=a/bi,a为否定词得分,b为程度副词得分,i为情感极性词语得分[19],具体的情感值计算程序如图5所示。
图5 基于情感词典的情感值计算程序
3.4.1.3 顾客满意度综合评价方法
借鉴张凌等在物流服务业顾客满意度评价研究中使用的赋值评价方法[20],将通过LDA主题模型提取出的各个主题对应的总体百分比作为权重,同时将各类别的主题情感得分均值作为顾客满意度评分,以此用来评价进口跨境电商领域的各主题综合顾客满意度值。具体计算公式为
y=aixn
(3)
式中:y代表总体顾客满意度均值;ai代表各主题所占的权重;xn为各类别的顾客满意度均值;i、n的取值范围都为1~5。
3.4.2 顾客满意度情感评价分析
3.4.2.1 整体顾客满意度情感评分
运用前文构建的跨境电商领域情感词典来设置相应的算法,依次遍历81 501条评论数据得到每条评论的情感总体得分。接着对每条评论的情感得分进行统计,得出积极情感(好评)、中性情感(中评)和消极情感(消极)3种情感倾向评论数量及各自所占的比例见表3。从表3中可以看出,有67.80%的消费者表达了积极情感倾向,说明消费者对其整体满意度较高。
表3 3种情感倾向评论数量及占比
同时根据各条评论情感得分可以看出其分值跨度较大,故将积极和消极情感得分按程度各分为3个区间:绝对值在[0,5]之间为一般情感倾向,(5,10]之间为中度情感倾向,10以上为高度情感倾向。根据表4所示的具体统计结果可以看出,在消费者给出的好评中,一般情感倾向的评论占比最高,中度和高度情感倾向占比相差较小,但二者总体占比也接近好评总数的40%,顾客满意度的情感倾向较强烈且整体满意度都较高。在顾客给出的差评评论中,一般情感倾向的数量同样最多,高达86.83%。然而与积极情感分布不同的是,消极情感程度的分布存在严重的两极分化现象,高度情感倾向仅占2.84%,这说明虽然在某些方面没有达到消费者预期的期望值,但消极情感倾向总体上还不是太强烈,只是在某一方面或几个方面存在着不满。
表4 各程度情感倾向评论数量及占比
3.4.2.2 主题顾客满意度情感评分
通过对LDA模型提取的5个主题文本分别进行情感得分计算与统计,可以得出消费者对各主题指标的关注程度,见表5。
表5 各主题指标的关注程度
由“用户关注率”可以看出,消费者对产品质量这一主题的关注率最高,达到了61.21%,感知价值以44%的占比紧随其后,品牌信誉也以31.7%的关注度位列第3,说明消费者购买的个护产品有很强的产品特性,产品使用后的感受以及是否有功效等,都是顾客有针对性地选择相应产品的主要因素;除此之外,消费者在购买产品和服务的过程中对其价值的感知也是重要因素之一,产品的性价比及优惠折扣力度等都是消费者看重的因素;同时由于跨境网购为消费者带来的信息不对称等因素,使其对产品真伪以及商家信誉产生极大的质疑,从而使消费者对此类问题也投入了较高的关注度。
根据各主题的情感评分均值大小排序来看:商家服务质量>物流服务质量>感知价值>产品质量>品牌信誉,其中品牌信誉的情感均值最低仅为4.867分,这进一步印证了顾客对跨境网购的信赖度不高,京东全球购平台急需优化品牌形象。从表5中还可以看出5大主题的好评率都达到了70%以上,其中物流服务质量以80.77%的好评率位居榜首,可见消费者对于跨境网购中物流环节的满意度很高,说明随着跨境电商的飞速发展与运营体制的完善,跨境物流的效率和体系建设也得到了极高的重视,使其物流服务质量得以不断提升。
3.4.2.3 顾客满意度赋值综合评价
根据前文设置的评分规则可知,顾客满意度综合得分由各主题所占权重和情感平均得分组成。因此依据式(3)对顾客满意度进行主题综合评分,见表6。
从表6可以看出,顾客对产品质量的综合满意度情感评分最高,这说明消费者对其购买的个护产品所带来的功效有着较高的满意度。然而与之相反的是,品牌信誉的总体综合得分仅为1.543,仍然处于最低水平,与前文的主题情感得分排序情况大体一致,一方面印证了目前最为阻碍跨境电商行业发展之一的消费者信任问题,另一方面也为商家和平台展现了用户最为关注的消费偏好和需求,为其改进服务提供了明确的方向。其次,与前文主题得分不同的是,顾客对于商家服务质量的综合评分仅为1.974分,位列倒数第2,这表明顾客虽然对商家服务质量的平均情感得分较高,但是纵观整体消费者对服务质量的感知而言,他们还是对购买产品过程中体验到的售前和售后服务投入了很高的关注度,同时此领域给顾客带来的价值远低于其期望值,顾客对此影响因素产生了较高程度的不满,因此商家应该着重提升对客户的服务质量。
表6 各主题所占权重和情感评分均值
4 顾客满意度优化措施
以各主题和综合评分结果为基础,为各个顾客关注点目前存在的薄弱环节提出具有针对性的优化措施,以期帮助企业在资金、技术和时间的限制下,根据各项用户需求的重要度迅速锁定产品及服务改进的优先级顺序。
1)全面提升跨境品牌信任度。区别于日常的境内网购,跨境电商在源头和运输环节都存在很高的造假风险,因此,京东全球购平台要对准入商家的信息和资质进行严格的把控;对于自营商品和商家的货源质量、真实来源地等加强监管,一旦发现售卖假货、仿货等,要立即查处和实施惩罚措施,通知同行电商平台共同监视后续行为。
2)健全客户服务流程与制度。个护产品的个体使用适配度和不同产品种类的功能性差异较大,因此顾客的购前疑惑能否有效解决是决定购买意愿的重要因素。因此,商家应对售前客服定期进行专业培训,同时针对境外商品存在语言障碍这一特性,还要设置专业的翻译人员对产品的属性功能、使用方法、原产国等信息做出准确详细的描述,避免顾客因为信息理解偏差而失去购买欲望。
3)优化跨境物流服务质量。平台要选择与适合的物流公司建立良好的合作机制,对运输过程中的商品进行实时追踪。针对京东平台,其发展至今已经在全球五大洲建立了超过110家海外仓,未来京东还需继续加强海外仓库的建设和已有仓库中智能化、自动化设备的投入,以期更加有效地处理退换货单并提高跨境物流配送的及时性。
4)有效降低购物成本。由于个护产品自身隶属高端快消品的特性,消费税通常会高于一般的商品,而进口个护产品还要在消费税的基础之上缴纳关税和增值税。因此,京东全球购自营和其他品牌店铺要调整并完善自身的供应链模式,与上游供应商建立良好的合作模式,同时还要重视国内保税区的建设,加强仓储设施的完善并扩大仓储容量。
5)严格把关产品质量。由于跨境网络购物买卖双方信息的不对称性,有些商家通过夸大产品功能、放置美化图片等方式欺骗消费者,故平台和商家对商品的宣传要与实际产品相符,严禁以夸大或虚构产品效果对消费者造成欺骗的方式来提高销量,为顾客构建真实诚信的购物氛围。
5 结语
本文通过对跨境网购个护产品的用户评论数据进行挖掘与收集,同时将顾客满意度综合评价模型应用到进口跨境电商领域,为利用在线评论研究消费者行为提供了新视角。从评价结果可以看出,顾客对跨境网购个护产品的总体评价是偏正向的,同时也显示出影响顾客满意度的各个因素的综合得分排序。因此本文构建的评价模型可以有效得出顾客满意度的量化结果,后续可为此领域的相关研究提供参考。由于条件限制,本文只对进口跨境电商中的一个产品分类进行了研究,数据来源具有一定的局限性;同时,仅依靠情感词典分析评论文本也会导致语义理解的偏差。在未来的研究中,将会提出更为科学的评价方法进行深入研究,并试图应用到更广泛的领域。