天猫超市消费者对网购物流服务因素的感知分析
2018-07-18张茜
张茜
【摘 要】本文从消费者的角度,探索网购物流服务因素与客户类别的关联性,构建一个研究框架。通过爬虫工具对天猫超市的在线客户评论数据挖掘,将语言转化为结构化数据,运用Rapidminer软件和FP-Growth算法挖掘出强关联规则。结果表明,该框架能够合理解释样本数据,并且发现不同类别的网购客户群体,对物流服务感知的侧重点具有显著差异。该结论为电商企业提供了物流服务盈利空间的切入点,具有重要的现实意义。
【关键词】在线评论;物流服务;FP-Growth算法;关联规则
一、引言
数据挖掘技术可以从大量的数据中提取出隐含的、以前不为人所知的、可信而有效的知识,能够对数据进行再分析,以期获得更加深入的了解,并且具有预测功能[1-2]。其中关联规则挖掘是数据挖掘知识模式中最活跃的一个分支,由Agrawal等于1993年首先提出,随即广泛应用在各个行业中[3]。尤其对于大型零售组织,在处理大规模数据,确定市场策略,提高决策支持能力方面。关联规则挖掘具有较大的价值,是从大规模数据中提取隐含信息的有效方法。
综上所述,为避免自建知识库的局限,本研究引入关联规则挖掘技术,对客观实时数据进行分析。在天猫超市购物网站上搜集大量在线客户评论,从中挖掘物流服务因素和网购顾客间影响关系,具有一定的理论创新性和技术可行性。
二、研究框架及关联规则
研究首先从B2C电子商务网站(如天猫超市,当当网等)的购买页面搜集大量在线客户评论,每条评论都包含着客户信息(用户名,会员级别,所在区域等)以及自由格式的文本式评论内容。接着从上万条在线客户评论中挖掘出有关于物流服务的内容,本文主要从以下三个步骤展开研究。
(1)数据收集和预处理:在线客户评论中按照客户类别和物流服务因素提取数据信息。
在B2C市场中天猫超市自2016年市场占比为6.7%,到2018年占比13.6%,一直处于增长状态。天猫超市无论是在仓储还是物流配送方面都远远领先于行业。物流也逐渐成为消费者选择在天猫超市购物的重要因素之一。因此,天猫超市网站上的在线评论数据具有一定的规模性和可研究性。接着是选定一种商品,使得评论内容可统一处理。iPhone8作为一款风靡全球的热销商品,其性能信息较其他产品更被广大消费者熟知,而且苹果的品牌体验店已遍布各大城市各个商圈。大多数消费者是在充分了解该产品信息后,才通过网络在线购买的。所以,iPhone8产品的评论内容更侧重于对B2C企业的服务体验,更利于本研究获取有关物流服务的信息。基于以上分析,本文在天猫超市的iPhone8购买页面收集在线客户评论。数据持续时长为一年,呈自然语言格式,评论总量为62529条。本文选取多可网络爬虫工具通过设定入口网址、关键词和评估词表来抓取大量在线客户评论中有关物流的评论。本研究选择人工识别和筛选的方法对上述有关物流的在线客户评论进行预处理,以期得到一个准确的有关客户类别和物流服务因素的评论矩阵。
(2)关联规则挖掘:在提取出的客户类别和物流服务因素中挖掘关联规则。在本研究中,关联规则挖掘用来识别和提取在线客户评论中隐含的有关物流服务因素和客户类别相关关系。基于毛国君对关联规则的定义和总结,可将关联规则问题描述为:假设I表示集合U和集合A的总项目集,即I={u1,u2,…,up,a1,a2,…,an}。那么关联规则可表示为:X→Y,其中X∈I,Y∈I并且X∩Y=?覫。进一步,令P(X)表示X在评论中出现的概率,换言之,如果x是包含X的评论的数量,n是所研究评论的总数量,那么,P(X)=x/n。
通常,描述关联规则的两个重要概念是支持度(Support)和置信度(Confidence)。那些超过最小支持度Suppmin和最小置信度confmin阈值的规则,就称为强关联规则。本研究中supp(X→Y)=P(X∪Y)表示评论的内容中同时涉及X和Y的的概率;conf(X→Y)=P(X∪Y)/P(X)表示X出现的情况下出现Y的概率;lift(X→Y)表示X和Y出现的相关关系。由此,本文设定以下三个标准,来挖掘X和Y之间的强关联规则.支持度的标准是用来确保项集X和Y在评论中有最低出现率,置信度的标准用来捕获评论中出现X的情况下,出现Y的条件概率,提升度(lift)的标准用来约束X和Y之间的影响关系,如果lift(X→Y)=1,由lift(X→Y)=P(X∪Y)/P(X)P(Y),可知P(X∪Y)=P(X)P P(X)P(Y),X和Y独立;如果lift(X→Y)>1,即表示X和Y呈正相关,X在评论中的出现影响Y的出现。
(3)相关性分析:结合实际情况,对规则进行分析,并针对性的提出改善物流服务质量,提高客户体验的建议。由于本研究搜集了大量的评论数据,可能会产生较多数量的关联规则,为了便于分析客户类别(U)与物流服务因素(A)的关联性,我们将X项目集分类,并用下标标识。XU和XA分别表示X项目集中客户类别和物流服务因素的子项目集,其中X∈A,X∈U,同样Y项目集也可以分类为YU和YA。
三、结论
本研究对B2C电子商务企业的物流服务因素影响进行了探讨,从消费者的角度出发,基于在线客户评论的数据挖掘方法,挖掘客户类别与物流服务因素的关联规则,发现不同类型的客户对物流服务因素的感知侧重点有所不同。由天猫超市的评论数据挖掘结果可知,活跃客户即大多数客户,更注重于物流配送速度、承诺配送时间的兑现水平以及退换货服务等的物流服务因素;新客户更在意物流的包装;而VIP客户更需要被重视感,对物流信息查询的服务有更高的要求。可见,B2C电子商务企业在提升物流服务质量方面,需要抓準关键点,精细化消费者的物流服务需求。
在当前大数据方兴未艾的背景下,数据挖掘技术可以深入挖掘在线客户评论中所反映出的消费者感知。然而要想满足每个消费者的服务需求,提供个性化的物流服务,势必会增加物流成本。因此,借助本文对天猫商城在线客户评论的实证研究结果,B2C企业可以考虑通过划分消费者类别、对应物流服务因素的顾客感知,提供精细化、规模化的物流服务。从而,在适当控制物流成本的前提下,有针对性的优化物流服务,以达到高效提升客户体验的管理目标。
【参考文献】
[1] CNNIC.第32次中国互联网络发展状况统计报告[EB/OL].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201307/t20130717_40664.htm.
[2] iResearch.艾瑞咨询:2013Q3中国网络购物交易规模4547.6亿元,B2C向平台化发展[EB/OL]. http://ec.iresearch.cn/shopping/ 20131104/217734.shtml.
[3] 周剑雄,高洁.基于数据库和数据挖掘技术的客户关系管理[J].计算机系统应用, 2003(2):9-11.