APP下载

大数据背景下数据挖掘技术在电子商务营销拓展中的应用
——以某网商企业为例

2017-06-05王馨晨

生产力研究 2017年4期
关键词:购买者网商置信度

王馨晨

(兰州财经大学 信息工程学院,甘肃 兰州 730020)

大数据背景下数据挖掘技术在电子商务营销拓展中的应用
——以某网商企业为例

王馨晨

(兰州财经大学 信息工程学院,甘肃 兰州 730020)

近年来,电子商务平台网商企业在日益激烈的竞争态势下,传统商业模式中的粗放式盈利模式难以为继,需要更加精细化的运作和精准化营销,通过深入分析用户行为,提升用户体验,通过个性化精准服务或产品来提高企业自身效益。文章基于大数据背景,以某网商企业为例,深入研究了数据挖掘技术在电子商务营销拓展中的应用。

大数据;数据挖掘;电子商务;营销拓展

一、引言

近年来,得益于信息技术的快速发展以及政府大力发展“互联网+”战略的政策红利,我国的电子商务平台网商企业迅速崛起,对传统的商务业态形成了较大的冲击,市场先行者也获得了较好的收益。但是经过多年的野蛮生长后,随着行业进入者的逐渐增多,行业内的竞争越来越激烈,政府也加强了对行业的规范和监管,同时传统商务业态也积极推进转型改革来应对其冲击和挑战。在这种大背景和大趋势下,电子商务平台网商企业依靠传统的粗放式盈利模式难以为继,需要更加精细化的运作和经营,通过扎实深入的研究用户行为,提升用户体验,来提高网商企业的经营效益。本文基于大数据背景,以某网商企业为例,深入研究数据挖掘技术在电子商务营销拓展中的应用,对于提高电子商务平台网商企业的经营效益,提升互联网购物消费者的消费体验,都有着重要的参考借鉴意义。

二、数据来源与样本结构

本文研究的数据来源是京东网电子商务平台上某网商企业记录的2016年全年的销售数据。该网上企业的店铺名称叫做ZE果业,主要经营芒果、木瓜、橙子等新鲜水果以及松子、核桃、开心果等坚果。数据分析采用的样本数据量为1 535 288,每条数据包括订单编号、消费者ID、消费者性别、消费者年龄、消费者地址、商品名称、交易金额、交易单价、交易评价、消费者信用、注册时间、付款方式、整体好评率等内容。图1~图5分别展示了该店铺消费记录的性别结构、年龄结构、区域结构、评价结构和付款方式结构。

图1 消费记录性别结构分析

图1展示了该店铺消费记录的性别结构,可以看出,该网商企业消费记录中男性占比为46%,女性占比为54%,女性消费记录略高于男性,但差别不是很大,说明该店铺的销售并不显著受消费者性别因素影响,或者说男性和女性对于该店铺销售商品的偏好度并无明显差异。

图2展示了该店铺消费记录的年龄结构,可以看出,该网商企业消费记录中25岁~35岁的青年消费记录占比最高,而且远远高于其他年龄段的消费记录,其次是25岁以下顾客,再后是35岁~45岁顾客,最后是45岁以上顾客。说明该店铺的消费记录以年轻人群为主,这与年轻人能够认同并且熟悉运用电子商务平台购买水果的原因是分不开的。

图2 消费记录年龄结构分析

图3展示了该店铺消费记录的区域结构,可以看出,该网商企业消费记录中东部地区的消费记录占比最高,其次是中部地区,最后是西部地区。造成这种现象的原因一方面是东部地区经济发达、客户购买力高,客户的理念也较为先进,能够认同互联网购物理念并且习惯使用互联网电商平台进行购物;另一方面是因为东部地区的物流系统较为发达,销售区域局限性较小,运输费用和快递成本也相对更低。

图3 消费记录区域结构分析

图4展示了该店铺消费记录的评价结构,可以看出,该网商企业消费记录中系统自动好评的比例最高,然后是主动好评,再后是中评,最后是差评。好评数量非常高说明该网商企业的口碑整体上还是可以的,但是系统自动好评的比例相对主动好评较高说明消费者被动认可程度要多于主动认可程度,店铺在消费者关系维护方面还有进一步提升空间。

图4 消费记录评价结构分析

图5展示了该店铺消费记录的付款方式结构,可以看出,该网商企业消费记录中信用卡付款的比例最高,然后是平台资金付款,最后是借记卡付款。说明该网商企业的消费者以银行存款资金消费的占比较低,更多地依赖于银行信用消费或平台资金沉淀消费。

图5 消费记录付款方式结构分析

三、数据挖掘分析

数据挖掘分析部分本文采用的分析方法包括购买集中度分析、商品支持度和商品置信度分析。

(一)数据挖掘购买集中度分析

数据挖掘购买集中度分析指的是消费金额与购买者人数之间的关系,旨在发现店铺的销售特点,以便更多的采取针对性的营销策略。如果购买集中度较高,则代表着少数的消费者贡献了多数的销售额,则需要采取重点维护策略,维护好高价值、高贡献的优质客户。如果购买集中度较低,则代表着消费者的贡献比较均匀,则需要采取普遍维护策略,批量化拓展客户。如图6所示,本次分析的消费者购买集中度数据显示,消费金额前10%的消费者人数占比为3%,消费金额前10%~30%的消费者人数占比为 10%,消费金额前 30%~50%的消费者人数占比为14%,消费金额前50%~80%的消费者人数占比为17%,消费金额后20%的消费者人数占比为56%。整体来看,该店铺的购买集中度呈现出较强的“二八效应”,优质客户的购买力非常突出。该店铺可以在客户维护方面有所侧重,集中更多的促销资源针对贡献度较高的顾客加大广告宣传和优惠促销力度。

图6 数据挖掘购买集中度分析

(二)数据挖掘商品支持度和商品置信度分析

数据挖掘商品支持度和商品置信度分析可以探索不同商品之间的关联关系,可以较好地反映出某商品组合受欢迎的程度,可以为组合营销提供智力支持。假设有两种商品:A商品和B商品,则A商品对于B商品的商品支持度反映的是,在所有的消费者中,消费者同时购买A商品和B商品的概率。A商品对于B商品的商品置信度反映的是,在所有购买A产品的消费者中,购买B商品的概率。

商品支持度分析的公式是:

从商品支持度分析的概念和公式可以看出,A商品对B商品的支持度和B商品对A商品的支持度是相同的。

商品置信度分析的公式是:

从商品置信度分析的概念和公式可以看出,A商品对B商品的支持度和B商品对A商品的支持度是不同的。

表1 数据挖掘商品支持度分析结果

从表1商品支持度分析结果来看,核桃与松子组合是最高的,其次是核桃与橙子组合、核桃与木瓜组合、核桃与开心果组合等。

表2 数据挖掘商品置信度分析结果前六位

从表2商品置信度分析结果来看,芒果-橙子的置信度最高为78.89%,其次是橙子-芒果为75.42%,芒果与橙子组合、松子与核桃组合、开心果与木瓜组合相互之间的置信度比较高。该结果的分析对于店铺的启示是,芒果与橙子、松子与核桃、开心果与木瓜之间存在较强的关联关系和相关依赖关系,如果店铺针对这几种商品组合开展一系列的促销活动,那么就能起到相对较好的效果。

四、数据挖掘高频次购买者行为分析和高价值购买者行为分析

(一)高频次购买者行为分析

本文开展的高频次购买者行为分析采用回归分析方法,其中被解释变量为按消费者分类汇总的销售次数(Y)。解释变量包括消费者性别(X1)、消费者年龄(X2)、消费者地区(X3)、消费者信用(X4)、注册时间(X5)、在线时间(X6)、整体好评率(X7)。其中消费者性别(X1)为分类离散变量,将男性设置为1,女性设置为2;消费者地区(X3)亦为分类离散变量,将东部地区设置为1,中部地区设置为2,西部地区设置为3;消费者信用(X4)亦为分类离散变量,从1到5分为5个等级,数字越大,信用等级越好。其他变量均为连续变量。数据处理方面,为了消除不同量纲之间的差距和数据的异方差性,对数据进行了对数标准化处理。建立的数据回归分析模型如下所示:

使用STATA12.0对模型进行估计的结果如表3所示:

表3 潜在客户挖掘高频次购买者行为分析结果

从回归分析的结果可以看出,消费者性别(X1)的系数显著为正,说明女性消费者的高频次购买行为相对更多;消费者年龄(X2)的系数显著为负,说明年轻消费者的高频次购买行为相对更多;消费者地区(X3)的系数显著为负,说明东部地区的高频次购买行为相对更多;消费者信用(X4)的系数显著为正,说明信用度高的消费者的高频次购买行为相对更多;注册时间(X5)的系数不够显著,说明消费者的注册时间对高频次购买行为的影响关系较弱;在线时间(X6)的系数显著为正,说明在线时间长的消费者的高频次购买行为相对更多;整体好评率(X7)的系数不够显著,说明消费者的整体好评率对高频次购买行为的影响关系较弱。综上所述,信用度高且在线时间长的东部地区年轻女性消费者的高频次购买行为相对更多。

(二)高价值购买者行为分析

本文开展的高频次购买者行为分析采用回归分析方法,其中被解释变量为被按消费者分类汇总的销售金额(Y)。解释变量包括消费者性别(X1)、消费者年龄(X2)、消费者地区(X3)、消费者信用(X4)、注册时间(X5)、在线时间(X6)、整体好评率(X7)。其中消费者性别(X1)为分类离散变量,将男性设置为1,女性设置为2;消费者地区(X3)亦为分类离散变量,将东部地区设置为1,中部地区设置为2,西部地区设置为3;消费者信用(X4)亦为分类离散变量,从1到5分为5个等级,数字越大,信用等级越好。其他变量均为连续变量。数据处理方面,为了消除不同量纲之间的差距和数据的异方差性,对数据进行了对数标准化处理。建立的数据回归分析模型如下所示:

使用STATA12.0对模型进行估计的结果如表4所示:

表4 潜在客户挖掘高价值购买者行为分析结果

从回归分析的结果可以看出,消费者性别(X1)的系数显著为正,说明女性消费者的高价值购买行为相对更多;消费者年龄(X2)的系数显著为负,说明年轻消费者的高价值购买行为相对更多;消费者地区(X3)的系数显著为负,说明东部地区的高价值购买行为相对更多;消费者信用(X4)的系数显著为正,说明信用度高的消费者的高价值购买行为相对更多;注册时间(X5)的系数不够显著,说明消费者的注册时间对高价值购买行为的影响关系较弱;在线时间(X6)的系数显著为正,说明在线时间长的消费者的高价值购买行为相对更多;整体好评率(X7)的系数不够显著,说明消费者的整体好评率对高价值购买行为的影响关系较弱。综上所述,信用度高且在线时间长的东部地区年轻女性消费者的高价值购买行为相对更多。

从数据挖掘高频次购买者行为分析和高价值购买者行为分析的结果来看,信用度高且在线时间长的东部地区年轻女性消费者既是高频次购买者,也是高价值购买者。结合前述的数据挖掘购买集中度分析结果中,商铺销售中存在的明显的“二八定律”特征,商铺应该选择该部分客户优先拓展。在拓展策略方面,结合前述的数据挖掘商品支持度和商品置信度分析结果,店铺销售的芒果与橙子、松子与核桃、开心果与木瓜之间存在较强的关联关系和相关依赖关系,如果店铺针对这几种商品组合开展一系列的促销活动,那么就能起到相对较好的效果。

五、研究结论

本文基于大数据背景,以某网商企业为例,深入研究了数据挖掘技术在电子商务营销拓展中的应用。研究发现,店铺销售的性别结构方面,男性和女性对于该店铺销售商品的偏好是无偏的;年龄结构方面,店铺的消费记录以年轻人群为主;区域结构方面,东部地区的消费记录占比最高,其次是中部地区,最后是西部地区;评价结构方面,系统自动好评的比例最高,店铺口碑整体上还可以的,但系统自动好评的比例相对主动好评较高,消费者被动认可程度要多于主动认可程度;付款方式结构方面,该网商企业的消费者以银行存款资金消费的占比较低,更多的依赖于银行信用消费或平台资金沉淀消费。数据挖掘购买集中度分析发现,店铺销售呈现出较强的“二八效应”,优质客户的购买力非常突出。数据挖掘商品支持度和商品置信度分析发现,店铺销售的芒果与橙子、松子与核桃、开心果与木瓜之间存在较强的关联关系和相关依赖关系,数据挖掘高频次购买者行为分析和高价值购买者行为分析发现,信用度高且在线时间长的东部地区年轻女性消费者的高频次和高价值购买行为相对更多。商铺可针对该部分客户推出关于芒果与橙子、松子与核桃、开心果与木瓜组合销售的优惠活动以提升经营绩效。

[1]李勇,张敏,刘浩,等,2016.数据挖掘与应用统计现状及趋势研究——第八届国际数据挖掘与应用统计研究会年会学术综述[J].会计之友(22):24-26.

[2]张维亚,严伟,汤澍,2016.基于数据挖掘的旅游者消费行为数字足迹特征分析[J].商业经济研究(18):65-68.

[3]盛夏,李斌,张迪,2016.基于数据挖掘的上市公司信用评级变动预测[J].统计与决策(15):159-162.

[4]王艺,姚正海,2016.制造业上市公司财务预警体系的构建及比较——基于数据挖掘技术[J].财会月刊(21):49-55.

[5]张维化,2016.基于数据挖掘的移动客户流失量预测模型[J].内蒙古师范大学学报(自然科学汉文版)(4):469-472.

[6]张健,2016.基于供给侧改革和数据挖掘的茶叶在线销售策略探析[J].商业经济研究(12):53-54.

[7]张玉峰,曾奕棠,郝彦,2016.基于动态数据挖掘的物流信息智能分析策略研究[J].图书馆学研究(5):46-49.

[8]张冬,丁宏进,张俊杰,2015.数据挖掘技术在产销差决策系统中的应用[J].中国给水排水(13):60-63.

(责任编辑:D 校对:L)

F724.6

A

1004-2768(2017)04-0064-04

2017-02-28

王馨晨(1979-),女,陕西汉中人,兰州财经大学信息工程学院讲师,研究方向:信息管理、信息经济、电子商务。

猜你喜欢

购买者网商置信度
网商银行升级,将逐步暂停支付宝提现
硼铝复合材料硼含量置信度临界安全分析研究
新零售背景下社邻商业顾客社群运营对策探讨
商业银行理财产品的调研及比较
正负关联规则两级置信度阈值设置方法
国外房地产市场差异化调控经验做法及启示
在线口碑、服务水平与网商绩效——基于交易量和交易额的比较研究
浅论B2C网商对于售后问题的会计处理
置信度条件下轴承寿命的可靠度分析
多假设用于同一结论时综合置信度计算的新方法✴