基于大数据精准营销的数据分析研究
2017-10-23尹景喆
尹景喆
【摘 要】精准营销是在充分了解顾客信息的基础上,针对顾客偏好,有针对性地进行营销,并以事实为依据,以数据为基础,实现对未来客户的精准定位、销售情况的准确预估以及对不同客户不同业务内容的精确推荐。本文基于大数据精准营销,从精准营销的定性分析与定量分析两个方面,对数据进行分析和挖掘,为精准营销提供依据和支持。
【关键词】精准营销;数据分析;定性分析;定量分析
精准营销,是在充分了解顾客信息的基础上,针对顾客偏好,有针对性地进行营销,就是在合适的时间向合适的人提供合适的产品。同时,精准营销要以事实为依据,以数据为基础,实现对未来客户的精准定位、销售情况的准确预估以及对不同客户不同业务内容的精确推荐。基于大数据精准营销的数据分析,就是从精准营销的角度,对数据进行挖掘与分析,找出数据的内在规律,对未来情况进行预计,为企业营销战略的制定和营销目标的实现提供重要依据。
一、背景介绍
随着近年来互联网、新社交媒体的发展,信息过载,数据爆炸、大数据分布式存储、大数据分析及挖掘技术的发展使得对海量数据进行收集、分析、整合成为可能。基于大数据精准营销对企业营销战略提出了很大的机会和挑战。可以说,精准营销是一个基于数据分析的量化过程,从而实现对客户的精准定位、数据的准确预估等。因此,怎样面对大量数据进行数据分析,并通过分析得出有价值的营销信息,实现精准营销,这里就需要一些数据统计分析方法的支持。
在精准营销领域,数据统计分析的方法又可分为定性分析法和定量分析法。定性分析法如分类、关联等,重点解决的问题有:哪些客户是某个产品或者营销活动的目标用户?每个用户最适合推荐的产品是什么?定量分析法如时间序列预测、移动平均模型、指数平滑模型、趋势预测法、季节指数法、贝叶斯统计预测方法、马尔可夫分析法等,重点关注怎样通过对客户消费行为数据和历史规律的挖掘与分析,预测未来客户需求数据的问题,实现以客户为中心的精准营销。本文从精准营销的定性数据分析与定量数据分析两个方面展开讨论。
二、精准营销数据中的定性分析
分类法:分类就是按照事物的性质、特点、用途等作为区分的标准,将符合同一标准的事物聚类,不同的则分开的一种认识事物的方法,是数据分析应用最广泛的应用之一。可利用分类法寻找目标客户的共有特征,通过分析准确的找到目标用户。构建分类模型方法有决策树、神经网络、判别分析等方法。
关联法:主要解决的问题是研究产品购买的关联性,即购买A产品的同时是否会对B产品感兴趣。关联分析又叫“购物篮分析”,意思是在超市购物时,一个购物车中往往会放多种不同的商品,通过大量的购物车分析商品之间可能会存在众多意料之中或意料之外的关联性。主要解决两大类问题:一是如何对客户进行商品推荐,二是把哪些商品捆绑在一起销售更好。关联法就是从一种行为中发现与之相关联的另一中行为,其广泛应用于零售业、金融业及互联网行业。最典型的运用是超市的购物篮分析,挖掘一般顾客在购买X產品的同时还会购买其他什么产品,于是制定相应营销策略,进行捆绑销售,增加销售量。电子购物网站也使用关联法对相关数据进行分析。一些购物网站使用关联规则设置相应的交叉销售,也就是使得购买某种商品的顾客会看到相关的另外一种商品的广告。
三、精准营销数据中的定量分析
时间序列预测:时间序列就是一个变量在一定时间段内不同时间点上观测值的集合。这些观测值是按时间顺序排列的,如按年、季度、月、周等统计的商品销量、销售额或库存量。通过时间序列观测值的变化规律与趋势或因变量观测值与自变量观测值之间的函数依赖关系,来推算未来预测值的方法。
移动平均模型:利用平均使各个时间点上的观测值中的随机因素互相抵消掉,以获得关于稳定水平的预测,将包括当前时刻在内的N各时间点上的观测值的平均值作为对于下一时刻的预测值。
例:某商品在过去12周的销售数量以用移动平均预测模型进行预测的数据如下表:
折线图如下:
按照移动平均预测模型,某商品第13周销量预测值为20.25。
指数平滑模型:也称为改进的移动平均预测模型,是在移动平均预测模型的基础上,将计算平均值时对于不同时期观测值的权数设置的不同,近期的全数较大,远期的权数较小。
将上例按照指数平滑法进行建模,阻尼系数取0.3时的模拟出第13周销量预测值为20.8,如下图:
趋势预测法:对于含有线性趋势成分的时间序列,可以将预测变量在每一个时期的值和其对应时期之间的线性依赖关系表示出来,确定相关系数(直线方程的斜率和截距)后,可得到直线趋势方程。以此可求得每个预测区间的预测值。
季节指数法:对于既含有线性趋势成分又含有季节成分的时间序列,对其成分进行分解,分解出趋势成分、季节成分与不规则成分的乘积。由于不规则成分的不可预测性,预测值可表示为趋势成分与季节成分的乘积。
贝叶斯统计预测方法:一种以动态模型为研究对象的时间序列预测方法。在做统计推断时,一般由先验信息加总体分布信息加样本信息,从而推断出后验分布信息。贝叶斯模型不仅利用了前期的数据信息,还加入了决策者的经验和判断等信息,将客观因素和主观因素结合起来,使得预测结果更加贴合实际。
马尔可夫分析法:又称马尔可夫转移矩阵法,是指在马尔可夫过程的假设前提下,通过分析随机变量的现时变化情况来预测这些变量未来变化情况的一种预测方法。这里以一个灰色马尔可夫预测模型拟合为例介绍马尔可夫分析法的运用。
(一)马尔可夫过程概念介绍
人们在实际生活中常遇到具有下述特性的随机过程:在已知它目前的状态(现在)的条件下,它未来的演变(将来)不依赖于它以往的演变(过去)。这种已知“现在”的条件下,“将来”与“过去”独立的特性称为马尔可夫性,具有这种性质的随机过程叫做马尔可夫过程。endprint
如荷花池一只青蛙的跳跃是马尔可夫过程的一个形象化例子。青蛙依照它瞬间或起的念头从一片荷叶上跳到另一片荷叶上,因为青蛙是没有记忆的,当所处的位置已知时,它下一步跳往何处和它以往走过的路径无关。如果将荷叶编号并用X0,X1,X2,…分别表示青蛙最初处的荷叶号码及第一次、第二次、……跳跃后所处的荷叶号码,那么{Xn,n≥0} 就是马尔可夫过程。液体中微粒所作的布朗运动,传染病受感染的人数,原子核中一自由电子在电子层中的跳跃,人口增长过程等等都可视为马尔可夫过程。还有些过程(例如某些遗传过程)在一定条件下可以用马尔可夫过程来近似。
以上述荷花池中的青蛙跳跃过程为例,荷叶号码的集合E叫做状态空间,马尔可夫性表示为:对任意的0≤n1
P[x(n)=in|x(0)=i0,x(1)=i1,...,x(n-1)=i(n-1)]=P[x(n)=in|x(n-1)=i(n-1)](1)
只要其中条件概率有意义。一般地,设E={0,1,…,M}(M为正整数)或E={0,1,2,…},Xn,n≥0为取值于E的随机变量序列,如果(1)式成立,则称{,n≥0}为马尔可夫链。
(二)灰色马尔可夫预测模型
传统的灰色模型是利用微分方程给出系统生成序列长期、持续的变化过程,这一过程通过生成序列转换得到,生成序列指减弱原序列随机性后的序列,还原生成序列就得到系统趋势作用。GM(1,1)是灰色模型中最常见的,两个参数1分别表示系统含有一个变量,使用一阶微分方程模型。其建模方式如下:
假设有非负的原始序列将其累加得到生成序列,其中,k=1,…,n,利用可建立下列形式的方程:
这是一个一阶变量的一阶微分方程,其中a和u是待识别的灰色参数,按最小二乘法求解得到:
其中
再由累减可得到原始序列的变化规律,即有
以上就是GM(1,1)模型的基本思路和公式。
对于利用GM(1,1)模型得到的预测结果,我们可以根据马尔可夫链的方法获得GM(1,1)模型在已知序列里的偏差规律(即偏差的状态转移矩阵),并且依照此规律对GM(1,1)模型结果进行修正,由GM(1,1)模型结果的一个预测数值,修正成为区间和概率组成的预测范围,增加预测的可信度。这就是马尔可夫预测方法的基本思路。
(三)实例分析
本文选取2003至2016年的某商品的销售数据作为原始数据,见下表。
由此计算得到商品销售总额的累加生成序列:
={1.2081,2.9484,4.986,7.3716,10.1647,13.4349,17.2637,21.7465,26.995,33.14,40.3346,48.7581,58.6204,70.1673}
進一步可以得到
由灰色马尔可夫预测模型原理可以得到
于是可以得到某商品销售总额的灰色预测模型:
由上式可以计算出2004-2016年某商品销售总额的预测值,见下表。
由表3我们可以得到预测值与实际图的比较图,见下图:
下面对于灰色预测结果进行马尔可夫链改进。
首先,根据马尔可夫链分析方法的应用经验和实际情况,将预测值与实际值的偏差程度划分为5种状态。见下表:
按照上面分级标准,各年份商品销售总额预测值与实际值偏差所处的状态如表3所示。可见这13年没有出现状态4和状态5。
计算出灰色预测结果马尔可夫状态转移矩阵:
根据马尔可夫链预测原理以及上述灰色预测模型,2012年到2015年销售总额预测结果分别为6.1450,7.1946,8.4235和9.8623(千亿元),且状态向量均为,最大概率区间计算情况见下表:
如表5所示,我们建立的灰色预测模型在2012至2015年的预测值均落在最大概率区间内,且这些区间包含实际值,因此认为该模型拟合状态良好。
根据马尔可夫预测原理,2017年的预测状态向量为(0 0.4921 0.5079),2017年销售额预计落在在(11.48972,12.84165)区间和(12.84165,14.19695)区间的概率均约为50%。也就是说,根据此预测模型,2017年销售额预计会超过1.1亿元,并低于1.4亿元。
以上运用灰色预测模型和马尔可夫链预测相结合的方法,为营销预测提供了一种全新的思路。本方法既考虑了从时间序列中挖掘数据的演变规律,又通过状态转移概率矩阵反映数据的随机波动,具有严密性和科学性。此模型原理简单易懂,计算简便,可以随着时间的变化将预测对象的新的实际值加入模型中,达到修正模型,提高预测精度的目的。
在市场竞争日益激烈的大环境下,营销方式正在发生意义深远的变革,从传统的、大众的、粗糙的转向深度的、细分的、精准的模式转变。这种转变要求营销工作要建立在在深度数据分析挖掘的基础上,因此,营销数据的统计与分析,必将在精准营销领域中发挥强大的作用。
参考文献:
[1]曾志生,陈桂玲.精准营销:如何精准的找到客户并实现有效销售[M].北京:中国纺织出版社,2007.
[2]伍青生.精准营销的思想和方法[J].市场营销导刊,2006.
[3]刘征宇.精准营销方法研究[J].上海交通大学学报,2007.
[4]韩家炜,数据挖掘:概念与技术[M],北京:机械工业出版社,2006.
[5]丁建石.基于数据挖掘的精准营销应用研究[J].商业时代,2007.