基于PCA和BP网络的线上零售客户价值细分研究
2015-01-04林明辉
林明辉
(安徽新华学院商学院,安徽合肥 230031)
基于PCA和BP网络的线上零售客户价值细分研究
林明辉
(安徽新华学院商学院,安徽合肥 230031)
在互联网经济和大数据营销环境下,正确识别客户、细分客户是发掘潜在客户和维系老客户、提供精准营销和差异化营销的关键所在。本文通过PCA主成分分析,对指标进行降维处理,消除指标间信息重复,运用BP网络高度的非线性映射能力对客户价值细分指标进行收敛训练,最终得到拟合度较高的因子权重分布,为建立以消费行为为导向的在线零售客户价值模型提供参考和借鉴。
主成分分析;BP网络;客户价值细分
随着OTO经济和移动互联技术的发展,传统零售行业逐渐将重心转移到用户规模庞大、利润可观的电子商务市场。互联网环境下的消费者购买行为具有更大的隐蔽性和可诱导性,竞争对手的策略渗透交互干扰着消费者的决策过程。正确识别目标客户、有效引导消费行为成为企业降低营销成本、获得核心竞争优势的关键,差异化、个性化的产品和服务可以更好地满足消费者的需求,也会进一步巩固和提升客户的忠诚度。
客户价值细分是动态营销和精准营销的一个重要研究课题。在大数据环境下,企业面临着海量的用户消费数据和个性化行为过程记录。挖掘、识别、归类有效数据,实现客户价值细分是企业营销战略所要解决的首要问题。目前,国内外学者对客户价值细分的研究成果主要集中于某些种类的行业应用,如服装业、零售业、通信业等。汤海霞利用协整矩阵分析客户通信费用以及通话时长等数据的变化趋势,预测客户消费行为偏好和离网倾向[1]。Alex. Berson等人从客户关系管理的角度出发,利用决策树和聚类分析理论研究零售业客户细分[2]。蒙肖莲等利用数据挖掘技术建立基于个人信用体系的商业银行客户价值识别模型,为金融行业绑定优质客户、延伸客户价值贡献提供了判断标准。刘芝怡在基于改进K-means算法的RFAT客户细分研究中,将客户最近购买时间(Recency)、购买频次(Frequency)、平均购买额(Average Monetary)和购买倾向(Trend)作为客户价值细分变量,对零售业客户进行分类[3]。基于上述研究,本文从另一微观角度进一步研究特定消费群体(网上零售客户)的购买行为倾向。通过监测收集消费者使用互联网和移动数据终端进行网络购物的行为数据样本,使用PCA和BP神经网络构建基于网络消费行为指标的客户细分模型,并利用BP网络的自我学习效应重构网络消费群体价值分类体系。
1 基于网络消费行为的客户细分指标体系
消费行为是消费者在收集商品信息、甄选商品信息并最终作出购买决策过程中所表现出来的一系列行为。理性的消费者在单次消费中所表现出来的行为具有一定的独立性。通过学习效应,消费者的多次购买行为将趋向类同性[4]。实践证明,消费者在单位价值较低、品牌差异度较小的商品购买决策中,增加了购买经验,其交易成本和时间成本大大减少,并呈现出相似的购买决策行为特征。
为了收集完备的客户消费行为指标,我们通过头脑风暴的方式,进行多轮论证,最终形成了以3类标准、26评价维度组成的基础评价体系。在数据准确性方面,采用某大型消费类电子商务门户网站的实名注册用户信息及其后台数据为研究对象。3类评判标准分别为个人信息变量、消费决策变量、消费结果变量。
1.1 个人信息变量
该变量主要反映消费者的基本情况,例如性别、年龄、职业、教育程度、个人收入、网络消费支出等数据来源于注册会员的实名登记信息。
1.2 消费决策变量
该变量主要反映消费者在从进入网络零售界面(接触)到完成交易(退出)过程中产生由在消费动机驱动的购买决策行为,是潜在客户转变为现实客户的过程体现。例如,浏览目录级次、页面停留时间、注册绑定银行卡数、持卡类型等来源于网站数据中心的日志处理模块(Log Preprocessing)。
1.3 消费结果变量
该变量主要反映消费者交易支出情况以及购买后的行为,是顾客满意度和忠诚度的主要检测指标,例如日交易支出、累计交易支出、咨询投诉成本、推荐他人购买、分享购买信息等是客户价值测定的关键指标,来源于财务数据库以及售前支持和售后代理数据库。
表1 客户价值细分指标列表
2 基于BP网络和主成分分析的客户价值模型
神经网络是人工智能的方法之一,通过模拟生物神经网络功能来解决各个领域的实际问题,其中应用最广的是BP网络。BP(back propagation)网络是一种利用误差逆传播算法训练的多层次前馈神经网络。输入层初始化权值后,通过隐藏层正向传播信号,若输出层不能得到理想的结果,则通过隐藏层反馈误差信息,逐层修正连接权,经过多次的学习和训练,在信号交替传递过程中实现网络误差的最小化[5]。
PCA主成分分析法是指将给定的一组变量指标,通过线性变换转化为另一组综合度更高的变量指标簇的统计分析方法[6]。在变换转化过程中,根据指标对信息对象的解释程度,重新归类定义综合变量。实际上,综合变量是原来的线性组合。由于初始指标之间或多或少具有一定的相关性,在对实际问题的表述上存在信息重叠。从描述统计的角度看,主成分分析法能更加集中地概括出数据的本质特征,体现数据的内部结构。
BP神经网络也存在一些局限性,如收敛速度慢、初始权值的选择缺乏依据等。同时,本研究所采集的指标数据较多,指标之间存在一定的相关性,因此应利用PCA法对指标进行降维,将得到的主成分作为初始数据进行BP网络信号输入[7]。
3 在线零售客户价值评价指标体系的建立
3.1 PCA主成分分析
3.1.1 建立原始客户细分指标矩阵
3.1.2 指标矩阵进行标准化
在同一量纲规范内,均值和方差可以对数据指标进行标准化操作,而本研究的指标参数在量纲的横向比较上存在不一致,为了避免量纲不同而产生“伪偏和现象”,我们选用线性无量纲极值法对数据指标进行标准化处理[8]。
由此可得V=(vki)m×n.
3.1.3 数据归一化
归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为标准量,缩小量值差距,归一化的数值频动范围在[0,1]之间。
3.1.4 计算相关系数矩阵
3.1.5 计算特征值和特征向量确定主成分贡献率
3.2BP网络自适应算法
(1)初始化,对输入层至中间层的连接权值Wij(i=1,2,…,n;j=1,2,…,p)中间层至输出层的连接权值Vjt(j=1,2,…,p;t=1,2,…,p),以及中间层各个单元的输出阈值θj,输出层各个单元的输出阈值γj,赋予(0,1)内的随机值;
(2)提供p个学习样本X1X2…Xp,目标样本T1T2…Tp和输出值Y1Y2…Yp;
(3)计算输出,利用sigmoid函数,用输入层样本X1X2…Xp,输入层至中间层的连接权值Wij,中间层各个单元的输出阈值θj,计算中间层输出Sj;
(4)利用中间层输出Sj,中间层至输出层的连接权值Vjt,输出层各个单元的输出阈值γj,通过传递函数,计算输出层输出Lj;
(5)比较计算目标向量与实际输出的一般化误差,利用Lj,Vjt计算中间层各单元一般化误差,进而修正连接权Vjt和阈值γj,同理,利用中间层各单元一般化误差和修正后的Vjt,逆向修正连接权Wij和阈值θj;
4 实例分析
4.1 样本选取
本研究以某大型消费率电子商务门户网站的实名注册用户为调查对象。其中,客户个人特征信息来源于注册用户个人所填写的信息,顾客消费行为特征数据采集于后台数据监控中心,消费结果信息来源于交易数据中心。同时通过问卷调查,模拟部分情景进行数据测试,确保行为特征数据能代表客户的真实意愿,同时修正了部分不对称的信息。
4.2 主成分分析
选取100位零售业的专家和经常网购的消费者对上述细分指标进行评定,对部分非量值指标,如性别、教育程度、职业、支付方式等进行数值化预处理,对收入支出类数据用均值进行标准化处理。结合Matlab软件对客户消费行为数据进行主成分分析,其中累计方差贡献率超过85%的有5项(表2)。
表2 主成分特征值及方差贡献率
由表2可以看出,前5项主成分方差在总方差中占比90.662%,超过85%的判断标准,可以代表原来的26项细分指标,5项主成分形成的网络输入向量经过标准化后部分如表3所示。
表3 网络输入部分数据表
4.3 网络训练及学习结果
表4 网络训练误差表
由表4可知,神经元个数为14个时,网络误差值最小,建立5个输入节点、14个隐含节点、1个输出节点的BP网络。使用传递函数traingdx进行2593次学习,网络在精度0.001的误差范围内收敛且稳定(图1)。
图1 BP网络误差收敛曲线
4.4 结果检验
为了验证模型的准确性,使用同批次剩余的20个测试样本作为输入值,通过验证误差、训练误差和测试误差比较可以得到,模型的拟合性较高,适应性较好(图2)。
图2 验证误差、收敛误差、测试误差对比图
5 结语
消费者的购买行为影响因素众多,除了个人心理特征外,环境因素和营销刺激也会改变消费者的购买动机。为了将消费动机具象化,本研究从消费者行为结果出发构造消费者决策过程变量,运用主成分分析法提取典型的具有代表性的特征指标,作为区分不同客户属性的标识,降低了指标的复杂性,同时也优化了BP网络输入效率,提高了网络的学习效率和泛化能力。
通过研究,我们找出了在线零售客户价值细分的行为特征指标,通过因子权重分析,发现客户价值不仅表现为消费者当期消费为企业所带来的收入,还表现在客户潜在需求的满足程度、对企业的产品和服务的满意度和忠诚度、对企业形象和价值的传播和推广意愿。鉴于此,企业应该在促销优惠、会员制个性化管理等方面,进一步丰富用户购买过程的体验性,提高他们的购买满足感,增加用户粘性,进而为企业带来长远的价值。
[1]汤海霞.移动通信企业客户管理模型与方法研究[D].南京:东南大学,2014.
[2]Carrie M1Heilman,Kent Nakamoto.Pleasant Surprises: Consumer Response to Unexpected In-Store Coupons[J]. Journal of Marketing Research,2002(2):242-234.
[3]刘芝怡,陈功.基于改进 K-means 算法的RFAT客户细分研究[J].南京理工大学学报,2014(8):532-533.
[4]董长虹.Matlab神经网络与应用[M].北京:国防工业出版社,2007.
[5]刘朝华,梅强,蔡淑琴.基于RFM的客户分类及价值评价模型[J].技术经济与管理研究,2012(5):33-36.
[6]朱艳丽.基于消费行为的客户细分模型应用研究[D].成都:四川师范大学,2007.
[7]王克富.基于数据挖掘技术的AFH客户分类应用研究[J].技术经济与管理研究,2012(11):24-28.
[8]翁淑珍.网络消费行为与传统消费行为的比较分析[J].产业观察,2014(3):23-24.
2015-06-29
林明辉(1982-),男,福建福州人,安徽新华学院商学院讲师,硕士,从事客户关系及消费者行为研究。
F724.2
A
2095-7602(2015)12-0167-05