基于支持向量机的保健品消费者行为研究
2013-03-21郭伟
郭伟
内容摘要:近年来,保健品行业和消费者行为均为学术研究的热点。如何利用现有的技术和理论,实现数据仿真、构建行为模型并挖掘潜在消费群体将成为保健品行业的重要发展方向。支持向量机利用核函数,将低维的线性不可分转化为高维的线性可分(李国正,2003),而且决策函数计算的复杂性仅取决于支持向量的数目,所以有效避免了“维数灾难”,大大减少了计算量,具有广泛的应用前景。本文基于影响消费者行为的各种重要因素即性别、年龄、收入等,利用SVM模型,在小样本条件下对消费者行为进行分析预测,对保健品企业市场营销策略的制定具有现实的指导意义。
关键词:消费者行为 支持向量机 保健品 仿真技术
引言
消费者行为不仅是营销策略的基础,也是目前的热点研究话题之一。国外早在20世纪50年代就形成了以市场为导向的营销理念,消费者由“经济人”向“社会人”转变;20世纪80年代进入个性化营销(微量营销)阶段,开始了以研究消费者行为为主要任务的营销手段。消费者作为“社会人”,其行为除受自身属性的影响外,还受消费行为心理、市场前景和预期效果等的作用。因此,分析不同消费者的属性,总结影响它们的各种因素,揭示消费行为的变化规律,建立购买行为的分类模型,为今后研究消费者行为的回归问题奠定基础。
保健品行业发展
我国的保健品行业从20世纪80年代起步,经过二十多年的发展逐渐壮大(徐剑锋,2011),“保健”一词深入人心。保健品的发展趋势如表1所示。但就人均来看,我国的保健品消费仅为欧洲发达国家的30%左右,还有很大的增长空间。为了减缓竞争程度的加剧,开辟更广的消费途径,保健品进入了新的变革期。
SVM模型构建
支持向量机(SVM)(邓乃杨等,2004)基于VC维理论和结构风险最小化原理,通过核函数实现到高维空间的非线性映射,引入松弛变量和惩罚参数,具有良好的泛化能力或推广能力。其一般步骤如下:
第一步:给定训练集T={(x1,y1),…,(xl,yl)}∈(Rn×y)l,其中xi∈Rn,指样本的各属性指标;yi∈y={1,-1},i=1,…,l,代表分类标签。
第二步:选取合适的核函数K(x,x`)和惩罚参数C>0,引入非负的松弛变量ξi=(ξ1,…, ξl)T,其中ξi用来软化约束条件,获得广义最优超平面的原始最优化问题:
s.t. yi((w·xi)+b)≥1-ξi,i=1,…l,
ξi≥0,i=1,…l,C≥0.
第三步:引入Lagrange函数:,其中α=(α1,…αl)T∈Rl+为Lagrange乘子。
第四步:由KKT条件bL(w,b,α)=0,wL(w,b,α)=0和ξL(w,b,α)=0,得到原始问题的对偶问题即凸二次规划问题:,
,得解α*=(α*1,…α*l)T。
第五步:计算,选取位于开区间(0,c)中的α*的分量α*j,据此计算。
第六步:构造决策函数:,其中符号参数
实例仿真
(一)数据的预处理
原始数据通过问卷的形式获得,问卷主要针对消费者自身的属性(包括性别、年龄、学历、工作地、收入状况、职务类别、消费心理(张丽莉,2010)、市场看法等)展开,并将属性特征进行数据化处理(见表2)。
(二)SVM的训练与预测
发放调查问卷55份,收回52份,收回率94.5%;经过合理性选择,得到有效问卷46份,有效率约占收回问卷的88.5%,整理得到如表3所示的原始数据。
根据SVM进行分类预测的一般步骤,将表3中编号i=1…35的样本作为训练集,得到相对的最优参数、训练模型;i=36…41作为测试集,用来检测各参数和优化SVM模型;通过预测i=42…46的样本,得到如表4所示的预测结果。
(三)结果分析
本文借助计算机仿真技术,通过选取不同的核函数和合适的参数(李盼池等,2005)实现了对消费者行为的预测,而且预测准确度很高,直观展示了SVM在建立消费者行为模型上,具有一定的实用价值。在模拟实验中,选取RBF核函数会得到比使用其他核函数图像更加平滑,拟合效果更好,在以后的使用中应优先考虑。
结论
指标向量xi的多维性,造成了仿真实验中大量复杂的运算,这时选择合适的核函数至关重要。不同的核函数在解决不同的问题上发挥着不同的作用。本文通过对常见的四个核函数模拟分析,用其构成的SVM模型进行消费者行为预测。实验表明,SVM相对于其他分类算法在真实分类中的不理想效果,具有更高的准确度和实用性。
在此之前研究消费者行为方面的论文,多是针对单一属性的消费群体进行分析的。本文在小样本条件下,基于支持向量机原理,对影响购买行为的不同因素进行较为系统的分析归纳,并将已有的数据与现有的libsvm工具箱等计算机技术相结合进行SVM分类机仿真建模,得到决策函数,实现对单一消费者进行行为分析和预测,更直接地对保健品的生产、营销和定位提供指导,为企业有计划、有准备地进行营销活动提供理论支持。
尽管如此,本文也存在着一些潜在不足,如问卷的选项设置或有不尽合理的地方;问卷采用网上发布的方式,其真实性难以保证等。支持向量机在消费者行为方面的研究还属于发展阶段,很多工作有待于进一步研究:如何选择更合理的属性特征、更合适的核函数和参数,提高模型的泛化能力或推广能力;怎样建立高精度的消费者购买能力与属性特征的回归模型;如何将支持向量机算法与其他算法相结合,提高解决问题的速度和效率等。
综上所述,支持向量机通过选择适当的核函数和参数,在解决小样本、高维模式和非线性问题上具有很强的优势。在对消费者行为模式的研究中,得到的预测效果将比其他数学模型准确很多,具有广泛的实践价值。
参考文献:
1.李国正.支持向量机导论[M].电子工业出版社,2003
2.徐剑锋.保健品的消费者行为分析及其营销探讨[J].时代金融,2011(21)
3.邓乃杨,田英杰著.数据挖掘中的新方法:支持向量机[M].科学出版社,2004
4.张丽莉.消费心理学[M].清华大学出版社,2010
5.李盼池,许少华.支持向量机在模式识别中的核函数特性分析[J].计算机工程与设计,2005,26(2)
6.Ed Hopkins.Adaptive Learning Models of Consumer Behavior.Journal of Economic Behavior & Organization,2007,64(3-4)