针织塑身内衣购买意愿预测模型的比较研究
2013-09-17王鑫,郭晨,李敏,b
王 鑫,郭 晨,李 敏,b
(东华大学a.服装和艺术设计学院;b.现代服装设计与技术教育部重点实验室,上海 200051)
针织塑身内衣购买意愿预测模型的比较研究
王 鑫a,郭 晨a,李 敏a,b
(东华大学a.服装和艺术设计学院;b.现代服装设计与技术教育部重点实验室,上海 200051)
通过对292名女性消费者进行针织塑身内衣购买意愿的问卷调查,得到影响被调查者购买意愿的影响因素并确定了13个主要因素,之后分别建立Logistic回归模型和BP(back propagation)神经网络模型,利用SPSS和Matlab软件进行预测比较分析.结果显示,在预测被调查者对针织塑身内衣购买意愿上,Logistic回归模型的预测过程更快,BP神经网络模型比Logistic回归模型的预测精度高,预测效果好.
针织塑身内衣;购买意愿;Logistic回归;BP神经网络
现代女性消费者对自身身材的要求越来越高,希望通过塑身内衣呈现完美曲线,“塑型”已经成为女性穿着内衣的重要原因之一.因此,众多国际知名内衣品牌不断增加塑身内衣的产品比例,我国本土塑身内衣品牌也开始崛起[1].
消费者对企业产品或服务的购买是企业获得利润的源泉.通常,企业会花费大量资金用于市场调研,试图了解并预测顾客的购买行为.而对消费者是否会采取购买行为最直接的预测方法是了解他们采取该行为的倾向,即购买意愿.目前,国内外学者对购买意愿的研究主要集中在测算上,有学者开发了Choice Based模型测量顾客的购买意愿[2],也有学者用数据挖掘、人工神经网络等先进计算机技术进行购买意愿的研究[3].因此,以消费者购买意愿为出发点,通过借鉴和分析影响消费者购买意愿的影响因素,精确地预测消费者对塑身内衣的购买行为,会为企业带来更大的帮助.
本文针对针织塑身内衣产品,引入人工神经网络技术,建立被调查者对内衣购买意愿的预测模型,并与传统的Logistic回归模型进行预测比较.这一探索不仅丰富了人工神经网络技术在服装市场营销方面的研究,同时也为企业选择更好地了解消费者购买行为的方法做有益的探索.
1 研究架构及相关影响因素确定
1.1 针织塑身内衣的购买意愿理论假设
根据对针织塑身内衣产品特点、市场现状调研和感知特性理论(感知利得最大理论、感知风险最小理论)[4-5]及 计 划 行 为 理 论 的 研 究[6-7],本 文 提 出了消费者对针织塑身内衣购买意愿的研究模型假设:
购买意愿=f(人口统计变量、产品知识、感知利得、感知风险、风险态度、主观规范、使用态度)
模型由8个变量组成:购买意愿是因变量,使用态度、产品知识、感知利得、感知风险(包括身体安全风险、误购风险、社会心理风险、财务风险)、风险态度、人口统计变量(包括年龄、受教育程度、职业、个人月收入、婚姻状况、最大子女年龄、居住时间、身材类型)以及主观规范为自变量.
1.2 影响消费者购买意愿因素的确定
本文采用消费者调查问卷为测量工具.首先,通过文献查阅并结合本研究自身特点对问卷测量项目进行设计,之后通过小组讨论、专家访谈和预调研的方法对测量项目进行筛选和确认,最终整理得到正式调研问卷.限于篇幅,本文未列出调研问卷的具体内容,仅进行简单说明.问卷由4部分组成:(1)购买经验和品牌满意度的调研,其中,品牌各项表现满意度采用五分制李克特量表,其余题项为单选或多选题;(2)购买意愿影响因素调研,此部分问卷项目所有变量均采用五分制李克特量表方式,给予1至5分的评价,分数越低表示对该问项的熟悉/同意程度越低,反之,则熟悉/同意程度越高;(3)消费者对针织塑身内衣的个人喜好及消费计划调研,此部分问卷1~10题均为单选题、11题为重要性排序;(4)人口统计变量,此部分问题全为单选题.研究对象为年龄均在18周岁以上的女性消费者.采取网络问卷和实地调研问卷相结合的方式进行,实地调研区域为上海市各大代表性商圈.调研时间为2011年4月至5月,共发放问卷320份,回收有效问卷292份,有效问卷回收率为91.25%.
通过对样本进行相关性分析和单因素方差分析,最终确定与购买意愿相关的因素有产品知识、感知利得、身体安全风险、社会心理风险、主观规范、风险态度、使用态度、年龄、受教育程度、职业、婚姻、最大子女年龄、身材类型.
2 针织塑身内衣购买意愿的Logistic回归模型
购买意愿的预测是一个复杂的过程,涉及的因素很多.在购买决策过程中,各因素会通过相应的机制影响购买意愿结果的形成,这种影响很难准确地通过某种函数关系来描述,因此,本文尝试用传统方法Logistic回归模型来处理.
2.1 Logistic回归模型简述
Logistic回归模型是对定性变量的回归分析,根据变量取值的不同可以分为二元Logistic回归和多元Logistic回归[8].由于购买意愿的结果通常用“有”还是“没有”来表示,因此,本文采用二元Logistic回归模型.
用于Logistic回归模型检验的统计量一般有沃尔德统计量(Wald)、-2对数似然值(-2LL)、Cox和Snell的卡方、Nagelkerke的卡方及赫斯默检验.一般而言,Wald值越大或Sig.值(Wald检验的系数为0的显著性概率)越小,回归方程显著性越高.
2.2 回归模型的变量定义
Logistic回归模型需要较大样本量,且模型能解释的自变量个数与样本量有关.本文的样本量为292个,因变量(购买意愿)取值为1的样本数为134,经计算可知,模型中最多引入13个变量[9].因此,本文将通过数据分析所得影响购买意愿的13个主要因素作为变量,对被调查者针织塑身内衣的购买意愿进行回归分析.在进行回归分析前,需要先对各个变量进行定义,具体如表1所示.
表1 针织塑身内衣购买意愿的相关变量定义Table 1 The definition of variables related to the intention to purchase knitted slimming underwear
2.3 针织塑身内衣购买意愿的回归模型分析
在定义变量的基础上,本文利用SPSS 17.0统计软件进行回归模型分析.
初始模型(模型一)为不含任何自变量、自变量取值为0、只有常数项时的输出结果,如表2所示.当模型中不包含任何自变量时,模型把所有的案例都预测为样本数较多(即有意愿购买)的那一类,此时预测准确率为54.1%.
表2 模型一的分类预测表Table 2 The classified prediction table of model one
表3为单因变量分析结果.在将每个自变量放入模型之前,采用得分检验方法,检验该自变量与因变量之间有无联系,哪些自变量会显著改变模型的拟合优度.由表3可以看出,年龄、受教育程度、职业、婚姻状态、最大子女年龄、身材类型、产品知识、感知利得、主观规范、使用态度的Sig.值都小于0.05,说明加入这些自变量都会显著改变拟合优度,因此可以解释因变量,模型线性关系较为显著.
表3 单因变量分析结果Table 3 The univariate analysis results in the equation
本文采用Enter[10]的方法进行一步输入,生成新的模型(模型二),如表4所示.由表4可知,引入自变量后,模型预测准确率为80.8%.
表4 模型二分类预测表Table 4 The classified prediction table of model two
表5显示了对购买意愿进行二元逻辑回归后得到的自变量系数、标准差、Wald值、自由度、显著性概率Sig.值以及每增减一个变量引起的变动值.由表5可以看出,使用态度、主观规范、产品知识、受教育程度以及年龄的Wald统计值较大,且显著性概率Sig.都小于0.05,说明这5个自变量对购买意愿有较大的影响作用;其他自变量的Wald值较小,且显著性概率Sig.值偏大,说明对购买意愿的影响作用不明显.
因此,该回归模型为购买意愿=f(使用态度、主观规范、产品知识、受教育程度、年龄).
表5 针织塑身内衣购买意愿Logistic回归模型变量分析Table 5 The variables analysis in the Logistic regression model of the intention to purchase knitted slimming underwear
3 针织塑身内衣购买意愿的反向传播神经网络模型
由于购买意愿是带有模糊性质的感觉、感知概念,用传统的数学模型来描述存在着不够精确的问题,而人工神经网络在解决问题时不需要对象的精确模型,仅需要大量的原始数据,通过其强大的自学能力和结构的可变性,逐步适应外界环境各因素的作用,并挖掘出对象内在的因果关系,最终达到对购买意愿的模糊评判.
因此,本文选用最为广泛的BP(back propagation)神经网络模型来实现对消费者购买意愿的预测.
3.1 BP神经网络模型简述
BP神经网络属于前馈型神经网络,通常具有多层结构:输入层、隐含层与输出层[11].BP神经网络的基本工作原理是信号正向传播,误差反向传播.通过对网络权值和阈值的修正,使误差函数沿负梯度方向下降,直到网络输出的误差减少到可接受的程度,或进行到预先设定的学习次数为止.图1为单隐层BP神经网络模型.
图1 单隐层BP神经网络模型[11]Fig.1 BP neural network model with single hidden layer
3.2 针织塑身内衣购买意愿的BP神经网络架构
本文以计划行为理论[6]为基础,加入感知风险、感知利得等影响因素,提出对针织塑身内衣购买意愿有主要影响的因素包括:产品知识、感知利得、感知风险、使用态度、主观规范、风险态度及人口统计变量(如:年龄、受教育程度、职业、收入情况、身材类型等).因此,针织塑身内衣的购买意愿可以认为是一个多输入(影响因素)、单输出(购买意愿)的决策系统,其BP神经网络模型如图2所示.
3.3 基于Matlab实现BP神经网络预测
本预测模型选取只有一个隐含层的3层BP神经网络.隐含层神经元的传递函数为tnasig()函数,输出层神经元的传递函数为pureline()线性函数.为了提高收敛速度、降低误差,本文采用将动量法和自适应学习速率相结合的算法来改进BP算法.
图2 针织塑身内衣购买意愿的BP神经网络模型Fig.2 The BP neural network model of the intention to purchase knitted slimming underwear
采用上述的292份有效样本数据,以预测被调查者的购买意向.将292份数据分为训练集和测试集,编号为1~250的样本数据为训练集,编号为251~292的样本数据为测试集.
为使网络训练更加有效和训练速度更快,本文对调研数据进行了一定的预处理,使其映射到[-1,1]范围内[12].利用Matlab对BP神经网络预测模型进行创建并训练,步骤如下:
(1)清空当前Matalb空间中的变量和值,以免影响程序运行;
(2)导入数据到输入神经元矩阵变量中;
(3)导入数据到输出神经元矩阵变量中;
(4)建立训练网络.
训练结果如图3所示.
图3 神经网络的训练图示Fig.3 Neural network training
由图3可知,数据显示预测模型的精度为0.004 999 41,训练次数为9 784次.
根据以上BP神经网络,使用剩余的42组数据对所设计的网络进行测试,测试结果如表6所示.
表6 预测情况总结Table 6 Prediction summary
原来实际42份样本中愿意购买的样本数为18份,实际误差为18/42-17/42=0.0238,在合理接受的范围内,精确度97.6%,即前面建立的BP神经网络预测模型是可行的.
4 结 语
本文通过SPSS软件和Matlab软件分别建立了被调查者对针织塑身内衣购买意愿的Logistic回归模型和BP神经网络预测模型,通过比较得到下述结论.
(1)预测因素选择.Logistic回归方程需要的样本量较大,且模型能解释的自变量个数与样本量有关,本文根据样本量大小只能通过13个因素对其进行解释.而BP神经网络对输入层没有具体的要求,本文则通过最佳变量集合及人口统计变量作为输入层进行预测.前者需要对因素进行筛选,在筛选的过程中可能会删除一些影响程度不大但对购买意愿确实有影响的因素,后者只需通过主成分分析输入最佳变量集合即可,由此可见,利用BP神经网络建立预测模型,在预测因素的选择上更为科学.
(2)预测过程.Logistic回归模型运用SPSS中的Regression模块,可以很快地输出预测结果的相关表格,但是Matlab软件需要对数据进行归一化、网络层数和精度的设定等一系列设置,还需要一定的时间进行网络的训练和验证.从这个角度而言,Logistic回归在预测过程上更快,且在影响因素选择有限的情况下,选择Logistic回归预测较有优势.
(3)预测效果.Logistic回归模型在加入了各影响因素后预测准确率达80.8%,BP神经网络模型预测的准确率达97.6%,可见BP神经网络的预测能力和预测精度比Logistic回归模型高.
显然,Logistic回归模型虽然具有预测速度快、选择因素少的优点,但是在预测精度方面,却不如BP神经网络预测模型准确.该研究结果不仅是BP神经网络运用在服装市场营销方向的有效尝试,同时也为针织内衣企业了解消费者购买决策提供了一种科学的方法.
参 考 文 献
[1]董大海,杨毅,强勇.顾客购买行为倾向的测量及其管理意涵[J].预测,2005,24(3):19-24.
[2]王萍.运用数据挖掘技术预测客户购买倾向:方法与实证研究[J].情报科学,2005,23(5):738-741.
[3]吴亮锦,糜仲春.珠宝的知觉价值与购买意愿之研究[D].合肥:中国科学技术大学商学院,2006:103-117.
[4]刘文波,陈荣秋.顾客价值理论的概念模型[J].商场现代化,2008(556):47-48.
[5]TAYLOR J W.The role of risk in consumer behavior [J].Journal of Marketing,1974,38(2):54-60.
[6]青平,李崇光.消费者计划行为理论及其在市场营销中的应用[J].理论月刊,2005,2(2):78-80.
[7]余莉.计划行为理论的发展综述[J].科教文汇,2008,7(2):170.
[8]卢文岱.SPSS for Windows统计分析[M].北京:电子工业出版社,2002:34-42.
[9]马庆国.管理统计:数据获取、统计原理、SPSS工具与应用研究[M].北京:科学出版,2002:45-66.
[10]赖国毅,陈超.SPSS 17.0常用功能与应用实例精讲[M].北京:电子工业出版社,2010:225-229.
[11]韩力群.人工神经网络理论、设计及应用[M].北京:化学工业出版社,2002:13-27.
[12]董长虹.Matlab神经网络与应用[M].北京:国防工业出版社,2005:112-134.
Comparative Study on the Forecast ModeIs of the Customer's Intention to Purchase Knitted SIimming Underwear
WANGXina,GUOChena,LIMina,b
(a.Fashion and Art Design Institute;b.Key Laboratory of Clothing Design &Technology,Ministry of Education,Donghua University,Shanghai 200051,China)
Based on questionnaires of customer's intention to purchase knitted slimming underwear among 292 female consumers,13 factors that are significantly correlated with the purchase intention are identified.Then the logistic regression model and the BP (back propagation)neural network model are built up.By using SPSS software and Matlab software,the objective differences of the two models are analyzed.The comparing results show that,on the aspect of predicting the intention to purchase,the prediction process speed of Logistic regression model is faster.But the BP neural network model has a higher accuracy of prediction than the Logistic regression model.
knitted slimming underwear;purchase intention;Logistic regression;BP neural network
TS 941.19
A
1671-0444(2013)06-0824-06
2012-05-23
王 鑫(1985—),女,内蒙古呼和浩特人,硕士,研究方向为服装产业经济.E-mail:amandawang1011@126.com
李 敏(联系人),女,教授,E-mail:fidlimin@dhu.edu.cn