APP下载

大数据下消费者网购影响因素的因子分析模型

2017-04-27简国明黄文莉王尚九黄冰娜周碧江

关键词:服务态度网购方差

简国明,黄文莉,王尚九,黄冰娜,周碧江

(韶关学院数学与统计学院,广东韶关512005)

大数据下消费者网购影响因素的因子分析模型

简国明,黄文莉,王尚九,黄冰娜,周碧江

(韶关学院数学与统计学院,广东韶关512005)

利用八爪鱼采集器采集淘宝网站某款产品销售的指标数据来研究消费者网购的影响因素。首先,经过数据预处理后得到776家店铺的数据,共包含8个主要指标。然后,应用统计方法,建立了含有8指标的因子分析模型,运用SPSS软件进行求解,得出了相应的影响因素的相关结论。因子分析模型的结果显示,大数据下消费者网购影响因素指标可归结为:服务质量、人气指数、安全保障及价格。

大数据;消费者网购;影响因素;因子分析

近些年,随着我国网络购物市场的飞速兴起,网络购物的客户规模也在不断壮大[1]。中国互联网络信息中心(CNNIC)发布的《2015年中国网络购物市场研究报告》显示:截至2015年12月,我国网络购物用户规模达4.13亿,同比增加5 183万,增长率为14.3%,高于6.1%的网民数量增长率[2]。在“大数据”炒得火热的时代,网购现象也变得越发普及和流行,影响消费者网购的因素有很多,本文将针对淘宝网上某款产品的相关指标数据,通过建立因子分析模型,找到当代消费者网购的影响因子。

1 数据的获取与处理

本文以淘宝网上销售的同一规格的天堂伞作为研究对象,参考文献[3]所用指标,从淘宝网页面上可获取下列关于网购的相关信息:淘宝价、淘金币抵价、快递费、描述相符(0~5分)、服务态度(0~5分)、物流速度(0~5分)、收藏数、好评数、卖家信用积分、保证金。首先,在淘宝网上共搜索到3 970家店铺,然后,利用八爪鱼采集器采集上述10个指标的数据,最终共采集到57 428个顾客购买情况的信息。将其导入Excel中,删除缺失值、极端值等;为避免数据受到多重共线性的影响,将价格表示为:价格=淘宝价+快递费-淘金币抵价;对同一卖家不同顾客的购买情况做归一化处理,最终得到776家店铺含有8指标的有效数据,部分数据如表1所示。

表1 776家店铺含8指标的部分数据列表

2 网购影响因素的因子分析模型

因子分析[4]以最少的信息丢失为准则,将原有变量用较少且相互独立的公共因子反映,找出具有命名解释性的公共因子,最终以因子得分线性表示各变量与因子间的关系。

2.1 因子分析的前提条件

首先,需确定上述指标之间是否具有相关关系,相关关系强说明适合进行因子分析。此处采用KMO和巴特利特球度检验[5]对各指标的测量项目进行结构效度分析,表2为SPSS 21软件的输出结果。

表2 KMO和Bartlett球度检验

由该检验结果可知:KMO检验值为0.748,显著性检验的P值为0.000<0.05,说明此研究数据具有比较好的构建效度,适合进行因子分析。

2.2 主成分法求解因子载荷阵

首先对各变量数据进行标准化处理,计算标准化数据的相关系数矩阵R;然后求相关系数矩阵R的特征值λ1≥λ2≥…≥λp≥0及其相应的特征向量γ1,γ2…,γp;根据R的特征根及特征向量计算求出因子载荷阵[6],其中p代表指标变量的个数。但由于提取的公因子个数m一定小于原有的指标个数p,因此仅仅提取前面m个特征根与其对应的特征向量,算出因子载荷阵。

2.3 根据累计贡献率确定因子数

2.4 最大方差法旋转因子

为了更好地解释上述2.3抽取出的公因子的实际意义,使用正交方差最大旋转法[7],使得旋转后的因子载荷阵B*=BT的每列元素的方差之和达到最大,也使得每一个因子都具有鲜明的实际意义。

2.5 回归法计算因子得分

因子得分是因子分析的终极体现,是原有变量线性组合的结果,即用原来p个变量来描述因子,根据回归法计算第j个因子的因子得分可表示为:Fj=βj1X1+…+βjpXp(j=1,…,m),其中βj1,…,βjp分别是第j个因子和第1,…,p个原有变量的因子值系数。

3 因子分析模型的求解及讨论

根据建立的因子分析模型,运用SPSS软件[8]求解得到的系列结果如表3所示。

表3 因子解释各原变量总方差的情况

续表

根据表3可知,当提取前4个因子后,解释原有8个变量的累积方差贡献率达到85.322%((2.613+ 2.192+1.059+0.963)÷8×100%=85.322%),说明从总体上看原有变量的信息丢失比较少,运用因子分析的效果较理想。

3.1 采用正交方差最大旋转法得到旋转后的因子载荷矩阵

使用最大方差法对因子载荷阵旋转过后使因子更具有解释性,旋转后的因子载荷矩阵及成分得分系数矩阵如表4所示。从表4左侧显示的各原有变量在4个因子上的载荷可知:服务态度、物流速度、描述相符这三个变量在第1个因子的载荷均大于0.9,因此可命名第1个因子为“服务质量”因子;收藏数、好评数这两个变量在第2个因子的载荷均大于0.9,因此可命名第2个因子为“人气指数”因子;卖家信用积分、保证金这两个变量在第3个因子的载荷均比较大,因此可命名第3个因子为“安全保障”因子;由淘宝价减去优惠价再加上快递费得到的价格在第4个因子上的载荷最高,因此命名第4个因子为“价格”因子。

表4 旋转后的因子载荷矩阵及成分得分系数矩阵

3.2 回归法计算因子得分

根据表4右侧可写出下列因子得分函数:

F1=0.353描述相符+0.364服务态度+0.362物流速度-0.006收藏数-0.011好评数+0.001卖家信用积分+0.018价格-0.002保证金。

F2=-0.013描述相符-0.006服务态度-0.002物流速度+0.477收藏数+0.498好评数+0.174卖家信用积分+0.046价格-0.154保证金。

F3=-0.013描述相符+0.013服务态度+0.000物流速度-0.067收藏数-0.159好评数-0.407卖家信用积分+0.037价格+0.833保证金。

F4=-0.017描述相符+0.000服务态度+0.051物流速度+0.055收藏数+0.037好评数-0.058卖家信用积分+0.998价格+0.070保证金。

由因子得分函数可知,影响消费者网购的所有因素指标可归纳为4类:服务质量、人气指数、安全保障及价格。淘宝店铺的竞争力也恰恰由这4个因素构成,要想吸引顾客,提升店铺的影响力,就必须在保证质量的基础上提升服务的优越性、制定价格的合理性和确保安全的保障性,以此增加商品人气,在同类商品中取得优势。

4 结语

本文在抓取了众多淘宝页面显示的指标数据并对所有数据进行预处理后,建立因子分析模型,将原有的指标浓缩成“服务质量”、“人气指数”、“安全保障”和“价格”这4个具有命名解释性的因子,各因子间相互独立并且能够反映原有变量绝大部分的信息,最终确认了影响消费者网购的因素指标。本文的模型对于讨论网购对传统零售业的影响因素、消费者网购满意度等方面的研究也具有一定的借鉴作用和参考价值。

[1]郭崇.基于大数据分析的网购客户忠诚度建模仿真[J].计算机仿真,2015,32(10):239-242.

[2]中国互联网络信息中心.2015年中国网络购物市场研究报告[EB/OL].[2016-07-07].http://cnnic.cn/gywm/xwzx/rdxw/2 016/201606/P020160721576734671513.pdf.

[3]时文静,朱文倩,王美玲,等.影响网络购物商品销量的因素研究——基于SEM的淘宝网数据分析[C]//2015年(第四届)全国大学生统计建模大赛论文集.北京:中国统计教育学会,2015.

[4]胡良平.SAS高级统计分析教程[M].2版.北京:电子工业出版社,2016.

[5]董超.西安大学生网络团购满意度影响因素实证研究[J].电子商务评论,2012,1(2):7-10.

[6]谢智聪.运用因子载荷阵分组变量的新主成分法及其应用[J].统计与决策,2008(12):19-22.

[7]刘智敏.不确定度评定的一种方法——最大方差法[J].宇航计测技术,1998,18(1):24-35.

[8]薛薇.SPSS统计分析方法及运用[M].3版.北京:电子工业出版社,2013.

【责任编辑:王桂珍 foshanwgzh@163.com】

Factor analysis model of influencing factors of consumers’online shopping under big data

JIANGuo-ming,HUANGWen-li,WANGShang-jiu, HUANGBing-na,ZHOUBi-jiang
(School ofMathematics and Statistics,Shaoguan University,Shaoguan 512005,China)

In this article,the influence factors of consumer online shopping were analyzed with product sales data from Taobao website collected by the octopus data collector.First,after data preprocessing,we got the data of 776 stores,which including 8 main indicators.Then,we set up a factor analysis model with 8 parameters and solved byusingSPSS software which drawthe correspondingconclusion related factors.Factor analysis results of the model showthat the data under the consumer online shopping factors can be summarized as:service quality, popularityindex,securityand price.

bigdata;online shopping;influence factors;factor analysis

F713.36

A

1008-0171(2017)02-0001-04

2016-12-01

广东大学生科技创新培育专项资金(2016b0455);广东省本科高校教学质量与教学改革工程项目(粤教高函〔2014〕97号)

简国明(1958-),男,江西南昌人,韶关学院教授。

猜你喜欢

服务态度网购方差
教老妈网购
概率与统计(2)——离散型随机变量的期望与方差
门诊分诊服务态度与正确率对护患关系的影响
网购寒假作业
网购寒假作业
方差越小越好?
计算方差用哪个公式
网购那些事儿
方差生活秀
做合格党员必须增强服务意识、服务态度和服务效果