基于因子分析的深圳市主要工业产品产量逐年变化趋势研究
2017-04-15闫登崧
闫登崧
(重庆交通大学经济与管理学院 重庆 400074)
基于因子分析的深圳市主要工业产品产量逐年变化趋势研究
闫登崧
(重庆交通大学经济与管理学院 重庆 400074)
改革开放以来,深圳已由一个当年的小渔村发展成了现在的国家重要的经济中心城市,经济总量长期位列中国大陆城市第四位,是中国大陆经济效益最好的城市之一。特别是进入新世纪以来,经济更是快速发展,与此同时,相关的工业产品产量也是逐年变化,从相关的数据也能看出其中的一些发展趋势,但不是很准确。为此,简化工业产品种类数,用因子分析法对影响指标进行降维,从而,就能更加容易地进行变化趋势的分析研究。
经济;工业产品;发展;因子分析
一、相关背景
深圳地处珠江三角洲前沿,是连接香港和中国内地的纽带和桥梁,是华南沿海重要的交通枢纽。深圳在中国的制度创新、扩大开放等方面承担着试验和示范的重要使命。在此过程中,工业对深圳市的经济发展贡献是十分巨大的,但从深圳市近十几年的工业发展情况来看对其经济发展的贡献,又是怎样一个发展趋势,这就是本文将要讨论的内容。
二、数据选择
此论文选择了自1998年至2013年深圳市工业产品:自来水生产量、发电量、小麦粉、啤酒、化学纤维为、布、印染布、服装、塑料制品、铝材、两轮脚踏自信车、家用电风扇产量的情况,现在需要综合各方面的因素确定在这16年当中某一年或某几年的几个年份群的发展情况。①
三、分析过程
(一)因子分析适合性检验。假设自来水生产量为X1,发电量为X2,小麦粉为X3,啤酒为X4,化学纤维为X5,布为X6,印染布为X7,服装为X8,塑料制品为X9,铝材为X10,两轮脚踏自信车为X11,家用电风扇为X12。
首先考察收集到的这12个变量之间是否存在线性关系,即是否适合采用因子分析的方式来进行因子的提取。
从结果可以看出,各变量之间呈现较强的线性关系,能够提取公共因子,适合进行因子分析。
(二)提取因子。由操作结果可写出因子分析模型:
自来水产量=0.969f1+0.003f2+0.213f3
发电量=0.960f1-0.085f2+0.157f3
啤酒=0.944f1+0.023f2+0.170f3
家用电风扇=0.926f1-0.243f2-0.055f3
印染布=-0.918f1+0.172f2+0.183f3
塑料制品=0.915f1+0.172f2-0.250f3
化学纤维=-0.880f1-0.021f2+0.348f3
小麦粉=0.670f1-0.374f2+0.366f3
铝材=0.339f1+0.832f2+0.046f3
服装=0.107f1+0.688f2-0.621f3
两轮脚踏自行车=0.609f1+0.622f2+0.385f3
布=-0.376f1+0.589f2+0.511f3
从软件分析结果可看出,12个变量在第1个因子上的荷载都很高,意味着他们与第1个因子的相关程度高,第1个因子很重要;第2个因子上的荷载相对第1个要小些说明重要性不如第1个,而第3个则更小
(三)因子命名解释。为了使因子具有命名解释性,采用方差最大法对因子荷载矩阵实施正交旋转。
结果显示,发电量、家用电风扇、自来水生产量、印染布、啤酒、塑料制品、化学纤维、小麦粉在第1个因子上有较高的荷载,那么第1个因子主要解释了这几个变量,可解释为必须消费产品;两轮脚踏自行车、铝材、布在第2个因子上有较高的荷载,那么第2个因子主要解释了这几个变量,可解释为中端消费产品;服装在第3个因子上的荷载较大,那么第3个因子主要解释了这个变量,可解释为一般消费产品。这与旋转前相比,因子含义就较为清晰。
继续进行检验,3个因子没有线性相关性,也就实现了因子分析的设计目标。
(四)计算因子得分。采用回归法估计因子得分系数,并输出因子得分系数。
F1=0.130X1+0.136X2+0.115X3+0.125X4-0.126X5-0.106X6-0.143X7-0.027X8+0.117X9-0.017X10+0.030X11+0.147X12
F1=0.126X1+0.066X2+0.060X3+0.111X4+0.147X5+0.455X6+0.133X7-0.058X8-0.043X9+0.327X10+0.425X11-0.096X12
F1=-0.122X1-0.112X2-0.328X3-0.089X4-0.236X5-0.160X6-0.078X7+0.587X8+0.217X9+0.210X10-0.059X11-0.023X12
在计算两个因子得分变量的变量值时,化学纤维和布的权重较高,但方向恰好相反,这与因子的实际含义是相吻合的。
四、结果解释
现在利用因子得分变量对1998到2013各年份进行对比研究。
首先绘制三个因子得分变量的3-D分布散点图。
观察散点图可看出2012年的第1个因子和第3个因子得分都是最高,说明2012年的必需消费产品和一般消费品都相比其他年份高,2004年的第2个因子得分最高,说明2004年的中端消费产品最高。这其实反映在现实生活中也是很容易解释的,由于进入新世纪后深圳市的发展使社会上大多数劳动人民都差不多享受到了福利,中端产品的需求也日益加大,这就进一步促进了中端产品的生产。2004年之后的发展过程中,经济持续增长,直到2008年全球金融危机,使得人们对一些高级消费品的追逐趋势放缓,从图中也不难看出2008年的3个因子得分都较低,其实还不算最低,由于经济危机对我国的影响的“潜伏期”较长,这种低糜期一致持续到2012才真正缓过气来。
现在,对各年的各指标综合评价。这里采用计算因子加权总分的方法,其中权重的确定是关键。通常的做法是根据实际情况由专家组研究来确定。这里,仅从单纯的数量上考虑,以三个因子的方差贡献率为权数。于是计算公式为F=0.58433F1+0.15986F2+0.13617F3。
五、结语
深圳市城市发展水平日益提高,这样工业产品的产量必然会有一个健康、稳定的发展趋势的。我国政府出台的各种保质量、稳增长措施,对与各个城市的经济结构优化是非常有利的,这样一来经济的持续健康发展是一个必然的趋势。所以,在我国的政策的大环境下,以及人们消费观念的逐渐变化过程中,各种主要工业产品的产量也会逐渐趋于平稳。尽管在进入新世纪最初的几年工业产品产量极不稳定,但在2010年之后就逐渐趋于平稳。
运用因子分析法进行工业产品产量各年度的变化趋势分析,只是一个初步的评价,想要更加准确地进行分析,可能还要结合其他分析方法一起进行。比如在因子分析之前可以首先对各年的工业产品产量做回归分析,这样的分析结果会更加完美。
【注释】
①数据来源:深圳统计年鉴2014。
[1]高惠璇.应用多元统计分析[M].北京大学出版社,2005.
[2]薛薇.SPSS统计分析方法及应用[M].电子工业出版社,2009.
[3]朱建平.应用多元统计分析[M].科学出版社,2012.