浅析多元统计分析及相关应用
2017-03-01王铎
王铎
【摘 要】多元统计分析被广泛应用在各学科领域当中,是问题研究必不可少的手段。本文简单介绍多元统计分析的发展历程,并简述了较为常用的4种多元统计分析方法。同时,本文以安徽省的R&D投入和GDP数据为研究变量,采用多元回归方法,对3个变量进行了单位根检验、协整分析和回归估计。结果表明,R&D投入与GDP之间存在长期协整关系,并且是正相关。这与大多数文献资料研究结论相符合。
【关键词】多元统计分析;多元线性回归;ADF检验;协整分析
随着社会经济的进步发展,学者发现利用一元回归分析已经满足不了实证分析的要求。这是因为研究问题除了受到一维变量的影响,也会受到其他因素的作用。尤其是在延长样本数据时期、增大样本容量、引入其他影响因素之后,数据内部之间的规律难以依靠一元回归挖掘出来。多元统计分析开始被广泛应用在经济、管理、农业、社会、生物等研究领域。
一、多元统计分析的发展
纵观多元统计分析的发展进程,二位正态总体的分析方法虽然出现于19世纪,但多元统计分析的正式兴起却在20世纪。20世纪30年代,费希尔、霍特林等人为多元统计分析研究奠定理论基础。进入40年代,心理、教育、生物等领域开始将多元统计分析作为研究手段分析问题。但由于计算工作量较为繁杂和时局的影响,多元统计分析并未广发应用在其他领域,得到更进一步的发展。50年代后,计算机的出现为其发展提供技术便利,相关理论也得以提出。时至今日,诸如SPSS、R、SAS、EVIEWS等多种计量软件使得多元统计分析实际应用在各学科领域。
二、多元统计分析的基本方法
1.多元回归分析
多元回归分析的基本原理与一元线性回归分析相似,只不过是自变量为两个或两个以上。通过多元回归分析,几个变量之间是否存在的特定相关关系以及是何种关系将得到验证。在实证研究中,则通常会引入控制变量,通过控制一些变量的取值,可以更好研究主要自变量影响程度,在此基础上可以进行因素分析,厘清各因素间的相互关系。
2.主成分分析
与多元线性回归法不同,主成分分析适用于更多个指标的数据处理。在建立多层次的指标体系后,将多个指标转化为保留原有数据大部分信息的几个综合指标,并利用这几个综合指标来分析。将复杂的指标数据进行压缩,变量之间不存在相关性,压缩后得到的指标要有代表性,不能损失太多原始信息,能够准确解释研究问题的内在关系。分析步骤主要包括以下几步:標准化处理原始数据矩阵;基于标准化数据矩阵建立标准化相关系数矩阵;计算特征根、特征向量及标准正交化特征向量;依据结果确定主成分个数;计算主成分和主成分值;计算研究样本的得分值并加以评价。
3.因子分析
与主成分分析法相似,因子分析也是对多个变量的降维处理。通过研究相关阵或协方差阵的内部关系,提取代表性的因子,以因子为新的解释变量,计算得出个样本的因子得分,并加以排序、评价分析。与主成分分析方法处理程序不同,因子分析在得到特征向量等数据后,需要确定公共因子个数,并计算因子载荷矩阵和各样本的因子得分、总因子得分。
4.聚类分析
聚类分析也是实证分析当中常用的一种研究方法。它是将数据按照一定的标准将以分类,同类别下的数据之间差异比较下,不同类别之间的数据则有较大的差异。具体的分析方法包括层次聚类法、非层次聚类法、智能聚类法等。
三、多元回归分析的应用
本文选择多元线性回归法加以实际应用。本文采用时间序列方法分析安徽省R&D投入与经济增长之间的关系。安徽省GDP绝对值取自2001-2015年的《中国统计年鉴》,R&D经费与R&D人员都则取自中国科技统计网站的中国科技统计数据(2001-2015年)。为了消除异方差的影响,将三变量对数化处理。同时,对数化的数据也能够反映变量之间的弹性系数,不改变变量之间的协整关系。GERD代表R&D投入经费,GRP代表R&D人员,GDP代表经济增长。
1.单位根检验
通过EVIEWS6.0软件估计,结果显示,原序列lnGDP、lnGERD、lnGRP是非平稳时间序列。对三者进行一阶差分后,D(lnGDP)、D(lnGRP)、D(lnGERD)通过ADF检验,拒绝原假设,即差分后的序列是平稳的。因此,lnGDP、lnGRP、 lnGERD是一阶单整的。
2.协整分析
由ADF检验可知,lnGDP、lnGRP、lnGERD符合协整分析的条件。本文采用回归残差的协整检验方法。检验结果显示,残差序列在1%的显著性水平下拒绝原假设,可以确定残差序列是平稳的,变量之间存在长期协整关系。
3.回归分析
回归方程结果为:lnGDP = 7.6579lnGERD + 0.3510 lnGRP +C。模型可决系数为0.8767,接近于1,且F值也通过显著性检验,说明回归方程的拟合效果较好且变量之间的线性关系显著。
参考文献:
[1]左瑞琼.多元统计分析方法介绍及在经济中的应用[J].时代经贸,2007(9):27-28.
[2]乌冉.多元统计分析介绍及其在一些方面的应用[J].百科论丛,2010(4):349-350.
[3]姜波.多元统计分析方法在实际问题中的应用[J].沈阳师范大学学报(自然科学版),2012(4):465-467.
[4] 杨锦忠,宋希云.多元统计分析及其在烟草学中的应用[J].中国烟草学报, 2014(5):134-137.
[5]邓雪,江璐瑶,孙全德.多元统计分析方法的理论研究及应用分析[J].数学的实践与认识,2016(4):190-197.