APP下载

苏州外资制造业增长因素分析模型*

2014-09-05程毛林

关键词:总产值科技人员因变量

程毛林

(苏州科技学院数理学院,江苏 苏州 215009)

苏州外资制造业增长因素分析模型*

程毛林

(苏州科技学院数理学院,江苏 苏州 215009)

苏州外资制造业经济增长受众多因素影响,各因素之间存在变量的多重相关现象,一般的多元回归分析自变量之间存在较严重的多重共线性.采用偏最小二乘回归对经济增长影响因素建模分析,这样最大限度地概括了原自变量系统中的数据信息,克服了多重共线性,同时自变量对因变量具有最大的解释能力,可靠性高.

苏州外资制造业;偏最小二乘回归;建模;因素分析

苏州外资制造业经济增长受众多因素影响,各因素对经济增长的影响大小不相同.在经济增长的系统建模分析与预测中,各因素之间存在变量的多重相关现象[1-2].目前,常用主成份分析法[3-4]来解决,先对解释变量进行综合,然后将综合后的新变量作为解释变量,再实施被解释变量(因变量)的回归分析.然而经验表明,在大多数情况下,这样进行回归分析的效果不尽人意,其根本原因是这样进行的自变量综合过程是完全独立于因变量进行的,完全没有考虑自变量对因变量的解释作用,导致模型的不可靠性.若采用岭回归,最大的困难就是偏倚系数的选择完全是凭判断的,无一般规律可循,这样可操作性不强.为此笔者对苏州外资制造业影响因素采用偏最小二乘回归分析[5-9]建模,即对自变量提取主成分并附加约束,即各因素X的主成份应与因变量Y尽可能相关.这样建模,最大限度地概括了原自变量系统中的数据信息,克服了多重共线性,同时自变量对因变量具有最大的解释能力,可靠性高.

1 偏最小二乘回归方法

设经济增长代表变量即因变量为Y,影响因素即自变量为X.在以下分析中,对自变量X=(X1,X2,...,XM)和因变量Y均采用标准化处理后的数据E0,F0.

首先寻找一个主成份t1=E0W1,‖W1‖=1使得t1与F0的协方差能达到最大,即max Cov(t1,F0)=Var(t1)×r(t1,F0)取最大值,其中Cov为协方差,Var为方差,r为相关系数.对中心化数据t1与F0有Cov(t1,F0)=t1,F0因此,在‖W1‖=1约束条件下,求最大值,由拉格朗日算法可求得

从而得到第一主成份t1=E0W1.

在得到t1后,就可以施行E0j对t1的回归,然后施行F0对t1的回归,即

E0j=P1jt1+E1jj=1,2,...,M,

F0=r1t1+F1.

2 苏州外资制造业经济增长实证分析

为深入研究苏州外资制造业发展的情况[10-11],探讨其增长方式,选取以外资制造业总产值(Y)作为经济发展的代表指标,以外资制造业从业人员数(X1)、资产(X2)、固定资产投资完成额(X3)、科技人员人数(X4)、科技经费(X5)、出口额(X6)等6个指标作为影响因素进行分析,建立偏最小二乘回归分析模型.原始资料见表1(时间1994—2006年).

表1 苏州外资制造业相关数据

先对这些因素作相关性分析,由Matlab软件[12]计算得相关关系(表2).

表2 外资制造业总产值相关因素的简单相关系数矩阵

由表2可以看出,外资制造业总产值和从业人员的简单相关系数为0.998 7,和资产的简单相关系数为0.997 5,和固定资产投资完成额的简单相关系数为0.865 9,和科技人员人数的简单相关系数为0.977 2,和科研经费的简单相关系数为0.994 4,和出口的简单相关系数为0.999 4.它们的相关系数绝对值|R|>R0.05(n-2)=0.553,均成显著相关.因此,可以得出这样的结论:外资制造业总产值和从业人员、资产、固定资产投资完成额、科技人员、科研经费、出口成线性显著正相关.在此基础上,再对这些因素作线性回归,得出如下回归结果:

Y=3 666 543.389 3-256 510.935 6X1+0.833 3X2-2.120 5X3+

934 952.745 5X4-2.061 4X5+7.335 1X6,

R2=0.999 8,F=8 566.046 4,P=0.159 0×10-10.

虽然统计量(R2,F,P)均显著,但是存在不合理的回归系数,X1,X3,X5的系数不能为负.主要原因是自变量之间存在多重共线性,为消除多重共线性,下面采用偏最小二乘回归.

首先对自变量提取主成份,使它能很好地反映各影响因素的有关信息,同时能对外资制造业总产值具有最好的解释性.

利用偏最小二乘回归,由Matlab软件计算得到第一主成份

表3 主成分t1得分和标准化的因变量Y* 数值

由Mablab软件得Y*=0.417 537t1,R2=0.995 5,F=2 410.674 6,P=0.307 5×10-13.可以看出,t1对Y的多重决定系数已达99.55%.最终可得偏最小二乘回归模型:

(1)

(1)式为标准化的回归模型,可改写为用原始变量表示的回归模型:

Y=-3 069 426.310 2+102 140.421 1X1+0.232 2X2+7.604 0X3+

4 767 375.835 4X4+16.308 8X5+1.521 5X6.

从统计量复相关系数R为近1,F检验统计量很大远超过临界值,概率P值很小接近0,因此可以认为拟合优度很高,被解释变量可以被模型解释的部分较多.也即从业人员数、资产、固定资产投资完成额、科技人员人数、科技经费、出口额可以较多地反映外资制造业总产值.从模型看出,回归系数均合理,从业人员数、资产、固定资产投资完成额、科技人员人数、科技经费、出口额都是正影响作用.

从标准化的回归模型系数看出,影响工业生产总值的影响因素从大到小依次为从业人员数、出口额、资产、科技经费、科技人员人数、固定资产投资完成额.这说明廉价的劳动力是吸引目前苏州外资经济的一个主要因素,同时说明苏州外资制造业目前是以出口额为主的外向型经济模式.标准化的回归模型系数相差不大,这说明资产、科技经费、科技人员人数、固定资产投资完成额也是推动经济发展的重要因素,苏州外资经济要实现可持续发展,要靠技术进步,例如增加科技人员的数量和科技经费的投入量等来带动才能实现.

从边际效用上看,由原始变量表示的线性回归模型可知:当外资制造业从业人员数(X1)每增加1万人,外资制造业总产值(Y)增加102 140.421 1万元;资产(X2)每增加1万元,外资制造业总产值(Y)增加0.232 2万元;固定资产投资完成额(X3)每增加1万元,外资制造业总产值(Y)增加7.604 0万元;科技人员人数(X4)每增加1万人,外资制造业总产值(Y)增加4 767 375.835 4万元;科技经费(X5)每增加1万元,外资制造业总产值(Y)增加16.308 8万元;出口额(X6)每增加1万美元,外资制造业总产值(Y)增加1.521 5万元.

[1] 陈希孺,王松桂.近代实用回归分析[M].南宁:广西人民出版社,1984.

[2] 童恒庆.经济回归模型及计算[M].武汉:湖北科学技术出版社,1997.

[3] 董 麓.数据分析方法[M].大连:东北财经大学出版社,2001.

[4] 何晓群.现代统计分析方法与应用[M].北京:中国人民大学出版社,1998.

[5] 熊吉峰.基于偏最小二乘回归分析的农民收入影响因素研究[J].统计与信息论坛,2005(7):35-38.

[6] 陈高波.偏最小二乘回归在选矿效益建模中的应用[J].数理统计与管理,2006(5):345-401.

[7] 许和连,赖明勇,钱晓英.外商直接投资影响因素的偏最小二乘回归建模分析[J].中国管理科学,2002(5):124-128.

[8] 周子康,崔 斌.我国财政能力的偏最小二乘回归研究[J].统计研究,2003(2):45-50.

[9] 张忠诚.一类基于偏最小二乘回归分析的成分数据预测模型[J].华中师范大学学报:自然科学版,2006(2):78-82.

[10] 程毛林,韩 云.苏州外资制造业经济增长因素贡献率测算模型与分析[J].数理统计与管理,2009(3):381-385.

[11] 程毛林.基于主成份回归模型的经济增长因素分析[J].运筹与管理,2012(1):175-179.

[12] 刘则毅,刘东毅.科学计算技术与Matlab[M].北京:科学出版社,2001.

(责任编辑 向阳洁)

FactorAnalysisModelofSuzhouForeignCapitalManufacturingGrowth

CHENG Maolin

(School of Mathematics and Physics,Suzhou University of Science and Technology,Suzhou 215009,China)

The economic growth of Suzhou foreign capital manufacturing industry is subjected to numerous influential factors,and among these factors there is a multi-related relaxionship between variables,generally independent variable of multivariate regression analysis is more serious in multicollinearity.This paper uses partial least square regression to set up a model,and analyics the economic growth impact factor.so on the one hand,it generalizes the data information with maximum limit in the original independent variable system,overcome multicollinearity;on the other hand independent variable has the greatest interprefaction ability for dependent variable,and reliability is high.

Suzhou foreign capital manufacturing;partial least square regression;modeling;factor analysis

1007-2985(2014)01-0025-04

2013-04-17

江苏省自然科学基金资助项目(BK2012165)

程毛林(1965-),男,安徽桐城人,苏州科技学院数理学院副教授,硕士生导师,主要从事应用统计与经济数学研究.

O212;F224

A

10.3969/j.issn.1007-2985.2014.01.007

猜你喜欢

总产值科技人员因变量
调整有限因变量混合模型在药物经济学健康效用量表映射中的运用
2019年来宾市蔗糖业总产值近100亿元
适应性回归分析(Ⅳ)
——与非适应性回归分析的比较
偏最小二乘回归方法
北京科技人才拥有指数全国最高
制造业企业科技人员激励机制研究
陕西林业总产值今年将突破千亿元
陕西有色上半年实现工业总产值590亿元
7月陕西省工业总产值增长由负转正
如何提高基层科技人员撰写田间试验报告的水平