多水平C-D生产函数模型及其参数异质性研究

2010-05-22程海森

统计与决策 2010年9期

程海森，石磊

（1.云南财经大学统计与数学学院，昆明 650221；2.大同大学数学与计算机学院，山西大同 037009）

在经济领域，多水平模型的应用研究并不多，在国内文献中，目前未见多水平模型应用于经济问题的研究。在此问题研究中，国家、省、地区、县和乡的众多经济指标数据就存在着明显的层次结构，即可视为多水平数据。在利用生产函数研究经济问题中，许多研究目前都基于传统的OLS理论进行分析，而且大多情况下，模型估计效果并不是很好。因此本文拟将多水平模型引入C-D生产函数，通过实证分析建立多水平C-D生产函数，并研究多水平模型的模型拟合效果、异方差特征和参数异质性问题。

1 变量指标介绍

本文在研究中涉及的变量或指标如下：

（1）实际 GDP-Y（1978年为基期）。GDP分为名义 GDP与实际GDP两种，通常在统计年鉴中得到的是名义GDP，它是用现期价格衡量的物品与劳务的价值，而实际GDP是用不变价衡量的物品与劳务的价值。它们之间相差一个通货膨胀的因素。因此，本文用实际GDP来粗略刻画收入。实际GDP可以由以下计算方法。

由以上两试可联立解出实际GDP。由于搜集资料不同，本文采用的是第二种实际GDP计算方法（与其他作者用第一种方法估计出的结果完全一致）。Yit表示第i个地区第t时间的实际GDP。

（2）劳动力—L。本文采用1997～2007年间，各省就业人员数进行估算。Lit表示第i个地区第t时间的从业人数。

（3）资本存量—K（1978年为基期）。资本本身是一个宽泛的概念，广义的资本可以包括物质资本、人力资本和土地。虽然少数研究考虑或讨论了土地和人力资本，但是大部分研究在估计资本存量时，仅指严格意义上的物质资本，本文也将遵循这一传统。目前已被普遍采用的测算资本存量的方法是戈登史密斯（Goldsmith）在1951年开创的永续盘存法。所以本文中所采用的是在估计一个基准年后运用永续盘存法按不变价格计算各省区市的资本存量。资本存量的估算公式为：Kit=Kit-1(1-δit)+Iit，其中 i指第 i个省市，t指第 t年。上式一共涉及到四个变量：①当年投资I的选取；②投资品价格指数的构造，以折算到不变价格；③经济折旧率的确定；④基年资本存量K的确定。本文根据用资本形成表示投资流量I，将经济折旧率设为10%，从而对资本存量进行估算（与其他作者估算结果一致，且将数据推算至2007年）。Kit表示第i个地区第t时间的资本存量。

（4）对外开放度-DWKF。对外开放是一个从沿海地区向内陆扩展的过程，我国的对外开放，就是为本土经济的市场化引入外部动力。指标的具体测算方法如下：人们习惯上用出口依赖度(出口额/GDP)来反映经济外向型的程度，很显然，出口并不是对外开放的唯一内容。所以本文采用包括国际贸易、利用外资（包括港、澳、台）两方面内容的对外开放指数(即这几方面指标占GDP比重的加权平均数)来表示对外开放的程度，其公式如下:

DWKFi表示第i个地区对外开放程度。在分析改革开放以来制度对经济增长的贡献研究中，对外开发程度是制度要素的一个重要组成指标，因此本文选取了对外开放程度这一指标进行异质性研究。

2 数据选取说明

数据分别来自《新中国50年统计资料汇编》、《中国统计年鉴2007》、《中国统计年鉴2008》和国泰安宏观数据库。数据截取了1997～2007年各个省份的不同指标。由于海南、重庆和西藏缺失数据较多，因此省略了这三个地区的数据（将重庆1996年后的数据归入四川省）。因此各指标变量的取值范围是：i=(1，2，…，28)；t=(1，2，…，11)。在该数据中，省区可以看成是一个二层次水平，省区在各年度的观测可以看成是一层次数据，因此具有层次结构。下面我们利用对水平模型验证层次分析的必要性以及相应的建模过程。

3 多水平建模分析

3.1 多水平模型建立的必要性判定

首先对实际GDP计算组内相关系数ICC，检验是否存在组内相关。如果数据集的ICC或组间方差统计不显著（无统计学意义），则可对该数据集进行多元回归模型分析，而不需要多水平模型分析；反之，如果统计显著，则应该考虑对其进行多水平模型分析。建立截距模型（intercept-only model）,又称空模型，或无条件均值模型：

该模型的水平 1 和水平 2 均没有解释性变量，eit～N（0，σ2）为相互独立的水平 1 残差，μit～N（0，）为相互独立的截距项水平 2 残差，cov(μoi,eit)=0，（2）式带入（1），得到一个具有随机效应的方差分析模型：

其中，γ00是固定效应部分，表示总截距，代表log(Y)it的总均值，μ0i+eit是随机效应部分；σ2表示省内方差或个体水平方差，则表示省间方差。由RIGLS估计可得=6.897，σ^2=0.8（p-value=0.0002），=0.123（p-value＜0.0001），二者均统计显著，表明GDP的初始水平在各省之间有着显著不同，且存在显著的对象内变异。根据经典定义（Shrout&Fleiss,1979）,ICC被定义为组间方差与总方差之比：ICC=）=0.1333，表示13.33%的总变异是由省间的异质性引起的。由于各指标均统计显著，因此可以推断ICC是统计显著的，从而需要进行多水平模型分析。

本文以C-D生产函数为基础分析资本对GDP的贡献。对C-D函数Y=AKβLα两边同时取对数变形为：log(Y)=log(A)+βlog(K)+αlog(L)，再令 log(Y)=Y'，log(A)=A',log(K)=K',log(L)=L'。

在多水平模型建立的过程中，为了进行模型之间的比较，采用计算出各自模型下-2log(likelihood)的数值，通过其差值大小的显著性来检验模型的改进，其根据是在大样本情形，-2log(likelihood)服从自由度为q的x2分布，其中q为对应于比较模型涉及的参数个数差，令D=-2log(like)作为比较模型优劣评价参数。对于多水平模型的参数估计可采用IGLS估计方法（迭代广义最小二乘估计方法）或RIGLS估计方法（限制迭代广义最小二乘估计方法），是固定效应参数的估计和随机效应参数的估计交替进行的过程，当迭代收敛时迭代结束。已经证明，不同水平残差项在正态假设下，参数的IGLS估计等价于极大似然估计（EML），RIGLS估计等价于限制极大似然估计（REML）。具体理论这里不再详细介绍。

3.2 混合数据模型

首先考虑建立数据模型：

其中 eit～N（0，σ2）为相互独立的残差，首先，此 C-D 生产函数的建立是在全国的角度上，将各省各年份的数据作为同一水平的样本量，因此也可称其为一水平线性模型。其次，本文重点考虑的是基于数据的不同水平（层次）而建立相应的多水平C-D生产函数模型及参数异质性的问题，因此建模过程中未考虑时间趋势的影响。

3.3 无条件两水平模型

考虑无条件的两水平模型

表1 无条件两水平模型（7）与混合数据模型（4）的参数估计对比表

混合数据模型（4）是应用OLS估计一般C-D生产函数的参数，其参数估计结果在0.05的水平上均比较显著，其残差方差为0.059较小，-2log(like)值为868.2363。无条件两水平模型（7）（即是对混合数据模型的常数项与资本的系数根据水平结构随机化）则是应用RIGLS估计（限制迭代广义最小二乘估计）多水平C-D生产函数模型的参数，由估计结果显示。首先，此模型的2log(like)值为-507.518，2log(like)值越小模型拟合越好，且模型二与模型一下2log(like)的差为1375.7543，与自由度为3的χ2分布的临界值（置信水平设为0.05，χ3(3)=7.815）相比是显著的；其次，无条件两水平模型（7）对残差根据水平进行了分解，与混合数据模型（4）比较方差σ2由0.059变为0.006，有了很大程度的减少，两模型中所有估计参数均显著，因此无条件两水平模型（7）比混合数据模型（4）有了很大程度的改善，但常数项统计不显著，需建立改进模型。

3.4 单变量条件两水平模型

考虑单变量条件的两水平模型

eit～N（0，σ2）为相互独立的水平 1 残差，μot～N（0，）为相互独立的截距项水平 2 残差，μit～N（0，）为相互独立的斜率项水平 2 残差，cov(μot，μli)=σu01，不同水平残差间相互独立。此时在资本弹性系数随机化时，加入二水平影响变量（DWKFi对外开放度），DWKFi变量是来自于第二水平（各省）的数据，即DWKFi表示第i个省的对外开放程度。将模型（9）带入（8），得到

由RIGLS估计结果为：

表2 单变量条件两水平模型（10）与无条件两水平模型（7）的参数估计对比表

单变量条件两水平模型（10）与无条件两水平模型（7）相比，是在资本的系数做二水平随机时加入了二水平条件变量DWKFi（对外开放程度）。首先，模型三的-2log(like)值为-541.248，与模型二下-2log(like)的差为33.73，与自由度为2的χ2分布的临界值（置信水平设为0.05，χ2(2)=5.991）相比是显著的，所有参数在0.05水平上均显著；其次，单变量条件两水平模型比无条件两水平模型更详细的刻画了资本系数的异质性，因此单变量条件两水平模型为较优模型。

本文在建立多水平C-D生产函数模型时，对截距项、劳动系数也分别进行了多水平建模分析，由于参数估计的结果在统计上均不显著，因此在文章中将此部分略去。

3.5 模型解释及主要结论

由单变量条件两水平模型（10）得出多水平C-D函数为：

其中劳动弹性系数α=0.334，资本弹性系数则是一个变量，是随DWKFi（各省的对外开放程度）变化而变化的，其形式为：βi=0.672+0.199DWKFi。对于生产函数而言，讨论规模报酬变动是考量α+β的数值，当α+β＞1时规模报酬递增，当α+β＜1时规模报酬递减，当α+β=1时规模报酬不变，在本结论中规模报酬的判定具有函数形式：α+βi=1.006+0.199×DWKFi，由于DWKFi为正值，则可以判定建立我国1997年到2007年期间的多水平C-D函数具有规模报酬递增的特性，而且递增速度的快慢是由DWKFi调节的。劳动力对GDP的贡献份额为劳动力对经济增长的贡献与对外开放程度成反向关系，即劳动贡献率随着对外开放程度的增大而减小；资本对GDP的贡献份额为：，其与对外开放程度成正向关系，由劳动和资本各自贡献份额的函数形式可知，在1997～2007年期间，资本对经济增长的贡献约为劳动对经济增长贡献的两倍左右，且两者均是的函数。由分析结果可得其余要素的变动均基于资本弹性系数的异质性，即各省资本弹性系数是随着DWKFi的变化而变化，因此根据各省的DWKFi指标，可分别估算出各省的资本贡献份额，具体结果如图1所示，其中横坐标按DWKFi指标由小到大排序。

由图1可知，广东、上海、天津、江苏四省市的资本贡献份额均在68.5%以上，表示这些地区资本投入量及对GDP的贡献均较高，且这些地方均为东部沿海省份，也是改革开放政策施行以来的首批试点省份，其较高的对外开发程度导致吸收较多的资本量，从而推动GDP的高速增长；福建、北京、辽宁、吉林、浙江、山东六省次之，资本的贡献份额在67.5～68%，这些地区的改革开放政策与广东、上海、天津、江苏四省相比实施较晚，因此其对外开放程度、资本吸收程度均次之；而其他省份的资本贡献份额大都保持在66～68%之间。由此说明一地区资本对GDP的贡献大小与此地区对外开放程度成正比，对外开放程度越高资本对GDP的贡献份额越大。

4 结论

宏观经济数据明显呈现多种水平结构（或层次结构），基于多水平数据提出的多水平模型在理论上首先是适用的。通过实证分析，多水平模型较一般模型而言有其独特之处：（1）多水平模型的建立是完全基于数据的层次结构，特别是在变量的选取上，按不同的水平选取不同的变量；（2）在参数估计方法上采用的是迭代广义最小二乘估计和限制迭代广义最小二乘估计；（3）对回归系数、各水平残差的方差和协方差均给出了估计和统计推断过程，对全面研究模型结构和处理实际问题提供了更详细的信息；（4）在描述参数的异质性问题上，多水平模型提出了详细的函数结构，这使得研究变量关系变得较为明显。

通过多水平C-D生产函数模型估算的资本的贡献份额再次证明，首先我国保持较高经济增长速度的主要源动力任然是资本要素，资本贡献份额较高的省份仍然集中于东部地区，中西部地区相对较弱，而资本要素在各省之间的差异与各地区间的对外开发程度有着密切的关系；其次，在我国中西部地区对外开发程度与东部地区差距仍然较大。因此我国在走可持续发展道路的同时，应继续加大中西部地区的开发力度，从而保证我国整体经济稳步增长。

[1]石磊.多水平模型及其统计诊断[M].北京：科学出版社，2008.

[2]王济川，谢海义，姜宝法.多层统计分析模型[M].北京：高等教育出版社，2008.

[3]Goldstein H.Multilevel Statistical Model(2ndEdition)[M].New York:Halsted Press,1995.

[4]Randenbush S W,Bryk A S.Hierarchical Linear Models:Application and Data Analysis Method(2ndEdition)[J].Journal of the American S.A.,2003，98.

[5]白仲林.面板数据的计量经济分析[M].天津：南开出版社，2008.

[6]郭庆旺，赵志耕,贾俊雪.中国省份经济的全要素生产率分析[J].世界经济，2005.

[7]何枫，陈荣,何林.我国资本存量的估算及其相关分析[J].经济学家，2003，(5).

[8]张军，吴桂英，张吉鹏.中国省际物质资本存量估算[J].经济研究，2004，(10).

[9]金玮.西部制度变迁对经济增长的贡献研究－基于西部六省1978－2004年宏观经济制度变迁的实证研究[D].西北大学，2008.