面板数据模型的应用现状与发展趋势
2010-09-15张凡勇
胡 健,张凡勇,李 萍
(1.西安财经学院,西安 710100;2.西安石油大学 经济管理学院,西安 710065)
面板数据模型的应用现状与发展趋势
胡 健1,张凡勇2,李 萍1
(1.西安财经学院,西安 710100;2.西安石油大学 经济管理学院,西安 710065)
面板数据模型的应用研究是当前学术界的一个热点。文章针对国内学术界的研究现状,讨论了当前面板数据模型应用中的问题,指出了面板数据模型的改进取向。
面板数据;模型设定;固定效应模型;随机效应模型
0 引言
由于时间序列(或截面)数据的经济计量分析在检验经济理论、寻找经济规律和预测经济趋势方面逐渐显示出不足之处,基于面板数据的计量经济模型逐渐受到了人们的关注。
面板数据(Panel Data)是指同时融合时间和个体两个维度的数据结构,用来描述一个总体中给定样本在一段时间的情况,并对样本中每一个样本单位进行多重观察。这种多重观察既包括对样本单位在某一时期(时点)上多个特性进行观察,也包括对该样本单位的这些特性在一段时间的连续观察,得到数据集称为面板数据。
因为能够提供更多的信息,克服时间序列分析受序列自相关等的困扰,更好地识别和度量单纯的时间序列和截面数据所不能发现的影响因素,反映经济变量的动态调整,面板数据的理论和应用研究受到了统计学和经济计量学界的青睐。特别是1990年以来,大量关于面板数据的分析方法及其应用研究文章不断出现,面板数据的理论以及应用研究逐渐成熟,据不完全统计,已有数千篇关于面板数据的理论分析及应用的文章发表(白仲林,2008),主要应用于金融、经济增长、产业结构、技术创新税收政策等宏观领域以及就业、家庭消费、企业管理、市场营销等微观领域。国内学术界自本世纪初期才开始对面板数据有所关注,相关研究工作近几年才展开,在最近两年才有较为明显的增加。就国内研究现状而言,面板数据的研究还处于起步阶段。本文将以面板数据模型为基础,对国内现有关于面板数据的应用研究文献进行总结梳理,指出面板数据模型建模及应用中存在的问题,为未来研究工作的展开提供一些方向性的建议。
1 面板数据模型的应用
1.1 面板数据模型的国际应用概述
自1966年贝尔斯特拉(Balestra)和纳洛夫(Nerlove)发表一篇研究会议论文以来,面板数据模型的应用得到了快速的发展。早期主要集中于经典线性模型的研究,以豪斯曼(Hausman)检验来判断是选用固定效应模型还是随机效应模型,主要应用在微观层面。随着研究的不断深入,特别是在上个世纪90年代之后,学者们开始主要到面板数据中的不稳定情况,面板数据单位根检验、面板数据协整检验以及非线性面板数据模型开始逐渐成为学者们关注的热点问题,相关的应用也从微观层面转向宏观层面。从国际学术界来看,关于面板数据模型的应用主要集中于以下几个方面:
(1)动态面板数据模型,主要是基于工具变量法和系统广义矩估计法的估计,一般认为系统广义矩估计更有效。代表性的应用文献如Bond等人对索洛增长模型的动态面板数据分析(Bond S.R.,Hoeffeler A and Temple J.,2001)。
(2)面板单位根检验,主要是检验宏观面板数据的稳定性,包括LL检验、IPS检验和Handri检验。相关研究如Choi利用面板数据单位根检验验证了23个OECD国家的收敛性假设,发现单位根的存在,解决了面板数据的横截面相依性条件下的检验问题,通过模拟证实了其检验具有很好的功效(Choi,2001)。但相关文献通常假设面板的纵剖面序列是独立,实际情况常常与之相反。
(3)面板协整检验,其应用研究主要集中于购买力平价理论、国际研发的溢出效应等宏观经济问题,代表性的研究如Pedori使用IFS的数据研究名义汇率和CPI缩减指数,发现两者存在协整关系,也即弱购买力平价理论成立(Pedroi,2004)。同单位根检验相比,面板协整检验尚处于早期阶段,特别是关于微观面板的协整检验无论相关方法还是应用均有待于进一步研究。
1.2 面板数据模型的国内应用概述
如前所述,面板数据的研究与应用国际学术界比国内学术界早了十多年,无论是理论方法还是实践应用的研究,都要比国内学术界成熟。国内有关面板数据的相关研究文献,以中国期刊网为来源进行搜索,可得如下表的数据:
注:以上数据根据期刊网检索系统获得,其中核心期刊2008年数据检索不到
从上表可以看出,国内学术界关于面板数据的研究开始于本世纪初期,兴起于2005年,在此之后,关于面板数据的研究文献呈现大幅增长的趋势。表中数据显示,截止2008年,国内关于面板数据或者研究中用到面板数据模型的研究文献有2280余篇。其中,2000~2004年国内期刊所刊载的关于面板数据的研究文献总量只有109篇,而2005年一年时间内刊载量达到158篇,2006年一年时间内刊载量达355篇,2007年一年时间内刊载量进一步跃升为672篇,2008年文献数量有1011篇,核心期刊所刊载的关于面板数据的研究应用文献也显示出与全部期刊相同的分布。此外,经济研究、数量经济技术经济研究、中国工业经济、统计研究、数理统计与管理、经济科学以及经济学季刊等国内关于经济以及数量经济研究方面的主流期刊杂志亦显示出这种分布。这说明,无论是国内学术界研究的整体趋势,还是象征高水平主流期刊杂志的研究焦点都在转向面板数据。无疑,关于面板数据的研究已经成为国内学术界的一个热点问题。
现有的研究文献主要以面板数据模型特别是静态线性面板数据模型的应用为主,而关于面板数据的理论工具以及分析方法上的研究较为欠缺。现有的应用研究文献主要有集中于以下几个方面。
1.2.1 静态线性面板数据模型应用
静态线性面板数据模型主要包括固定效应模型、随机效应模型以及混合回归模型,是国内学术界应用最多的一类模型形式,现有的多数文献均以将其模型设定为静态线性形式。代表性文献如下:王红领、李稻葵、冯俊(2006)新等利用37个行业6年时间的面板数据,以固定效应模型、随机效应模型以及混合回归模型等三种方程分别进行回归分析得出FDI能够促进我国民族企业自主创新的结论。杨亚平(2007)以C-D函数为基础分别建立了固定效应模型、随机效应模型和混合回归模型,通过F检验和豪斯曼检验判断采用双向固定效应模型,利用广东省工业面板数据进行回归分析得出FDI后向关联的技术溢出效应较为显著,而其水平溢出以及前向溢出相应不显著。徐康宁、王剑(2006)利用1995~2003年的省际样本数据构建固定效应模型,探讨了自然资源丰裕程度与经济发展水平的关系,并以山西为例进行实证分析,认为密集而过度的资源开采引致的制造业衰退和制度弱化是制约经济增长的主要原因。孙立军(2008)则以1978~2004年中国省际面板数据为基础,通过构建相应模型进行回归分析,得出FDI在一定水平下,对东道国资本积累和产出增长的影响是非线性的,随着外资数量的逐渐增加,其对资本积累和产出增长的促进效应逐渐下降,FDI进入初期的正影响最终转为负影响,而FDI在数量一定的情况下,金融发展对本国资本积累和产出增长有正影响。廖谋华、刘丹(2005)使用 Meta-production Function方法,根据中国 1996~2002的省级面板数据,使用固定效应模型,估计出了各省的生产函数,发现在固定资产投资来源的各个组成部分中,国内贷款来源对GDP的贡献比自筹资金来源的贡献小,但是比其他来源的贡献高。吕长江、金超、韩慧博(2007)利用1997~2004年深沪两市610家上市公司的面板数据建立联立方程,通过实证研究认为资本结构、管理者利益侵占与公司业绩三者之间存在相互影响的关系。此类文献实证分析中的典型形式是根据相应的理论构建相应的线性模型,采用相应的方法进行回归估计,然后进行检验。
1.2.2 动态面板数据模型应用
动态面板数据模型的应用在国内相对比较少,在2008年以前更是鲜有涉及,现有文献多集中于2008年以来的一段时期,从相应文献数量的时间分布上看,有增多的趋势。代表性文献如下:谭本艳(2008)依据我国30个省、自治区和直辖市(西藏除外)1985~2006年的数据,采用动态面板数据模型以及Blundell和Bond(1998)提出的系统广义矩估计法,把对外贸易对我国总体以及东、中、西部地区资本形成的效应进行了实证分析,其结果显示当期和滞后1期的进出口贸易对我国总体及东、中、西部地区的当期资本形成有正或负效应,且这种正负效应在东、中、西部地区之间存在明显的地区差异。还分析了产生这一结果的原因并提出措施发挥对外贸易对我国资本形成的正效应,尽量缩小正效应在不同地区的差异。吴一平(2008)文章采用中国1992~2005年的29个省级(重庆并入四川,西藏除外)动态面板数据,构建滞后一期的模型,通过差分广义矩估计和系统广义矩估计两种方法来研究区域创新的决定因素,结果显示系统广义矩得出的结果更优,通过了Sargan检验值和误差项的一阶序列相关、二阶序列不相关的原假设。彭方平、王少平(2007)利用动态面板数据模型,实证检验了利率政策的微观有效性。
1.2.3 面板数据单位根与协整检验应用
同国外相比,面板数据单位根与协整检验的理论方法以及应用方面的研究据比较少,现有的应用研究文献尚不多见。代表性的文献如下:鄂永健(2007)基于中国经济信息网上1978~2004年间28个省份的年度商品零售价格指数和18个省份年度居民消费价格指数采用LLC方法分别进行了平稳性检验,认为样本区间越是靠近现在,越容易得出收敛的结论,且估计的收敛速度也越快。魏锋、曹中 (2007)以1978~2004年的面板数据为基础,运用B检验、LLC以及IPSW检验得出东中西三个地区服务业增加值、人均GDP等数据的一阶单整性,又通过协整两步法以及误差差修正模型方法进行检验,认为东部地区的经济增长推进了其服务业的增长,中部地区经济增长与服务业的增长没有显著的相关关系,而西部地区的服务业增长推进了其经济增长。黄旭平(2005)基于亚洲国家的面板数据,通过面板单位根检验、协整检验研究了混业经营条件下银行集中与效率的关系,认为混业经营条件下,银行集中与银行效率有显著的正相关关系。此外,焦兵(2007)也做过类似的研究。
1.2.4 面板数据的随机前沿模型
关于面板数据的随机前沿分析模型主要用于生产或成本函数的估计,国内的相关应用研究较少,主要集中于技术效率方面,代表性文献如下:唐德祥、李京文、孟卫东(2008)基于面板数据随机前沿法考察了我国三大经济区域R&D与技术效率之间的内在联系,认为R&D与技术效率呈显著的正相关关系。顾乃华和李江帆(2006)借助随机前沿生产函数模型,使用面板数据,分析了我国服务业技术效率的区域差异及其对劳均服务业增加值区域不均衡的影响,研究表明,东、中、西部服务业技术效率存在显著差异,这加剧了我国服务业区域发展失衡现象。
1.2.5 非线性面板数据模型研究
现有的国内文献中,个别文献涉及到关于非线性模型的应用。类似的研究在国外亦不多见。代表性的文献如下:张宇(2008)基于《中国工业经济统计年鉴(2000~2006)》所刊载的1999~2005年中国30个省市自治区的210组地区工业数据,采用“门限回归”方法构造非线性面板数据模型,进一步检验了影响FDI技术外溢效应的若干吸收能力因素以及FDI技术外溢影响的门限特征,并从经济发展水平、对外开放度、基础设施和人力资本状况以及地区经济结构等方面测定了引发积极技术外溢效应的门限水平。
2 面板数据模型国内应用中的问题与改进取向
2005年以来,国内关于面板数据及其模型的应用研究发展较快,而理论方法及分析工具的研究明显不足。中国期刊网检索的近两千篇的研究文献,涉及理论方法以及分析工具的研究尚不足20篇。应用性的研究虽然发展较快,而且也取得了一定的成果,但问题依然很多。
2.1 数据的来源与样本的选取
现有文献中,主要以省际层面或者行业层面的分析为主,数据多以中国统计年鉴以及各省、市、区的统计年鉴等国家以及各省、市、区的统计部门公开出版的数据为主要来源,显示了较好的数据可信度。但一元化的数据来源也会对计量经济模型的分析与建立有所限制。国家与地方各级统计部门所出版的各类统计年鉴的权威性不容置疑,但在这些统计年鉴中,出于调查的难度与复杂性所限,多以宏观总体数据为主,对微观个体数据多以平均数据为主。如果仅以这类权威数据为主要数据来源,则不免会对我们利用面板数据分析个体经济行为的差异有所限制。笔者以为,这也是构成我国面板数据模型的应用研究中多以宏观层面或者行业层面分析为主的一个重要原因。在有关面板数据(包括许多的宏观层面或者行业层面)的研究文献中,我们常会见到“出于数据的限制,我们仅以…”等类似的字眼。无疑,单一化的数据来源已成为制约面板数据计量经济分析的一个主要因素。在样本的选取上,国内学术界多以几年或者十年的时间来选取样本。现有的研究文献中,多数的样本区间选择在十年以内,只有少数的样本区间选择在十年到十五年之间,超过十五年的尚不多见。一般情况下,面板数据模型的分析也包含历史的分析,为了提高研究的真实与可靠性,在技术与数据来源可靠的情况下,较长的区间选择可信度会更高。
2.2 模型的选择与设定问题
建立面板数据模型,首先应该考虑的就是静态模型与动态模型的选择问题。经济现象的复杂性要求计量经济模型中存在滞后变量,也就是动态模型的使用。但国内的多数研究,由于相关技术的限制或出于研究的方便,利用静态的固定效应和随机效应模型进行实证分析,其对经济问题的解释能力又或经济对策的可行性也就不言而喻。在时间序列的计量经济分析中,因为时间序列的非平稳性,常常会造成计量经济分析出现有偏差的结果。作为时间与截面的混合数据,面板数据也同样存在着非平稳的问题。国外学术界兴起于上个世纪90年代的单位根检验以及协整理论为这一问题的解决提供了一个可供选择的途径,国内学术界近年来在单位根以及协整分析方法上的使用上逐渐增多,但多见于时间序列的计量经济分析中,在面板数据的计量经济分析中,并不多见。解决滞后变量和非平稳性所带来的问题,动态面板数据模型特别是协整分析是国内计量经济分析的一个主要趋势。近期的研究,特别是在《经济研究》等主流杂志上关于类似的研究已经呈现逐渐增加的迹象。
当前的研究多以固定效应模型和随机效应模型作为面板数据建模的主要选择。学者们一般采用hausman检验来判断是采用随机效应模型还是固定效应模型。但就具体模型的设定上却还存在着一些问题,主要体现在模型的截距和回归系数的设定上。截距的设定过程中常出现的情况有遗漏掉某个个体因素或时间因素,数据未曾进行与模型相适应的处理(如典型的通胀率扣除或是价格因素),回归系数的设定中常见的问题主要体现在研究者在建模之前未曾对模型所需要检验的理论以及所建模型结构中的个体所对应的回归量与解释变量间的关系进行深入的理论分析与必要的统计检验(靳庭良和郭建军,2004)。此外,在相应指标(解释变量)的处理上,也存在一定的问题,如应该选用平均指标的却选用了绝对量指标。
2.3 国外研究成果中国化的问题
前述的问题,虽然部分原因在于面板数据模型本身的局限性,又或是相关检验方法与技术上暂不具可行性的缘故,但实际却是“国外研究成果中国化的问题”。无疑,国外的相关研究比国内要领先,对国外成果的借鉴亦属可行,但国内的多数学者,在面板数据模型设定时很少仔细考虑国内的实际情况,为了分析和研究的方便,大多照搬国外的理论,或者对于部分模型稍作修改,而对国外相关模型的构建背景、参数假设、指标设计、变量选取以及相关的检验方法未曾具体的分析,也不曾考虑过模型本身的严谨性,这样就引出了数据的选择问题、模型的设定问题,乃至具体的变量指标设计问题。这一点从现有文献中理论分析与实践应用文献数量的对比上可窥一斑。仅有的少量理论分析以及工具方法上的研究中,多以对国外相关研究的介绍性叙述为主,当然也有一些做得比较好的研究文献,如南开大学张晓桐、白仲林以及中国科技大学的李志宏等也曾就面板数据模型的理论分析方法以及检验工具等做出过较为深入的研究,特别是对于面板数据的单位根以及协整理论的亦有所涉及,但这样的研究毕竟太少。
3 结论
动态面板数据模型的应用特别是面板数据的单位根与协整理论将成为学界研究的一个热点问题,也是国内外计量经济领域的一个必然取向。国内也出现了许多的应用文献,但理论研究方面相对欠缺一些。从现有的应用文献来看,存在着样本数据来源单一、模型选择不够科学,甚至照搬国外模型而加以分析等问题。
结合国际计量经济分析的发展,我们除了需要加强面板数据模型相关理论的分析,尤其是面板数据模型本身以及其中国应用的研究之外,还应注意面板数据模型研究的一些新的发展趋势。这样的发展趋势主要以下几个方面:一是在模型假设检验中,尤其是对于非平稳序列,加强面板数据的单位根检验、协整检验的理论以及应用方面的研究,可以注意微观面板数据模型协整检验方法的开发与应用;二是在模型算法的发展趋势中,将引入面板向量自回归(PVAR)模型。在微观面板数据个体样本比较大、时间序列较小和个体异质差异的情况下,PVAR模型的提出克服了VAR模型的缺陷。面板向量自回归模型根据其效应区分为固定效应和随机效应两种模型形式,因此,PVAR模型更加有利于面板数据的分析。实际上,向量自回归模型是时间序列模型和联立方程模型的结合体,比联立方程有一些优势,例如研究人员不必对变量的内生性和外生性进行设定,模型设定更为灵活,在预测方面比传统的结构模型更为准确等;三是在面板数据内部结构研究方面,LL检验、IPS检验的前提假设是面板数据的纵剖面时间序列相互独立,而实际经济现象的复杂性或者模型中某些变量的缺失会导致纵剖面存在相关性,纵剖面相关的面板数据的平稳性检验也会存在失效现象。这一点已被Maddala、Wu以及Fabian等人的研究证实。如能对纵剖面相关的面板数据的研究有所进展,必将使面板数据模型的理论和应用研究出现显著的突破。
[1]白仲林.面板数据的计量经济分析[M].天津:南开大学出版社,2008,(5).
[2]王红领,李稻葵,冯俊.FDI与自主研发:基于行业数据的经验研究[J].经济研究,2006,(2).
[3]杨亚平.FDI行业内溢出还是行业间溢出:基于广东工业面板数据的经验分析[J].中国工业经济,2007,(11).
[4]徐康宁,王剑.自然资源丰裕程度与经济发展水平的关系研究[J].经济研究,2006,(1).
[5]孙力军.金融发展、FDI与经济增长[J].数量经济技术经济,2008,(1).
[6]吕长江,金超,韩慧博.上市公司资本结构、管理者利益侵占与公司业绩[J].财经研究,2007,(5).
[7]谭本艳.对外贸易影响我国资本形成的效应与地区差异——基于系统广义矩估计的动态面板数据分析[J].国际经贸探索,2008,(2).
[8]吴一平.外商直接投资、能源价格波动与区域自主创新能力——基于省级动态面板数据的实证研究[J].国际贸易问题,2008,(11).
[9]彭方平,王少平.我国利率政策的微观效应——基于动态面板数据模型研究[J].管理世界,2007,(1).
[10]鄂永健.中国地区间价格水平差距趋于收敛还是发散——基于省级面板数据的单位根检验[J].经济评论,2007,(5).
[11]魏锋,曹中.我国服务业与经济增长的因果关系研究——基于东、中、西部面板数据的实证研究[J].统计研究,2007,(2).
[12]黄旭平,熊季霞.混业经营条件下银行集中与效率——基于面板单位根与面板协整分析[J].当代经济科学,2005,(6).
[13]焦兵.东、西部农村金融对农村经济增长贡献的比较研究[J].统计与决策,2007,(2).
[14]唐德祥,李京文,孟卫东.R&D对技术效率影响的区域差异及其路径依赖——基于我国东、中、西部地区面板数据随机前沿法的经验分析[J].科研管理,2008,(2).
[15]顾乃华,李江帆.中国服务业技术效率区域差异的实证分析[J].经济研究,2006,(1).
[16]张宇.FDI技术外溢的地区差异与吸收能力的门限特征——基于中国省际面板数据的门限回归分析[J].数量经济技术经济研究,2008,(11).
[17]靳庭良,郭建军.面板数据模型设定存在的问题及对策分析[J].数量经济技术经济研究,2004,(10).
(责任编辑/亦 民)
F224
A
1002-6487(2010)17-0021-04
国家社会科学基金资助项目(08BJL038);教育部文人社会科学研究青年基金资助项目(09XJC790012)
胡 健(1959-),男,甘肃天水人,博士,教授,博士生导师,研究方向:资源经济学。
张凡勇(1979-),男,湖北公安人,硕士,讲师,研究方向:经济统计。
李 萍(1968-),女,黑龙江哈尔滨人,博士,教授,研究方向:统计学。