Meta分析方法在经济学中的发展及应用
2019-09-20徐双丽吕昭河
徐双丽,吕昭河
(云南大学 发展研究院,云南 昆明 650091)
一、Meta分析的发展
Glass首次提出Meta分析(Meta-Analysis)的概念,并将其定义为“以综合已有研究结果为目的,对大量单个研究结果进行综合的统计学分析方法”[1]。尽管不同学者对Meta-Analysis给出了不同的定义(Sacks等,1987;Fleiss等,1991),但更多的学者倾向使用Glass的定义。国内有学者将“Meta-Analysis”译为元分析、分析的分析、荟萃分析、再分析、整合分析等,但更多学者认为直接将其简称为Meta分析更加贴切。
Meta分析方法的雏形可追溯到1904年英国统计学家Karl Pearson发表的以样本大小为权重对5个估计值进行求平均,检验当时所用疫苗是否有效的方法。之后,Tippett、Fisher、Yates三位统计学家提出的结合概率统计检验的思想进一步奠定了Meta分析方法的统计基础,也有人将Fisher提出的合并P值的思想视为Meta分析的前身。此后的很长一段时间内,Meta分析方法发展缓慢,学科应用的领域也较为狭窄。医学领域最先引入Meta分析用于研究安慰剂的治疗干预效果[2],20世纪70年代初和80年代后期,Meta分析先后被用于临床医学和预防医学,通过整合医学论文中不同学者对同一问题不同的研究结论,以期得出更加客观的研究结果,由此Meta分析方法在方法论上有了很大的改进。到20世纪90年代,Meta分析方法已经成为人文社会科学、自然科学领域最具影响且居于学术前沿的文献综述方法。
文献综述是对特定研究主题下众多已有文献研究结论、观点和思想的总结。传统的文献综述是定性的叙述性方法,存在很强的主观性,会导致难以避免的“评述偏见”(Reviewer-biases)问题[3]。特别是对于采用统计计量进行研究的文献,传统的文献综述未能对同一主题下的差异性计量结果予以量化评价和分析,自然也不能回答不同实证结果为何存在差异的问题(M.Borestein等,1999)。而Meta分析是一种定量的更加客观的文献综述方法,能够应用定量方法对同一主题的不同实证研究的数据结果和研究结论进行综合性的统计计量分析,以解决各个独立研究结论不一致的问题。Meta分析中的Meta回归分析一方面能分析不同研究结论存在差异的原因,另一方面能识别出单独的实证研究所不能发现的变量关系和潜在的调节变量,为未来实证研究提供新的研究思路[4]。
经济学是一个具有大量实证研究的学科,特别是随着计量经济学的发展和进步,经济学领域实证研究不断增多,在纷呈宽广的经济研究主题和经济理论中,以实证研究的方法予以理论解释和问题验证成为现代经济研究的主流。但是,由于不同实证研究在变量设定、样本获取、数据收集、实证模型选取等方面处理方式的不同,导致实证研究结果存在不一致性,由此难以得到理论解释上的认同和具体问题的解决,这一结果有碍经济理论及其应用实践向前推进。1989年Stanley和Jarrell提出Meta回归分析(Meta-Regression Analysis)可以在文献研究中予以应用的思想[5],此后Meta分析方法被应用到经济学领域的研究中,为经济学研究中解决实证研究结果不一致的难题提供了方法途径。
二、Meta分析在经济学中的应用
为了对当前经济学领域Meta分析方法的应用现状进行系统评价,本研究以“Meta分析”“元分析”“荟萃分析”“Meta-Analysis in Economics”为主题关键词系统地检索国内外经济学领域1989年至今有关Meta分析方法的文献,最终从中国知网(CNKI)数据库检索出经济学领域的17篇文献(1)此处的17篇文献仅为发表在由中文社会科学引文索引(CSSCI)所收录期刊上的论文。;以“Meta-Analysis in Economics”为主题从Elsevier 中“Social Sciences and Humanities”子库下的“Economics,Econometrics and Finance”中检索到442篇相关文献;从IDEARS上检索到Tomas Havranek整理出的56篇文献;从网站(2)从网站http://meta-analysis.cz/上检索的22篇文献均为由捷克国立银行和布拉格查尔斯大学的研究人员采用Meta分析撰写或合著的论文。上检索到22篇文献,合计检索到不重复的506篇相关文献。
自Stanley和Jarrell首次将Meta分析引入到经济学领域后,Meta分析最先被用到环境经济学中评估娱乐性的价值[6],接着用于劳动经济学中研究最低工资问题[7]、薪酬的性别歧视问题[8],随后被更多地应用到国际经济学(Havranek等,2011)、能源与环境经济学(Loomis等,1996;黄光晓等,2011;Havranek等,2016)、发展经济学(Bumann等,2012;Valickova等,2013)等研究领域(3)由于篇幅有限,此处仅给出Meta分析在经济学领域不同研究方向应用具有代表性或者Meta分析相对规范的研究。。此外,经济学领域Meta分析相关文献数量也不断增多(如图1),尤其是2010年以后相关文献数量快速增长,由此证明Meta分析方法得到经济学学界的认同,研究主题和研究成果不断丰富。
图1 经济学领域Meta分析相关研究数量
国内经济学领域关于Meta分析的应用,最早用Meta回归分析法研究了关于中国外商直接投资的溢出效应(王万珺,2010),随后还有用Meta分析研究效益转移评价自然资源价值(赵玲等,2011),也有用这一方法研究生命周期偏误对中国教育收益率的影响(于洪霞,2013)。近年,国内经济学领域对这一方法的应用有所增加,方法使用上也相对更加规范[9-11]。尽管如此,由于Meta分析在国内的应用没有其在国外应用早,该方法在国内经济学领域的应用不仅在数量上较国外少,方法使用上也没有国外娴熟和规范,未能充分发挥这一方法综合评价的价值。
Meta分析的基础理论与应用仍在继续演进中,特别是在方法论的探索上。经济学领域不乏应用Meta分析进行研究的文章,也有部分方法论的文章阐述了Meta分析中的异质性问题[12]、发表偏倚问题[13],还有研究详细阐述Meta回归分析[14-15],Stanley等人的研究给出了Meta分析在经济学中应用的指南[16],但都只是粗略介绍,缺少对细节的阐述。综合来说,目前方法类的文章大多只涉及Meta分析的一部分,没有系统性的阐释,难以呈现Meta分析方法一般范式的全貌。
总之,当前缺乏系统阐释Meta分析在经济学中具体应用的方法类文章。因此,有必要梳理Meta分析方法在经济学中的具体应用范式,为经济学领域研究者更加科学、正确地使用Meta分析进行科学研究提供有效的方法论工具。鉴于此,本文基于Meta分析在经济学领域中具体应用的实例和方法
论文献,梳理出该方法在经济学领域应用的一般分析范式,也即Meta分析的方法论逻辑,最终总结Meta分析在经济学领域中需要注意的问题及应用前景。由此,方便经济学研究者充分利用已有实证研究结果,整合和提炼出更为客观的研究结论和探索实证研究结论不一致的原因。
三、Meta分析在经济学中应用的分析范式
本文基于Meta分析方法在经济学中的具体应用,以及Meta分析方法论文献的进展,总结和归纳出Meta分析在经济学应用中的一般分析范式:确定研究主题后,根据研究主题进行理论分析并提出研究假设,从检索到的文献中筛选符合标准的文献作为研究样本,从中提取出Meta分析所需数据,对研究样本的异质性进行检验和处理后进行Meta整合分析,对发表偏倚性进行检验和修正后进行Meta回归分析,最终对Meta分析结果进行解释,具体分析范式如图2所示。
图2 Meta分析在经济学中的一般分析范式
(一)理论分析
在进行Meta分析之前,先要明确所要研究的经济问题,确定研究主题和研究目标。由于Meta分析是基于对“人为因素”导致统计偏差的考虑,能更准确地分析经济理论关系[4],这一方法适合于有重要研究意义但以往实证研究结论存在不一致尤其是存在争议性的问题。因此,经济学领域的Meta分析应选择具有争议性的经济理论问题作为研究主题,确保经济研究中研究方法选择的合理性,充分发挥这一方法的价值。此外还需有大量针对这一经济理论问题的实证研究,同时这些实证研究的效应值(4)效应值也即文献中所报告的统计数据,例如相关系数(r)、偏相关系数(pcc)、回归系数的标准误(SE)和自由度(df)、回归系数的值和自由度等。可获取且具有可比性,保证使用Meta分析的前提条件。
Meta分析需要判断和确定经济变量之间的关系,为了更加真实地模拟经济变量之间的关系,研究者通常会在控制部分影响变量的基础上,研究一个经济变量对另外一个经济变量的影响。例如在分析是否存在“资源诅咒”问题时,需要将必然会影响经济增长的宏观经济条件(受教育水平、经济开放程度、投资活动、初始GDP水平等)作为控制变量,在此基础上研究自然资源变量对经济增长变量的影响[17]。Meta分析过程中,需要根据特定经济主题的相关研究进行定性文献综述,总结出经济变量关系估计的计量模型,一般如式(1)所示:
Yi=α+βXi+γCi+μi
(1)
其中,用i表征研究个体,Yi是经济变量关系的因变量,Xi为自变量,Ci为相关变量中调节变量的向量(5)Meta分析中的调节变量也即一般模型中的控制变量。,α为常数项,β为自变量系数向量,γ为控制变量系数向量,μi为残差项。
从式(1)可以看出所研究经济变量的基本关系形式,同时还可以看出自变量Xi对因变量Yi的影响方向,由此可以提出经济变量关系的研究假设(6)也即关于两经济变量是否相关的假设,若相关,那两经济变量是正相关还是负相关的假设。。同样,也可从影响经济变量间关系的其他调节因素的综述中,提出有关调节因素对经济变量关系影响的研究假设。例如有研究在分析国际化与绩效提升的问题时,通过理论综述企业国际化和绩效的基本关系,提出了“综合国际化—绩效关系各经验研究的总体估计结果应该为正相关关系”的研究假设,此外还根据影响企业国际化—绩效关系的调节因素提出了14个关于调节因素对经济变量关系效应影响的研究假设[10]。
(二)数据搜集及数据处理
由于Meta分析所需数据源于同一经济主题的大量实证研究,因此需要全面、系统地检索出与所要研究经济主题高度相关的实证研究文献,保证样本文献的全面性、完整性和来源的多样性。可通过以下几种方式检索Meta分析所需的样本文献:一是数据库检索,先确定所要检索的数据库并说明选择这些数据库的原因,再根据研究主题制定检索策略在选定的数据库检索;二是滚雪球法检索,检索上述数据库所连接的相似文献,追索已有文献的参考文献中与已有研究主题相关的文献;三是与前述两种方法所检索到的文献作者联系,补充其提供的相关文献。所检索到的文献应包括已经发表的期刊文章、研究报告、学术论文等,还应包括未发表的灰色文献。
为保证Meta分析研究样本的质量,需按照严格的文献筛选标准从所检索到的初始文献中筛选出能进入Meta分析的研究。文献筛选一般应遵循以下原则:一是入选的文献应是针对同一经济理论展开的定量实证研究,理论研究、综述研究等文献应予以剔除;二是文献所研究的经济关系相同,研究主题一致;三是可直接或间接获取Meta分析所需的效应值;四是应剔除重复研究,也即当几篇文献采用相同的样本数据和相同研究方法进行研究时,将这些文献视为一个研究仅作为一个样本纳入到Meta分析中;五是应根据研究主题的实际情况选择研究的时间和空间跨度范围。总之研究者在文献选择中应在“宽标准-多数量”和“严标准-高质量”中进行权衡(7)“宽标准—多数量”意味着文献筛选标准宽松的情况下能筛选出更多数量的文献进入Meta分析,但这可能会降低文献质量;而“严标准—高质量”意味着严格的文献筛选标准能高保证进入Meta分析的文献质量,但会减少Meta分析的样本量。,但最终纳入Meta分析的研究不得少于30个(8)Meta分析研究样本量不得少于30,这是由于只有样本容量不低于30时才能确保误差项的正态性。,如何在二者之间进行权衡应视实际情况而定。
筛选出纳入Meta分析的研究后,从中提取研究描述数据和效应值统计数据,并给出这些数据的统计性描述。其中,研究描述数据信息主要包括每个研究的基本信息(包括作者、发表时间、发表期刊等文献来源信息)、研究变量(也即经济关系变量的测度和代理变量的选用)、研究样本(也即研究所选的样本量及样本特征、研究期间等信息)、研究方法(也即所选文献的研究设计、所采用的数据类型、数据特点等)等方面。而效应值统计数据主要指的是经济关系的原始相关系数r、回归系数β、标准误SE、t值、p值、方差等。对于缺乏Meta分析所需原始数据的文献,可通过间接计算或者和作者取得联系获取所需数据;对于不能通过前述两种途径获得数据的文献则不能纳入到Meta分析中。通常不同文献中研究描述数据和效应值统计数据的表述通常不具一致性,为了将不同研究样本放到同一框架下进行综合分析,需采用统一的编码方式对所提取的数据进行统一编码,例如,可采用哑变量(是=1,否=0)对二分类数据进行编码。
(三)研究样本的异质性检验
Meta分析是综合多个独立研究,以已有研究文献作为研究样本对总体的效应进行综合评价的一种统计方法。由于纳入Meta分析的文献在研究地、研究时间、研究者、研究对象等方面不尽相同,不同研究异质性(heterogeneity)的存在使各研究中变量关系效应的估计也不同。Meta分析中的Meta整合分析旨在求不同研究的合并效应,若不考虑研究间异质性直接将不同研究进行整合分析,则会存在将“橘子”和“苹果”进行合并的错误做法。对异质性进行检验和处理可避免这一错误的做法,更加合理地对已有研究进行合并分析。
异质性检验的三种定量方法具有相同的零假设和备择假设H0:各独立研究不存在异质性,H1:各独立研究存在异质性。当检验结果显著时,则拒绝H0接受H1,也即各独立研究存在异质性,可以通过Meta回归分析、亚分组分析识别异质性来源,当不能识别异质性来源时应采用随机效应模型进行估计;当检验结果不显著时,则接受H0,也即独立研究间不存在异质性,可以选择固定或者随机效应模型进行统计分析。
(四)发表偏倚识别
发表偏倚(Publication Bias)有时也被称为文件抽屉问题,是指同类研究中具有统计学意义的研究较之无统计学意义的研究更易于被接受和发表,使得Meta分析会夸大变量关系效应的一种现象。发表偏倚现象源于研究人员、编辑、资金资助者等倾向于发表和报告特定类型的估计结果,一方面,论文撰写者撰写中存在主观性,会根据估计结果是否显著来选择所报告的估计模型,可能会高估研究结果的显著性;另一方面,当评审一篇论文能否发表时,关注的是论文中解释变量对被解释变量影响的大小、方向以及显著性,则会存在发表偏倚问题(R.Rosenthal,1979)。按照Stanley的观点,具有显著性的实证研究更受论文评审者青睐[18],也有一些研究发现一些经济主题的文献存在很强的发表偏倚性[9]。Meta分析的文献检索和筛选中再科学的检索策略和再严格的筛选标准,均不可避免会存在发表偏倚问题,这会降低Meta分析结果的可靠性。因此,Meta分析中需对纳入Meta分析研究的发表偏倚性进行检验,以减少其对Meta分析结果的影响。
发表偏倚检验的方法有漏斗图法、失安全系数法、剪补法、森林图法。在经济学领域的研究中,Stanley提出采用漏斗不对称检验(Funnel Asymmetry Tests)来检验发表偏倚问题[18],当前也有部分经济学研究采用失安全系数法和森林图法进行检验。但是,有研究者通过蒙特卡洛模拟发现漏斗不对称检验是识别发表偏倚问题的有效工具[19],当前更多经济学研究采用的是漏斗图法进行检验,故此处仅对其进行阐述。
漏斗不对称检验是基于研究所报告标准差对效应量影响的估计,一般采用下述方程进行估计:
pccij=β0+β1SEij+μiji=1,2,…,N;
j=1,2,…,S
(2)
式(2)中,pccij为第i个研究中第j个估计的效应量(12)经济学领域中偏相关系数(pcc)较其他效应量具有优势(详见表1),本文后续均仅考虑以pcc作为效应量的情形。,SEij为对应的标准差,N为研究的总量,S为所有研究中估计个数的最大值,μij为残差项。根据Stanley等处理异方差问题的方式(13)Stanley和Doucouliagos(2012)对上述公式进行了转换,两边同时除以SEij。,式(2)可转化为式(3)的估计方程[13]:
Tij=β0/SEij+β1+νij
(3)
式(3)中因变量Tij为式(1)中估计系数β的t统计量,Tij=pccij/SEij,发表偏倚检验的原假设H0:β1显著为零,备择假设H1:β1显著不为零。当拒绝原假设时,我们得到漏斗不对称的证据,也即Meta分析文献存在发表偏倚问题,且用β1的正负表示偏倚方向(14)当β1为正数时,表明发表偏倚对Meta分析存在积极的影响;当β1为负数时表明发表偏倚负向影响Meta分析结果。;相反当接受原假设则不存在发表偏倚问题。β0的统计显著性可说明发表偏倚以外的真实效应。
(五)综合分析
Meta分析作为一种综合分析方法,基于同一经济主题下的已有研究,以已有研究为研究样本,数据源于现有文献,在考虑研究样本异质性和发表偏倚性的前提下对现有研究进行综合分析。Meta分析最终的综合分析包括Meta整合分析和Meta回归分析以及Meta分析结果的解释。
Meta整合分析的关键在于平均效应量的计算,效应量为能从总体上表征一个变量造成另外一个变量变化强度的统计变量(Hedgeset等,1985;Cohen,1992)。而在经济学领域,Meta分析的效应量应是衡量经济变量关系效应具有经济学含义的指标,如相关系数(R)、回归系数(β)、弹性系数(β′)、偏相关系数(pcc)这样的指标[14]。通过对经济学领域Meta分析中几种可选效应量的对比(如表1),由于偏相关系数不仅易获得、不存在单位和数量级差异的问题,且具有经济学含义,经济研究中的Meta分析常选其作为效应量。在确定效应量后可通过简单平均法(15)简单平均是基于样本研究文献的效应量是同质的假设,未考虑样本间的差异问题。、样本量加权法(16)以每个样本文献中的样本量作为权重进行加权,在一定程度上能修正抽样误差。、变异加权法(17)用观察变异Vi=1/(ni-3)的倒数进行加权。对样本文献的效应量进行求平均。结合效应量的经济学含义可以分析总体上经济变量的关系效应。
表1 经济学领域Meta分析中可选效应量的对比
注:总结自彭俞超等对于效应量选择的阐述[15]。
由于在众多关于同一经济主题的研究中,经济变量关系的估计效果取决于估计特征、相关经济变量的选择和测度、数据类型、研究区域等调节变量,值得关注的是不同研究的结论为什么会存在差异?Meta回归分析旨在探索调节变量对效应量的影响,能给出研究结论存在差异的原因。一般采用多元回归估计方程进行Meta回归分析,如式(4)所示(18)式(4)是加入调节变量对效应值的影响,并将式(3)中的残差vij拆分为文献层面的残差(εi)和剩余残差(eij)。。
(4)
其中D表示会影响文献所报告出估计结果的调节变量,下标k表示调节变量的序号,K为调节变量的个数。给出式(4)中的调节变量D进行统计性描述,基于上述回归方程和相关变量数据进行Meta回归分析,分析不同调节变量对经济变量关系效应的影响。
最终,还需要从以下三个方面对Meta分析的研究结果进行解释。一是针对一个经济理论,根据Meta整合分析结果,就已有的实证研究中存在不确定、模糊的甚至具有争议的研究结论给出更为合理且具有一般意义的结论;二是根据发表偏倚识别的结果分析影响某一经济理论的实证研究结论的调节因素,并分析这些调节因素调节效应的大小;三是指出这一经济主题的实证研究存在的不足,为未来该主题实证研究提供方向上的参考。
四、结论
已有研究已经表明,Meta分析法可对已有经济学研究的不同结论进行基于数理统计分析的综合评价,得到更具有一般意义的结论,以此进一步推动经济理论的发展。但是,Meta分析中存在的样本数据可靠性、样本异质性、发表偏倚性等问题会影响Meta分析结果的可靠性和科学性,尤其需要基于应用范式的系统分析以减少上述问题对Meta分析结果的影响。
Meta分析是基于已有实证研究中的二手数据进行综合分析的方法,研究样本的质量会进一步影响Meta分析数据的质量和可靠性,进一步关系到Meta结果的科学性和可靠性。经济学领域中的计量经济学模型是经济理论研究和实际经济分析的一种主流的实证研究方法,计量模型中一手数据的质量以及计量处理方法的科学性和规范性均会影响初始实证结果的可靠性。此外,实证研究质量的评价具有多维性和主观性,难以统一并客观地对其进行评价。因此,在采用Meta分析对某一经济主题进行研究时,一方面需要很好地把握相关经济理论,另一方面需要整体把握这一经济主题的研究现状和分析质量,筛选出研究设计及实证处理相对规范的样本文献,确保样本数据的可靠性。由于符合常识和具有统计显著性的结果更容易被接受和发表,研究样本仅仅来自文件抽屉(file drawer),存在不全面性,一些灰色文献未纳入到Meta分析中,会存在发表偏倚问题。同时,样本文献的不一致性会导致Meta分析存在异质性问题。由于Meta分析中存在的异质性以及发表偏倚性均会影响Meta分析结果的可靠性,因此研究间异质性的检验和处理,以及发表偏倚的识别与修正是Meta分析中不可或缺的环节。此外,Meta分析方法在经济学研究领域中的应用还需要考虑样本文献数据量的问题。虽然增大研究样本量(如将更多的灰色文献纳入到Meta分析中)可以降低发表偏倚性,提高研究样本的质量可减少Meta分析中的异质性,但二者是矛盾的,因此在文献筛选中如何在“研究质量与大样本”之间进行权衡尤为重要。
经济学研究通常基于特定分析范式的重复性研究来寻求经济规律。由于每个实证研究实施条件不可能完全相同,经济学领域的重复研究是不可能的,单个研究所得出的结论不具有一般性。而Meta分析是一种基于已有研究进行系统研究的方法,能充分利用已有的实证研究结果,将独立的研究结果进行综合分析,探究出一个具有一般性意义的结论,同时还能探究实证研究差异性结果产生的原因,为进一步的实证研究提供方向性指导。Meta分析作为一种定量的文献综述方法,通过定量分析得到的量化分析结果,纠正了传统叙述性文献综述在评价上的主观性问题,使文献综述评价更具客观性和准确性。此外Meta回归分析还可以分析实证结果存在差异的原因,进一步规范经济学的实证研究,有效避免发表偏倚问题,降低不同研究的异质性。
目前,中国经济学领域研究已经具备了应用Meta分析的良好条件。一是Meta分析在引入到经济学领域之前已经有了很好的发展,这为Meta分析在经济学中的应用提供了方法论基础;二是计量经济学方法在经济学领域已经成为研究的主流方法,实证研究文献快速增长,为Meta分析方法的应用提供了较为充分的样本数据基础;三是随着科学技术的进步,相关的分析软件为Meta分析提供了技术支持,例如,Stata软件中有专门的Meta分析模块,R软件中有专门的Meta包,这些都为经济学的Meta分析提供了可操作的应用软件。
总之,尽管也有学者质疑Meta分析的科学性,但是,有如学者对计量经济学应用的可信度有质疑而计量经济学模型仍然是一种主流的实证方法一样,这不会影响Meta分析在经济学中的应用,相反会进一步推进Meta分析法的完善。经济学研究者既要认识到Meta分析在经济学领域的应用价值,也需要充分理解和掌握这一分析方法的一般分析范式。