“格兰杰因果检验”及其应用
——基于文献计量的分析
2014-03-02郑秋红李婧华吴灿
郑秋红 李婧华 吴灿
“格兰杰因果检验”及其应用
——基于文献计量的分析
郑秋红 李婧华 吴灿
“格兰杰因果检验”由2003年诺贝尔经济学奖得主克莱夫·格兰杰(Clive W. J. Granger)在20世纪60年代末提出并经过逐步完善。该方法的基本着眼点,是两个自由变量呈高度相关,并不能说明它们之间一定存在因果关系,可能有别的因素存在,使之显示出协同变化趋势,因此,须对相关变量进行因果关系检验。“格兰杰因果检验”作为一种归因分析的方法,实现了跨学科的推广,特别是近年来,从社会经济学科被成功引入自然科学,尤其难得。
一、“格兰杰因果检验”的基本原理
简单的因果关系检验认为:如果事件A的发生改变了事件B发生的概率P,即P(B|A)≠P(B),则可以认为事件A与事件B之间存在因果关系。但事实上,A可能并不是B的原因,可能有一个共同因素C影响着A和B,造成了A与B之间的联系,也可能存在A除了直接影响B,还通过影响C来间接影响B等更为复杂的联系。
“格兰杰因果检验”运用了信息集的概念,且强调事件发生的时间序列。要检验A和B之间的因果性,设Ωn为到时间n为止宇宙中有恒定时间间隔(t=1,2,…,n)的所有信息的集合(亦包含除A和B以外的信息),Bn为到时间n为止所有B的信息,Bn∈Ωn,则Ωn―Bn为到时间n为止B以外的所有信息。Bn和Ωn均为多元变量,且为随机变量。假设:(1)现在和过去可以影响未来,但未来不能影响过去;(2)Ωn不包含任何冗余信息,如果某变量Zn与其他一个或多个变量在功能上相关,则需将其从Ωn中去除。如果有:P(An+1|Ωn)≠P (An+1|Ωn―Bn),则认为变量B是变量A的因,Bn包含一些独有的信息影响接下来An+1的发生。
“格兰杰因果检验”的思路与简单因果关系检验类似,但它集信息集的概念,把需要考虑的因素拓展。要得出B是A的原因的结论,理论上必须全面考虑论域中所有的变量,但实际操作中,不可能获得宇宙中所有的信息,而在有限的信息集中保证不遗漏重要的相关变量是非常关键的。目前很多采用“格兰杰因果检验”的研究是在两个变量之间进行检验,很容易出现遗漏重要信息的情况。例如,观察到气压计变动(A),下雨(B)的概率就会增加,即P(B|A)>P(B),显然气压计变动并不是下雨的真正原因,而气压计变动和下雨背后有一个共同的原因,即气压的降低,如果把气压降低(C)纳入信息集,A就不再是B发生的原因了。
时间序列因果检验是该方法的核心,即如果B对A构成格兰杰因果性,则Bn会影响An+1的概率分布。传统因果关系的一个缺点是没有考虑事件发生的先后,导致有时从统计上无法区分原因和结果,从公式推导上,如果P(B|A)>P(B),则P (A|B)>P(A)一定成立,即:如果A是B的原因,则必然可以推导出B是A的原因。例如,如果P(关节痛|阴天)>P(关节痛),即阴天导致关节痛的概率增加,那么按照公式一定可以推出P(阴天|关节痛)>P (阴天),关节痛导致阴天的概率更大,这显然是不合逻辑的。“格兰杰因果检验”通过考虑时间发生的先后顺序来解决类似问题。时间序列分析是格兰杰对经济学界做出的伟大贡献,诺贝尔奖评委会认为,格兰杰的工作改变了经济学家处理时间序列数据的方法,对研究财富与消费、汇率与价格以及短期利率与长期利率之间的关系具有非常重要意义。
如果P(关节痛|阴天)>P(关节痛),即阴天导致关节痛的概率增加,那么按照公式一定可以推出P(阴天|关节痛)>P(阴天),关节痛导致阴天的概率更大,这显然是不合逻辑的。“格兰杰因果检验”通过考虑时间发生的先后顺序来解决类似问题。
二、“格兰杰因果检验”在各学科领域应用的文献计量分析
1. 数据来源及统计方法
of Science中,选择SCI-E数据库和SSCI数据库,采用检索式为:主题=(“Granger caus*”),年限选择所有年,文献类型限定研究论文和综述,共检索命中文献2362篇,其中有中国作者署名的文献310篇(包括台湾) (检索日期为2014年5月5日)。
2. 文献年代分布
图1给出了各数据库“格兰杰因果检验”主题文献随年代的分布,从图中可以看出,该方法的发展应用可分3个阶段:1981—1989年,属于起步阶段,SCI-E和SSCI中文献总量18篇,CAJD中0篇;1990—1999年,属于发展阶段,在文献数量上比前一阶段有了实质性的增长,SCI-E和SSCI中文献总量288篇,CAJD中14篇;2000年以后为跨越式发展阶段,文献数量直线增加,SCI-E和SSCI中文献总量2056篇,年均140篇以上, CAJD中高达8000多篇。
检索到中国最早引入“格兰杰因果检验”方法进行研究的学者为西安交通大学管理学院的孙林岩,他于1996年在英文期刊Journal of Environmental Management发表题为Global warming and global dioxide emission: An empirical study的文章,通过格兰杰因果检验证实,全球地表温度与二氧化碳排放之间确实存在因果关系。同年,他在中文期刊《系统工程理论与实践》发表题为《我国教育投资对国民收入的影响分析》一文,用格兰杰因果检验法检测证实,1950—1988年我国国民收入与国家对教育的投资之间存在着长期稳定的关系,且教育投资与国民收入互为因果。此后直至2000年,SCI-E和SSCI中没有检索到中国学者的相关文献,CAJD中也仅有10多篇。中国学者对该方法的大量应用是在2004年以后。
3. “格兰杰因果检验”由社会经济学科向自然和工程科学领域的引入
“格兰杰因果检验”仍然以经济学及相关领域应用为最多(表1)。在SCI-E和SSCI库检索到的文献中,有一半以上论文属于经济学相关领域。在CAJD检索到的8000多篇文献中,更有95%以上与经济学和管理学相关。随着学科研究的发展,格兰杰因果检验方法也在不断的改进和创新。由于金融时间序列数据大多是非平稳、非线性的,为适应不同情况,格兰杰因果检验模型也逐渐从传统的线性平稳领域的分析逐渐发展到线性非平稳领域和非线性平稳领域,常用的检验方法包括针对线性平稳的基于向量自回归的WALD检验,针对线性非平稳的协整检验和MWALD检验,以及针对非线性平稳的修正的Baek Brock检验。针对线性非平稳和非线性平稳领域的检验方法的发展是格兰杰因果分析在经济学领域应用发展的重要里程碑。
国际上,经济学以外的领域广泛引入“格兰杰因果检验”发生在20世纪90年代以后。SCI-E(代表自然和工程科学)和SSCI(代表社会科学)中,1980—1989年的18篇论文均在社会科学领域,且仅有1篇属非经济学领域,由美国学者Freeman于1983年将该方法用于政治关系的研究。1990—1999年,已经有40个学科领域(根据SCI-E和SSCI类别,下同)引入该方法,但288篇论文中的95%以上仍然在社会科学范畴, SCI-E中仅检索到41篇文献,占比14%,且其中34篇属于自然科学和社会科学交叉领域。此时期,经济学以外的其他领域开始逐步引入“格兰杰因果检验”,如:1991年,美国学者Enders和Sandler将格兰杰因果检验用于跨国恐怖主义与旅游的关系研究;加拿大学者Weersink和Tauer用该方法检测了加拿大各州乳品农场规模和生产率之间的因果关系;1992年,美国学者Wood以美国环保署和50个州实施《清洁空气法案》为例,用该方法分析1977—1985年美国政府的政策执行效力,结果表明,单独区分联邦执行的效力是不容易被理解的,国家和地方层面的输出是互相依存,交织在一起的。
2000—2009年,共检索到来自98个领域的778篇文献,SCI-E库检索到331篇,占比43%,其中117篇属于自然和工程科学和社会科学的交叉领域,医学、环境科学、数学、计算机、生物化学等成为应用该方法进行研究的突出领域。2010年以后仅3年多的时间,SCI-E和SSCI中已能检索到应用和讨论该方法的文献1200多篇,其领域进一步延伸, SCI-E库检索到750多篇,占比50%,虽然其中仍然有300篇左右属于自然和工程科学与社会科学的交叉领域,但可以看出自然科学领域对该方法的应用正呈突飞猛进式增长。
当前,非经济学相关领域中,以医学相关领域(包括神经科学、医学影像等)对该方法的应用最多。截至检索时间,SCI-E和SSCI库“格兰杰因果检验”主题引用频次最高的前10篇论文中,有9篇都在医学相关领域(详见本期P3页榜单)。但CAJD库在“医药卫生科
技”大类下仅检索到11篇文献。中国作者在医学相关领域发表的论文大多是与国外专家或海外华人联合发表在国际期刊上。
图1 “格兰杰因果检验”主题文献的年代分布
CAJD中,其“基础科学”类别下检索到相关文献2000多篇,其中大多是与经济学管理学的交叉领域,98%以上的文献在数学类别下,其次是资源科学,有14篇,海洋学有11篇。
表1 “格兰杰因果检验”主题文献产出较多的领域
4. “格兰杰因果检验”在地学和大气科学领域的应用
“格兰杰因果检验”在地学相关领域的应用相对较少。在SCI-E和SSCI中,共检索到地学相关领域应用格兰杰因果检验的文献56篇,其中大多数在气象学及气候变化领域(47篇)。气象学领域最早应用格兰杰因果检验方法的是 Triacca于2001年发表在Theoretical and Applied Climatology杂志上的“On the use of Granger causality to investigate the human influence on climate”一文 ,采用格兰杰因果检验研究了人类活动对气候的影响,指出人类活动对气候的影响并不十分显著。同年, Reichel等采用格兰杰因果检验研究北半球平均地面气温与太阳活动周期的关系,检验通过99%的信度水平,指出二者之间存在因果关系。
气象学领域被引频次最高的是美国波士顿大学地理系的Wang Weile等2004年发表在Journal of Climate上的“The relation between the North Atlantic Oscillation and SSTs in the North Atlantic Basin”一文和英国学者Mosedale等2006年发表在Journal of Climate上的“Granger causality of coupled climate processes: Ocean feedback on the North Atlantic oscillation”一文,两篇文章均被引用35次,都是在研究北大西洋涛动与海面温度的关系中采用了格兰杰因果检验。Wang Weile等通过研究指出格兰杰因果检验比简单的滞后相关性更为严格和可靠。Mosedale等则使用格兰杰因果关系时间序列,在耦合大气环流模式中定量诊断北大西洋涛动中每日海面温度的反馈。从研究内容看,当前研究主要集中在北大西洋涛动、厄尔尼诺、南方涛动的原因及影响、人类活动和自然因子引起的气候变化等方面。
CAJD中共检索到地学领域(自然地理学和测绘学+气象学+海洋学+地质学+地球物理学+资源科学)应用格兰杰因果检验的论文36篇,其中气象学领域8篇。地学领域应用该方法最早的论文为傅开道于2006年发表于《科学通报》上的“澜沧江干流水电开发的下游泥沙响应”一文。气象学领域最早的论文为曹鸿兴等于2008年发表于《气候变化研究进展》上的“气候检测与归因的格兰杰检验法”,该文对格兰杰因果检验法进行了介绍,并通过格兰杰检验解释我国气温变化由滞后到同步于全球气温的现象。引用频率最高的是孙慧宗和李久明2010年发表于《人口学刊》的“中国城市化与二氧化碳排放量的协整分析”一文,共被引26次。
地学气象学领域的大多数研究都是直接利用格兰杰因果检验研究不同变量因子之间的关系,而对该方法在地学气象学领域的适用性研究很少。2005年,Triacca发表论文讨论格兰杰因果检验在检测大气二氧化碳浓度和全球温度因果关系的适用性,认为应用格兰杰方法检测二者之间的关系并不合适。因此,格兰杰方法在地学及气象学领域的适用性和方法论还有待进一步的研究。
5. 国家和机构产出和影响力分析
SCI-E和SSCI库中,“格兰杰因果检验”主题文献产出量最多的国家为美国,占总文献量的33%,中国排在第2位。从他引总次数和h指数两个影响力指标来看,美国仍然远超其他国家,排在第1位。英格兰虽然在文献量上不及中国,但影响力比中国高。中国排在第3位。德国、澳大利亚、意大利、荷兰等国虽然文献总量不多,但影响力均相对较高(表2)。
表3给出了“格兰杰因果检验”主题文献产出较多的机构。国际机构中,以佛罗里达大学产出最高,中国科学院排在第7位。从表中可以看出,机构的国别很分散,排在前10位的机构中,只有2个机构同属于美国,其他机构分别隶属于不同的国家,还有一个国际机构“东地中海大学”。巴基斯坦、马来西亚等
虽然论文产出总量不高,但均有在该领域权威的机构,尤其是巴基斯坦的COMSATS信息技术学院,总排名位列第2。SCI-E和SSCI中国文献的机构以中国科学院产出最多,前11位的机构中包括6个台湾和香港机构。CAJD库发表该主题文献较多的机构集中在大学系统,以中南财经政法大学产出最多,东北财经大学和中国人民大学分列第2和第3位。
表2 “格兰杰因果检验”主题文献产出较多的国家/地区及其影响力(SCI-E和SSCI)
表3 “格兰杰因果检验”主题文献产出较多的机构
三、结果讨论
文献计量结果表明,“格兰杰因果检验”正被加速引入各领域的研究中,2000年以后国内外该主题文献的产出呈稳步增长趋势。该方法由经济学向社会科学其他领域,及由社会科学向自然和工程科学领域应用经历了一定的历程,呈现出由经济学为主(1980年代)→社会科学其他领域或社会科学与自然和工程科学交叉领域为主(1990年代)→自然和工程科学领域占相当比例(2000年以后)逐步引入,各领域共同增长的趋势。
“格兰杰因果检验”方法学及应用发展最为成功的仍然是在经济学领域,国际和中国文献数据库中,分别有超过50%和超过95%的文献都在经济学和管理学相关领域。国际上,经济学以外的领域应用该方法最多的是医学相关领域,但国内在医学领域的应用还相对较少。
地学气象学领域引入“格兰杰因果检验”开展研究是在2000年以后,国际上的研究主要集中在气象和气候变化领域,“格兰杰因果检验”为人们理解不同气象和气候因子之间的联系提供了有用的线索。国内该方法在地学气象学领域的应用还刚刚起步。目前研究中,大多都是直接利用该方法进行不同变量之间的因果关系检验,其在地学和气象学领域的适用性和方法论还有待进一步发展。
近年来,我国虽然在该领域已发表了8000多篇中文论文,但国际表现力较弱,仅有310篇(其中大陆209篇)文献发表在国际期刊上。我国相关领域研究地位与英国、德国相当,与美国相比还存在较大差距。我国在该领域的权威学者也较少,且主要集中在经济学、管理学领域,中文发文最多的作者也仅有14篇论文。
需要说明的是,文献计量方法本身尚存在一些局限性。例如,虽然前述的孙林岩的文章是研究温度与二氧化碳排放之间的关系,但由于作者本人从事的是管理学研究,且论文发表在管理类期刊上,数据库没有将其归为气象学类别。尽管如此,文献计量法能够帮助研究者从总体上把握学科发展现状和动向,是信息研究中常用且可靠的方法之一。
(作者单位:中国气象局气象干部培训学院)
深入阅读
Covey DB. 1992. Testing for granger’s full causality. The Review of Economics and Statistics, 74(1): 146-153.
Freeman JR. 1983. Granger causality and the times series analysis of political relationships. American Journal of Political Science, 27(2): 327-358.
Granger CWJ. 1969. Investigating Causal Relations by Econometric Models and Crossspectral Methods. Econometrica, 37(3): 424-438.
Granger CWJ. 1980. Testing for Causality:a personal view point. Journal of Economic Dynamics and Control, 2: 329-352.
Reichel R, Thejll P, Lassen K. 2001. The cause-and-effect relationship of solar cycle length and the Northern Hemisphere air surface temperature. Journal of Geophysical Research: Space Physics, 106(A8): 15635-15641.
Sun LY, Wang MH. 1996. Global warming and global dioxide emission: An empirical study. Journal of Environmental Management, 46(4): 327-343.
Triacca U. 2005. Is Granger causality analysis appropriate to investigate the relationship between atmospheric concentration of carbon dioxide and global surface air temperature? Theoretical and Applied Climatology, 81(3-4): 133-135.
Wood B D. 1992. Modeling federal-implementation as a system - the clean-air case. American Journal of Political Science, 36(1): 40-67.
曹鸿兴, 郑艳, 虞海燕, 等. 2008. 气候检测与归因的格兰杰检验法.气候变化研究进展, 4(1):37-41.
曹永福. 2006. 格兰杰因果性检验评述. 数量经济技术经济研究, (1): 155-160.
知网学术期刊
总库(CAJD)和ISI Web of Science平台数据库,检索国内外有关“格兰杰因果检验”主题文献。在CAJD中,采用检索式为:SU='格兰杰因果' OR SU='granger因果' OR SU='格兰杰检验' OR SU='granger检验' OR SU='格兰杰因果检验' OR SU='granger因果检验',精确匹配,时间不限定,学科不限定,共检索命中文献8337篇(检索日期为2014年5月5日)。在ISI Web