APP下载

基于状态空间模型的GDP与用电量数据协调性评估
———以山东为例

2015-12-08邓慧

当代经济 2015年2期
关键词:参照系协调性年份

○邓慧

(山东省统计局 山东 济南 250100)

基于状态空间模型的GDP与用电量数据协调性评估
———以山东为例

○邓慧

(山东省统计局 山东 济南 250100)

本文以山东省为例,尝试使用状态空间模型对动态数据协调性进行评价。首先通过分层聚类选择参照系,分别利用整体偏离系数、变异系数和时点偏离指数等参数对数据的整体偏离情况、整体波动情况和时点偏离情况进行协调性评估,并得出基本结论:山东省电力消耗系数明显高于全国平均水平,二者总体变动趋势具有相似性;以七省市聚类数据作为参照系,则山东省与新参照系的电力消耗系数整体差距有所缩小,但系数差本身波动较大,协调性不够理想。

数据评估 协调性 状态空间模型

一、引言

近年来,人们对统计数据的需求与日俱增,大量统计数据用于政府宏观决策、企业生产经营,以及公众生产生活上,社会各界对统计给予了越来越多的关注,了解统计、应用统计、监督统计的意识不断增强。随着关注度的提高,部分统计数据也引起了广泛质疑,特别是在1998年亚洲金融危机期间和2008年全球金融危机爆发以来,国际研究机构从数据协调性的角度对中国GDP等数据提出了质疑。中国及各地区统计数据的协调性究竟如何,采用什么样的方法可以对各地区数据进行客观评估并找出不协调的数据等等一系列问题亟待解答,对统计数据的协调性和准确度做出客观评估具有重要的现实意义。

二、文献综述

国内外学者采用多种方法评估中国经济数据协调性,并得出了不同结论。Rawski(2001)指出,中国经济增长率与能源消耗数据之间、生产数据之间以及生产数据与投资数据之间存在数据不匹配,并由此质疑中国统计数据造假。Klein和Ozmucur(2002)选取对中国经济有广泛代表性的15个指标进行了主成分分析,结果表明,各指标的变动与中国官方数据的变动是一致的。任若恩(2002)考察了德国、英国、日本和韩国的经济增长与能源增长数据,发现这些国家都曾经出现过二者不同步的现象。阙里和钟笑寒(2003)借鉴Klein和Ozmucur的思想,使用1984—2001年的中国省际面板数据开展研究,为中国GDP数据真实性的讨论提供了地区一级数据的检验,结果表明,从整个时期来看,各地区的若干基础经济变量(包括能源消费量)相对于各自GDP的变化趋势是符合基本经济规律的,年度特殊影响也不严重,地区特殊影响虽然较大,但可以从地区经济结构及其变化等方面的差异上得到解释。周国富和连飞(2010)选取了9个主要经济指标,提取其主成分,并考虑地理空间因素对经济增长的影响,采用空间面板数据模型对中国地区GDP数据的真实性进行经验分析,结果表明中国地区GDP同各经济指标的协调性较好,分年份来看也没有被系统高估的迹象。

以往学者的研究往往偏重于经济数据的静态分析。对宏观经济数据而言,由于经济改革、各种各样的外界冲击和政策变化等因素的影响,经济结构会逐渐发生变化,在相似的外部环境和内在因素下,指标间的相互关系具有相似性,通过同时期数据关系演变趋势的对比可以在一定程度上反映和评估数据的协调性。考虑到使用固定参数模型难以反映数据关系的动态变化,在数据评估方面难以体现灵敏性和动态性,因此本文选择状态空间模型(Harvey 1989,Hamilton 1994)这一变参数模型反映指标间的动态关系,并通过参数变化趋势的对比进行数据协调性评估。

三、模型构建

以GDP为被解释变量,用电量指标为解释变量,构建模型如下:

量测方程:gdpt=powertβt+ut,…,T (1)

状态方程:βt=+φtβt-1εt,t=1,2,…,T (2)

式(1)中,可变参数βt是电力消耗系数,为不可观测变量。式(3)中ut和εt相互独立,且服从均值为0,方差为和协

方差矩阵为Q的正态分布。

图1 1995—2010年电力消耗系数对比

表1 1995—2010年山东省和参照区域电力消耗系数对比

将1995—2010年全国及山东省GDP和用电量数据代入,利用EViews 5.0软件计算出时变的电力消耗系数结果如图1所示。

从电力消耗系数的变化趋势看,山东省与全国的电力消耗系数总体趋势具有相似性,除2004年等个别年份外,多数年份的系数差相对稳定。从电力消耗系数时点值的比较看,1990—2010年山东省电力消耗系数均明显高于全国平均水平,但考虑两者的经济发展状况差别较大,山东作为东部沿海城市,以全国作为参照具有较强的不可比性。因此我们选择人均地区生产总值指标对全国各省市做聚类分析,并将山东省所在的包括北京、江苏、浙江、广东、辽宁、福建、山东等七个省市大类的GDP和电力消耗数据加总,以此作为参照系进行数据评估。通过状态空间模型求得参照区域电力消耗系数,对比情况如图1和表1所示。

可以看出,与以全国为参照相比,山东省与新参照系的电力消耗系数整体差距有所缩小,但系数差本身波动较大,尤其是1997年、2001年等年份,协调性不够理想。山东省与参照区域电力消耗系数差如图2所示。

图2 1995—2010年山东省与参照区域电力消耗系数差

四、模型评估

通过电力消耗系数差可以从整体偏离、整体波动和时点偏离三个角度进行数据协调性评估。

1、整体偏离评估

从整体偏离的角度,可以通过整体偏离系数对数据做出评估和判断,其表达式为:

其中,Δ ̄β ̄表示待评估区域与参照区域电力消耗系数差均值,β ̄0表示参照区域电力消耗系数均值。整体偏离系数反映待评估区域相关数据整体偏离的程度。我们可以结合实际情况和相关省市整体偏离系数的大小设定警示标准,例如可以将该警示标准设定为0.1,小于警示标准值视为数据整体基数较为客观,超过警示标准则视为相关年份数据整体匹配度偏低,或基数偏大。计算可得1995—2010年山东省整体偏离系数为0.114,如果假定警示标准为0.1,则可以据此对数据质量做出整体评估,或在此基础上引导调整。

2、整体波动评估

从整体波动的角度看,可以使用变异系数法对一个省市数据的协调性做出评估,其表达式为:

其中,S表示电力消耗系数差值的标准差。变异系数值能够动态反映待评估区域相关数据的稳定性。我们可以根据需要设定变异系数的警示标准,例如可以将该警示值设定为10%,低于警示值表示相关年份数据基本稳定,或协调性较好,超过警示值则表示数据波动偏大,并可将此标准作为数据评估调整的参照。计算可得1995—2010年山东省电力消耗系数差的变异系数为22.5%,依据10%的参照标准,该省数据波动偏大,匹配度不理想。

3、时点偏离评估

从时点偏离的角度看,可以通过时点偏离指数对具体年份数据的异动情况做出评价,其表达式为:

时点偏离指数以参照系为基础能够直观反映某一年份数据的异常波动情况。我们可以结合实际需要设定警示标准值,例如可以将警示值设定为0.2或0.3,低于警示值视为该年份数据基本稳定,超过警示值则表示该年份数据出现异常波动。计算可得山东省各年份的电力消耗系数差的偏离指数,如果以0.2为警示值,则山东省1997年、1999年、2001年、2004年数据出现异常;如果以0.3为警示值,则山东省1997年和2001年数据出现异常波动,表示相关年份数据不够协调。

五、研究结论

研究发现,1995—2010年,山东省电力消耗系数明显高于全国平均水平,二者总体变动趋势具有相似性,除2004年等个别年份外,多数年份的系数差相对稳定;若以北京、江苏、浙江、广东、辽宁、福建、山东七省市聚类数据作为参照系,则山东省与新参照系的电力消耗系数整体差距有所缩小,但系数差本身波动较大,尤其是1997年、2001年,协调性不够理想。

[1]卢二坡:统计数据质量评估方法述评[J].工作视点,2006(12).

[2]孟连、王小鲁:对中国经济增长统计数据可信度的估计[J].经济研究,2000(10).

[3]张新、蒋殿春:中国经济的增长——GDP数据的可信度以及增长的微观基础[J].经济学(季刊),2002(1).

[4]任若恩:中国GDP统计水分有多大—评两个估计中国GDP数据研究的若干方法问题[J].经济学(季刊),2002(1).

[5]Rawski Thomas G.:近年来中国GDP增长核算:目前的状态[J].经济学(季刊),2002(1).

[6]许宪春:中外经济学家对中国经济增长率的评论[J].财贸经济,2003(2).

[7]阙里、钟笑寒:中国地区GDP增长统计的真实性检验[J].数量经济技术经济研究,2005(4).

[8]周国富、连飞:中国地区GDP数据质量评估—基于空间面板数据模型的经验分析[J].山西财经大学学报,2010(8).

[9]高铁梅:计量经济分析方法与建模[M].北京:清华大学出版社,2009(5).

[10]陈强:高级计量经济学及Stata应用[M].北京:高等教育出版社,2010.

猜你喜欢

参照系协调性年份
特殊的一年
协调性练习在小学足球训练中的作用
小学足球教学的协调性训练对策分析
探讨高中物理参照物问题的解题思路
各地区高等教育与经济发展水平协调性分析
什么是闰年?
一样的年份
更正
环境雕塑在共有空间中协调性