大数据背景下CPI之GEKS指数构造方法研究进展与评述
2020-10-12陈立双张金廷
陈立双,张金廷
(1.湖北经济学院 旅游与酒店管理学院,湖北 武汉 430205;2.新加坡国立大学 理学院,新加坡 119077)
一、引 言
大数据作为推进国家治理能力与体系现代化的一种技术路径和有效手段,它具有催生管理革命和服务模式创新的效果,也必将给政府机构改革带来新气象。而在通货膨胀领域,政府可通过对大数据的实时采集和高效处理,及时了解未来物价走向,提前预知通胀或经济危机,以推动政府通胀治理的技术、手段和管理模式创新。居民消费价格指数(以下简称“CPI”)作为反映通胀水平的重要指标,其实践编制中也开始逐渐引入居民消费大数据。目前,美国、英国、澳大利亚、新西兰等越来越多的国家,开始尝试利用网络抓捕数据、扫描数据等扩展CPI数据采集范围,创新编制CPI。2015年8月,中国国务院常务会议也明确提出,要充分运用大数据实现对经济运行更为准确的监测与预测,提高决策的针对性、科学性和时效性。可见,大数据背景下创新编制CPI已经成为一种国际必然趋势。
但纵观国内外学术界,大数据背景下CPI创新编制中亟需解决的问题颇多,指数创新构建就是其焦点之一。而具有最佳经济特征的GEKS多边价格指数,则是国际学术界研究的热点指数[1]。因此,本文在对GEKS指数序列构造的研究成果进行梳理的基础上,归纳、总结了GEKS指数序列更新方法与窗口长度选择、GEKS指数序列优良性检验、GEKS指数序列中商品质量调整、GEKS指数与其它多边指数的比较及其国际应用等方面的研究进展,以厘清其发展研究趋向、进一步推动GEKS多边价格指数理论与方法的创新发展。
二、传统CPI指数构造危机与GEKS指数创新构造
(一)传统CPI指数构造危机
基于国际学术界的长期呼吁及联合国、国际货币基金组织等的极力推崇,包括美国、中国等很多国家在CPI指数序列的编制中,已经由定基指数转向链式指数[2]。这一重要转变,既有助于减少引入新商品时所带来的困难,也为适时更新CPI代表性篮子提供了极大便利,从而促进CPI代表性和准确性的不断提升。但是大数据属于巨量数据,其更新速度快,流失率高、波动性大[3]。已有实证研究表明,基于大数据,传统指数公式编制的链式价格指数存在明显的漂移性(1)链式漂移,也即当所有商品价格都返回到初始(基期)水平时,链式总指数值不等于单位值的现象。,尤其是在长期经济变动存在逆转时,其累积的“漂移”可能严重歪曲实际经济增长率[4-6]。因此,创新构造能够解决链式漂移问题的大数据价格指数,就成为大数据背景下CPI指数编制的关键。
(二)大数据源头下GEKS指数的创新构造
GEKS多边指数是经合组织、欧共体统计处和联合国粮农组织进行各种国际比较时,使用的主要汇总方法,由于该指数在克服链式漂移问题上的良好效果,Ivancic L,Diewert E,Fox J将其创新性地引入到CPI指数中[4]。令PlT表示以l(l=1,2,…,T)为基期,T为当期的Tornqvist价格指数;Pl1为以l(l=1,2,…,T)为基期,1为当期的Tornqvist价格指数,则基于GEKS多边指数下第T期相对于第1期商品价格的综合比较水平为:
上述4类方法依次被称为移动更新法(Movement splice)、窗口更新法(Window splice) 、半窗口更新法(Half window splice)和均值更新法(Mean splice)[7-9]。
(三)关于GEKS指数优劣性评述
CPI编制中GEKS指数的构造,不仅可以克服链式指数的漂移性问题,而且能够最大限度利用任意两个时期内所有能够匹配的代表规格品[10]。但也有部分学者对其实践应用提出了一些质疑。比如,乔晗认为,该指数不容易向CPI用户解释,也未受到统计界的广泛接受,所以不适合作为国家统计政策来实施[11]。陈立双和周宇驰认为,GEKS链式指数仍存在漂移性,漂移衰减程度也有待进一步深入研究[12]。
三、CPI中GEKS指数构造方法研究进展
(一)GEKS指数序列更新与窗口长度选择方法研究
1.GEKS指数序列更新方法比较研究
可见,GEKS指数序列更新方法的选择是一个较为复杂的综合性问题。不同学者、基于不同角度得出了相关结论,但尚未达成相对客观可靠的一致观点。
2.GEKS指数窗口长度确定问题研究
在国际多边比较中,窗口长度一直是个引人关注的问题。比如,Ivancic L等的研究认为,季节性商品具有周期性,要完整地考查季节性商品,就需要至少观察一年时间。因此,为了提高季节性商品的可比性和提供一个足够稳定的价格指数序列,可以考虑选择窗口长度为13个月[4];De Haan等则指出,13个月也是GEKS指数处理季节性产品的最短长度[16]。Chessa A基于电子数据进行不同窗口长度的比较研究发现,不同窗口长度对不同类型商品的GEKS指数影响存在一定差异;1年期的时间窗口更适合于超市扫描数据,而更长的时间窗口则更适合于药品扫描数据[15]。
基于上述分析,13个月是GEKS指数的最小窗口长度,已在学术界获得一定共识,但13个月是否为最优窗口仍不能确定。究其原因主要在于:从理论上系统论证最优窗口长度比较困难,而且最优窗口长度的影响因素较多,这使得该问题的研究变得更加复杂。因此,对于该问题的科学认识,还有待后续研究的深入推进。
(二)GEKS指数序列优良性检验及其问题研究
学术界通常借助数学形式及其特征,考察指数构造的科学性、有效性和实用性,这一方法被称为指数的优良性检验。作为一种极具应用价值的多边指数,GEKS指数的优良性也是备受关注的一大问题。对此,学术界以传递性和恒等性检验为研究重点。
1.GEKS指数序列传递性检验及其问题研究
传递性检验的基本含义是,两个时期之间的链式指数应该等于这两个时期直接比较指数,该检验是学术界关注度极高的一个重要检验。在国际多边比较中,GEKS指数是满足这一检验的。但在CPI时间序列比较指数中,由于窗口不断更新而导致该指数不满足该检验。然而,已有实证研究显示,利用GEKS指数编制的链式指数,不存在明显的链式漂移,或者说其漂移已经不是重点考虑的问题,因为该指数具有漂移性衰减的显著优势[19-21]。也正因为如此,自2009年该指数被引入CPI以来,就一直获得了指数领域的极大关注,并得到国际学术界的高度认可。
2.GEKS指数恒等性检验及其问题研究
恒等性检验的含义是,如果“篮子”内各项商品价格在两个时期都保持不变,则其价格指数必须等于1。对于传统价格指数,如Jevons、Carli、Dutot、拉氏、帕氏、Fihser、Walsh、Törnqvist、Lowe和Young等指数,几乎都满足这一检验。而且,在指数检验体系中,该检验也是指数公式中通过率最高的一项检验。但GEKS指数并不满足这一检验。Melser D通过对GEKS-Törnqvist指数的分解分析发现,该指数可分解成纯价格指数、销售额指数和随机误差项等三部分,并指出即使没有任何商品的价格变化,该多边指数依然可得出商品价格水平发生变化的错误结论[22]。Von der Lippe等关于恒等性检验的研究指出,即使篮子中全部商品价格都没有发生变化,GKES指数序列值也可能大于单位值,或者小于单位值;当商品价格发生变化时,其指数值反而可能变成了单位值[23]。实际上,GEKS指数恒等性检验的失效,表明该指数难以满足纯价格比较原则,容易引发恒等性检验失效偏误[24]。随着商品相对价格与交易量间协方差的增加,其偏误程度也会变大。实际上,这也是统计部门难以向用户解释,该指数尚未大规模投入实践应用的一个原因[25]。
GEKS指数序列恒等性检验的失败,可能是与生俱来的。随之而来的问题是,恒等性检验失败所造成的偏误程度到底有多大,这一偏误是否具有传递性和长期的累积性。关于这些问题的研究,也亟需理论与实践的系统论证。
(三)GEKS指数序列中商品质量调整问题研究
前述GEKS链式指数序列都属于直接比较指数,也即将“动态基期”内不匹配或者新旧产品加以剔除。但在大数据环境下,产品更新换代快,报告期与基期的产品匹配度低,时间上同质可比性差,从而引发了商品质量变化现象[26]。如何有效处理商品质量变化,尽可能提高商品的匹配性,就成为GEKS指数序列编制中亟需解决的重要实践问题。对于该问题的研究,学术界主要基于如下两条主线展开。
1.商品质量信息充分时的质量调整方法研究
超市扫描数据和网络交易数据通常都包含商品交易价格、数量及商品质量等信息,这为GEKS指数中商品质量调整提供了极大方便。De Haan和Krsinich F借助八类电子产品扫描数据,通过三类方法,即直接虚拟法、时间虚拟变量的Hedonic模型法和时间产品虚拟模型法,对未能匹配的商品价格进行虚拟,再将其价格指数输入GEKS指数。据此编制的指数,分别称为ITRYGEKS、ITRYGEKS(TDH)和ITRYGEKS(TPD)指数。结果显示,仅ITRYGEKS(TDH)指数波动性相对较小,八大类电子消费品的综合价格指数与新西兰统计局编制的ITRYGEKS(TDH)指数非常接近[27]。
由此可见,商品质量信息充分的条件下,ITRYGEKS(TDH)指数法是GEKS指数序列下商品质量调整的理想方法[28-29]。新西兰CPI中部分电子消费类产品,已经编制了此类商品价格指数。
2.商品质量信息缺失时的质量调整方法研究
当商品质量信息出现缺失时,学术界也探讨了商品质量信息缺失情况下GEKS指数的商品质量调整问题。而De Haan等人研究均认为,当所有商品质量信息都无法获取时,时间产品虚拟模型法可能是一种非常有应用前景的方法[8,30]。但陈晓君认为,TPD指数无法区分产品特征价格,并提出以特征市场供求均衡理论和成本构成作为基础,对特征价格指数质量调整法进行改进[31]。De Haan等研究指出,在商品质量出现明显变化的情况下,其指数还会出现严重下偏误[5-6]。实际上,有不少学者认为,尽管TPD是一个针对商品质量调整的价格指数,但由于没有使用任何商品特征信息,该模型是不可能对商品质量进行调整的。De Haan,Krsinich F试图通过其它方法来解决该问题,如通过取相邻两个时期内共同存在的商品,以构造交集性(Intersection)的GEKS指数等,但均未取得令人满意的效果[16]。
由此可见,在商品质量信息极其缺乏的情况下,GEKS指数如何开展商品质量调整,仍然是一个悬而未决的问题。
四、CPI中GEKS指数的国际应用进展及研究评述
(一)GEKS指数的应用范围及其数据来源
GEKS价格指数在CPI中的应用,最为典型的国家是澳大利亚和新西兰。自20世纪90年代以来,澳大利亚统计局就开始评估并尽可能地引入信息化交易数据,以扩展政府CPI统计数据来源,提高CPI的代表性、覆盖性和及时性。目前,澳大利亚CPI中信息化交易数据比例已高达25%,而且针对部分商品编制了GEKS链式指数。而新西兰统计局近十年来关注的活跃领域是基于扫描数据的价格测量。其利用扫描数据的主要目的在于:更加准确的价格测度、更为真实地反映商品交易量的季节性波动、商品间的相互替代效应等。目前,新西兰也在CPI中逐渐扩大使用扫描数据和网络交易数据的范围。将这两个国家的应用范围及其数据来源的相关信息列于表1。
表1 澳大利亚和新西兰CPI中GEKS指数的应用现状
从表1中可知,两个国家在GEKS指数的汇总层次上,都是基于扫描数据的基本分类价格指数;而在应用对象上则存在较大差异,其中澳大利亚侧重于食品类消费品,而新西兰则侧重于耐用消费品。
(二)GEKS指数构造方法应用
在系统的实证分析及相关专家的建议下,澳大利亚统计局决定,2017年12月开始正式在CPI中编制ITRYGEKS(TDH)指数,以解决大数据下GEKS链式指数的漂移性问题和商品质量变化问题,并将GEKS指数的窗口长度确定为9个季度。同时,该统计局还编制了加权时间虚拟产品模型的多边价格指数,用于比较和参考,并在更高层次上使用Lowe价格指数对GEKS价格指数作进一步的汇总。实施过程中,统计部门对这些方法的应用情况进行实时跟踪和必要的调整和改进,其GEKS指数方法和技术仍在不断发展完善中。新西兰统计局从2014年9月开始利用超市扫描数据,在CPI中针对部分商品构造ITRYGEKS(TDH)指数,并将其窗口长度确定为5个季度。此外,对于CPI中引入的网络抓捕数据,由于缺乏详细的商品质量信息,新西兰统计局考虑将窗口更新法与时间虚拟产品模型法结合使用,以构造网络抓捕数据的相关CPI指数。
上述两个国家借助大数据编制GEKS价格指数,取得的显著成就和积累的宝贵经验,向国际社会展示了GEKS多边价格指数的应用前景。
五、CPI中GEKS指数与其它多边指数的比较研究
(一)CPI编制中的几类多边指数
根据目前学术界的研究来看,CPI编制中可选用的多边指数主要有:(1)GEKS指数,该指数由Gini提出,Elteto、Koves及Szulc将其应用于国际比较,学术界称其为GEKS多边指数;(2)时间产品虚拟指数(也即TPD指数),De Haan,Krsinich F将Summers提出的Country-Product Dummy (CPD) 方法应用于CPI中,并称其为Time Product Dummy(TPD)指数[27];(3)Geary-Khamis指数(也即GK指数),该指数由Geary和Khamis提出,被Chessa A引入时间序列中,并用于构建荷兰CPI中部分商品的价格指数[32];(4)CCDI指数等,该指数由Diewert E和Fox J基于相关研究加以界定。其它多边指数,比如Intersection GEKS、ITRYGEKS(TDH/TPD)、QAUV_TPD等均由此衍生而来。目前,这些方法在CPI编制中的应用,形成了极为丰富的比较性研究成果。
(二)CPI编制中GEKS指数与其它多边指数的比较研究
Chessa A等基于荷兰床上用品、糕点、办公用品和男士T恤等商品的超市扫描数据,实证比较了GEKS、GK、TPD和TDH等多边指数值。研究结果发现,TPD与GK指数没有任何的差异,GEKS指数与这两类指数间呈现了轻微差异,而TDH指数与其它三类指数间呈现了相对明显的差异,尤其是T恤类商品更为明显[14]。究其原因主要在于,TDH指数充分利用了全部商品特征信息,包括新产品信息,而其余三类方法则未充分利用相关特征信息。TDH和GEKS指数之间明显的差异,是因为传统Hedonic模型中商品特征缺乏相互作用,以及调整项目与商品重新标价所引发的错误加权所致。Diewert E等借助人工数据,以常数替代弹性指数为基准,开展了不同替代弹性下WTPD、GK、GEKS和CCDI指数的比较研究,并指出随着商品间替代弹性的增加,各指数间的差异不断扩大,尤其是GK指数总存在明显的上偏。但总体而言,根据作者的研究,GK指数和WTPD指数的表现相对较差,GEKS指数要比这两类多边指数更为理想,而均值拼接法下的CCDI指数表现则最优。但其实证研究主要基于人工数据展开,结论的可靠性及CCDI指数的实践应用效果仍有待于进一步验证。
此外,澳大利亚统计局在2016年开展了一项研究计划,以优化澳大利亚CPI,并最终出版了一份研究成果——《Making Greater Use of Transactions Data to Compile the Consumer Price Index》。该研究基于2012年9月到2016年3月间食物、不含酒精饮料、烟酒、家具、家用设备和服务交易等大数据,就TPD、GK、QAUV_TPD和GEKS等几类多边指数的实践应用效果进行了比较性研究,从理论与实证角度支持大数据价格指数中使用多边指数,并指出没有任何一种方法能够满足文献中所提出的全部检验,GEKS方法相对而言是最佳的方法[1]。
六、研究评述及展望
近十年来,GEKS指数序列构造理论与应用研究取得了较为丰硕的成果:(1)GEKS指数属于目前CPI指数构造中最具关注度、更具经济学理论基础,以及研究成果最为丰富的一类多边价格指数;(2)GEKS指数序列具有克服链式漂移的良好效果;(3)GEKS指数序列更新方法2的应用效果较差、其它几类更新方法尚无定论;(4)GEKS指数的最小窗口长度为13个月,且延长窗口长度会带来系列不良后果,但何为最优窗口长度仍悬而未决;(5)GEKS指数序列不满足恒等性检验;(6)在商品质量信息充分的情况下,将GEKS指数与时间虚拟变量Hedonic模型相结合,可以实行有效的商品质量调整;但在商品信息缺乏的情况下,GEKS指数构造中如何开展商品质量调整,还存在较大争议。基于对现有文献的评述,本文认为大数据背景下,CPI中GEKS指数构造方法问题的研究,未来应重点聚焦以下几方面问题:
第一,基于商品替代偏误视角评估各GEKS指数序列更新方法的优劣性。大数据属于高频率数据,商品种类更新快、交易价格和数量波动大,容易引发商品间的替代效应,从而造成替代偏误,这也是传统CPI指数所面临的突出偏误。为了有效解决该问题,同时更有效地识别出更优的更新方法,可以针对更多种类商品,借助时间跨度相对较长的扫描数据或网络交易数据,就各更新方法开展商品替代偏误测算与评估,以选择更优的更新方法。
第二,探讨最优窗口长度的认定标准以确定更为理想的窗口长度。窗口长度的选择是GEKS指数编制中尚未解决的难题,也是事关商品质量调整、季节性产品处理、GEKS指数偏误、数据维护与更新成本的复杂经济问题,需要基于多种因素考虑,以研究出一种最优窗口长度的认定标准,并进行有效决策。而这一研究,首先需要系统性探讨窗口长度与GEKS指数序列及其更新方法间的动态关系和变化规律,然后据此进行综合权衡与比较研究,以识别出最优窗口长度。
第三,加强GEKS指数恒等性检验失效偏误大小的测度研究。既然GEKS指数序列违背了恒定性检验,也必将造成相应的检验失效偏误,从而在某种程度上影响其实践应用。而对于这一问题,目前极少有学者进行其偏误程度测度的研究。因此,有必要进一步探讨恒等性检验失效的系列影响因素,并通过有关定量分析,以有针对性地对其偏误加以测度及探讨出有效的应对方法。
第四,继续开展商品质量信息缺失情况下GEKS指数商品质量调整问题研究。由于商品质量信息缺乏情况下,时间产品虚拟模型不仅难以实现商品质量调整,而且容易形成偏误。针对该问题,可通过网络抓捕方式获取商品质量信息。例如,目前,美国劳工统计局已经开始利用这一方法开展Hedonic方法下的商品质量调整统计工作。实际上,这也是目前解决该问题切实可行的突破口和有效措施;另一方面,也可以尝试通过理论研究来解决和完善GEKS指数构造所面临的这一难题。
第五,探讨GEKS指数构造方法的系统性框架和国际规范问题。GEKS指数具有最佳经济特征,也是大数据背景下CPI指数编制中可供选择的目标指数。但由于这一统计工作尚处于实践应用初期,探讨GEKS指数编制的系统性框架和国际规范,将有助于促进其更为广泛的实践应用。