APP下载

宏观经济统计数据质量的Benford评价及实证研究

2015-09-10阚珍珍

经济师 2015年7期
关键词:宏观经济统计数据实证研究

摘 要:随着我国经济实力与国际影响力的不断提高,人们对宏观经济总量及其相关的数据统计准确性越发关注。部分学者对我国宏观经济统计数据的准确性存在着质疑,认为其存在着人为操纵因素。引入Benford评价,在分析Benford法则及其检验方法的基础上,进行宏观经济统计数据质量的Benford评价及实证研究。研究结果表明,Benford法则在数据可靠性分析上具备较好的稳健性,宏观经济统计数据可靠性特征突出,不存在人为操纵现象。

关键词:宏观经济 统计数据 质量 Benford 评价 实证研究

中图分类号:F131.30 文献标识码:A

文章编号:1004-4914(2015)07-061-02

一、引言

随着近年来国民经济的快速发展,我国经济实力与国际综合影响力不断提高,我国宏观经济统计数据质量引起了世界关注,国内外相关机构及学者对宏观经济统计的准确性问题进行了大量研究。本文引入Benford法则进行宏观经济数量质量的评价。实践证明,应用Benford法则,其在数据质量评价应用中存在着成本较低,稳健性良好等优势。在分析Benford法则及其检验方法的基础上,探究其在宏观经济统计数据质量的实证研究。

二、Benford法则及其检验方法认知

(一)Benford法则的基本认知

Benford法则是以物理学家Frank Benford名字所命名的一种数值规律,其法则认为,人们进行数据处理时,其将较小数字作为首位数字的数据的频率相对较高。其通过长时间的数据收集与分析,对其规律进行了论证,即“Benford定律”,又被称之为“首位数法则”。通过研究与推导,Benford依据其定律获得以下数学表达式:

p(d1)=lg(1+■) d1=1,2,3,…9

在上式中,p(d1)代表的是以d1作为首位数字所出现的频率参数,首位数字,指的是数据集中数字左侧的第一位数字,其数字应非零非负,确保其数据有效性。其公式即Benford法则表达式。

Benford法则的出现,为进行大量数据的数字分布状况预测提供了理论支持。然而该方法在最初阶段缺乏对该现象的合理解释与证明,随着学者进一步的研究与论证,对该法则应用的范围与影响因素进行了明确,如要求数据具备一定规模性,数据形成不执行认为直接赋值,数据不应为按照规律排列的数据集等。

(二)Benford法则在宏观经济数据质量中检测的方法

国内外大量实证性研究表明,应用Benford法则可以进行数据集中的舞弊行为有效检测,将目标数据所具备的实际数字分布规律与Benford法则条件下的标准分布规律进行对比,获取评估结果,判断其实际数据分布规律是否存在不合理现象。如存在,则说明数据统计存在着人为因素证明数据集可靠性较差。Benford法则进行数据检验,其本质上属于一种对比检验方法,具体的流程为:第一,选定宏观经济指标,进行电子数据采集,其宏观经济指标应具备代表性;第二,对所收集的数据集是否符合Benford法则进行判断,选择一定的目标字段,Benford法则其数据集适应条件为:数据信息其来源不同,采取随机抽样方式形成统计数据;第三,针对选中目标字段,将统计数据进行一定处理,如数据中存在的负值可以取其绝对值,针对首位为0的数据则可以通过数据扩大来提取数字;第四,进行数据异常分析。将所选择的数据集之中的数据首位进行分离,进行数据首位1—9各个数字所出现的频率与分布规律进行描述,将其分布规律与Benford法则条件下的分布规律进行对比,计算出其数据分布偏差参数,将所选数据第二位进行分离,采取通道方式进行数字频率统计与分布规模描述,循环操作并观察数据是否存在异常,以上操作可通过统计软件来实现;第五,依据统计结果与数字分布偏差研究,对数据可靠性进行判断,针对不可靠数据应找出原因,给出结论。

三、宏观经济统计数据质量的Benford法则评价及实证研究

在Benford法则进行宏观经济统计数据准确性实证研究中,选择两个视角进行分析,其一,对我国成立后四个经济部门的主要宏观经济指标数值执行分析,时间阶段选择1949年—2008年期间,采取Benford法则对其经济指标可靠性进行分析。综合数值取值可靠性,以分段形式进行纵向研究,进而获得宏观经济统计数据质量状况。其二,从区域视角进行研究,即以我國主要省份宏观经济指标总量进行数据可靠性分析。

(一)我国历年来宏观经济统计数据所具备的可靠性研究

1.宏观经济指标选择。在本研究中,以国民经济核算统计、政府财政统计、金融业与国际收支平衡四个部门为研究对象,选择主要的经济变量,指标选择中需要考虑指标的全面性、代表性与数据可获取性。如在民国经济核算部门,其指标选择以国内生产总值、居民消费水平、固定资本总额。支付消费支出及股票筹资额等指标;政府财政统计部门中则选择国家财政收入、国家财政支出、预算外资金收入及支出总额、国家外债余额等指标;金融业部门则选择现金收入与现金支出、信贷资金总额、流通现金四个指标,国际收支平衡部门则选择经常项目差额、金融项目差额、储备资产增减额及净误差、资本往来项目差额、储备资产遗漏等为统计指标。

考虑到我们建国后不同经济体制的差异,有些项目指标在当时并不存在,为此选择相近指标作为补充。如固定资本形成总额指标,在1978年之前,我国采取的是固定资产积累额等。在实证研究中,以1950—2008年为时间段,选取指标数据作为数据集,其数据来源为各年《中国统计年鉴》,在数据调取时,存在着一定的数据缺失问题,最终数据获取情况如下:国民经济核算数据为246个,政府财政统计数据为265个,金融业部门数据为198个,国际收支平衡部门其数据共108个。

2.指标数据的处理操作。考虑到应用Benford法则需要确保数据首位数字为有效数字,即要求首位数字非零非负,为此,在进行数据分析之前需要进行数据处理,从而为数据提取与分析奠定基础。针对部分指标数值为负值的数据,取其绝对值将其转变为正数,针对不同单位数据指标,针对大于0小于1的数据,采取数据提取并乘以100的方法获取新的数据,其数据处理均可以通过Excel来实现。

3.宏观经济统计数据的Benford法则实证分析。在进行实证研究时,其思路设计为:针对每个经济部门,如其统计指标所选择的数据可靠性良好,则该组数据的首位及第二位数字所具备的分布规律与Benford法则条件下的规律相符;而如其数据首位及第二位所具备的的分布规律与Benford法则条件下规律差异较大,则可以判断其统计数据具有不可靠性。

在实证研究过程中,依托Excel軟件来实现。通过应用LEAF函数与MID函数,将每个经济部门统计数据的第一位数字与第二位数字提取,采取COUNTIF函数,进行经济部门首位数字与第二位数字1—9自然数所出现频率的统计,将其统计结果与Benford法则期望频率进行对比分析。采取拟合优度检验,进行数字分布与Benford法则分布状况的整体拟合程度研究,从而判断经济部门所具备的统计数据准确性与可靠性,实现宏观经济统计数据质量的评价。

在本研究中,其拟合优度即偏离误差研究,引入非参数统计x2拟合优度检验法,其表达式如下:

首位数字:x2(8)=N×■■

第二位数字:x2(9)=N×■■

在上式中,N代表的是数据样本个数值,θi代表的是数字i是首位数字或第二位数字时所出现的实际频率,f(i)代表的是在Benford法则中,数字i作为首位数字或第二位数字所期望出现的频率。通过公式可以看出,x2所取统计值越大,则其数据分布与Benford法则所期望的分布偏差则会增加,其统计数据的可靠性则越低。反之,随着x2所取统计值的降低,其与Benford法则所期望的分布拟合度越高,说明统计数据的准确性越好。如表1为国民经济核算统计数据前两位数字所出现的频率与Benford法则期望频率对比表:

从表1可以看出,国民经济核算统计数据,其首位数字观察频率在整体趋势上而言,表现为递减分布规律,只有数字8、9分布频率相对数字7分布频率高一些;第二位数字分布频率没有呈现出较为显著的递减规律,其分布表现为阶段性递减趋势。从对相关数据频率及Benford法则期望频率差异对比,首位数字及第二位数字差异值可以控制在[0,0.1]范围之内。采取同样方法,可以进行政府财政统计数据的分析,获取其首位数字观察频率与Benford法则期望频率大致相同,其差异值控制在[0,0.1]范围之内。金融业数据中,其观察频率与Benford法则之间吻合性偏低,数字出现频率在1—4范围内递减,但在5之后呈现出上升趋势,但从观察频率与Benford法则期望频率差异值的角度进行分析,其首位数字与第二位数字差异值均控制在[0,0.1]范围之内。在分析国际收支平衡统计数据时,发现其首位数字分布规律表现出递减与阶段性递增状况,第二位数字分布情况较为杂乱,然而其差异值均控制在[0,0.1]范围之内。采取x2拟合优度检验法进行观察频率及期望频率拟合度检验,拟合结果显示,在0.05置信水平条件下,所选四个部门其统计数据首位数字及第二位数字拟合度较好,准确可靠性较高,符合Benford法则。

(二)区域宏观经济统计数据质量的Benford法则分析

在区域宏观经济统计数据可靠性研究中,为更为全面评价经济统计数据质量,在研究时间纵向数据的同时,选择区域2008年的统计数据进行横向研究。具体指标选择上,以各主要省份的区域生产总值、区域居民消费水平、资本形成总额、财政统计预算收入及预算支出、政府消费支出等作为主要研究指标,依据统计年鉴,获取数据共计186个。其研究方法与历年来宏观经济统计数据研究部方法一样,进行数据第一位数字及第二位数字提取,计算其频率分布并与Benford法则期望频率进行综合对比,以拟合优度检验进行整体拟合,从而判断2008年我国统计数据的准确性。研究结果发现,2008年我国地区宏观经济总量统计数据首位数字的观察频率呈现出递减分布趋势,但其与Benford法则期望分布频率存在着一定差异,局部存在递增现象,第二位数字分布其递减表现不显著。从观察频率与Benford法则期望频率差异值来分析,其差异控制在[0,0.1]范围内。进行拟合优度检验后发现,我国31个省份其宏观经济统计数据的第一位与第二位数字分布与Benford法则期望分布较为符合,不存在较大差异,说明区域宏观经济统计数据较为准确,可靠性较高。

四、结语

伴随着我国国民经济的快速发展,人们对宏观经济总量数据统计的准确性越发关注。为评价我国宏观经济统计数据质量,对其进行Benford法则评价与实证研究。在论述Benford法则及其检验方法的基础上,以历年来宏观经济统计数据及区域宏观经济统计数据为主要视角,采取Benford法则进行统计数据质量分析。实证研究表明,不论是宏观经济统计数据还是区域宏观经济统计数据,其数据首位及第二位数字与Benford法则期望分布规律拟合度较高,证明了其统计数据的可靠性与准确性。

参考文献:

[1] 李鹏.基于Benford法则的GDP统计数据准确性研究[J].商情,2013(9):59,63

[2] 刘云霞,吴曦明,曾五一等.关于综合运用Benford法则和面板模型检测统计数据质量的研究[J].统计研究,2012,29(11):74-78

[3] 刘云霞,曾五一.关于综合利用Benford法则与其他方法评估统计数据质量的进一步研究[J].统计研究,2013,30(8):3-9

[4] 易娇.GDP数据质量的可信度分析及实证研究[D].湖南大学,2013

[5] 刘明宇.基于Benford法则的城镇居民人均可支配收入质量评估[J].统计与咨询,2014(6):30-30,31

[6] 易娇.GDP数据质量的可信度分析及实证研究[D].湖南大学,2013.DOI:10.7666/d.D390731

[7] 晏正春.基于Benford法则的GDP数据可靠性分析--以四川省为例[J].中小企业管理与科技,2014(33):74-75

[8] 张珺华.我国宏观经济统计数据质量的Benford评价及实证研究[D].山西财经大学,2011

[9] 曾五一,薛梅林.GDP国家数据与地区数据的可衔接性研究[J].厦门大学学报(哲学社会科学版),2014(2):110-119

[10] 孙飞,宋向东,郑阳等.区域宏观经济数据质量的检验[J].中国集体经济,2015(1):64-65

(作者单位:河南财经政法大学统计学院 河南郑州 450002)

[作者简介:阚珍珍(1980—),女,河南信阳人,河南财经政法大学统计学院讲师,主要研究方向:经济统计]

(责编:若佳)

猜你喜欢

宏观经济统计数据实证研究
创新视角下统计数据的提取与使用
即时经济:一场实时革命将颠覆宏观经济实践 精读
2021—2022年中国宏观经济更新预测——提高中等收入群体收入增速的宏观经济效应分析
从G20视角看国际宏观经济政策协调
国际统计数据
2017年居民消费统计数据资料
玉雕专业学生专业认同的实证研究
温州小微企业融资环境及能力分析
认知语言视角下英语词汇多义习得的实证研究
实证分析会计信息对股价的影响