大数据背景下经济统计的机遇与挑战
2013-04-29隋林桐
隋林桐
经济统计的发展是建立在社会技术发展基础之上的,不同时期,面对不同的客观需要不断发展自身,以满足人们研究和社会管理的需求。随着大数据时代的到来,面对海量的数据,经济统计必然面临新的机遇和挑战。
经济统计更多的时候作为一门方法学科被应用到经济、社会等问题的研究中。从其发展的历史可以看到,一方面社会管理的需求对其不断提出更高的要求;另一方面随着统计概念在实际社会生活中的推广,也不断丰富经济统计的方法和内容。这两者之间也有着相辅相成的关系,他们的共同作用使得经济统计越来越在政策制定、问题研究中突显出其重要性。
随着大数据时代的到来,每天产生的数据越来越多,我们对于数据的接触也越来越方便,可以说我们现在处于一个数据爆炸的时代。这种情况随着对于大量、多样数据的存储技术的进步以及对于信息技术的推广变得越来越严重。在这种情况下,对于经济统计不仅会提出更高的要求,也会给提供更多的机遇。
大数据背景下的经济数据特征分析
1.数据统计刻度变小
由于技术手段的限制,历史上的多数经济统计数据往往以较大的数据可读进行统计,如年、月等。随着大数据时代的到来,我们相信对于经济数据的统计刻度将不断的缩小。实际上,已经存在对于股票交易数据的分时统计了,而对于高频交易而言数据的统计刻度就更加的小了。
2.样本群体扩大
从以往来看,搜集大量样本的相关信息是一种成本巨大的工作,所以统计中的样本替代总体也是在这样的背景下发展起来的。随着互联网的发展和信息技术的普及,对于大样本数据的观测和统计不再是一项难以完成的任务。
3.样本信息扩大
大样本统计的巨大成本使得我们无法更多的获得样本更多的信息,而只能针对一些关键信息进行统计。随着现在对于数据统计成本的降低,我们不但可以对我们关心的关键数据进行采集和统计,而且对于非关键信息也可以进行统计,这样可以为我们的研究工作提供更多的选择空间。当然,这里的信息扩大也涵盖了对于信息多样化扩大的含义,不久的将来对于经济信息的统计将会以更多的形式呈现。
4.数据的优良性得到改善
在现有的经济数据中从在很多的断层和不连续性,很多是由于历史的原因造成的。随着对于数据存储技术的发展,我们可以获得更多、更优质的数据。其优质性体现在数据的完整性、连续性和标准化上。大数据时代会有更多的数据已更加标准化的形式产生和存储,降低我们在对于数据筛选和处理过程中所话费的成本。
5.宏观与微观统计关系更加密切
现在看来,对于宏观经济指标体系是通过微观样本统计得来的,但是宏观经济指标体系只关注特定的一些经济指标,而忽略了大多数微观个体产生的经济信息,且两者之间的关系也相对复杂,我们不能很直观的从宏观信息中得出关于相关微观个体经济特征的信息。随着大数据时代的到来,统计样本数量和层次的增加,将会使得宏观统计更加具有现实的微观基础,使得宏观统计的准确信以及与微观统计的关联性有更大的提高。
利用现代数据机遇,强化经济统计发展
1.利用现代数理技术,充实经济理论
很多的经济理论都是建立在对于现实的高度抽象的基础之上,而且很多变量在现实中很难进行量化和统计。例如,经济学中的效用的概念,我们很难在现实中去应用效用来精确刻画消费者的偏好,这样的结果就是我们很难把理论很好的与现实结合起来。随着大数据时代的到来,数据可以做到精确化,我们可以详细跟踪我们所需要研究的对象,通过对能够体现理论模型的数据的采集和统计来对经济理论进行检验。当然,这个过程中也会产生出现有经济理论尚未解释的现实现象,这样通过我们对于关键信息的把握,可以反过来促进我们对于经济理论研究的充实。综上所述,对于经济理论的充实是从对现有经济理论的验证和新的经济理论的发现两个层面而言的。
2.提高模型的精确化和持续性
在大数据时代,我们对于某个问题的研究可以更加向其微观层面发展,不需要担心数据的获取,只需要关心如何选取相关统计量的问题。在社会和经济研究中,往往建立很多模型,而且由于经济研究中外部因素的不可控性,大多数模型无法进行持续的验证和使用,从而对其理论假设的优良性进行合理的评估。大数据时代的到来,可以在这方面为我们提供新的可能。在我们的模型构建中我们可以更多的考虑加上可能影响模型的外生环境变量,从而在更长的时期里对于模型背后的理论假设和结论进行观察。当然,在这个过程中还有很多的其他因素需要考虑,不能盲目地增加模型中的变量,使研究问题的主次变得模糊不清
3.强化统计数据定制化
目前,在经济等研究中对于数据的来源大多数是来自于已有的数据库。在这个过程中,往往数据使用者涉及到数据的搜集、数据的筛选和数据的整理,在研究过程中这一部分工作非常耗费时间。大数据时代下,随着数据搜集和处理成本的下降。可以预想到,在不久的将来,研究者可以向数据直接产生者或者第三方数据要求定制化的数据服务,以便节省对于数据处理和搜集的成本,从而加快研究的速度。
应对经济统计挑战,提高统计质量
1.高质量甄别有效的数据
数据的爆炸式增长,在某种程度上可以扩宽我们对于问题研究的层次和角度,但是同样这也带来一个关键的问题需要我们去思考,因为并不是我们在我们的回归模型中添加更多的变量就会有一个好的结果,并不是我们最大限度的把与现实有关的变量加入模型,使模型就更好的解释现实。在这个过程中,过犹不及的问题很容易发生,所以随着研究变量选取范围的不断扩大,如何选取有效的研究变量会成为研究者思考的关键问题。因此,如何从“大数据”转变成“优数据”需要耗费研究者更多的时间。
2.发展统计学理论,给予数据有力的经济支持
随着大量统计数据的增长和研究模型的复杂化,如何提出更多优良的理论去解释新的统计变量所揭示重要经济现实必然会增加研究者在这一方面的努力。这个过程中也需要更多更新的数理研究模型的提出,从而更好的支持新数据的使用和对现实的解释。随着中国加入WTO之后,我们面临更多来自外部的竞争,而在社会经济管理效果评价方面,我们也有一些复合国情的统计体系和法则。面对如何与外部经济题相比较时,因为没有统一或者较高相似度的统计法则,所以在研究中必然存在体制偏差。因此,对于较高统一度的经济统计体系和法则的要求有很现实的意义。
3.优化数据处理方法
在海量数据中如何能够获得满足要求的数据,如何使得获得的大量数据能够更好的以结构化的形式进行运算,这些都对于数据的处理方法提出了更高的要求,也对计算机在处理效率方面提出新的要求。从目前来看,大多数经济研究者都至少能够掌握一门或者多门计算机语言和几款数据处理软件,这些发展趋势与大数据的处理密不可分。
结论
通过对经济统计在大数据背景下展现出的新特征的描述可以看出,整体而言大数据会使得我们的经济统计更加的深入化和具体化,主要表现在于我们对于样本的大量信息进行统计同时也可以实现对于样本更加详细的层次化抽样研究。这样的深入化和具体化,反过来给我们的经济研究注入更多活力也带来更多的机遇和挑战,主要表现在对经济研究理论的充实以及模型精确化、持久化方面。同时,大数据也为数据定制化提供了可能。其主要的挑战来自于我们将会花费更多的时间去在海量的数据信息中搜寻合乎理论和有效的数据,即“大数据”与“优数据”之间的权衡取舍,这对于我们对数据的处理能力和效率提出了更高的要求。综上可以看出,大数据背景下对于经济统计而言机遇与挑战并存。
(作者单位:安徽财经大学统计与应用数学学院)