大数据与统计新思维发展分析
2016-05-14汪辉
汪辉
摘要:大数据正在改变着人们的行为与思维,而在全面深化改革背景下,我国正在加紧“四化同步”的协调,其中信息化的建设十分关键。大数据的广泛应用使得统计对象的基础变了,统计思维也要跟着变化,本文基于对大数据的理解,在全面深化改革背景的特殊时期,分析统计思维发生的改变,围绕这些变化,本文提出相关政策建议应对大数据,以促使统计学科紧随时代步伐。
关键词:全面深化改革;大数据;统计新思维;新常态
在近期召开的中央经济工作会议上,以习近平为总书记的党中央对我国经济发展做出了科学判断,当前所处的历史阶段做出的科学判断。当前,我国发展仍处于重要战略机遇期,同时也正处于增速换档期、转型阵痛期和改革攻坚期三期叠加的关键历史阶段。当前,信息快速发展,大数据以一种超乎想象的速度改变着整个商业形态与人民生活。对于统计来说是不是也已进入新常态?在新的历史时期,我们应该要改变过去传统的统计思维,在全面深化改革背景下,结合大数据的特点来重新思考统计的新走向,运用新思维发挥统计的功能。
一、全面深化改革背景下对大数据的初步认识
数据和统计工作存在着天然的、内在的、必然的联系,大数据作为各种数据源的变动趋势,改变了传统统计的思维。同时大数据是未来企业创新、竞争和提高生产力的重要参考因素,“大”与“数据”根本就不能分开,我们该如何来理解大数据?尤其是在当前的宏观背景下,怎么结合大数据去改变统计思维。
二、全面深化改革背景下统计思维的变化
改变统计思维,是大数据时代的必然要求,当然,统计思维的变化应该以一个永恒不变的主题为前提,也就是说,数据分析要以数据背后的数据去还原事物的本来面目,那么现在我们则可以在很多方面借助大数据去实现这个目的,而这又首先取决于我们统计思维能否适应大数据时代的变化。统计思维应该发生怎样的变化?笔者认为:(1)认识数据的思维要变化。与传统数据相比,大数据来源、类型和量化方式都发生了根本性的变化,因此数据的提供者大多是确定的,有的还可以进行事后核对,而是人们一切可记录的信号。从某种意义上讲,大数据来源的微观基础是很难追溯的。(2)收集数据的思维要变化。“没有黏土,如何做砖?”,需要什么数据就收集什么数据,所要做的最重要的工作就是比较与选择,由于大数据来源与种类的多样性,如何甄别数据的真伪,如何选择关联物,今天的大数据,明天就不再是大数据,如果让数据库自动更新就有可能失去一些宝贵的数据信息,也就是说,进行再过滤、再选择。大的数据库可能需要将信息分散在不同的硬盘或电脑上,这就需要识别、整理、提炼、汲取。(3)分析数据的思维要变化。主动利用现代信息技术与各种软件工具从大数据中挖掘出有价值的信息,特别需要强调,传统的统计分析过程是“定性定量再定性”,找准定量分析的方向,直接依赖数据分析做出判断,测“定量的回应”变得越来越简单,得出可以作为判断或决策依据的结论,从而大大提高得到新的定性结论的可能性。
三、主动适应统计新常态,积极应对大数据
(1)用“发展新常态”引领统计思维,改变总体、个体乃至样本的定义方式
“智者顺时而谋,愚者逆时而动”,在正确认识新常态的前提下,必须要统一认识,转变观念,只有思想和行动统一,才能增强加快转变经济发展方式的自觉性和主动性。传统的统计分析,是先有总体,再有数据,但对大数据来说,情况完全不同了,是先有数据,再有总体。更为复杂的是,事后个体的识别也很困难,因此我们对于大数据往往是只见“数据”的外形而不见“个体”的真容。当然,考虑到大数据的流动变化性,需用“发展新常态”引领统计思维
(2)适应统计新常态,需要改变对不确定性的认识
新常态对统计工作创新发展的新挑战,统计必须主动适应、积极应对。因为无论是自然现象还是社会经济现象,个体的差异性,通过量化事物的不确定性去发现规律,要研究不确定性就需要收集数据,这样,大数据的不确定性就不再是样本的获取与总体的推断,可以说,大数据的不确定性只来自于其来源的多样性与混杂性。
(3)构建统计新常态四大格局,需要建立新的数据梳理与分类方法
统计要以新常态引领,主动构建四大格局。一是要构建“数据大生产”格局;二是要构建“统计大服务”格局;三是要构建“统计大普及”格局:四是要以统计法治化构建“统计大环境”格局。传统的数据梳理与分类是按照预先设定的方案进行的,但对于大数据,由于新的网络语言、新的信息内容,面对超大量的数据,只能从数据本身人手,从观察数据分布特征人手。强化结构化数据与非结构化数据的对接研究,有效开展大数据分析,转变抽样调查的功能,在信息化、数字化、物联网还不能全覆盖的情况下,快速进行探测性分析,需要相关分析与因果分析并重,需要统计技术与云计算技术融合。数据创造统计,流量创新分析。