浅论大数据背景下政府统计的转变
2014-02-11许福娇
许福娇
(玉环县统计局,浙江 台州 317600)
浅论大数据背景下政府统计的转变
许福娇
(玉环县统计局,浙江 台州 317600)
大数据的作用日益被公众所认识。本文介绍了大数据对促进政府统计改革发展的意义和政府统计面临的挑战,提出积极应对大数据所需要的几个转变,以期提高数据质量,重塑政府统计公信力。
大数据;挑战;政府统计
2012年以来,大数据(big data)一词风靡全球。对于大数据的研究和利用,一些发达国家已经上升到国家战略的高度,同样的在我国也引起高度重视。2013年5月,国家统计局马建堂局长在科研所等单位上报的有关大数据的报告上批示:“我们对大数据对我国统计工作的机遇与挑战,无论如何强调都不过分,甚至都不够。抓住这一机遇和挑战,当前的关键还是统一思想,坚定意志,主动进取。如果我们不想成为落伍者,而欲成为弄潮儿,就必须清醒地认识这一点。”因此,以数据质量作为生命线的政府综合统计如何适应大数据时代值得深思。
一、大数据给政府统计带来的机遇
近年来,工资“被增长”、CPI“被下降”、房价“被降低”、失业率“被减少”……因百姓的切身感受与统计数据之间的差异,导致了社会对统计数据的质疑,政府统计的权威性和公信力也因此受到质疑。这既可能是由于方法制度不完善造成的,也有可能是宣传不到位和信息解读不够等原因造成。如何化解统计数据信任危机,重塑政府统计权威性和公信力?兴许利用大数据能够很好的化解这一危机。那么何为大数据呢,它具有什么特点呢?
维基百科认为,大数据是一个难以通过现有数据库管理工具进行处理的大而复杂的数据集的集合。它是继云计算、物联网后的又一次颠覆性技术革命,它的特点可以用有四个以“V”为开头的单词表示,即数据量十分庞大(Volume)、产生频率非常快(Velocity)、数据类型繁多(Variety)和数据量不稳定(Variability)。
政府统计如果挖掘这一数据宝库,对于促进政府统计改革发展具有重大意义。主要表现为:通过利用客观存在的海量数据,能够有效降低调查成本;大数据化的采集方式减少了层层上报环节,有助于提高数据及时性、准确性。同时,通过对海量数据的分析、整理,可以对经济社会运行情况进行多方面印证,减轻外界对于统计数据准确性的质疑。
二、大数据背景下政府统计面临挑战
1.统计设计方面。统计设计是对统计研究对象的内容和统计工作过程通盘规划和统筹规划的综合。在大数据背景下,面临两方面挑战。一是一套表设计不专不全。目前实施的一套表制度,还不完全是真正意义上的一套表,一方面,仍存在多头设计、专业布置、分别收集、分别审核、分别汇总处理,仅仅是各种报表在数据处理程序上的简单汇集而已;另一方面,针对住户和个人调查的内容、部门以及“三下”单位仍没有纳入一套表。二是统计标准化较难。《统计法》虽然赋予国家统计局对部门统计调查项目的管理权、部门标准的审批权,但在实际工作中由于工作性质、职责权限和业务流程的不同,政府综合统计和政府部门统计对数据采集的管理不统一、不规范,指标口径范围不可能完全相同,容易出现数据打架或者数出多门的现象。
2.数据生产方面。数据生产过程分为数据收集、整理和分析三大阶段。一是数据采集模式。2012年,我国采用一套表网上直报制度,实现各级共享,但仍然没有从根本上改变“我布置,你填报”的传统数据采集模式,如果统计调查工作人员责任心不强或者调查对象配合程度不高,那么数据质量难以有效控制。二是数据整理模式。目前,我国数据生产模式主要以结构化数据处理为主,采用超级汇总方法得到。三是数据分析模式。在政府统计领域,部门对数据信息的敏感度不强,应用数据信息指导工作的意识不够,导致很多数据资料并未被真正利用起来;同时,数据分析应用仍然处于低端水平,一般以描述性统计分析为主、短期性分析为主,对于长期性、趋势性分析仍然较少,还未形成一套完整的数据综合分析应用体系,因此造成数据服务决策的参考作用不明显。
3.数据公布方面。一是数据发布时间滞后。2002年,中国正式加入国际货币基金组织数据公布通用系统(GDDS),但我国的统计实践与GDDS和SDDS(数据公布特殊标准)的要求仍然存在一定距离。二是数据发布内容不全。目前,政府统计往往公布一个结果性的、汇总性的数据,而对于调查原始性、个性化数据提供较少,难以真正实现统计生产全过程共享,这就可能导致很多学者、研究人员处于想研究但无原始数据的尴尬。
4.统计服务模式。一是服务较为被动。一直以来,我国的政府统计部门以党政机关为服务对象,对于广大社会群体对数据产品需求服务仍然较少,缺乏服务主动性。二是服务链较短。由于政府统计往往公布一个结果性的、汇总性的数据,导致有些统计数据与社会公众真实感受可能不一致,这既可能是由于方法制度不完善造成的,也有可能是宣传不到位和信息解读不够等原因造成,换句话说服务链较短。
三、大数据背景下政府统计要实现的几个转变
1.构建“大一套表”体系,将部门、专业统计转变为调查对象统计。构建以调查对象为核心的一套表体系,这个“大一套表”体系相比传统的一套表具有内容更广、处理更集中的特点。在这个体系下,对于不同的调查对象设计相应的一套表,根据各自的特点灵活掌握,初步实现按调查对象实际情况“量身定做”统计调查内容;对于相同的调查对象全部统计内容集中统一布置、统一搜集,消除跨专业和跨部门对统一调查对象重复布置、重复统计,进而避免数出多门、数据打架的现象,从而减轻基层工作量。
2.构建“大标准”体系,将非标准化大数据转换为标准化统计数据。要构建跨部门、专业的“大一套表”体系,其前提就是构建跨部门、专业的统一社会标准,构建“大标准”体系。在这个社会标准下,非标准化大数据可以转换为标准化统计数据。因此,不管是行政记录、商业记录,还是企业生产记录,都可以通过转换为标准化统计数据,从而解决长期以来各专业、各部门以及民间数据处理互通性差、统计口径不一、数据衔接性差的问题,推进了基础工作的规范化;同时积极研发企业电子化生产经营记录自动导入的软件,用标准软件采集数据,实现由有障碍交流转变为无障碍交流转变,加快大数据的应用步伐。
3.加快信息化进程,使数据采集从传统报送向智能采集转变。大数据背景下,不再单纯依靠“我布置,你填报”的传统数据采集方式,而是依赖测量技术设备和方法的成熟和完善的智能化数据采集方式,这种采集方式得到的数据是信息技术记录的原始记录,大大减少了由于调查对象责任心、理解水平不同造成的人为数据质量差异,大大减轻统计工作人员搜集数据产生的工作量。
4.培养复合型人才,使数据挖掘技术由结构化向半结构化、非结构化转变。大数据要求的数据整理分析技术远高于传统数据分析方法,最关键的是数据分析和数据挖掘。因此,要培养复合型人才,对数学、经济学、统计学以及计算机等知识熟练掌握,有能力对结构化数据进行分析挖掘,也能对言论、图标、视频等半结构化或非结构化数据进行深度挖掘分析,大幅缩短数据获取、处理和分析响应时间,加快数据产品创新应用,充分挖掘政府信息的经济价值,提高工作效率。
5.推进“大平台”建设,使部门“自留地”转变为政府“集体田”。目前,统计数据的流动性和共享性远远不够,一些重要数据资源获取难度较大。在大数据时代下,数据工业功能逐步体现,加快数据库建设,打破政府各部门、政府于民众之间的“信息孤岛”现状,降低因分散存储管理而丢失统计数据的风险,构建跨系统、跨部门的政府综合信息处理平台,将原本分散、分离的碎片信息得到有效整合,使之在部门之间流畅协调,实现数据共享与数据处理过程同步,真正实现统计生产全过程共享。
6.推进“大应用”进程,使统计应用由“一枝独秀”转变为“百花齐放”。一直以来,大部份的政府统计数据仍然由统计部门生产并且掌握,这一优势决定统计部门在政府统计分析领域处于“一枝独秀”地位。但在信息化、网络化技术迅猛发展的今天,整个社会无时不在产生着海量的生产、交易、价格等电子化信息,形成了许许多多的大数据,加上政府信息公开制度的完善,如何开发好、利用好这些数据资源,让政府统计成果惠及全社会?面对大数据,仅靠政府统计自身力量是很难做到的,应该敞开统计的大门,让更多的部门、大专院校、专家学者以及科研人员参与统计数据的分析研究工作,让更多的人掌握统计数据的生产工艺和统计产品的生产流程,增加统计工作的透明度,提高政府统计公信力,加快统计数据应用向“百花齐放”转变,实现“死数据”向“活信息”的转变,让统计科研成果迅速转化为生产率。
7.提供“自主性”服务,使服务模式由“要我服务”转变为“我要服务”。大数据背景下,对于调查数据现实性、针对性、人性化要求空前提高,同样的价值需求下,人们需要的不再仅仅是一个结果性质的数据,更需要统计部门提供更为详细的过程信息,以表格、图表、文字等发布形式更为丰富的统计调查数据,满足用户多方面的个性化数据要求。2013年全国统计工作会议,首次提出建设服务型统计。在大数据背景下,服务型政府统计就是通过对大数据的开发,转变服务方式,为党政机关和社会各界人士提供更为广泛、满足不同层次需求的大服务。因此要找准统计服务切入点,用统计理念引导服务对象,用统计方法指导服务对象,用统计标准规范服务对象,延长统计服务链,将数据采集、数据整理、数据分析等全过程公开,提供更为及时贴心的统计服务。
[1]杨海燕.大数据时代的图书馆服务浅析[J].图书与情报,2012(4).
[2]郑京平,王全众.官方统计应如何面对Big Data的挑战[J].统计研究,2012(12).
[3]王树良,丁刚毅,钟鸣.大数据下的空间数据挖掘思考[J].中国电子科学研究院学报,2013(2).
[4]许小乐.“大数据”与政府统计改革[J].调研世界,2013(5).
10.3969/j.issn.1674-8905.2014.03.017
牛域宁)