大数据背景下我国政府统计管理的创新模式
2015-02-18杨美沂
杨美沂,林 勇
(西北师范大学 经济学院,兰州730070)
1 大数据背景下政府统计新需求
1.1 大数据的涵义
麦肯锡将大数据定义为:无法在一定时间内用传统数据库软件工具对其内容进行抓取、管理和处理的数据集合[1]。根据国际数据资讯(IDC)公司调查监测,全球数据量以每两年翻一番的速度增长,到2020年,预计全球的数据量将达到40ZB,并且非结构化、半结构化的数据高达85%以上。数据容量从TB、PB升级到EB、ZB,甚至YB,但并不意味着大数据特点仅体现在数据容量之大,大数据真正内涵并不是一维的,而是三维立体的(容量、种类、速度),大数据的意义不仅体现在容量上,也体现在结构和速度上,因此,研究大数据必须寻求其“大价值”和“大发展”,这是数据的内涵问题。从这个意义上说,大数据的涵义更多体现在人对数据的分析管理能力。
海量异构数据引领的大数据时代不断冲击着信息和数据最重要的生产部门——政府统计,在大数据时代他们不仅是数据的生产者,同时也是数据的重要形成者,在数据的循环流通中发挥着重要作用。大数据带给政府统计诸多发展机遇,也造成不少挑战和困难,这不仅需要先进的信息技术,更需要创新的管理思维和方式。因此,大数据背景下政府统计的创新本质上是对管理模式的革命。
1.2 大数据对政府统计工作的影响
(1)数据需求多样化
过去,由于受数据获取技术的制约,人类对数据的认知能力有限,想要获取大范围的总体数据比较困难,只能感知样本数据。而在大数据背景下,数据的获取技术、云计算和数据挖掘技术日益成熟,数据的捕获和分析将全社会共享,打破统计部门一家独享局面,这种新趋势势必导致对数据的需求层次不断提高,人们不仅需要高质量、公开化的数据,更需要细粒度化的数据,数据需求呈现多样化趋势,这将引导政府统计工作以更好地服务于多样化的数据需求为根本目标。
(2)数据来源扩大化
过去,政府统计的数据主要来源于联网直报系统和其他调查数据,是具有元数据支撑的结构化数据,而在大数据背景下,更多的数据需要从互联网、物联网中挖掘收集,商业行政记录的数字化趋势,网络在线文本、流媒体的普及等极大拓宽了统计机构收集数据信息的渠道来源,数据源由此扩展到这些没有元数据支撑的非结构化数据,数据源呈现扩大化趋势,这就要求统计机构要充分利用现代信息技术,探索一些有价值的、成本和效率都比较好的数据源,采集到规格、分类更加翔实、具体的统计信息。
(3)数据生产社会化
大数据时代的数据生产方式标志着政府统计工作进入到多元化层面,政府统计部门的数据生产垄断将被打破,在此背景下,大批民间咨询调查机构应运而生,他们不只提供商务领域统计信息服务,也将提供公共领域信息服务,届时官方统计不再是公共统计数据信息的唯一提供者,统计数据的生产呈现社会化趋势,在市场规律作用下政府统计产品可能被民间统计产品所替代,如目前阿里研究中心推出的ISPI大有冲击CPI之势,这就要求统计主体要从以政府统计机构单兵作战向社会上各机构单位(包括商业机构、研究机构等)联合作战转变。
(4)数据应用微观化
过去,由于信息技术制约,想要获取大范围的总体数据比较困难,只能由样本数据推断总体数据。而在大数据背景下,人们可掌握的数据渐渐由样本数据转变为总体数据,政府统计面对各领域和各层次的大数据浪潮,有机会和条件获得并使用这些内容广泛而深入的全及数据、原始数据和系统数据,而这些数据中隐藏了各种丰富的知识、规则和联系。在实际使用中,宏观层面上的应用只能掌握情况的基本面,很难发现微观数据存在的关联、关系和规则,无法从大量的数据中提取有用信息,因此,大数据带来的新转变促使政府统计关注的数据由“国家层面”走向“企业、个人层面”,形成偏向社会微观个体的细粒度数据,能更好地满足个体的感知和需求,从而创造宏观数据所不能体现的社会价值。
2 大数据背景下我国政府统计管理突出问题
2.1 重数据采集,轻数据共享
我国政府统计在数据采集方面已经由分散设计向统一设计、传统报送向智能化采集迈进,成为大数据发展的基础。但在统计数据开放共享方面,还有不足。中央和地方、政府统计信息内网和外网都还不能实现信息充分共享,致使大量宝贵信息资源分散在各部门而无法充分利用,形成一个个低价值“信息孤岛”,难以满足大数据环境下数据维度多元化和数据需求多样化的要求。
2.2 重结构化数据,轻原生态数据
“大数据”时代,数据来源于信息技术记录下的原始数据,包括了一切可记录并存储的信号,如网络日志、视频、图片、地理位置信息等,它们呈现出非结构化、半结构化和异构性,多元化、无结构无标准、很难用以前的传统指标和方法存储分析。同时,网络信息系统各不相同,数据识别方式也各异,相互之间缺乏统一的数据分类标准[2]。可见,在大数据背景下,结构化数据仅是一部分根据研究目的而抽取的样本定制数据,其处理方式也难以满足多元异构、多实体和多空间之间的相互动态性,所以原生态数据才是大数据之源,其处理方式是政府统计所需直面的首要问题。
2.3 重宏观服务,轻微观服务
长期以来,我国各级统计机构一直将政府视为其提供统计产品的服务对象,为政府及其决策服务的思想意识根深蒂固,片面地将政府视为统计数据的唯一用户,收集了大量没有利用价值甚至已经过时的统计数据,当然无法满足公众需求,有时甚至连政府需求也不能很好满足,造成大量统计资源浪费。另一方面,统计部门依据法律向社会公众免费索取数据,但同时缺乏为其服务的意识,不能规范及时向社会公众发布信息,且很多信息处于空白状态,数据发布满足不了公众的需求,是一种典型的大政府小社会的统计体系。统计数据总是侧重反映宏观形势,微观的个体数据仍然处于空白,更有价值的专项信息很难获取。而大数据带来的新转变,使政府统计关注的数据由“宏观”走向“微观”,更加重视细粒度数据的采集和分析,更加重视源头数据,深入分析宏观趋势变化背后的微观信息。要实现这一转变,必须在重视宏观服务的同时也要重视微观服务。
2.4 重职能服务,轻激励服务
在大数据时代,社会如同一个工厂,互联网、搜索引擎、电子商务、多种传感器和多媒体技术使各种形式的原生态数据源源不断产生,政府统计不再是生产数据的唯一部门,提供的统计产品不再是唯一的公共信息资源,鉴于此,政府首先应当具备辨别数据用户的能力,能够从抽象的“社会公众”里分辨出用户的不同需求和类别,进一步明确哪些人想了解哪些数据,开放有偿服务部分,将他们最需要的数据信息传递给他们,以激发各级统计机构主体的主动性与创造性,将其作为解决统计管理模式单一、统计经费紧张、统计机构独立性差等一系列问题的依据,以推动政府统计全面、协调、可持续发展。
3 大数据背景下我国政府统计管理模型构建
3.1 模型构建
在大数据背景下,以数据为核心,构建一种政府、企业、市场和公众四维模式的政府统计管理模型,见图1。
图1 政府统计管理模型
3.2 模型创新点
3.2.1 流转路径:数据——信息(知识)——数据
在此模型中,数据流转路径由原生态数据,再到信息和知识,最后又回到原生态数据,即关注的焦点从信息向数据转变,这不是倒退,而是大数据环境所带来数据价值的转变。从根本上讲,信息和知识的本源是数据,数据是生成信息和知识的载体。在大数据时代,先进的技术极大地降低数据的边际成本,再加上其价值不易折旧,导致对数据不同的组合搭配及分析产生不同的信息和知识。可见,要实现信息多频次、多角度利用及价值最大化,必须从中提炼各种有价值组合方式和源数据,因此通过信息向数据的流转,促进了知识的不断创新和决策优化。
3.2.2 增值渠道:从定期发布向市场需求转变
在此模型中,数据增值的关键在于统计产品与市场需求的融合,从定期发布统计数据逐渐向迎合各类市场主体的需要转变,这是大数据时代数据生产社会化所必须经历的蜕变。因此,大数据生产模式推动了政府统计管理创新,即采集什么数据、怎样生产、如何发布不再是上级的行政命令和任务摊派,而是根据各层级用户实际需求来决定[3]。
3.2.3 行为方式:从独立向协同转变
全新的统计管理模型由政府、企业、市场和公众四大主体共同构筑而成,统计行为由政府独立完成向全社会协同配合转变,不仅实现内部各层级综合统计和部门统计间的协同管理,数据共享,实现单一信息模式向统一集成的数据生态模式转变;而且实现政府统计与社会之间自上而下数据公开和自下而上数据需求,自上而下创新激励和自下而上价值积累的统一结合,在大数据时代,全社会都将利用大数据这一生产资料来推动生产力发展、生产关系变革及二者的协同互进。
4 四位一体的政府统计管理创新模式
基于以上政府统计管理模型的构建,大数据背景下四位一体的政府统计管理创新模式如图2所示。
图2 政府统计管理创新模式
4.1 主导模式——政府内部
政府主导模式是指以政府综合统计和部门统计为核心进行统计信息资源的生产和管理,这种统计管理模式是建立在国家行政管理权威的基础上,是构建具有公信力的政府统计体系不可或缺的部分。在大数据环境下,这种模式运行的关键是数据交换平台的建立。首先,通过交换平台的搭建,让综合统计和部门统计在上报数据的同时由平台授权将数据共享延伸至相关部门,既保证各自独立性和特色,又通过业务协作完成数据的交互共享,自发形成权利与义务对等的观念并引导大数据应用良性互动;其次,交换平台的搭建还可以识别并规避数出多头现象,通过平台上关联数据的相关性来保证数据的唯一性、提高数据质量,最重要的是同一对象的所有特征数据将分布在各个部门,不同部门之间互相监督协作,这将给政府统计带来新的发展契机——数据分析内容不断延伸,数据关联分析不断加强,数据挖掘深度不断提升,政府统计大数据管理模式不断创新[4]。
4.2 引导模式——政府与市场
市场引导模式是指通过市场导向,提供各种丰富的统计产品以满足各类市场主体需求,从根本上增强政府统计的市场意识,竞争意识和服务意识。在大数据环境下,这种创新模式可以借助市场对非核心政府信息机构进行企业化改制来完成。具体来说就是将与市场关系密切的政府统计机构企业化、市场化、盈利化,成立由政府控股的股份制信息公司,广泛参与统计产品市场竞争、依靠优质服务不断发展壮大。一方面,市场化的股份制信息公司控股权仍然掌握在政府手中,充分保障国家信息安全;另一方面,拥有一定的自主经营权且经营方式灵活,既可以为政府提供宏观服务,也可以为市场提供微观服务,且市场需求的拉动使其所提供统计商品大大丰富,营利性收入的增加使其所提供统计服务在数据生产社会化的大数据环境中更具竞争力。
4.3 辅助模式——政府与企业
企业辅助模式是指利用物联网、互联网、手机移动平台、数据终端采集等先进的IT技术工具,自动抓取并实时处理企业大数据,作为对官方统计产品有益的补充和验证。大数据是企业的一种资产,特别是某些有限来源的大数据,更是其特有的无形资产。且随着时间的推移,这些主动生产或作为副产品生产的大数据,其量将越来越大,必须保证其持续不断地被政府统计部门使用、开发。因此,该种模式通过搭建自动实时采集平台,将统计机构的数据作为金标准和框架对互联网数据进行纠偏和矫正,通过抽取、清洗、转换和标准化,将融合过的大数据作为有益补充对政府统计数据进行实时更新,可见,收集挖掘大数据的过程就是识别、整合、提炼、分配以及存储元数据的过程。
4.4 基础模式——政府与公众
公众基础模式是指政府部门以服务公众为基本原则,在充分保障国家信息安全、维护企业商业机密、保护个人隐私的基础上,借鉴发达国家的先进经验,通过建设政府数据网站,定期免费发布非涉密的数据,最大程度开发这些数据资源的社会价值,促使其转变为社会财富,进而形成新的经济增长点和利润源泉。在大数据时代背景下,政府统计创新的贡献源自于普通大众的数据反馈。比如借助于先进的数据采集技术,网站可以实时记录并存储人们浏览的时间、流量、周期、内容甚至阅读习惯,而这些新数据源又会形成新的信息渠道反馈给统计部门,再通过清洗集成和数据挖掘,引导公共福利有效分配,从而实现政府统计与公众利益的双赢。
5 结束语
在大数据背景下,我国政府统计管理必须以数据为核心,通过政府、企业、市场和公众的协同合作,通过数据的抓取、整合、分析、销售和展示来创新政府统计管理模式。但政府统计与大数据的融合过程中,数据质量、数据安全、数据转换、数据挖掘等多方面问题仍需进一步探讨。
[1]计算机行业-大数据(Big Data)专题报告[R].上海:光大证券股份有限公司研究所,2011.
[2]李金昌.大数据与统计新思维[J].统计研究,2014,(1).
[3]许小乐.“大数据”与政府统计改革[J].调研世界,2013,(5).
[4]汪维,张雅雅.大数据环境革新官方统计[J].浙江经济,2013,(10).