APP下载

大数据环境下政府统计所面临的思考

2015-07-05洪江萍

2015年35期
关键词:信息技术应用大数据环境

洪江萍

摘 要:随着我国经济发展水平的不断提高,信息技术在各领域中的应用不断增强,如何更好的与时代发展潮流相适应,积极应对大数据时代下的挑战是政府部门需要思考的问题。因此不断对统计业务流程进行优化,成功打造出强大的信息数据支撑显得至关重要。本文将对大数据环境下政府统计工作面临的挑战进行了分析,并针对这些挑战提出了一些应对措施。

关键词:大数据环境;政府统计工作;信息技术应用

大数据可以说是计算机和互联网结合的产物,它的出现代表着全球已经建立起了移动化、智能化、自动化的网络系统,是在“云计算”、“物联网”、“数字城市”基础上的延伸与加强,已经成为一种标志性的概念。据相关资料显示,我国在2010年,全球范围内产生的2.2ZB(约合1.6万亿GB)数据量已经远远超出了世界人均拥有的300GB数据水平,预计到2020年,数据量将达到50ZB。随着政府统计工作的开展,如何利用有限资源与信息技术做好统计工作,如何将数据资源有效整合到一起是打造服务型政府的关键,也是政府统计工作当中最重要的一环。

一、“大数据”概述

专业机构对“大数据”是这样定义的:“大数据”首先作为一种新型的处理模式具有非常强的决策效果与洞察效果,其流程化能力也非常强,这种特征明显比多样性的信息资产更具优越性,而且大数据最核心的价值就是对海量数据进行存储和分析。其特征表现为:第一,数据体数量庞大。能够顺利从TB级升级为PB级;第二,数据类型较多[1]。比如,网络日志、声音、图片、地理信息等内容;第三,数据价值密度较低,但具有商业价值。比如,在对视频进行连续监控过程中,有利用价值的数据停留的时间非常短,以2~3秒居多;第四,数据处理的速度快。数据处理遵循1秒定律,可从各种类型的数据中快速获得高价值的信息,这一点也是和传统的数据挖掘技术有着本质的不同。此外,云计算、移动互联网、平板电脑、PC机也在全球范围内得到了广泛利用,这些都是数据的来源。随着IT技术的进一步发展,人们对大数据的研究也在显著增强。

二、分析大数据对政府统计的优势与重要性

(一)优势

首先,“大数据”是相对于传统“小数据”而言的,传统数据时代由于收集数据非常耗时、昂贵和困难,数据处理的成本很高,所以只能处理部分信息系统中产生的非常规范的数据,而对于文本、图片等数据则无法处理,而且当数据量非常大时,只能通过抽样的方式来降低数据量,再通过科学的调查计算完成调查任务;而在大数据时代,数据收集和存储将会更便宜、更容易,使用数据的成本将会更低,数据分析工具也会更加优化,所以,大数据相比起现有的其它技术而言,其“廉价、迅速、优化”三方面的综合成本是最优的。其次,大数据具有非常强的生命力。大数据与企业当中的固定资产、人力资源有很多相似的地方,这些也成为了生产过程中的一项重要要素,但又与其他的传统要素存在差异,使用的人越多,其价值就越大,数据也会在成本上有所降低,同时受时间与地域的限制较小,折旧、重复性的成本累计不会出现,重复性的增值情况也较少。第三,大数据具有一定的竞争力。曾有专家将Date.Gov比喻成一个巨型轮船,西方各国纷纷登陆,因为这些国家对数据开放时间与程度较高,进而决定了这些国家的地位与市场竞争力[2]。

(二)重要性

1、有利于改进数据采集与处理方式

企业进行联网直报,是当前政府统计工作中较为常用的信息化工具,能够对信息与数据做出有效采集,对于统一政府开展工作的业务流程有着重要作用,使各项数据能够规范整理、确保了数据质量与安全性,但是管理模式却很单一,制度也不够健全。大数据的出现能够实现数据收集与利用的统一,并能与实际工作相结合,明确各项业务系统中的关联,能对空缺、错误、更新差的数据进行处理,以提高數据处理质量。

2、有利于数据分析与挖掘

大数据时代下,随着大量信息的涌入,静态数据已经不能满足政府决策需求,通过大数据战略能够使用云计算对海量数据进行挖掘,发现数据的潜在价值,将孤立的数据连接起来,为政府深入、全面分析问题提供引导,并能实现准确预测。对政府来说,在政治决策过程中,将会更完善,更理性并且更基于事实,对于管理一个愈加复杂的社会,这是至关重要的。

三、大数据将给统计部门带来的机遇与挑战

(一)机遇

大数据技术的运用还能够推动政府统计模式的转变,使传统统计方法开始向大数据战略转移,推动了行业变革,为政府带来了非常多的发展契机。统计部门能够构建其数据平台,将其作为基础打造出更为专业、灵活的大数据分析团队,在服务形式上、业务办理上都将得到启发与帮助[3]。

大数据为统计工作创造了更广阔的舞台,使政府数据信息收集渠道拓宽了,成为了政府数据收集的“第二道轨道”,以此能够判断出诸如经济景气情况、主要商品价格走势等,比如,2009年,谷歌成功利用大数据预测到了H1N1禽流感的爆发。

大数据的种种优势都在具体统计工作中得到了验证。以国家统计局为例,2010年国家统计局积极开展了“四大工程”信息建设,分别为单位名录统一、一套表调查制度的统一、数据采集处理的统一以及联网直报系统的统一。在这些建设内容基础上,大数据应用空间更为广泛,比如,房地产价值指数可以利用网签数据计算出来,使操作流程得以简化,计算更为方便。

(二)挑战

1、由“数据采集”到“数据分析”。随着大数据时代的来临,数据分析与处理能够使静态的数据重新发挥其价值,数据间的关联性、预测性逐渐成为了政府工作的核心。政府部门将这些作为主要的工作内容,能够引导社会、服务社会,成为政府分析数据的关键所在,同时也对政府提出了更高要求,而目前政府部门对大数据环境下的理论研究、使用标准等都存在空缺,且大数据应用的核心环节(即数据处理与价值挖掘)也缺少复合型专业人才。因而,大数据对政府统计的机构设置、专业要求等提出了新的要求。

2、由统计数据“实报”走向“精报”。面对大量的信息资源,政府需要的不是发布这些信息,而是要求统计部门将多余的数据删除,将有价值的留下,对信息进行精细化处理,从而达到服务大众的目的[4]。这就要将公众“实报”转变为“精报”,数据处理要更精准才行。

四、关于政府统计中大数据应用的若干建议

(一)不断对“一套表”统计制度进行完善

过去的专业布置、分类审核、分类汇总只是简单的对数据汇集处理,只体现在“物理变化”上。为此,政府需要建立起统计基层的“一套表”制度,实现统计的“化学变化”,将过去的专业统计限制消除,转变过去重复布置、重复统计的情况,只要沿着“元数据”发展路线就能实现数据的及时共享、减少了填表带来的麻烦。

(二)不断对“网上直报”业务处理平台进行完善

对于一些地方政府来说,采集功能的扩展度非常低,并且缺少数据统计的接口,为确保政府部门统计工作的顺利开展,就要对“网上直报”业务处理平台进行调整[5]。一方面增设县区“一套表”数据审核、汇总功能;另一方面开通网上数据汇总、报表设计、数据采集、调查分析等,将各项统计业务全面集中到网络平台上开展,进而构成一个集统计对象、统计工作、调查分析为一体的综合性业务处理平台。

(三)建立其统计的元数据系统

元数据(metadata)又称为中介数据,是关于数据的数据,是描述数据及其环境的数据。是一种对数据采集、覆盖范围、数据质量的个信息的一种描述[6]。建立起统计元数据库能够对过去的数据做出管理,对政府统计业务进行整合。结合数据环境建立起制度元数据、技术元数据、管理元数据等。制度元数据库中包含了目录、报表、调查对象等内容,实现对其的规范;技术元数据库中包含了数据来源、转换规则等,實现了对数据的统一描述,实现了存取上的统一。另外还能对每个元数据的时间、指标、地址进行定位分析,形成三维管理,使查询服务效果增强。

(四)政府部门成为大数据的实践者。为更好地提升服务能力,树立更加开放、透明、负责、高效的政府形象,首先要创造条件,鼓励大数据在政府部门和公共事务,尤其是关系国计民生的关键行业率先使用。第二,要加强横向合作,即一方面加强政府各职能部门的合作,另一方面要加强与各种类型的大数据生成企业的合作,提高数据资源的有效利用率和共享率。第三,要完善数据发布制度。针对大数据即时产生、内容丰富、形式多样、主体多元等诸多特点,增加统计数据发布的内容,丰富数据发布的形式,提高数据发布的频率和时效性,加强对数据的解读,更好地满足社会各界对统计数据多样化需求。

结束语

本文主要对大数据环境下政府统计工作面临的机遇、挑战进行了分析,并结合这些问题提出了几点关于大数据环境下政府统计工作的建议,依靠大数据的诸多优势使政府统计工作得以稳定、持续开展。(作者单位:山西省长治市郊区统计局)

参考文献:

[1] 刘道伟,张东霞,孙华东等.时空大数据环境下的大电网稳定态势量化评估与自适应防控体系构建[J].中国电机工程学报,2015,35(2):268-276.

[2] 王宁,李杰.大数据环境下用于实体解析的两层相关性聚类方法[J].计算机研究与发展,2014,51(9):2108-2116.

[3] 孙浩,何晓红.动态数据环境下基于信息熵的相对离群点检测算法[J].计算机应用,2010,30(5):1284-1286.

[4] 潘郁,陆书星,潘芳等.大数据环境下产学研协同创新网络生态系统架构[J].科技进步与对策,2014(8):1-4.

[5] 赵航.大数据环境下科技孵化网络结构与治理——基于网络风险视角[J].科技进步与对策,2015,(6):20-23.

猜你喜欢

信息技术应用大数据环境
信息技术在小学班级管理中的应用探索
探析幼儿园教学活动中信息技术的应用
信息技术在电网运维中的应用
基于大数据环境的新闻编辑理念变革创新机制
大数据环境下的数据挖掘技术分析及若干研究
大数据环境下的新闻编辑理念创新探讨
信息技术在小学体育课中的应用
数学课堂教学应用信息技术的策略
大数据环境下的网络文学舆情控制系统
云南省江川县中小学教育信息化建设和应用现状及对策建议