APP下载

基于大数据背景下政府统计工作的研究*

2016-12-27岳大波

办公自动化 2016年22期
关键词:数据挖掘行政政府

岳大波

(成都信息工程大学统计学院成都610103)

基于大数据背景下政府统计工作的研究*

岳大波

(成都信息工程大学统计学院成都610103)

政府统计工作是信息和数据最重要的生产部门,顺应大数据时代发展的需要,积极应对大数据时代所带来的机遇和挑战,打造现代服务型统计是当前统计工作值得思考的问题。本文从大数据背景下对统计工作的变化进行了探讨,对统计工作变革提出相应的建议,有利于提升当前统计工作质量和效率。

大数据 政府统计 行政记录

一、前言

大数据时代的来临,从日常生活到国家宏观调控,面临的都将是数据的海洋。政府宏观决策对经济数据的质量提出了更高的要求,而大数据时代对数据的挖掘、处理和分析的方式对于传统的统计工作带来机遇与挑战,顺应大数据时代的要求,适时改变传统统计工作方式和思路具有重要意义。

二、对政府统计工作中的大数据认识

政府统计工作中可应用的大数据来源分为行政记录数据、商业记录数据、互联网与传感器数据3大类,如表1所示。

1、行政记录数据

行政记录数据是政府部门在行使其行政管理职能过程中,通过审批、注册登记等记录的大量信息数据,行政记录数据的质量相对有保证,连续性较好,政府部门在建立行政记录的过程中能够遵循相关国家标准、行业标准和部门标准等,数据的标准化程度也较高。

2、商业记录数据

商业记录数据是企业对其生产经营管理过程等信息的记录及商业交易数据的记录。这些数据具有及时、丰富和多样的优点,这些数据被及时记录在企业数据库中,具有很大的挖掘价值。

3、互联网与传感器数据

互联网与传感器数据每天都产生大量数据信息,数据量巨大,数据记录易获得,政府统计部门可以利用这些数据进行舆情分析,了解统计的关注点以及辅以统计数据来判断经济形势。

三、大数据时代对统计工作提出的挑战

1、大数据时代推进统计调查工作提出新要求

政府统计调查工作的主要目的是为国家与社会提供各种决策依据,在当前的大数据时代背景下,传统统计技术帮助人们通过观察小部分的样本情况从而描述与推测总体情况,帮助人们更好地了解中观和宏观数据。“大数据时代”的来临使人类第一次有机会和条件在非常多的领域以及非常深入的层次获得和使用全面数据、完整数据和系统数据。这样的系统数据可以更加偏向个体情况,更加符合个体的感知,产生宏观数据无法实现的价值。因此,政府统计调查必须要迅速调整工作措施,适应大数据给统计调查带来的各种转变,不断提高统计调查工作的质量。

2、大数据时代下统计工作重心发生了变化

大数据时代下统计工作重心由“数据采集”走向“数据分析”。当前,我们的统计工作虽然也很关注数据的分析处理,但是数据的采集仍然占据工作的重心。大数据时代的到来,面对的不再是数据的匮乏,而是数据的严重超载。对收集的海量数据进行分析处理,让这些静态的处于休眠状态的数据焕发活力,发挥价值,展现数据之间的相关性和预测性,是未来统计工作的重心。政府统计部门作为数据统计工作的主体,对社会起到至关重要的引导与服务作用,同时数据的重要性使得政府越来越成为数据分析应用的关键环节,这不仅对政府统计工作提出了更高要求,对统计工作人员的分析数据能力的要求也进一步提高。“大数据”下的统计数据搜集需要面对的是已经存在的或通过一定手段可以获取的大量数据,并且弄清楚是通过什么方式产生的这些已经存在的相关数据,进而确定采用什么样的数据分析来反映统计目标,统计工作的重心已经不再是传统意义上的数据收集,而重心在于做好数据分析,并为宏观调控做决策咨询。

3、大数据时代下对统计工作中的数据处理方式发生变化

大数据背景下统计工作中的数据的处理更加复杂,云端存储的数据和信息规模庞大、种类繁多,其中也包含大量的无用数据,进行专业的统计分析需要的有用数据则只是其中的一小部分,所以如何从冗杂的数据中抽离出来可以应用于我们的日常统计工作的数据也成为政府统计工作者面临的新问题。在这一背景下,数据分析就变成了统计部门一个关键性的环节,需要专业化的数据挖掘与处理技术,首先要将这些无法识别和运算的信息转化为结构化的数据,针对结构化的海量数据分析挖掘数据之间的内在关系,寻找更多价值信息,这就要求统计工作中的数据处理不再是简单逻辑与数字运算,而是系统性地分析和各类指标数据的复杂处理。

四、“大数据”时代加速统计工作改革

1、大力提高数据挖掘分析能力

我们所要面对的大量、复杂的行政记录、商业交易数据实际上是结构化的海量数据,从这些海量数据中提取隐含的关系、模式和趋势等信息供统计使用。为了在未来的数据竞争中统计发挥更大的社会功能,就必须在数据挖掘方面作出更大努力。大数据时代背景下数据挖掘技术的应用技术主要包括神经网络算法、数据遗传、数据决策树、数据粗糙集等算法。数据神经算法通过对庞大的数据库进行分类,对符合优先条件的有用数据进行分类,能够在规模庞大的数据中迅速定位和精选有用数据。通过挖掘数据分类中的抽象层和价值层找出数据的模式和规则性,数据的规则性通过不同的方法挖掘,通过数据概念的描述和数据预测等方法实现大数据精细化分类。

2、提高行政记录数据在统计工作中的应用

行政记录是政府行政部门为实现管理、控制和服务等目的,通过办证、登记、审批等方式,收集并保存的关于自然人或其他社会实体的相关信息,比如,公安部门因户籍管理、身份证核发而掌握的居民个人信息等信息。行政记录本身不是以统计为目的,但行政记录庞大的信息量可以为统计提供丰富的信息资源,通过深入研究挖掘,可以对统计工作起到一定的补充作用,开发利用好行政记录可以弥补统计调查的不足,用好行政记录,可以有效帮助提高统计数据质量,行政记录统计化能提高源头数据质量,对行政记录数据对统计工作的补充情况如表2所示。

表2 行政记录数据对统计具体工作的数据补充情况表

3、对统计普查与抽样调查的不断改进

普查和抽样调查是传统的两大数据收集方法。普查不需要统计学方法进行推断估计,因为通过普查,已经取得了所有个体数据和总体的实际分布。抽样调查是利用抽样理论解决如何科学设计样本,取得样本个体数据,并科学地推断总体分布及特征。无论是普查还是抽样调查,其核心问题之一是要取得准确的“个体数据”。统计调查覆盖的对象范围应既包括线下也包括线上,而且调查对象报送的原始统计资料应是其生产、经营、管理的原始记录,而不是经加工整理后的所谓原始统计资料,在这样的前提下,从整个统计数据生产流程中剔除了调查对象加工整理其原始记录这个关键环节,打通了阻碍统计数据质量提升的最后一公里,既减轻了调查对象的负担,也较好地解决了统计资料的“真实、准确、完整、及时”这一关键问题,对统计工作中普查与抽样调查的不断改进,能够明显促进统计工作质的飞跃。

五、结论

大数据时代的到来,对传统的统计工作是机遇也是挑战,顺应这种潮流,并借助于“大数据”的力量变挑战为机遇,变数据收集为数据分析,充分利用好海量的行政记录数据,提高统计分析能力,使统计工作在大数据背景下发挥更高效和精准的决策咨询功能。

[1]许小乐.“大数据”与政府统计改革[J],调研世界. 2013年第5期.

[2]姜澍.大数据时代下的政府统计[J],调研世界.2014年第4期.

[3]韩家炜.Micheline Kamber,数据挖掘:概念与技术.机械工业出版社.2006年

[4]马建堂.大数据在政府统计中的探索与应用[M].北京:中国统计出版社,2013.

[5]潘璠.走进大数据[J].调研世界.2014年第10期.

[6]魏春香.试论大数据背景下的基层统计工作[J].中国集体经济,2016年第7期.

Research on Government Statistical Work Based on the Background of Big Data

Yue Dabo
(Statistical Institute,Chengdu University of Information Engineering Chengdu 610103)

The government statistical work as the most important information and data production departments,we comply with the needs of the era of big data development,we actively respond to the big data era brought opportunities and challenges,we build a modern service-oriented statistics is the current statistical work is worth pondering.This paper discusses the change of statistical work from the background of big data and puts forward the corresponding suggestions for the reform of statistical work,which is conducive to improving the quality and efficiency of the current statistical work.

Big dataGovernment statisticsAdministrative records

C829.2;G250.252

A

161030-7404

*注:本论文为国家统计局统计信息技术与数据挖掘重点开放实验室开放课题的部分研究成果,项目编号:SDL201611。

岳大波(1978.12~),工作单位:成都信息工程大学统计学院工作;职称:讲师;学历:硕士;研究方向:统计信息化方向。

猜你喜欢

数据挖掘行政政府
关注《行政与法》方式
改进支持向量机在特征数据挖掘中的智能应用
探讨人工智能与数据挖掘发展趋势
米其林行政主厨的GENTLEL
基于事故数据挖掘的AEB路口测试场景
行政事业单位内控管理制度的建立与完善
知法犯法的政府副秘书长
软件工程领域中的异常数据挖掘算法
行政为先 GMC SAVANA
“政府信息公开”观察