APP下载

刍议大数据时代的电子政务

2013-11-14舒宝淇云南大学

新世纪图书馆 2013年7期
关键词:结构化数据处理电子政务

王 晋 舒宝淇(云南大学)

近年来,在云计算、物联网等信息技术的推动下,互联网已步入了“大数据”时代。大数据(Big data)是IT 界近年来最流行的词汇。在大数据时代,数据作为一种重要资源如何加以高效利用并开发出其中的价值,成为政府公共管理部门关注的问题。美国政府于2012年3月29日宣布推出“大数据的研究和发展计划”,意在推进和改善联邦政府部门的数据收集、组织和分析工具技术,以提高从大量的、复杂的数据集合中获取知识和洞见的能力。大数据背景下,在电子政务领域,利用大数据技术去挖掘、识别、组织与分析隐含在用户行为中的结构化、半结构化数据信息,寻找他们的隐性诉求进而改进电子政务的公共服务,达到政府信息资源、电子化公共服务与公众需求的双向理想控制已成为大数据时代电子政务领域亟需解决的问题。

1 大数据概述

1.1 大数据的概念

目前对大数据还没有标准的定义,一般认为它是一种数据量很大、数据形式多样化的非结构化数据。维基百科定义为:大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。百度百科定义为:大数据通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。从各种各样类型的数据中快速获得有价值信息的能力,就是大数据技术。IBM 从三个基本特性角度来定义大数据,即:“3V”:体量(Volume)、速度(Velocity)和多样性(Variety)。也有人认为大数据包括三个要素,即:大分析(Big Analytic)、大带宽(Big Bandwidth)和大内容(Big Content)。

1.2 大数据的特点

(1)数据总量规模持续增长。同一类型的数据在快速增长,目前在传感器网络、地理信息导航系统、即时通讯(如QQ)、社会网络(如微博)、电子商务(如淘宝)、电子政务、移动互联、网络日志等领域都产生了巨大的数据量,数据规模在不断增加。

(2)数据增长速度不断提高。大数据的动态性很强,要求分析处理应快速响应,在动态变化的环境中快速完成分析过程,有些甚至必须要实时进行分析,否则这些结果可能就会过时或无效。

(3)非结构化和半结构化数据明显增多。目前产生大数据的数据来源在不断拓展,数据类型除了包括文本、图片、音频和视频外,还有位置信息、链接信息等新的数据类型。伴随着社交网络、移动计算和传感器等新技术的应用,大数据中的非结构化数据或半结构化数据不断增加,这些数据没有固定的描述模型,它们的数据结构是不固定、不完全或不规则的。

(4)数据潜在价值有待挖掘。大数据虽然数据规模巨大,但通过海量数据挖掘、整合分析,可以发现新的知识、规律和联系,从而创造新的更大的价值。大数据分析能从庞大的数据中发现潜在的具有较高价值的知识、规律和联系,为预测和决策提供有力支持。

2 电子政务具有了“大数据”特征

近年来国内外电子政务获得了长足的发展,很多政府部门正在尝试将云计算、物联网、移动互联等新技术应用到电子政务中来,随着电子政务信息公开、公众参与、在线服务等功能的深入发展,用户对政府电子化公共服务满意度不断提升,从而推进了政府信息资源建设的步伐,电子政务在大数据时代已经具备一定的大数据特征。首先,电子政务信息资源规模总量不断增加,随着政府电子化公共服务水平的提高,用户参与电子政务的积极性日益提高,这也导致电子政务信息资源总量的激增。其次,电子政务的数据种类繁多,有电子政务内部公务处理的结构化数据,也有大量的来自于外部用户反馈的大量非结构化数据和半结构化数据。最后,随着电子政务个性化服务的深入开展,用户的个性化需求日益增多,政府部门必须根据用户的服务需求做出相应的处理,对大数据量的分析与信息潜在价值的挖掘将不可避免。

电子政务的大数据特征主要体现在数据处理和信息服务两个方面,数据处理是电子政务信息服务的前提和基础,用户信息服务是数据处理效率的具体体现,以下将重点分析大数据时代电子政务的数据处理和信息服务的具体特征。

3 大数据时代电子政务的数据处理

大数据时代的来临对电子政务带来了影响和挑战,数据处理是电子政务服务用户的基础和前提,为用户提供个性化的电子化公共服务必须以快速髙效的数据处理为前提,在大数据时代用户的信息需求日益个性化、复杂化、实时化,这必然要求电子政务的信息处理也必须适应大数据的时代特征,创新电子政务数据处理方式。大数据时代的电子政务数据处理呈现出以下特征:

3.1 复杂多样的数据处理

传统的电子政务数据处理在政府内网主要处理一些标准化的公文数据,在电子政务外网中主要处理数据格式和XML 格式的数据,很多政府部门通过一系列国家标准等规范使这些数据格式和XML 格式的数据实现了规范化和统一化,这使得传统环境下电子政务数据处理基本以结构化数据为主。随着大数据时代的到来,大数据的特性与优势在政府内部日常工作和电子化公共服务中将显现出其巨大的优越性。用户对的电子政务的需求也将呈现出个性化、多样化等特点,这必然使电子政务的信息资源呈现复杂化、多样化的特点,适应社会的发展,满足用户的个性化需求,提供复杂多样的数据处理将成为大数据时代电子政务数据处理的显著特征。

3.2 海量的数据存储

信息环境下,信息产生的成本快速下降,产生的方式也多种多样,存在于社会空间中的信息数据量迅猛增长,但大数据时代更会促使数据产生的范围、方式、途径发生翻天覆地的变化,人们的一举一动、一言一行、行为规律等都将产生出大量的半结构化、非结构化信息数据,信息数据的组成结构、类型格式、存在形态等都愈加复杂。电子政务信息处理对这些复杂的数据进行的应用、存储将有着极强的挑战性,其不仅有技术问题,也还包括社会问题。因此,大数据时代的电子政务信息处理首先要通过云计算技术解决海量数据的存储技术问题,另外还需要全面收集用户结构化的个人信息数据,同时大量的用户存储信息行为、搜索方式、行为痕迹等半结构化、非结构化数据也是必不可少的。

3.3 智能化的数据分析

传统的电子政务数据处理主要是通过结果化的公文处理、数据库处理和网络数据处理实现用户对信息服务满意的最大化。在大数据时代电子政务的数据处理范围、方式、对象、目的将日趋个性化和智能化,比如根据用户浏览政府门户网站的痕迹和参与在线服务的偏好,通过智能化的数据分析,构建出新的电子政务服务方案和策略。可见,在大数据时代,电子政务的数据处理将由结构化数据处理转向智能化的数据挖掘和数据分析,通过海量数据挖掘、整合分析,可以发现新的知识、规律和联系,从而创造新的更大的价值,实现更高层次的用户满意最大化。

4 大数据时代电子政务的信息服务

服务用户是电子政务的最终目的,为用户提供个性化的髙效的电子化公共服务是电子政务信息服务的根本目的。在大数据时代用户的信息需求日益个性化、复杂化、实时化,这必然要求电子政务的信息服务也必须适应大数据的时代特征,创新电子政务信息服务方式。电子政务的用户服务一般包括信息公开、公众参与和在线服务三个方面,大数据时代的电子政务的信息公开、公众参与和在线服务呈现出以下特征:

4.1 大数据时代的电子政务信息公开

目前,政府门户网站已经逐渐成为各政府部门发布政务信息的主要平台,政务信息公开是以网络为工具进行政务信息资源收集、传播、贮存并将信息与公众共享。政府部门应按照《政府信息公开条例》要求,建立政务公开栏目,主动发布各类政务信息。在大数据时代,信息公开的内容依然应按照《政府信息公开条例》要求,而信息公开内容的页面布局应顺应大数据时代的特征发生改变,通过分析大量的用户访问和浏览的行为数据,分析用户对政务信息公开的内容的偏好,重新组合页面布局,实现个性化的政府信息公开服务。

4.2 大数据时代的电子政务公众参与

目前,电子政务公众参与的渠道日趋多样化,主要的渠道有领导信箱、民意征集、留言板、网上信访、网上直播、在线调查、网上咨询投诉、在线访谈、公众论坛、政务微博等,随着信息技术的快速发展,一些新技术、新网络形态还将应用到电子政务公众参与中来,换句话说通过电子政务公众参与获得的用户反馈信息会越来越多样化、复杂化和个性化,这表明电子政务的公众参与具备了“大数据”的特征,因此,大数据时代的公众参与应按照大数据时代的数据处理要求,通过处理海量的结构化、非结构化和半结构化的数据,深入挖掘潜在价值,进一步优化电子政务的公众参与服务,从而提升用户的满意度和政府的公信力。

4.3 大数据时代的电子政务在线服务

电子政务的在线服务功能是指通过政府网站整合政府各部门以及社会各种服务资源,完成或促进社会公众日常生活及企业经营决策活动实际事项的能力。目前,电子政务的门户网站要求能为用户提供“一站式”的服务平台,即能够为面向不同类型的用户群提供全生命周期应用主题的信息和服务,最大范围的整合服务资源。由于电子政务的在线服务的用户类型多样,需求各异,这必然要求电子政务在线服务能够具备处理用户个性化信息需求的能力,通过对海量个性化数据的处理,发掘出潜在的有价值的知识和规律,从而提升大数据时代的电子政务在线服务能力和服务质量,获得最大化的用户满意。

1 赛迪智库软件与信息服务研究所. 美国将发展大数据提升到战略层面[J].中国电子报,2012-07-17(003)

2 Big data[EB/OL].http://en.wikipedia.org/wiki/Big_data,2013-02-23.

3 大数据[EB/OL].http//baike.baidu.com/view/6954399.html,2013-02-23.

4 涂兰敬.专家观点:“大数据”与“庞大数据”的区别[J].网络与信息,2011(12):37~38

5 黄晓斌,钟辉新.大数据时代企业竞争情报研究的创新与发展[J].图书与情报,2012(6):9~14

6 韩翠峰.大数据带给图书馆的影响与挑战[J].图书与情报,2012(5):37~40

猜你喜欢

结构化数据处理电子政务
顾丽英:小学数学结构化教学的实践探索
借助问题情境,让结构化教学真实发生
认知诊断缺失数据处理方法的比较:零替换、多重插补与极大似然估计法*
基于ARCGIS 的三种数据处理方法的效率对比研究
深度学习的单元结构化教学实践与思考
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
高层建筑沉降监测数据处理中多元回归分析方法的应用研究
高层建筑沉降监测数据处理中多元回归分析方法的应用研究
视频大数据处理的设计与应用
中国电子政务的“短板”