APP下载

政府多部门数据协同共享流程研究
—— 以温州为例

2016-06-02林元杭张晓芳温州医科大学仁济学院浙江温州35035温州大学网络经济研究院浙江温州35035温州医科大学人文与管理学院浙江温州35035

关键词:数据共享大数据

林元杭,张晓芳,叶 永(.温州医科大学仁济学院,浙江温州 35035;.温州大学网络经济研究院,浙江温州 35035;3.温州医科大学人文与管理学院,浙江温州 35035)



政府多部门数据协同共享流程研究
—— 以温州为例

林元杭1,张晓芳2,叶 永3,†
(1.温州医科大学仁济学院,浙江温州 325035;2.温州大学网络经济研究院,浙江温州 325035;3.温州医科大学人文与管理学院,浙江温州 325035)

摘 要:大数据时代,数据价值不断被发掘,数据共享也日益重要,但受到利益和风险的限制,数据共享实践困难重重.本文以温州人口数据库构建为例,探讨数据从采集到建库的完整流程,为实现各部门分散数据的有效整合提供路径;结合数据的类别性质,设计多重标签,调整各部门的数据供需,为实现跨部门数据的有效共享提供路径;分析流程中降低跨部门数据风险的关键因素,确定数据专有性和隐私级别,决定数据的流向与共享的权限,从数据专有程度和开放程度两个方面为保障数据的有效共享拓宽新的视野.

关键词:大数据;数据共享;人口数据库

随着云计算、移动互联网、物联网等信息技术的蓬勃发展,以及以微信、微博等社交网络为代表的新型信息发布方式的兴起,大数据时代已经来到.未来国家的核心竞争力,将很大程度上依赖于数据,数据将成为国家、政府、企业的资本[1].数据共享也因此成为政府和企业关注的热点和焦点.由于数据共享涉及到多部门的利益,并存在一定风险,因此必须要有明确的机制才能保障数据共享的实现.现阶段,数据共享主要涉及到政府、企业间的共享以及数据对公众的开放.政府数据共享有利于领导层制定管理决策,因此,政府部门间的数据共享机制构建具有重要意义.本文以温州人口数据库建设为例,将分散在公安、人口计生、教育等部门的相关数据进行协同共享,以有效整合数据资源,提升数据本身的实用价值.

在现有的数据共享研究中,龙健[2]总结了国内外政府数据跨部门共享研究,并通过问卷调查提出了改进数据内部共享机制、优化数据外部环境的相关建议;刘同录[3]分析了企业数据共享存在的问题,提出了促进数据共享实现的对策;邵风云[4]从立法的角度探析了基于公众获取政府信息著作立法权的问题;吕欣[5]从信任因素的角度分析了信息资源共享的信任机制构建;查先进[6]描述了政务信息的共享及其类型,分析了电子政务共享的障碍,并提出促进信息共享的对策;袁琳[7]则从跨部门政府信息资源入手,通过设计共享技术框架、构建共享联通模型、建设目录交换体系,建立了多部门共享信息资源的动力机制.

然而,现有相关研究虽然从不同角度剖析了数据共享的障碍,也提出了相关建议,但缺乏具体的实施方案,同时,共享数据涉及到的利益仍未有明确的保障机制.本文将主要针对政府跨部门数据共享问题,在分析数据共享过程中涉及到的源数据、数据处理及数据分级分类的基础上,以温州人口数据库的构建为例,详细探讨从数据采集到建立数据库的整个流程,并充分阐明各部门参与共享的工作,以在保障部门权益的前提下,降低数据共享风险,使各部门能够有效共享数据.

1 政府跨部门数据共享的意义

政府跨部门数据共享[8-10]能更广泛地发挥出数据的价值,促进数据的有效利用.政府数据的共享不仅能节省人力、物力、财力,还能使政府部门深入地了解社会现状,察觉社会需求,从而更好地为社会服务.

信息跨部门数据共享具有如下现实意义:一是明确数据归属及采集途径,丰富数据库使数据能够全面支撑宏观统计和分类分析,为政策制定和社会管理提供有效依据;二是减少社会事务办理中的浪费和不准确现象,通过强化政府部门数据之间的比对、更新和查询认证机制,减少通过证书传递过程中由于数据更新不及时出现的差错;三是降低数据采集成本,在确定采集权和减少多头采集的基础上,探索最有效的数据采集机制.

政府跨部门数据共享能为社会带来很大的福利,但现阶段由于各部门数据孤岛现象的普遍存在,部门之间在公共数据共享上缺乏相应机制[6],使得数据共享在理论上搁置,无法付诸实践.解决跨部门数据共享问题必须要协调各部门利益,保护隐私,明确职责.面对实际存在的各种障碍,除了在理论上要做出判断,更重要的是在实际操作中要保证数据共享的可行性,以逐步推动数据共享的实现.

2 数据共享流程

我国跨部门的政府信息资源应用相对较晚,目前主要以人口、法人、空间地理三类基础信息共享为主.为掌握各类信息的基本情况,实现各部门间的数据共享,构建资源库是必不可少的环节.以温州市构建人口数据库为例,首先涉及到的是拥有自然人基础信息的部门,主要有公安、卫生、人口计生、教育、人社、民政六大部门以及新居民服务管理局等.各部门为了有效行使其社会管理和公共服务的职责,相继建设了各自的信息化应用系统,但各部门间数据采集存在重复或交换取用的现象,这使得源数据错综复杂.因此,构建人口信息数据库必须经过数据清洗、筛选等过程,按照一定的原则进行,具体流程包括数据采集、数据处理、构建数据库等内容,如图1所示.

2.1数据采集

数据采集是由各部门向社会采集信息并进行汇总,也包括扩充信息.这个过程不仅要明确数据的采集途径及相关内容以便核对,更要严格要求各部门数据采集的可靠性,从而减少无价值数据带来的风险.同时,数据的归属权也需要得到保障,这是保障部门权利的有效依据,同时也能督促各部门对自身被采集数据的可靠性负责.具体来讲,数据采集包括以下三个方面:

1)源数据采集 源数据采集需要保障数据的质量,以此提升各需求部门对数据的信任度,提高数据发布的有效性.在美国,OMB曾经制定过数据采集的3个指导原则:①客观性,即发布的数据是否准确、可靠;②实用性,即采集的数据是否对社会有用;③完整性,即是否能够保证数据在搜集、整理的过程中不受到非法的接触和修改.考虑到温州市的人口相关数据在不同的部门都有记录,包括人口计生委、人社、教育、卫生等部门,我们必须秉承这三原则,对政府数据重复搜集和处理,并结合数据分散等现象考察各部门采集方式是否严谨,以此来决定数据是否直接录入系统.如果存在多个部门重复采集相同内容的信息,要通过对比、核实的手段对数据进行统一规划,选取最有效的数据作为源数据录入.

2)源数据筛选 源数据筛选过程中,每个类型的数据都可能重复,为了提高数据的准确性,要剔除掉内部流程控制、重复的数据和不满足共享标准的数据,再对清理后的数据进行汇总.例如,对温州市人口数据的处理,首先需要对各部门的人口相关数据进行汇总,保留原始数据,去除重复数据及为特定用途而生成的数据,然后再次进行汇总,最终得到有效的源数据.

3)源数据整合 各成一体的数据必须统一标准,按照每个数据的格式、属性等因素进行分类,将未经处理直接采用的初始源数据汇总建立成源数据库,对另外生成的数据可做记录,将其整合为衍生数据库.以上过程要对各部门采集的全部数据进行处理,形成典型特征的源数据库.例如,人口数据库需要将各部门所有的信息汇总,包括人口从出生到死亡的相关数据等,然后进行删减、筛选,从而得到有效的源数据来构建最终的数据库.

综上所述,数据采集综合处理流程如图2所示.

图2 数据采集流程示意图

2.2数据处理

从不同的角度分析,数据往往会有不同的属性,这些属性可以作为数据的类别标签,对数据进行更准确的划分.构建人口数据库时,应该对人口数据做出类别标记,为每个信息进行明确标注.就人口数据的性质而言,可以结合温州市各部门的职权,从以下四个角度进行分析,为数据添加四类标签,以便在数据共享过程中明确范围.

1)数据类别 根据数据来源的不同可以划分为本部登记、外部交换、专项采集三类.本部登记数据是指由于受部门特征影响而存在于本部门的数据,例如,温州市公安局的公民身份相关信息,卫生部门提供的出生日期、户籍地址等信息都归属此类;外部交换数据是指由于部门需要,采用其他部门所拥有的数据,这类数据如若发生归属权变更,则归属变更后单位,否则归属原单位;专项采集数据是指为了特定目的专门收集到的数据,例如,指纹信息、参保状况或者统计信息等.这三种类型可以作为数据的一类标签,确定数据的来源,为数据后续的归属标注提供依据.

2)数据归属 准确的数据归属有助于分析数据的共享是属于同类部门的纵向共享还是不同部门的横向共享,是确定数据专有性的一个关键因素.一般来说,依据部门职责确定采集产生的数据来源,数据主要归属拥有数据原始权的部门;特殊情况归属权限会发生变更,则归属变更后部门所有.例如,温州市的工作单位信息归属新居民服务管理部门,而民政婚姻登记、新生儿基础信息最终归属公安部门.

3)数据专有性[11]专有性是数据共享的一个重要属性,可以通过对数据添加专有性标签来明确数据的共享方向.根据数据的部门专有性可以将数据分为两个层次:一层是专有数据,这类数据仅限于本部门使用,主要用于数据的纵向共享,方便本部门了解相关信息,利用该类数据进行相关的决策;另一层是共享数据,这类数据就是指横向跨部门使用的共享数据,主要流向其它部门.

4)隐私级别[8]隐私级别是数据共享的另一个重要属性,主要用于保障个人信息以及部门权益的信息,有效降低数据共享的风险.本文按照数据的隐私性对采集数据进行分级,将共享数据一共分为四个级别:多部门具有共同需求的有权威或法定来源的重复搜集数据定义为一级共享数据;有利于相关部门作出决策但并非多部门共需的数据信息定义为二级共享数据;单个部门之间需要共享的数据信息定义为三级共享数据;部门间提供社会服务性质(如建立居民健康档案)的特有型数据信息定义为四级共享数据.另外,将进行内部控制或仅供自身使用的数据列为零级,代表该数据为部门专有数据.零级为进行数据各层次的统一而设,属于隐私级别,只针对本部门开放,不涉及跨部门共享.将各部门的专有数据进行这样的数据分类,在推进数据共享实现的同时,也间接地为节约社会资源、提供社会服务做出了贡献.依照上述规则,以人口数据库为例,即可把身份基本信息归为第一级,牵涉到的家庭信息归属为第二级,户口变动信息归属为第三级,各方面生理信息(如居民血型)归属为第四级.

以上四类标签作为数据共享的依据,每类标签都是数据的一项特征,具体内容如图3所示.数据类别与数据归属息息相关,数据归属又影响到了数据的专有性质,继而决定数据的隐私级别,环环相扣,但最终作为数据共享的参考因素是数据的专有性和隐私级别.随着数据库的不断完善,数据的标签也会按需求合理增加,从而实现数据的多维度保障,降低风险,提升部门共享的主动性.

2.3数据库构建

按照上述,源数据将被添加四类属性标签.为方便拥有源数据的部门掌控共享数据的流通和需求部门提取数据,数据录入与导出的效率需要得到很好的保障.现有情况下,导致数据流通效率低[12]的原因有两个:一是各系统自成体系形成信息孤岛;二是有价值的信息资源分散存储,整合效率低下.因此,我们必须要为数据的交换制定标准,统一数据的结构,增强数据的可传递性.数据库的建立会极大程度地减少各部门整合数据的工作量,为各部门精确查询信息提供更快速优质的服务.

为防止数据多层次化引起分散与混乱,导致其可靠性受到影响,数据库的建立必须围绕核心部门,由核心部门联合其它部门进行数据的互联互通,从而增强数据库的稳定性.核心部门的选取要根据数据库的性质以及数据的主要来源确定.例如,温州市人口数据库是以公安部门为中心建立的,因为公安部门是常住人口户籍主管部门及信息提供的法定单位.由公安部门联合人口计生部门、教育部门等进一步完善人口数据库数据信息,扩充信息量,最终建立相对完整的人口数据库.

为了方便数据的提取,考虑到数据的安全性和风险性,在数据录入时将对数据进行属性标记,包括信息名称、归属部门、所属类别、隐私级别及数据性质五类标签.通过标签添加,限制数据的无条件共享,是现阶段推进数据共享的可行性方法.温州市部分人口相关信息经过整理后的形式如表1所示.

对源数据的各项属性做出标记是数据共享的基础,也是各部门数据共享内容及范围的确定依据.随着系统的不断完善,可根据实际使用状态,将数据不断从多种意义上细化,赋予其必要的类别标签,增加数据属性,从而能够对源数据作出更有效的分析,指引后续共享工作的进行.

图3 数据标签示意图

2.4共享目录

共享目录[7]是明确各部门供需的具体体系,根据各部门提供数据和需求数据的性质对共享的具体模式给予说明,能够促使各部门实施数据交换.因此,需要明确各部门的数据供需状况,并按照源数据的基本形式整理各部门的供给与需求数据,再将所有信息汇总整合,实现具有针对性的数据共享.人口信息在各政府部门中主要用于个人的身份检验,因此政府部门在行使社会管理、提供公共服务时,对人口基础信息有着非常强烈的共享需求.对温州市部分部门人口数据的供需状况进行整理,见表2.

表1 温州市人口相关信息数据分类示意图

表2 温州市部分部门人口数据供需信息表

依照上述形式,每个部门根据自身权限将所属数据进行类别划分,可以有效整合数据供应与需求,实现数据的分类分级共享.本文所述部门间源数据的共享主要由数据专有性与隐私级别来决定,专有性决定数据是否只能针对本部门开放,隐私级别决定部门对共享数据的共享权限.在此基础上,各部门明确自身数据对外的共享范围以及可以得到共享权限的其他部门的数据范围,这是部门间数据共享的一个重要支柱,能有效促进初步阶段数据共享的实施.

在这样的交换体制下,关键点在于确定各部门可以获取数据的范围及隐私级别,并在数据系统中给予权限,这可以由部门协商或依据相关政策规定作出决策,也可以依照实际需要不断作出调整.例如,特殊情况下经过申请等手段,允许特殊的共享权限发生.目前,为了保障数据共享的安全,初步阶段需要对权限作出设置.随着系统的完善化,数据共享的必要条件可以不断修正,甚至可以使用多维度筛选系统,扩大共享范围,使数据更能有效地被需求部门利用.

2.5共享要求

共享要求主要是考虑到影响数据共享的因素,尤其是利益与风险,需要明确整个环节涉及到的协调细节,以避免利益冲突,降低数据共享潜在的风险性.通过共享要求来提高共享的可能性.共享目录是保障数据风险的关键,共享要求是保障各部门利益的关键,利益不平衡会阻碍部门之间的共赢合作.因此,为避免源数据的违规利用,保障源数据的质量不受侵害,必须保证各部门数据的所有权限以及明确各部门对数据拥有的权利及义务[10],包括数据的归属权、使用的知情权以及风险责任的承担等.

第一,保证共享的透明度.数据使用部门有必要对数据的使用用意进行说明,即在数据共享实现的同时创建数据交换协议,具体内容包括:导出内容、时间、用途等.对导出的数据各项内容由系统生成记录,以此增加数据共享的透明度,明确数据的使用目的.数据的知情权会维护政府部门的利益,减轻数据提供方的负担,在一定程度上可以推动数据共享的进度.

第二,明确参与部门的职责.在数据共享的过程中,各部门相关工作的任务、职责等都需要明确记录,并由相关部门将制度详细化,具体到人,增强工作人员的责任感.此外,后续数据挖掘的信息维护、数据处理等工作也需要各主体部门来跟踪完善.

第三,保持数据的实时性.各部门应该及时对数据的更新或修改进行调整,合理排版数据库信息,保障被利用数据的适时性,提高部门分析数据的有效性,从而增强各部门对共享数据库的使用意识.

第四,明确各部门权益.政务信息资源的共享需要各部门积极配合,会消耗大量财力、物力、人力支撑体系的运行.因此,必须明确涉及到的所有产权、利益及风险,提高各部门对数据共享的主动性和积极性.

3 结 语

我们建立了温州市人口数据库,从源数据到最终数据进行了分类标签处理,有效地提升了数据的利用率,促进了数据共享的进一步实现.但由于涉及到分级分类以及权益保障问题,还需要相关政策法规的支撑才能实现.现阶段,全国政务信息资源共享法制工作相对滞后,缺乏综合性、基础性政务信息资源共享立法.为了促进各部门尽快实施信息共享,可以为各部门提供相关的政策支持,比如采取利益补偿机制[13],对积极参与推动数据共享的部门予以补贴,为数据共享提供动力.除此之外,还需要从多个角度分析影响数据共享的因素,逐步发现共享过程中存在的问题,不断寻找解决方案,以完善数据共享的各个环节,尽早创造出数据共享合作共赢的新局面.

参考文献

[1] 方璐. 浅析大数据时代的科学研究方法[J]. 信息通信, 2014, (5)﹕ 150-151.

[2] 龙健. 政府基础信息资源跨部门共享机制研究[D]. 北京﹕ 北京大学信息管理系, 2013﹕ 75-84.

[3] 刘同录. 企业数据共享存在的问题及其解决措施[J]. 现代电子技术, 2009, (20)﹕ 88-102.

[4] 邵风云. 基于公共获取的政府信息著作权立法问题探析[J]. 河南图书馆学刊, 2014, 34(3)﹕ 92-94.

[5] 吕欣. 电子政务信息资源共享中信任机制的构建[J]. 信息网络安全, 2009, (3)﹕ 11-13.

[6] 查先进. 电子政务信息共享的障碍及对策研究[J]. 江西社会科学, 2006, (7)﹕ 45-49.

[7] 袁琳. 跨部门政府信息资源共享的机制研究[D]. 上海﹕ 上海社会科学院信息研究所, 2011﹕ 16-17.

[8] 陈金. 我国电子政务信息资源共享的障碍及对策研究[D]. 秦皇岛﹕ 燕山大学文法学院, 2011﹕ 17-27.

[9] 吴迪. 地方政府职能部门间信息共享运行机制研究[D]. 苏州﹕ 苏州大学政治与公共管理学院, 2013﹕ 19-26.

[10] 楚会霞. 大部制背景下的跨部门协调与合作机制研究[D]. 河南﹕ 河南大学哲学与公共管理学院, 2011﹕ 14-17.

[11] 刘润达, 孙九林, 廖顺宝. 科学数据共享中数据授权问题初探[J]. 情报杂志, 2010, 29(12)﹕ 15-18.

[12] 高洁. 政务信息资源共享研究[M]. 北京﹕ 中国社会科学出版社, 2011﹕ 124-132.

[13] 陈海亮. 温州数字资源共建共享联盟机制的构建[J]. 科学情报开发与经济, 2012, 22(11)﹕ 72-73.

(编辑:王一芳)

The Study on DS Mechanism from Government Multi-departments—— A Case Study of Wenzhou Population Database

LIN Yuanhang1, ZHANG Xiaofang2, YE Yong3
(1. Renji College, Wenzhou Medical University, Wenzhou, China 325035; 2. Research Institute of Cyber Economy, Wenzhou University, Wenzhou, China 325035; 3. College of Humanities and Management, Wenzhou Medical University, Wenzhou, China 325035)

Abstract:In the age of Big Data, the value of Big Data has been exploring, and the data sharing has also been increasing significant. However, the realization of data sharing process is restricted by public benefits and risks. By analyzing the development of Wenzhou population database, this paper probes into the complete procedure of the database from the data collection to the establishment of data. Firstly, the providing path has to be decided in order to effectively realize the integration of the dispersed data from all departments. Secondly, the combination of the data classification properties has to be confirmed, the multiple labels has to be designed and the supply as well as the demand of share data from respective departments has to be adjusted in order to provide the path to realize the cross-department data sharing mechanism. Thirdly, the key factors to reduce the risk of cross-department data has to be analyzed in order to determine the exclusiveness of data and the level of privacy to determine the flow direction of data and the data sharing rights. Finally, this paper works hard to broaden the brand-new vision of effective data sharing from the field of data exclusiveness to the field of data openness.

Keywords:Big Data; DS(Data Sharing); Population Database

作者简介:林元杭(1997- ),男,浙江苍南人,研究方向:风险管理.† 通讯作者,yong_ye@foxmail.com

收稿日期:2015-12-22

DOI:10.3875/j.issn.1674-3563.2016.02.008 本文的PDF文件可以从xuebao.wzu.edu.cn获得

中图分类号:TP393

文献标志码:A

文章编号:1674-3563(2016)02-0055-08

猜你喜欢

数据共享大数据
科学大数据的发展态势及建议
数字化迎新系统宿舍分配模块的设计与实现
贵州大数据产业发展战略理解和实施建议
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索
面向海上平台机械电气设备的数据共享平台的设计与实现
浅谈“营配贯通”对供电企业的作用
基于协同办公的会议管理系统设计与实现