地方政府数据开放全生命周期安全管理政策研究*——基于全国17个省级政府的政策文本分析
2021-08-30冉连张曦
冉 连 张 曦
(1.西华大学社会发展学院 成都 610039;2.西南交通大学马克思主义学院 成都 611756)
1 问题的提出
2016年中共中央办公厅、国务院办公厅印发的《关于全面推进政务公开工作的意见》明确提出,“加快建设国家政府数据统一开放平台,制定开放目录和数据采集标准,稳步推进政府数据共享开放。”党的十九届五中全会明确提出:“扩大基础公共信息数据有序开放,建设国家数据统一共享开放平台。”这表明大数据时代推动数据开放共享已经成为国家治理的重要议题。根据《中国地方政府数据开放报告(2020上半年)》统计,截至2020年4月底,我国已有130个省级、副省级和地级政府上线了数据开放平台,其中省级平台17个,副省级和地级平台113个。然而,政务公共数据往往涉及大量个人隐私与相关涉密信息,随着政府数据开放的规模不断扩大,其安全问题也日益凸显,这给国家安全、社会稳定和个人隐私带来了巨大的潜在威胁。因此,有必要在推动公共数据有序开放共享过程中制定和优化数据开放全生命周期安全管理政策,切实保障数据安全,这是当前政府数据开放可持续性面临的重大挑战,也是各级政府推行政务大数据开放共享过程中亟需加强建设的核心能力之一。
数据安全管理是政务大数据开放的核心能力,探讨政府数据开放全生命周期安全管理政策议题是政府数据安全研究的重要内容。国内外学者主要探讨了数据生命周期理论及其在政府数据开放中的应用。在政府数据开放生命周期阶段划分方面,国外学者形成了数据生命周期的“五阶段论”“六阶段论”“九阶段论”。五阶段论认为政府数据开放周期模型主要包括识别(制定战略、选择数据)、准备(制定要求、建模和描述数据、转换格式、数据链接、数据存储)、发布(数据发布、元数据发布)、再利用(利用已发布的数据、数据管理)、评估(制定业务主张、监测和改进数据)五个部分[1]。六阶段论从创建、存储、使用、共享、存档、销毁六个方面论述了数据开放生命周期[2]。九阶段论从数据预处理、数据开发、数据维护三个方面划分了数据创建、数据筛选、数据协调、数据发布、数据关联、数据发现、数据探索、数据开发和数据监护9个阶段[3-5]。国内学者主要探讨了数据生命周期模型在政府数据开放中的应用。政府开放数据全生命周期包括数据的生成采集期、数据的整合开放期、数据的整合利用期、数据的价值评估期、数据的再生/消亡期 5个时期[6]。政府开放数据平台构建框架应包括数据创建、数据筛选、数据发布、数据关联、数据管理、数据检索、数据开发、数据互动八个方面内容[7]。数据生命周期视角下的政府数据开放在不同阶段存在诸多障碍与安全风险,需要从数据开放文化、法律法规、数据标准、用户体验、数据素养培育等方面加以应对[8-12]。
综上而言,国内外基于数据生命周期的政府数据开放研究已经成为学界关注的重要议题,相关研究成果为本研究的开展提供了重要的理论参考,但是相关研究还存在一定的可拓展空间:一是缺乏从全生命周期的视角探讨政府数据开放安全管理政策的研究成果;二是已有研究成果多聚焦于政府数据开放的阶段性分析,缺乏专门针对政府数据开放安全管理的分析框架;三是已有研究成果在研究方法方面多用一般的规范分析法来开展理论推演与经验分析,鲜有从政策文本分析视角探讨政府数据开放全生命周期安全管理政策的制定情况。本文运用内容分析法,在构建政府数据开放全生命周期安全管理分析框架的基础上,对已经上线政府数据开放平台的17个省级政府出台的政府数据开放安全管理的相关政策文本进行分析,以期弥补既有研究的不足,从而为优化地方政府数据开放安全管理政策体系提供知识增量。
2 研究设计:数据来源、研究方法与技术路线
2.1数据来源本文主要是对省级政府出台的关于数据安全管理的政策文本进行分析,样本政策文本主要通过北大法宝、白鹿智库政策大数据平台以及省级政府门户网站获取。根据复旦大学数字与移动治理实验室发布的《中国地方政府数据开放报告(2020上半年)》统计,截至2020年4月,全国共有17个省级政府上线了地方政府数据开放平台。因此本文基于此信息源来搜集已上线数据开放平台的省级政府出台的关于政府数据开放的相关政策文本,共搜集到17个省级政府发布的关于政府数据安全管理的相关政策文本84份,政策文本的搜集时间截止到2021年2月23日。从搜集的政策文本主题来看,除了浙江、贵州、天津专门出台了政府数据开放安全管理的政策法规之外,其他省级政府均未专门出台政府数据开放安全管理政策法规,相关安全管理内容主要嵌入在数据开放条例、大数据发展、数字政府建设、政务信息系统整合、电子政务发展规划等政策文本之中。因此,鉴于大多数省级政府并未出台专门关于政府数据安全管理的政策文本,本文主要从相关样本政策文件中提取了关于数据安全保护的文本内容进行编码分析,以保证内容分析的针对性与有效性。
2.2研究方法本文主要是对省级政府出台的关于政府数据开放安全管理的政策文本进行分析,因此依据分析对象的特质,文本在研究方法上主要采用内容分析法,内容分析法是一种将非系统的、定性的符号性内容如文字、图像等转化成系统的、定量的数据资料的研究方法[13]。具体而言,内容分析法是把媒介上的文字、非量化的、有价值的信息转化为定量的数据,建立有意义的分类项目与标准以分解政策文献内容,并以此来分析信息的某些特征,其目的是将用言语表示的文献转换成用数量表示的资料,以揭示文献特有的隐性情报内容,对事物发展作情报预测[14]。
2.3技术路线本文技术路线主要分为3个步骤:第一,将收集的84份政策文本进行逐一分析与初步归类,一方面通过关键词搜索政策样本中关于数据安全管理的相关内容,另一方面运用政策类型学方法对收集的文本内容进行初步的归类整理。第二,运用Nvivo12 Plus软件对收集的样本文字内容进行词频分析(Word Frequency Analysis)、核心关键词句编码(Coding)以及生成可视化(Visualization)图表。第三,在Nvivo计量统计与分析的基础上,结合内容分析结果,提出相应的对策建议。
3 地方政府数据开放全生命周期安全管理政策的内容分析
运用Nvivo软件对收集的样本政策内容进行统计与编码。在统计方面,通过关键词词频分析可以从总体上把握地方政府数据开放全生命周期安全管理政策制定的基本情况;在编码分析方面,通过构建数据开放全生命周期安全管理分析框架,编码分析地方政府数据开放全生命周期安全管理的具体内容,可以详细了解地方政府数据开放全生命周期安全管理政策的具体实施情况。
3.1总体内容分析通过Nvivo软件的词频分析功能能够从总体上把握地方政府数据开放全生命周期安全管理政策制定的主要现状。词频分析是一种基本的文本分析方法,其原理是统计文本中每个词出现的次数,通过“统计词频”来识别海量文本中隐含的高频词汇,进而可以推测文本所表达的主要信息[15]。
图1、图2是地方政府数据开放全生命周期安全管理政策的词云图和矩形式树状结构图,从主要关键词出现的频率来看,地方政府在数据开放方面更加强调对数据开放全生命周期安全管理的要求,主要体现在对开放前的数据审查、事中安全管控、开放后行为处置三个层面。
图1 地方政府数据开放全生命周期安全管理政策词云图
图2 地方政府数据开放全生命周期安全管理政策矩形式树状结构图
3.1.1 开放前数据安全审查层面 制定政府数据开放安全审查标准和风险评估与预警机制,能够事前避免或及时解决数据开放过程中产生的意外风险。从词云图和树状图可知,评估、要求、审查、预警、标准等词在政策文本中出现频率较高,说明政府在数据开放前开始关注数据开放安全内容的审查与风险评估,体现了事前控制的特征。从政策文本分析来看,绝大多数地方政府在数据开放前制定了数据开放目录与清单,设置了前置审查程序,并制定了相应的数据审查与评估要求,尤其是针对涉密和个人隐私的信息进行严格审查,以防止因数据开放而引发的隐私问题,从事前预防的角度保障政府数据安全有序开放。
3.1.2 开放中数据安全管控层面 强化数据开放中的安全管控是地方政府数据开放的关键环节,也是地方政府安全管理能力的重要彰显。从词云图和树状图可知,事中安全管控的政策内容占比较大,如管理、保障、技术、体系、机制、措施、应急等高频关键词的重复出现,说明政府数据开放安全管理重心在事中数据安全管控层面。由于数据开放风险的不确定性,很难通过事前安全审查进行控制,大多数地方政府将主要注意力集中在开放过程中安全风险的动态管控层面。从政策文本分析来看,地方政府主要从体制(制度)、机制、工具应用、具体安全管控举措等方面强化了数据开放中数据安全风险管控,以及时解决数据开放过程中产生的安全风险。
3.1.3 开放后行为处理的方式与措施层面 数据开放后行为处理的相关规定能够有效明确数据开放主体、数据运营主体以及数据利用主体的权责关系,并能够进一步保障安全责任的落实与义务的履行。从词云图和树状图可知,主体、违法、责任、行为、处理、处分、责令、罚款等高频关键词的出现说明地方政府在对数据开放后的行为处置方面制定了一定的标准和要求。从具体政策文本分析来看,部分地方政府从数据开放主体与利用主体两个层面分别制定了数据开放和使用过程中的违法违规行为处置的规范,以明确各个主体的权责与义务,从而达到约束和规范数据开放主体与利用主体行为的目的。
3.2具体内容编码分析编码是质性研究资料分析、组织和使文本有意义的重要步骤之一,编码是将资料转移成概念的过程,是研究者将搜集资料裂解,赋予新概念,将资料重新汇编成不同分析单位,并分类成不同类型,检视与研究主题有特殊关联的操作过程[16]。本文将收集的84份样本政策文件中关于数据安全保护的相关内容作为基本分析单元。在政策节点类型划分方面,本文基于国内外数据生命周期相关理论启示,借鉴《中国地方政府数据开放报告(2020上半年)》中关于“开放前的数据审查、事中安全管控、开放后行为处理”的数据开放全生命周期安全管理的划分标准,构建了基于“事前数据审查—事中数据安全管控—事后相关行为处置”的地方政府数据开放全生命周期安全管理分析框架(见图3)。
图3 地方政府数据开放全生命周期安全管理分析框架图
依据分析框架,本文从事前数据安全审查、事中数据安全管控、事后行为处置三个层面制定了14个节点的编码规则(见图4)。编码是按题目、主题收集材料的过程,笔者从整体上将编码体系分为三级:第一级编码主要依据前述所构建的事前、事中、事后的分析框架作为基本树节点;二级子节点编码主要是依据分析框架对收集的政策文本进行归类、提炼、总结而形成;三级参考点编码主要呈现相关政策文本中最原始的节点数据,也是二级子节点的重要内容来源。依据编码规则,借助Nvivo12Pro中的关键词句搜索功能,从84份文本中挖掘了312个节点,其中事前数据安全审查层面参考节点47个,事中数据安全管控层面参考节点200个,事后行为处置层面参考节点65个。从总体上看,地方政府数据开放全生命周期安全管理政策内容主要集中在事中数据安全管控层面,占了总节点内容的64.1%,而事前数据安全审查与事后行为处置的政策内容相对较少。同时,为了保证所编码参考节点的可靠性,笔者和第二作者进行了两轮编码操作,并在此基础上对两轮编码的一致性进行了评估,评估结果符合编码的信度检验标准。
3.2.1 事前数据安全审查层面编码分析 开放前数据安全审查是政府数据开放全生命周期安全管理过程中的风险预防环节。开放前数据安全审查也是政府数据开放的“前置安全审查”,政府数据开放是个系统化、体系化的过程,按照数据的重要性和敏感程度分级分类进行事前安全审查十分必要,使得开放的数据不得对国家安全造成威胁[17]。通过开放前的数据安全审查程序能够有效对搜集且尚未发布的数据进行安全风险审查,将有可能出现的数据安全风险消除在萌芽状态,在源头上做好防范,从而起到“风险预防”的作用。通过文本内容编码分类,本文将政府数据开放事前安全审查分为主管部门审查、安全审查要求与安全审计三部分,具体编码内容见表1。
那一路日本兵过江后,就直奔沈家大院而来了。沈老七不得不开门把日本人迎进院里。那个挎着长刀的日本军官叽里咕噜几句后,几个日本兵就又出院门去了,一会儿后他们就牵来了几头大黄牛。那群日本兵将牛的腿脚绑在院门外的柳树上,就开始用军刀在牛屁股、牛腿上割肉,那牛就“哞哞”惨叫,血不断线地往下流。那些割下来的活牛肉放在砧板上还跳得老高,像是还有生命样的。他们把这些牛肉褪去皮毛,就在沈家大院架火烧烤。吃完了又去割。
表1是地方政府数据开放前数据安全审查内容编码,编码内容表明地方政府在数据开放全生命周期安全管理过程中开始关注具有风险预防特征的事前安全审查环节。从编码具体内容来看,地方政府目前关于事前数据安全审查的内容主要集中在主管部门审查、安全审查要求以及安全审计三方面:第一,从主管部门审查内容来看,主要强调对符合条件且即将发布的数据交由相关主管部门进行保密性与敏感性审查和备案,以从源头上保障数据的安全性。尤其是浙江、贵州、上海等省级政府明确规定了开放前的数据需要经由同级或上一级主管部门进行安全审查,通过前置安全审查环节方可对外开放。第二,从安全审查要求来看,大多数地方政府都对安全审查的要求做了明确的规定,主要包括审查形式、审查主体、审查范围、审查内容、审查责任等方面的论述。第三,从安全审计内容来看,主要强调在政府数据开放前建立安全审计制度,涉及的内容并不多,主要是福建、贵州、天津等省份明确提到了安全审计机制与制度的构建与完善。
表1 事前数据安全审查层面节点编码
总体而言,地方政府对于事前数据安全审查环节开始有所重视,但是重视程度还不够,在一定程度上掣肘了事前安全审查环节效力的发挥。主要表现有以下几点:一是在数据开放政策中提及安全审查的地方政府并不多,仅占17.6%,主要是已经专门出台数据开放法规与条例的地方政府有所提及;二是已经提及事前安全审查的地方政府在数据安全审查内容方面论述较为粗略,诸多内容往往是宏观层面的表述,多数政策对安全审查内容仅是一句话的简单阐释,对于具体审查程序、形式、范围以及内容的表述比较模糊,象征性意义大于可操作性价值;三是事前数据安全审计制度有待进一步完善,已有政策关于安全审计的内容匮乏且十分粗略,有必要构建和完善数据开放前可能出现风险点和行为的安全审计制度。
3.2.2 事中数据安全管控层面编码分析 事中数据安全风险管控是政府数据开放全生命周期安全管理过程中的风险管理环节,也是政府数据开放风险管理的核心内容。数据开放过程中可能引起的威胁和破坏国家安全、社会安全、商业机密、个人隐私等数据安全风险是政府监管数据开放的重中之重[18]。由于风险具有不确定性特征,事前数据安全审查并不能完全预料和消除数据开放过程中出现的各类风险,因为很多数据安全风险事件多发生在数据利用与互动过程之中,事前安全审查不可能解决数据开放过程中出现的各类风险,因此在数据实际开放运作过程中的各类安全风险管控举措显得尤为关键和重要。健全的事中数据安全风险管控体系能够有效和及时解决数据开放过程中面临的各类风险,从而在保证国家安全、社会安全、个人隐私的基础上推动政府数据开放有序推进。通过文本编码分类,本文将事中数据安全管控体系划分为六大机制,具体编码内容见表2。
表2 事中数据安全管控层面节点编码
表2是地方政府事中数据开放安全管控层面的内容编码,从编码内容来看,事中数据安全风险管控参考节点较多,所占比例较大,这表明强化数据开放过程中的数据安全风险管控是地方政府数据开放全生命周期安全管理政策的核心内容与重点方向。从主要内容来看,可以综合划分为风险预警控制机制、应急处置机制、风险回应机制、监督管理机制、合作共享机制以及风险评估机制六大方面。风险预警控制机制主要侧重在数据开放过程中建立数据安全风险的监测、识别与预警控制机制,提升数据开放安全风险预警研判能力,实现由传统的被动防御向主动防御转变;应急处置机制主要注重从组织机构、事件分级、应急程序、应急预案、定期应急演练等方面着手提升数据开放过程中数据安全风险事件的应急处置能力;风险回应机制强调数据开放主体针对数据开放过程中发现的各类风险点或利用主体对安全事件的报告与建议做出及时有效的回应与处置,从而消除可能影响数据开放安全秩序的各类隐患因素;管理监督机制侧重于对数据开放过程的日常性管理与监督,主要从主体权责、安全技术应用、实时监控、监督管理规范、绩效评估、平台基础设施建设、教育培训等方面保障数据开放进程安全、有序、可持续推进;合作共享机制强调政府、行业、企业、个人等多元主体构建应急联动、风险信息共享的协同共治机制,以推动数据开放风险的多元主体综合治理体系的构建;风险评估机制强调定期对数据开放平台、数据服务商开展应用安全测评与风险评估以及时发现技术漏洞并进行有效整改。
总体而言,地方政府在事中数据安全管控方面建立了较为全面的风险应对处置机制,但是也存在一些需要完善之处:一是各类风险应对机制还需进一步细化以推动在具体实践中的应用,已有政策文本对于各类风险机制建设多是简单的提及,同时还缺乏可细化的操作指引目录;二是各类机制构建的政策注意力差异较大,尤其是对多元主体合作共治数据安全风险的关注程度不够,仅浙江、江苏、陕西、广东等少数省份在政策文本中明确提及多元主体合作共治机制构建,可见需要加强多元主体合作共治数据安全风险的关注;三是缺乏对数据安全人才培育机制的关注,已有政策更多关注技术、基础设施、平台建设等内容,缺乏对数据安全人才挖掘与培育的关注。
3.2.3 事后行为处置层面编码分析 事后行为处置是政府数据开放全生命周期安全管理过程中对开放和利用主体的行为问责与处置环节,对于强化开放主体责任与利用主体义务方面具有十分重要的价值。对数据开放主体的公共部门而言,责任追究对倒逼政府部门及其工作人员履行数据开放责任有着重要作用[19]。对数据利用主体而言,责任追究能够有效地监督和惩处数据利用中的违法和违规行为,从而保证数据利用主体有效履行数据安全保护义务。通过对编码内容的归类分析,本文将政府数据开放后行为处置维度划分为记录信用档案、追究法律责任、行政处罚、行政处分、限期整顿五个方面,具体编码内容见表3。
表3 事后行为处置层面节点编码
综上而言,地方政府在事后行为处置方面初步建立起了较为全面的行为追责体系,有效推动了各主体数据安全保护责任与义务的落实。但是从编码内容来看,这一追责体系还存在一定的不足之处:一是以行政处分为主的数据开放问责机制还不健全,贵州、浙江、上海在数据开放行政问责方面走在全国前列,明确制定了数据开放行政问责规范,但是对于问责的主体、范围、程序、手段等还缺乏具体可操作化的规定。二是利用主体信用管理政策还有待进一步规范,已有政策关于数据利用主体违法行为信用管理的论述仅是简单的一笔带过,没有明确的配套性联合惩戒举措与手段,这也使得这一管理机制很难发挥实际作用。三是法律责任追究的规定也较为模糊,需要进一步明确一般法律责任与重大刑事责任追究的具体行为种类与适用条件,方能真正发挥法治保障的作用。
4 结论与建议
4.1结论综上政策文本编码内容分析表明,当前地方政府数据开放全生命周期安全管理政策体系初步形成,但是政策体系内部各维度要素受重视程度差异较大且内容还不完善,具体呈现以下几方面特征:一是事前数据安全审查环节重视程度不足。从已有政策文本分析来看,事前安全审查的政策阐释较为粗略,仅仅是有所提及,并未详细阐释,绝大多数地方政府政策文本仅用一句话的字节长度予以提及,可见地方政府对事前安全风险预防的审查环节重视不足。二是事中数据安全管控环节政策内容丰富但缺乏可操作性且注意力分配失衡。一方面,已有政策涉及安全管控内容较多,但仅是提及,可操作的指引性举措阙如;另一方面,数据安全管控内容的政策注意力分配不均,多数政策内容集中在硬件设施建设层面,对多元主体合作共治体系构建、安全人才培育方面关注度不够。三是事后行为处置环节政策内容有待进一步细化。尤其是各类行为问责与处置的主体、范围、程序、内容、手段还需进一步细化以保证行为追责政策的可操作性。
4.2建议针对地方政府数据开放全生命周期安全管理政策存在的主要问题,本文有针对性地提出以下几方面的优化与完善建议:
a.完善政府数据开放全生命周期安全管理的政策与法治保障。政府开放数据的有效实施高度依赖于政策保障[20],政府数据开放必须先行实现法治化和规范化[21]。强化地方政府数据开放全生命周期安全管理的首要任务是完善数据安全管理的政策与法治保障。一方面要完善各类数据安全管理的政策保障体系,从数据审查、数据管控以及数据追责等环节构建系统配套的政策,尤其要重点强化数据审查与数据追责环节的政策配套,真正构建全流程、无缝隙的数据安全政策保障体系。另一方面,适时推动数据安全管理政策上升为专门的法律法规,强化数据开放安全管理的法治保障。当前,除了贵州出台了《大数据安全保护条例》之外,其他省份均未出台专门的数据安全保护法规,因此有必要在完善政府数据安全管理政策体系的基础上,适时将相关完善的政策上升为专门的政府数据安全管理法,从而为数据开放全生命周期安全管理提供法律依据。
b.完善数据开放前安全审查体制机制。针对我国数据开放前安全审查体制机制不健全的现状,需要在数据开放全生命周期安全管理过程中完善数据安全审查机制。一是要建立专门的数据开放安全审查机构。当前新加坡成立公共部门数据安全审查委员会,负责评估政府机构及其供应商收集个人信息的过程以及数据安全保护措施[22]。我国数据安全管理也需要成立专门的数据安全审查队伍与机构,以强化数据安全审查的组织保障。二是要完善数据安全审查的内容与标准,提升审查环节的可操作性。一方面,需要进一步细化数据安全审查的内容,明确具体审查主体、程序、形式、范围;另一方面,需要统一数据安全审查标准,制定数据安全审查工作指南,指导工作人员有效开展安全审查事项。三是要强化事前数据安全审计,构建和完善数据开放前可能出现风险点和行为的安全审计制度,实现对敏感数据审计的监管工作,搭建起完善的数据审计安全体系。
c.平衡事中数据安全管控政策的注意力分配,注重多元主体合作共治与安全人才培育机制的构建。注意力代表着政府决策者对特定事务的关注,注意力的变化是政府决策选择变化的直接原因[23]。政府数据开放安全管控政策是地方政府数据开放重点关注的内容,需要平衡好不同层次内容的比例,尤其是要打破“重硬件建设,轻软件建设”的误区,平衡好数据安全管控中的“硬支撑”与“软支撑”政策。具体而言,既要在数据安全风险管控过程中构建多元主体协同共治的治理体系,政府纵横部门间、政府与社会主体之间、社会主体之间应该强化多元沟通、安全信息共享,构建多主体协同联动的数据安全共治体系;又要强化数据安全管理人才的培育,积极培育和引进大数据安全管理人才,推动构建高校、企业联合的安全人才培育机制,夯实大数据安全人才培养的产学研体系。
d.进一步完善和细化数据开放与利用行为追责的政策规范。建立数据开放的评估问责机制,能够客观公正地反映信息共享的效果与质量[24]。数据开放与利用的行为追责政策规范是否完善在一定程度上会影响数据开放的效果与质量,因此有必要细化和完善政府数据开放与利用行为追责的政策规范。一方面,细化开放主体的问责内容。明晰数据开放行政主体的问责范围、程序、方式、手段等内容,从而强化数据行政问责政策的可操作性;另一方面,细化利用主体行为追责的政策规范。一是要完善利用主体行为的信用管理体系,打破公共部门间的信息壁垒,协同联动多部门实施利用主体行为信用联合惩戒机制,推动实现“一处记录,处处受限”信用管理目标。二是要进一步细化利用主体法律责任追究规范,进一步细化不同类型违法违规行为的法律条款适用情形,真正发挥法律法规在约束数据利用行为方面的威慑作用。