信息生态视域下政府数据开放中的数据安全和隐私保护问题研究
2021-01-05佟林杰燕山大学文法学院京津冀协同创新发展研究中心
佟林杰,刘 博(燕山大学.文法学院,b.京津冀协同创新发展研究中心)
1 引言
随着大数据产业的崛起以及社会数据文化的蓬勃发展,数据共享和数据开放成为政府在公共服务供给过程中的必然趋势和选择。但在政府数据共享和开放的过程中,数据安全和隐私保护的短板逐步凸显,如何缓解和平息政府数据开放共享与数据安全之间的矛盾成为各国政府关注的焦点。国外学者Kshetri分析了数据在收集、存储和共享过程中出现的安全和隐私问题,指出随着数据集规模的扩大、数据多样性和复杂性的增加,安全风险也随着增加;[1]Paul等提出,政府应该采用中央集权的管理结构来保护个人隐私,并提出了7种政府监管模式;[2]Zuiderwijk等提出五项改善公共组织数据开放的新原则,关键之一是制定与隐私和敏感数据相关的指导方针;[3]Teresa Scassa等基于加拿大的政策实践,将开放数据中与个人隐私相关的 “个人信息” 分为可直接、快速地识别确切个体的信息和无法直接识别出确切的个体信息但可与其他信息相结合从而重新识别个体的信息两类;[4]Bendert Zevenbergen提出通过四步测试法来判断政府收集、使用个人信息的行政行为是否存在,强调应运用最小侵犯个人隐私的方式实现行政目标。[5]国内学者陈美从管理途径、政治途径和法律途径三方面对澳大利亚政府数据开放中的个人隐私保护进行研究;[6]刘凌等在大数据视角下提出了一种先导性的个人隐私保护框架模型,分析了数据实践过程中利益、文化规范、隐私保护工具、技术和非政府实体参与等主体的关系;[7]贾旭楠提出完善隐私保护法律体系、建立政府主导的政策协同管理体系、成立数据开放审核机构、规范数据审查流程、采取各种保护技术等策略以应对个人隐私泄漏风险;[8]迪莉娅分析了我国政府数据开放中个人数据保护存在的问题并指出了改进路径;[9]丁红发等探讨了数据生命周期各阶段的数据安全和隐私问题,并从管理与技术相结合的视角提出了相应举措。[10]
综上所述,国内外学者对政府数据开放中数据安全和个人隐私保护的研究主要集中在概念界定、性质描述、类别细化以及治理困境与对策等方面。本研究以信息生态为研究视角,对政府数据开放中的数据主体、数据客体、数据环境和相互关系进行分析,深入其中的数据安全和隐私保护问题,以期为政府数据开放过程中的数据安全和隐私保护政策的制定提供借鉴。
2 政府数据开放信息生态系统
信息生态学利用生态学的观点将人、信息与信息环境看作一个信息生态系统加以研究,试图找到维持系统平衡的条件和方法,最终实现系统的可持续发展与进化。技术是其中的一个重要因素,但核心要素是技术支持下的人的实践活动,核心价值在于促进人的信息化发展,强调信息生态的演变和进化。[11]政府信息开放的信息生态系统主要包括数据资源整合系统、数据资源循环系统和数据资源互利共生系统三个方面(见图1)。
图1 信息生态下数据资源机制
(1)数据资源整合系统。在日常工作中,政府各个机构部门及人员会产生大量涉及国计民生的重要数据,社会公众、企业和第三方团体也会创造海量的数据资源,因此,需要政府对这些数据资源进行有效整合。首先,需要政府通过数据资源整合为社会公众、企业和第三方团体提供精准的数据服务。政府部门掌握着住房、经济、教育、环境等多方面的数据,仅凭简单的筛选和搜索无法满足用户的需求。政府应制定数据处理指南,依据数据格式、质量、安全价格、复用、期限、更新频率等指标对数据进行分类分级,优化数据门户网站,为用户及时获取有效数据提供有力支持。其次,政府部门本身也是数据资源的创造者。政府各个部门设有不同分工的职位并配有相关人员,在搜集统计外部数据的同时会产生自身数据,政府在分类汇总这些数据时的依据标准、处理技术、存储方式、公开指南、数据价值等信息都需要通过数据资源整合机制将其条理化、逻辑化、公开化。如,北京市《关于全面推进政务公开工作的实施意见》、上海市《政务数据资源共享管理办法》中都有关于政府数据资源开放目录、数据资源获取标准、流程性动态清单等的规定,从而对政府数据资源进行全面系统的整合。[12]
(2)数据资源循环系统。数据资源循环包括数据的正向流动过程,即数据的创造(产生)、搜集、处理、存储、开放、获取、利用、增值和反馈。在整个数据流中,存在多个数据节点,每个节点都是必不可少的环节和接洽。从数据产生的那一刻起,用户的需求和数据流的传送会促进数据在云计算技术、大数据技术、转化升级、筛选完善等一系列操作下,在传输通道内进行对接,最终被需求方获取,发挥数据的内在价值。而后,数据流会继续促进起点数据源的数据释放,继续推动其到达数据终端,不断循环该过程。每个节点既是系统中不可或缺的部分,也是独立的内部组织,他们有各自的数据接收对象、专门的数据处理技术和特定的传输出口。每一部分随时间流逝都会扩大自己的数据资源含量,增添数据盲区,剔除过时无效数据,呈现更加科学全面的数据面貌,完成节点的信息更新。[13]这也是数据资源循环机制的体现,是整个数据流循环机制的构成部分。
(3)数据资源互利共生系统。数据资源互利共生系统是政府、公众、企业和第三方团体为了实现自身利益以及整体利益最大化而形成的运行状态。政府鼓励企业对数据进行深度分析和挖掘,从而为所从事的职业或所处的行业带来增值效益。如企业通过研究分析政府数据和自身需求创建政府数据资源App,既方便自身查询数据,也能为政府服务提供有效辅助,还可带动相关行业发展;社会公众借助政府的开放数据可提升幸福感和满足感,有利于政府权威的塑造,加强政府与公众的亲密感;政府可通过数据开放状况了解各个主体对于数据的需求倾向,充分发挥数据资源效用,在数据开放起点上把握全局和大方向,精准提供有效数据,不断完善自身的数据开放系统,平衡数据存储格局,节省数据成本,提高数据效益。[14]
3 政府数据开放中数据安全和隐私保护困境
3.1 法律政策健全下维权执行逆效率化
目前,我国政府数据开放的政策格局中并未有来自上层政府层面的统一标准和规定,大多是地方性政府的规定,如《2014年度上海市政府数据资源向社会开放工作计划》《贵州省大数据发展应用促进条例》,中央层面仅有《2006—2020年国家信息化发展战略》《中华人民共和国信息公开条例》(2007)、《政府信息公开工作要点》(2015)《国务院关于印发促进大数据发展行动纲要的通知》(2017)等规范性文件。[15]适用于数据安全和隐私保护的法律政策大多属于行政法规,立法层次较低,约束力仅限于行政部门及其下属机关。在司法过程中,虽然我国一直注重法律体系的健全和内容的细化,但是许多规范性法律具有交叉性,在执行过程中容易受到例如《中华人民共和国保密法》《中华人民共和国档案法》等其他法律的限制,且在明确性上有待加强,给个人隐私权维护和数据安全的保障带来较大困扰。此外,维权通道不健全、缺少专业的维权机构等因素也导致公民维权困难。
3.2 数字技术加持下隐私保护复杂化
强大的技术支持贯穿于数据开放生态系统中的每一个数据节点,为数据流传送保驾护航。在数据安全方面,数据开放平台存在的安全风险最大,网络钓鱼、磁盘擦拭和信息窃取程序等技术被不法人员利用从而开展间谍活动,给数据安全和个人隐私带来很大威胁。[13]Cookies数据会夹带有用户的个人信息,不法人员为了追逐商业利益会将这些信息进行不当转卖,导致用户隐私泄漏。各国的政府信息化和开放政府的建设都取得了一定成效,但是过于追求高水平和高功能、在细化技术漏洞防护上力度不够、数据脱敏的程度不一、没有统一的脱敏规范等因素会在一定程度上导致数据安全和隐私保护进程的脱节。
3.3 数据保护政策下权利维护冲突化
政府规定,在存储、传递、修改和删除个人数据时,禁止对这些数据加以滥用,除非在法律规定范围内或获得当事人同意,否则禁止对个人数据进行处理利用;而在不损害数据库功能的前提下,个人可以请求从数据库中获取本人数据,个人有权查询、更正本人的数据,有权清除有关自己的某些数据,即个人的信息自我决定权。该项政策为个人的数据安全和隐私保护提供了有效保障。但是,在具体实践中,即使是犯罪分子也有一定程度的信息自我决定权,造成了个人利益与公共利益的冲突、数据保护与政府执行的冲突。目前,隐私保护与打击犯罪之间尚未进行清晰地协调,甚至有人认为保护罪犯数据就是在帮助罪犯。[16]面对这样的现实情况,数据保护政策在积极的出发点之下,也存在潜在的风险漏洞。
3.4 审查机制构建下数据安全片面化
为了确保政府开放数据的质量,需要对开放数据进行审查。一般来看,政府应将要开放的数据投放于开放平台之上,受理隐私侵权相关的投诉,帮助公众进行隐私维护,对关乎国计民生的数据,在保密条例的规范下进行有序开放,并对这些数据的内容、种类、开放格式、更新时限等进行审查,以保障政府数据开放的安全性。然而,有些政府数据开放平台的审查程度比较浅显,尤其对于通过脱敏技术处理的数据,难以进行深度检测,从而影响了数据开放的质量和隐私安全的保护。
4 政府数据开放中数据安全和隐私保护困境成因
4.1 数据安全与隐私保护的专项法律不健全
数据开放安全与隐私保护属于公民新兴权利之一,随着权利意识的激活、法制实践的深入,这些权利已经从公共讨论空间进入到了制度构建的范畴,是法律认可的实定化权利。但是,没有足够的权利认知,责任边界模糊,定义混乱,必会带来数据安全和隐私保护的阻力。目前,政府部门缺少对数据开放知识、安全知识、隐私保护知识的学习,容易忽视安全问题和隐私保护的细小节点,缺少在数据安全与隐私保护方面的专项法律及成熟体系,虽然在数据开放的标准、政策上做了些许倡导性、方针性规定,但并未进行领域类别的详细描述。[17]公民虽认定政府对个人隐私掌控具有合法性,但关于自身隐私如何被政府收集利用的认知较为模糊,维权意识较为淡薄,对相关的隐私保护法律熟知度较低,在隐私技术的学习和使用上意识不鲜明。
4.2 数据安全和隐私保护技术有待升级
政府的数据开放平台兼具目录发布、数据汇集、便捷检索、数据下载、统计分析和互动参与等功能,因此,必须对数据进行精准分类、逻辑存储,对开放数据的格式、内容、领域、大小、时限、获取方式进行详细考量。有些政府数据开放门户网站的搜索主题类别较少,窗口衔接繁琐,数据目录、数据搜索、数据申请、开发工具、应用展示和错误反馈等页面的设计有待加强,平台的防火墙技术、数据监管技术、数据预测风险技术、数据应急技术、数据追踪与反馈技术等都需要进行详细考量。除了在开放前端做好技术准备,在开放中端也要进行监管追踪,如数据接输通道、数据接口的安全措施、数据利用的方向等。[18]在数据传送后,需要继续顺利返回数据起点进行新一轮数据循环保护,对数据的效用反馈进行全面汇总统计,并存于系统以备调查。除此之外,要对国际数据协作和数据开放投入更大的力度,以保障我国的数据安全。
4.3 保障性环境因子不健全
环境因子是政府数据开放生态系统的三大要素之一,为数据流动提供肥沃的土壤和广阔的空间,具体包含政策、制度、平台、技术、组织等内容。①政策因子。政策为数据开放提供外围框架保障,包括指导性原则、开放内容、开放流程、开放平台、开放手段等规定。政策的不明晰、边界的不确定、关于数据安全和隐私保护的专项政策的缺失、人才引进和资金注入政策的不到位等是造成数据安全和隐私保护问题的政策因素。②制度因子。制度标准在政策的指引下将规定细化,如落实主体、责任分属、数据格式、数据内容、数据存储方式、搜索指南、下载说明、开放标准等。数据安全和隐私保护的制度不健全是造成其上层架构不成熟的原因之一。③平台因子。开放平台在缺少政策指引和标准规范的条件下难以构建自身的经济基础。目前,我国政府数据开放平台普遍存在资金引入渠道单一、开发利用主体单一、数据红利波及范围狭窄、运行机制不完善等问题,给开放数据流带来了困难。④技术因子。我国政府数据开放平台普遍存在数据脱敏技术有待提升、数据流程型技术的协同能力有待加强、专项数据保护技术有待挖掘等技术问题,[19]大数据、云计算、数据通信等技术有待进一步下潜研究。⑤组织因子,具体包括数据发展综合管理办公室、数据保护专项人才、数据开发专门机构、数据开放统筹局、数据安全监督管理局等,这些组织机构一旦设置不完善则难以为数据安全和隐私保护提供依托。
4.4 数据考核及立法机制不成熟
数据开放的监管考核机制和立法机制是数据开放生态系统的辅助性因子,只有通过监管和考核,才能实时关注开放动态,剖析开放漏洞,审查开放流程,发现问题并及时改进。绩效考核能够甄别政府数据开放的效益所在,因此,政府数据开放的考核机制建设必不可少。此外,对隐私保护的专项立法应该提上议程。目前,我国缺少对法律格局的清晰划定、缺少专项法律、缺少对立法力度的足够重视、缺少对实际情况的审慎把握,因此我国在政府数据开放的顶层法律建构上亟须做出改变。
5 政府数据开放中数据安全和隐私保护的保障策略
通过对上述问题的剖析,笔者提出了以下对策(见图2),以期有效应对数据安全和隐私保护的有关问题。
5.1 加固数据安全和隐私保护的顶层架构
加快制定出台《个人隐私保护法》,建立健全政府数据开放的隐私保护政策法规体系,将公民隐私权作为一项基本的公民权利纳入法律的保护范围,对 “个人隐私” 这一核心概念作出明确界定,确立隐私保护的若干原则,建立个人隐私救济制度,明确当公民个人隐私受到侵害时的救济方式和途径。[20]多学科、多角度、多方法地促进隐私研究,建立完整的个人隐私泄露事前事中和事后应对措施框架。在组织架构上,设置政府数据开放综合管理办公室,下设数据开放专员,对政府数据开放进行统筹监管,形成政府数据开放的全国统一管理机构;设置数据安全和隐私保护委员会,处理开放过程中的数据安全和隐私保护问题;设置数据发展研究管理局,预测数据发展趋势,深度挖掘数据潜在价值,为数据红利的创设提供机构支持。
5.2 打造数据安全和隐私保护应用平台
政府数据开放平台是整个开放进程的核心,是政府与用户沟通联系的重要节点,对于平台的功能、网站门户的设计、平台的运行、平台的安全等方面都要进行考量。平台配有政府数据开放资源库,库中储藏着政府对外开放的海量数据资源,对于这些数据资源的排列和备用,平台必须慎重。在资源分类上要做到全而精,资源的格式要多元实用,要有保护屏障和保密措施,以防被他人窃取侵犯。[21]平台应设多个数据接输口,连接开放的各个具体通道,保障数据流量较大情况下不会发生拥堵。同时,平台在具备多方数据资源汇集、多方主体使用、多种数据流动的情况下,提供使用指南和开发利用模板,最大限度为用户提供便捷服务。数据门户网页应分设查找页面、浏览页面、下载页面和申请页面。①搜索页面要简洁明了,分类排列搜索主题;②浏览页面分设夜间浏览和日间浏览两种模式,可进行计时自动翻页、标注、手动跳页、浏览目录指引等操作;③下载页面提供下载路径、下载格式、下载指南等内容;④在申请页面,可提交数据利用等操作申请及有关协议的电子版。
图2 政府数据开放中数据安全和隐私保护的信息生态系统模型
5.3 挖掘数据安全和隐私保护高精技术
政府数据开放离不开强大的数据技术的支持,数据的搜集、处理、存储、利用、开发、反馈等环节都需要相应的数据技术。①数字甄别技术,将关乎国家机密和人身安全的数据挑选出来,以供审核,处理达标后再进行开放。②数据统计技术,快速对海量数据进行可视化呈现,统计出所需内容以及呈现形式等。③数据存储技术,保证数据资源库的容纳能力,使接收数据迅速而准确、存储方式安全而高效。④数据查找技术,保障查找内容为有效数据,且不会出现数据安全和隐私泄露风险。⑤数据利用技术,对数据背景、可使用的领域和可加工途径进行匹配,提高数据安全度。⑥数据脱敏技术。很多情况下需要对涉及个人隐私和国家安全的重要数据进行脱敏处理,但在脱敏过程中容易出现对数据的处理过度,导致数据变形、数据扭曲、给数据的再利用增加难度。同时,应对开放数据实施数据追踪技术,监测被下载数据被施加了何种操作、数据价值是否得到了开发等。
5.4 填充数据安全和隐私保护保障机制
(1)监管机制。从数据的收集节点开始对数据源进行监管,保障所搜集到的数据资源安全可靠。①数据处理,如是否采用合法合理的处理方式、是否按照处理标准实施行动、对数据的处理程度是否顾忌数据的安全和隐私保护等;②数据存储,如存储格式是否与开放平台相匹配、存储数据的资源空间是否与数据内容一致等;③数据利用,如不同主题数据资源的搜索点击量、下载频率倾向、二次开发方向等;④数据价值,如数据更新是否及时、无效数据是否回收、数据档案的创建和利用情况等。
(2)协同机制。协同机制是所有保障性机制的特点集合,包括政策协同、制度协同、组织协同、主客体协同、技术协同等。协同多元政策,使数据统筹性政策与数据开放规范性政策协同配合;协同价值目标,增强政府透明度和公共服务能力,提高公民参与社会治理的积极性;协同多元主体,通过社区答题竞赛、众包等方式协同作为数据的提供者的政府决策部门、行政部门与作为数据开发者和利用者的企业、组织和用户;协同多元客体,社会组织、企业和个人对政府开放的数据进行再次开发,创造更大的数据价值,为政府数据循环机制增加动力;协同多维技术,形成从采集、处理、存储、可视化到反馈的统一连贯技术体系。
(3)人才资金补充机制。政府数据开放生态协同离不开人才和资金的支持,人才的培养、开发和利用对于政府数据开放生态系统来说是主干性的环节。首先,完善人才引入机制,为政府数据开放吸纳高水平专业性人才,如通过开设数据安全与隐私保护专业、举办大型竞赛等途径培养后续人才给养队伍。其次,制定专门人才培养方案,采用 “旋转门” 制度促进人才流动和能力提升。最后,对人才进行绩效考核,以此来对政府数据开放的成效进行考核。而在资金机制上,应逐渐展开与其他主体的合作,通过数据项目开发、数据项目竞标、数据资源再生利用等方式为政府数据资源提供强大资金支持。