公共数据开放视域下的个人信息保护风险及其治理逻辑
2022-06-18嘎拉森徐拥军
嘎拉森 徐拥军
摘 要:在公共数据开放过程中做好个人信息保护是推动数字经济发展的首要任务和重要保障。由于法规制度设计、管理体制机制、技术应用等方面的不足,当前公共数据开放在收集、存储、开放、运营阶段存在个人信息的过度收集、泄漏、滥用、产权分配争议等诸多风险,需要以治理思维为指导,从善治、法治、共治、智治、分治等维度予以防范应对。
关键词:公共数据开放;个人信息保护;数据安全
中图分类号:D922.16 文献标识码:A DOI:10.11968/tsyqb.1003-6938.2022088
The Risk and Governance Logic of Personal Information Protection in the View of Public Data Open
Abstract In the process of public data opening, personal information protection is the primary task and important guarantee to promote the development of digital economy. Due to the deficiencies in the design of laws and regulations, management system and mechanism, technology application and other aspects, the current public data opening has many risks in the collection, storage, opening and operation stages, such as excessive collection, leakage, abuse of personal information, disputes over property rights distribution, etc. It is necessary to take governance thinking as the guidance to prevent and respond from the dimensions of good governance, rule of law, common governance, separate governance and intelligent governance.
Key words public data open; personal information protection; data security
黨的十八届五中全会首次提出“国家大数据战略”,数字资源的开放共享已成为促进数字经济发展、释放数据红利的基础工作。公共数据是由行政机关与法律法规授权组织在依法履行职责与提供公共服务过程中,收集、产生、处理的涉及公共利益的各类数据[1]。其内容之丰富,覆盖国民经济和社会发展的方方面面;体量之庞大,占据我国整个数据规模的70%-80%[2];价值之巨大,既能通过直接服务于数字经济、数字政府建设创造不可估量的经济社会价值,又能间接带动企业数据、社会数据、个人数据等其他数据要素的开放利用,是各类数据资源中最为重要的组成部分。
但也正是因为来源主体权威、内容覆盖全面,公共数据在具有高价值、高质量、高密度的同时也具有极高的敏感性和隐私性,尤其是其中包含大量涉及公民身份信息或隐私问题的个人信息。公共数据的不当开放与利用极易造成数据滥用、隐私泄露等问题,从而威胁公共与公民安全,成为学界与业界共同关注的议题。尤其是在《中华人民共和国个人信息保护法》(以下简称《个人信息保护法》)于2021年1月1日正式实施后,当前公共数据开放政策对于数据法律的协调衔接情况尚不明确,各项业务环节中个人信息保护的风险点亟待梳理。现有研究多集中在宏观视角对公共数据开放的相关问题进行综合研究[3-5],鲜少有聚焦到个人信息保护领域的针对性探讨。少数微观层面的研究成果仅停留在法律等某一具体视角[6-8],并未从公共数据开放中个人信息保护的整体视角展开全面研究。公共数据开放和个人信息保护作为实践性较强的领域,涉及的影响要素复杂,相关研究均需要进一步结合业务工作实际,做更具针对性、操作性的研究。为此,本文以数据流转的环节为切入点,识别分析公共数据开放中个人信息保护的关键风险点,借鉴治理理论内核讨论应对策略,以期为相关实践工作提供方向性指引。
1 公共数据开放中个人信息保护的风险
公共数据开放并不等同于简单的信息公开、数据公布,而是一项以数据融合为动力、数据价值发挥为目标,包含多方主体互动性参与的系统工程。这项工程依靠数据的流转逐步释放数据价值,主要包括:数据收集阶段的价值汇集,数据存储阶段的价值沉淀,数据开放阶段的价值激活,以及数据运营阶段的价值变现。由于不同阶段数据的流转方式存在差异,因此所涉及的主要个人信息风险暴露面也有所不同。
1.1 数据收集阶段:规则不明导致个人信息过度采集
公共数据收集是指公共部门依据履职需要记录、采集相关数据的过程,在这一阶段数据由零散分布向统一共享转变,由孤立分散向融合互联转变。这些“一次数据”不仅是推进业务流程的必要基础,也是支撑后续数据分析与开发利用的重要支撑,对于数据的准确性、实效性、完整性要求较高。但也正因如此,部分公共部门出于精细化治理、精准化服务等目的,在数据采集过程中违背最小必要原则,导致个人信息面临被过度采集的安全风险,进而增加了数据泄漏、数据滥用等数据安全事件的发生概率。以政府信息公开工作为例,依据《中华人民共和国政府信息公开条例》第二十九条之规定,政府信息公开申请应当包括“申请人的姓名或者名称、身份证明、联系方式”。但根据笔者对31个省(自治区、直辖市)政府信息公开制度调研,除上述规定采集的个人信息外,有27个省(自治区、直辖市)政府部门要求申请人在以公民身份申请过程中提供工作单位、证件照片、职业、地址等个人信息,即存在个人信息过度收集之嫌。
此外,各公共部门暂未向社会公布其行政执法等过程中数据采集的范围、目的、方式、格式等信息,国家层面也暂无规范公共部门信息收集的机制,导致公民在提供个人信息时无法作出判断与参考,甚至多数是在不知情的情形下被过度采集个人信息。如《贵州省政府数据共享开放条例》第二十一条规定“涉及国家秘密、商业秘密、个人隐私,或者法律、法规规定不得开放的政府数据属于不予开放类”[9],但并未对“个人隐私”的内涵、范围以及涉及的公共数据类型进行具体说明。这一方面为相关工作开展造成了操作层面的不便,另一方面会导致不同地区、不同部门在数据采集、开放标准划定上的不统一。
在大数据时代,数据的传输与接入服务呈现低成本、高效能等特征,数据在被采集后会被动参与到后续业务环节中,伴随着泄漏、篡改、滥用等安全风险,因此个人信息收集的事前许可与源头控制就显得尤为必要。
1.2 数据存储阶段:内外部风险导致的个人信息泄漏
公共数据存储是指将非动态公共数据以数字格式进行物理存储的方式,是后续数据开放与利用的重要基础。目前我国各地公共数据主要依托政务云平台通过分布或集中形式存储于数源部门或地区政务大数据中心,存储介质包括云磁盘、高效磁盘、对象存储等。如浙江省公共数据采取云存储方式集中存储于政务“一朵云”上[10]。虽然该阶段公共数据的价值尚未发挥,但数据本身并非处于静态存储模式,会涉及到海量的复杂查询和调用存取操作,由于系统内部的脆弱性和外部的威胁性,个人信息的泄漏风险突出。
(1)从内部风险来看。首先,由于信息技术固有的两面性,公共数据存储系统在不断提升安全防护能力的同时,风险系数也会随之升高。根據国家信息安全漏洞共享平台(CNVD)的统计,仅2021年上半年,其处置的网络安全漏洞事件中就有1.8万起涉及政府部门、重要信息系统[11]。其中,山东省2月单月的政府网站及重要信息系统网络安全问题事件均源于漏洞隐患,仅某一机动车驾驶培训监管服务平台存在的个人信息泄漏数量就高达270523条[12];其次,根据国家网信办云计算服务安全评估,部分云平台存在安全产品授权过期、特征库陈旧、防火墙规则过宽或过期等问题[13],导致云平台在数据安全防护方面隐患重重;最后,公共数据存储系统在功能设计方面也难以完全平衡数据防护与数据开放之间的矛盾。以存储数据的查询调用为例,目前多地公共数据开放平台的数据调用主要使用的是API (Application Programming Interface,应用程序编程接口) 技术。该技术在提升数据共享便利性的同时,增加了数据隐私与安全的风险,窃取者可通过数据滥刷、越权访问等方式进行批量窃取甚至篡改。如部分网络攻击者会针对政务系统注册环节中的API实现逻辑问题,通过手机号码等特定信息套取相应注册者更多个人信息。随着公共数据的存储越来越趋于集中,跨机构、跨业务、跨地区的存取使得API所包含的数据和逻辑更加复杂,尤其是公共数据开放必须面对公网环境,个人信息保护面临较高泄漏风险。此外,区块链技术在公共数据开放领域也已有较多探索性应用,广西在政务数据共享开放过程中依托区块链技术保障用户隐私,通过以公私密钥的形式来验证和确认数据利用者数字身份信息[14],并将数据管理行为全程留痕。但根据GitHub的统计,约150MB的信息经加密后最高可达到50GB,而现有数据交易平台单次上传数据一般不超过10MB[15]。截至2021年底,我国已有193个省份和城市的地方政府上线了数据开放平台,以北京市为例,其公共数据开放平台北京市政务数据资源网当前数据量为59.86 亿条[16],对算力和传输能力提出了极高的要求。因此该项技术短期内难以大规模运用到数据存储与处理业务中。
(2)从外部威胁来看。随着网络环境越来越复杂,尤其是国家间战略博弈的网络化,针对政务系统等高价值、高敏感数据及其基础设施的网络攻击行为呈现出频繁化、专业化、高危化、扩散化的趋势,公共数据、政务资源等云平台在资源高度集中、价值高度集成的运行环境下更易成为黑客的攻击目标,外部数据安全威胁持续升级。据统计,2020年政务外网主动监测发现网络攻击行为2.5亿次[17]。而且,由于数据可追溯性差、加密技术不完善,数据存储中个人信息保护风险骤增。2022年1月至10月,全球重大数据泄露事件中逾60.2%导致个人信息泄露,其中62.4%是由外部威胁导致[18]。个人信息的泄漏引发针对个人的恶意骚扰、名誉损害、诈骗勒索等行为,严重侵犯公民隐私,甚至会造成对当事人的精神伤害、经济损失等不良后果。加之数据不同于其他实物性资产,具有可复制性、易迁移性和非排他性,使得数据一旦泄漏,将导致数据所有者对其全面失去控制和监管,对社会秩序、政治稳定、国家安全产生负面影响。
1.3 数据开放阶段:智能化处理导致的个人信息滥用
公共数据开放主要是依托开放平台向公共管理和服务机构提供数据开放服务。各地政府的数据开放平台主要是通过数据集和数据接口方式向社会开放公共数据,部分地区还提供移动应用、小程序、数据分析报告等创新开放模式[19]。根据各地规定,对于涉及个人隐私或公开后可能造成个人权益侵害的公共数据,一般列入不予公开类别,但不包括匿名化处理的信息。虽然开放数据中已将涉及个人信息内容进行剔除或脱敏处理,但脱敏数据的有效性与实用性矛盾又将导致数据再识别风险与自动化决策引起的数据所有者客体化危机。目前该项技术已广泛应用到公共数据开放工作中。但无论从有效性还是实用性来看,该项技术在个人信息保护方面尚存在一定技术漏洞。
(1)从脱敏数据的有效性来看。一方面脱敏数据固然已被降低甚至消除所含信息的敏感性,可以相对安全地在数据计算、内容挖掘、关联性分析等场景中应用。但为保障分析结果的可应用性、高适配性,脱敏数据还需要在统计意义上保留一定的原始数据特征,这也使得数据脱敏技术本身存在一定的剩余风险。如性别、年龄、消费能力等具有明显区分度的数据类别,其特征将对数据分析结果产生较大影响,在脱敏过程中可能通过数据模糊、替代等其他方式予以处理,无形中提高了数据再识别的风险性;另一方面,公共数据开放数据体量巨大、主题丰富,在流转过程中存在数据交叉验证后重新识别的风险。
(2)从脱敏数据的实用性来看。脱敏数据的利用价值不再单纯来源于其原始收集目的,而更多源于对其二次的挖掘利用。面对海量数据,自动决策算法成为首选数据处理工具。人们通过算法评估数据,分配优先性以寻求思维经济[20]。而且根据《个人信息保护法》规定,匿名信息不再属于个人信息范畴,这也为相关技术赋能活动提供了便利性。但由于自动决策算法的局限性,其结果关注数据的相关性而非因果性,这种将“次个人信息”纳入算法客体的行為,将导致绝对工具理性,造成原有秩序价值的偏移乃至异化[21],削弱了人的主体性,会间接对个人权益造成伤害。
1.4 数据运营阶段:数据衍生化导致的权属分配争议
各地政府在数据开放的基础上通过特许开发、授权应用等方式,鼓励和引入社会力量对公共数据进行增值性开发利用。如成都市通过构建可信应用云,实现了“不拿数据拿结果,不汇聚数据但汇聚价值”的运营目标,完成了数据开放向价值共创的升级[22]。但随着数据运营产生社会效益乃至经济收益,涉及个人信息的数据源所有权、使用权、求偿权不清,将导致政府、个人、企业等不同主体的权属分配争议,造成法律风险,阻碍公共数据运营。
目前我国法律法规尚未对数据的权属问题进行明确规定,默认公共数据为国家所有的公共资源。公共数据的独特性也使得既有法律难以对其进行规制。首先从其界定来看,根据数据形成的主体和来源不同,一般可将数据分为个人数据、商业数据和公共数据。但由于数据内容存在交叉,因此政府数据和商业数据中涉及个人信息的数据,也属于个人数据,因而包含自然人的隐私权、姓名权、肖像权等人格权内容;其次从其属性来看,一方面数据不同于传统要素,具有可复制、可衍生、可复用的特性,在占有上不具有排他性,同一数据一般承载着多方主体的数据权利,无法将所有权绝对化。另一方面数据也不同于知识产权,其记录性不符合知识产权的独创性要件。因此在法理层面数据权属问题难以界定,进而数据要素的权益保障制度制定也相对滞后。个人作为数据被采集者的权益不明,涉及个人信息的数据使用目的、流转去向无从查证,数据运营过程中产生的个人信息安全问题也难以维权;最后,虽然部分地区公共数据管理相关规定中涉及了数据销毁的内容,但在实际操作过程中却普遍缺少数据销毁环节。作为数据流转的最后一个环节,数据销毁尤为重要,如果无法对数据及时进行到期鉴定与完全销毁,便将导致个人信息等敏感数据的超期保存,进而侵害其信息权益,同时再次增加数据泄漏等安全风险的发生概率。
值得注意的是,上述公共数据开放各业务环节所涉及的个人信息保护风险虽侧重各异,但并不是孤立静止地存在于对应阶段的,由于存在业务的接续性和信息的复用性,各风险点存在相互交叠的潜在可能。同时某阶段出现风险后,如不及时防范化解,风险在下沉、累积过程中会形成复杂多样的风险链,对公民个人信息保护造成更大威胁。
2 公共数据开放中个人信息保护风险的治理逻辑
公共数据开放中个人信息保护方面存在的潜在风险,反映出的不仅是各业务环节的具体不足,实则更多的是法规体系、管理机制、技术研究等方面的缺位与滞后。因此,对于公共数据开放中个人信息保护风险的防范不能仅停留在理论层面的分析论证和实践层面的被动完善,要以治理性思维为指导,从善治、法治、共治、分治、智治[23]等维度统筹推进,全方位筑牢数字经济时代的个人信息安全防线。其中,善治是价值目标,通过以人民为中心的价值引导,以目的牵引的形式渗透于其他防范措施之中。
2.1 完善法治体系,推进法规制度体系建设
通过前文对公共数据开放中个人信息保护的风险梳理,一定程度上反映出了该领域制度体系建设的薄弱与缺位问题。健全公共数据开放中个人信息保护的法规制度体系,不仅是进一步规范和促进公共数据开放、利用和安全管理的现实需要,也是个人信息保护法规制度体系建设的重要组成部分。
从公共数据开放领域的个人信息保护制度体系建设成效来看。国家层面在《促进大数据发展行动纲要》《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》《国民经济和社会发展第十四个五年规划和2035年远景目标纲要》等重要政策文件中,均对各领域公共数据的安全有序开放工作进行了专门部署,并以不同方式强调了个人信息保护和数据安全的重要性。但目前尚未出台专门针对公共数据开放中个人信息保护问题的法规政策文件。地方政府作为公共数据开放的实际落实部门,在制度供给上有着相对更为丰富的探索性成果。截止2023年1月,北京、上海、贵州等26个省(自治区、直辖市)已经出台了专门针对公共数据、政务数据的管理办法,其中上海、浙江、山东等9个省(自治区、直辖市)制定了公共数据开放管理办法,另有四川、山东、深圳、武汉等地出台了有关公共数据开放技术规范、标识编码规范等地方标准。初步构建起了地区适用的公共数据开放政策体系框架。但是,根据笔者对上述法规政策文本的分析,地方性法规政策中对于个人信息的保护,散见于管理原则、保障措施等部分,且多为原则性规定,缺乏可供操作的具体条款。如《贵州省政府数据共享开放条例》第二十一条规定“涉及国家秘密、商业秘密、个人隐私,或者法律、法规规定不得开放的政府数据属于不予开放类”[9],未对“个人隐私”的内涵、范围以及涉及的公共数据类型进行具体说明。
在个人信息保护制度体系构建方面,自党的十八大以来,党和国家对个人信息保护的法规政策支持力度不断加大。在顶层设计上,《中华人民共和国民法典》的专章规定和我国首部个人信息保护专门性法律《个人信息保护法》的颁布,填补了此前的立法空缺。在实践规划上,党的二十大报告中更是将“加强个人信息保护”列入“推进国家安全体系和能力现代化,坚决维护国家安全和社会稳定”的战略部署,进一步筑牢了数字社会中公民信息权益的制度保障,也充分体现了党和国家以人民为中心的发展思想。但上述制度文件作为综合性的法规、政策,难以就公共数据开放这一具体方面进行过多法律规制或提出具体任务要求。因此亟待在后续的政策制定和实施过程中结合具体应用场景、现实问题逐步完善。
综上,目前我国在公共数据开放中个人信息保护的制度体系建设方面存在体系性不足、指导性不强、关联性不够、解释力不足等问题,公共数据开放中个人信息保护的法治体系建设的重点应放在完善制度规范上。
(1)从宏观角度出台国家层面的公共数据开放中个人信息保护办法。在国家层面统一公共数据开放中个人信息保护的基本原则和重点要求,明确个人信息的概念、范围、类别、属性、保护方法等。地方再据此因地制宜地开发更具操作性的配套制度。打破公共数据开放中个人信息保护因分级分类规则不一致、保护模式不统一的藩篱,在保护个人信息的同时进一步促进数据价值发挥。
(2)从微观角度分应用场景制定更具针对性的法规制度。进一步规范不同领域公共数据开放中个人信息保护的主体责任和程序规范,形成以公共数据开放中个人信息保护办法为基础的公共数据安全法规制度体系。考虑到不同领域、不同行业对于个人信息的收集需求、处理方式等存在显著差异,难以通过一部专门法规实现完全涵盖,因此需在综合立法制规基础上,进一步完善法规制度体系框架,尤其是要将医疗健康、金融储蓄、电子商务等涉及敏感个人信息的领域纳入其中,并协调法规制度间关系。如美国在颁布《开放政府数据法案》等法律法规的同时,不仅专门出台针对数据开放的《隐私保护指令》,还就健康、教育、通信等专门领域制定了个人信息保护法律[24],实现了数据开放过程中个人信息保护从宏观层面到微观层面,从政府部门到行业领域的全方位、多层次保护。
2.2 构建共治格局,增强数据控制力与监管力
公共数据开放中的个人信息保护是涉及公共部门、市场主体、公民个人等多主体的复杂治理议题,需要通过优化治理主体结构、持续完善多方参与的治理模式,构建全域性公共数据安全治理体系,形成协同做好防范化解包括个人信息安全在内风险的工作合力。
目前在公共数据开放过程中,公共部门和市场主体作为数据的供求方参与度较高,规范性较好。但个人作为公共数据的实际参与建设者和间接利用影响者,却未能充分地参与到公共数据开放工作尤其是个人信息保护之中,亟待进一步拓宽公民参与公共数据安全治理的路徑,提高其对个人信息的控制能力。根据笔者对现有的19个省(自治区、直辖市)公共数据开放平台调研,所有平台均未面向自然人提供涉及本人个人信息的查询功能,仅有上海、重庆、四川、山东、贵州5个省市提供了针对平台开放数据侵犯个人隐私等合法权益的申诉机制。
此外,由于公共数据开放中个人信息保护的业务复杂性和信息技术的持续对抗性,安全监管的独立性和必要性就显得尤为突出。各地在公共数据开放的相关管理办法中均明确了公共数据开放主体安全监管的权责和可采取措施。如《浙江省公共数据开放与安全管理暂行办法》明确,公共数据利用主体存在“出于获取国家秘密、商业秘密或者个人隐私目的,挖掘公共数据”的情形时,公共数据开放主体可提出整改意见并暂时或终止其公共数据开放服务[25]。但公共数据开放作为一项面向社会的公共服务,其监管责任不仅局限于公共数据开放主体与监管对象,而是需要将网信、公安、保密等相关主管部门也纳入其中,建立公共数据开放的合作监管机制。但目前各地暂未明确各部门安全监管的责任分工和管理机制,因此造成了一定的监管真空地带和潜在安全风险。为此,要从以下两方面予以加强治理。
(1)加强个人对数据的控制。一方面要合理建立公民对公共数据开放中个人信息的知情同意机制。公共部门应当将除“履行法定职责或者法定义务所必需”外的个人信息处理活动进行区分管理,并在充分的价值考量基础上,对部分涉及敏感个人信息的公共数据开放活动寻求个人的知情同意,对个人信息受保护的民事权益作出正当与合理的保护与限制[26];另一方面要适当赋予公民对公共数据开放中个人信息的控制管理权限。公共部门应在重视向社会开放数据的同时,关注公民对个人信息的积极管理与控制权限问题,加强数字人权,创新基于个人的数据服务。如美国奥巴马政府于2010年发起的MyData运动,就是在开放数据中个人可以确认分散在各政府部门和商业机构的相关信息,并通过向企业提供自己的信息来获得商品或服务推荐,在数字经济时代分享源于自身的数字红利[27]。
(2)加强有关部门对数据的监管。一是要加快明确各监管部门的责任分工。应当在明确网信部门统一监管的前提下,加快明确其他监管机构的职责及分工,尤其是不同领域公共数据的行业监管职责,通过整合监管力量,统一监管标准,避免多头监管、监管漏洞等问题,确保公共数据开放中个人信息监管有效;二是要借助信息技术构建全生命周期监管机制,提高公共数据中个人信息安全治理的科学化、专业化、智能化、精细化水平。在全面梳理监管公共数据流转的安全指标和阈值,明确相对应个人信息风险事件的处置规范基础上,扎实推进建立审查备案、预警监测、应急保障的动态监管体系。在此基础上根据应用场景构建支持事件研判、态势分析、辅助决策的智慧监管模块,提高事前预防、事中监管和事后处置能力。
2.3 加强分治水平,覆盖全流程实施精准治理
分治即根据治理对象的特点实施精准、分类治理。公共数据开放涉及的业务环节多,不同环节的个人信息保护关键风险点不同。为此,需根据对象差异,构建公共数据中个人信息保护的精准化安全治理体系。
目前各地公共数据开放实践中的安全保障措施,主要包括事前评估与事后复核,主要涉及到数据存储和数据开放阶段,暂未将前期公共数据采集过程的规范管理、数据开放之后的实时监管、数据利用结束后的到期销毁等问题纳入其中。以贵州省为例,根据《贵州省政府数据共享开放条例》,相关部门在公共数据开放前,应当对拟开放的敏感数据实施脱敏处理,并对数据申请使用方开展安全审查;事后则主要通过对公共数据开放平台的定期安全检测评估和对数据利用成果的安全审查两项措施确保公共数据开放过程中包括个人信息在内的安全管理[9]。其安全管理措施未能实现对公共数据开放的全流程覆盖,存在个人信息保护的薄弱环节与风险隐患。
(1)完善安全管理措施,加强公共数据开放业务流程的生命周期闭环化管理。此处可借鉴档案工作中的价值鉴定、保管期限设置与到期销毁等做法与经验。对公共数据实施“档案化”管理。首先,要建立一套科学完整的公共数据中所涉及个人信息的分级分类标准;其次,以此为基准建立数据鉴定方案,对公共数据中是否涉及个人信息、应采取的对应安全管理等级进行鉴定与标注;最后,综合安全管理要求与开放利用需求为公共数据设立合理的保管期限,到期后严格落实安全销毁措施。全面加强公共数据开放的业务流程闭环管理与安全治理能力。
(2)提升安全管理能力,实施公共数据开放中个人信息保护的精准化防范。针对公共数据开放中不同阶段的风险,按照“事前防范,事中控制,事后管理”的原则,分别采取相应的对策。在数据收集阶段,针对主要存在的个人信息过度收集风险,可在遵循最小必要原则基础上建立公民个人信息采集的清单化管理与透明化机制,实现个人信息的“照清单采集、依清单记录”;在数据存储阶段,针对个人信息泄露風险,以《中华人民共和国网络安全法》《中华人民共和国数据安全法》等为依据,做好系统等级保护定级备案、测评整改,从物理、网络、主机、应用、数据等层面全方位梳理系统薄弱环节和安全隐患,实现对个人信息保护的“堵漏、补短、规范”;在数据开放阶段,针对个人信息滥用问题,可建立内外部监督反馈机制,加强相关部门对数据提供方监督管理的同时,面向社会畅通个人信息保护权益维护渠道,杜绝个人信息滥用乱象;在数据运营阶段,针对产权分配争议问题,培育数据要素市场加强数据要素供给激励的同时,重视个人权益维护,探索由受托者代表个人利益,监督市场主体对个人信息数据进行采集、加工、使用的机制[28];在数据销毁阶段,确保数据的到期及时销毁并做好数据恢复等效果验证。但需要注意的是,公共数据开放中的个人信息保护是一项系统性工作,在加强单点防护的同时要注意安全防护的综合治理,避免出现风险防范的真空地带。
2.4 提升智治能力,加强技术创新研究与应用
公共数据开放中的个人信息保护涉及技术领域广泛、问题复杂,既要兼顾数据开放度与安全性,又要考虑数据真实性与匿名性,这也是导致部分地区或单位对于部分敏感程度高、处理难度大的公共数据不敢开放、不愿开放的重要原因。因此,需要在坚持技术向善的基础上持续做好公共数据开放中涉及个人信息保护的技术创新研究与融合应用,形成开放包容的数据安全技术体系,支撑更加灵活的个人信息安全保护模式,从而降低公共数据开放的内部技术性风险,提高抵御外部系统攻击的能力,确保公共数据在安全开放的基础上实现最大化利用。
针对公共数据的收集、存储、开放与运营等不同阶段存在的个人信息保护风险,主要涉及到以基于云计算的数据存储技术、以接口调用为主的信息共享技术、数据匿名化处理技术以及数据挖掘与自动化决策技术。
随着云原生技术的成熟,云原生安全已成为云计算安全体系优化升级的重要发展方向。公共数据开放主管部门应以纵深防御体系为架构,实现安全技术与云的紧密结合,构建全链路、动态精准的安全防护体系。相比于具有显著局限性的API数据接口调用技术和数据匿名化处理技术,以联邦学习(Federated Learning)为主的隐私计算技术以“数据可用不可见”的特性,有效平衡了公共数据在开放共享和个人信息安全保护之间的价值冲突。《“十四五”推进国家政务信息化规划》《全国一体化大数据中心协同创新体系算力枢纽实施方案》等国家层面的政策规划,也鼓励将隐私计算技术与数据流通相结合。此外,可结合区块链、安全传输等信息技术建立隐私计算平台,融合多个功能,形成工具化、整体性的个人信息安全能力[29]。面对数据挖掘与自动化决策导致“算法权力”扩张和个人信息滥用,公共数据利用方应确保技术的可解释性、可验证性和可理解性,并对依据自动化决策所做出的差别性选择进行记录保存与算法解释,确保个人信息的安全利用与决策的公平公正。
3 结语
数字经济时代,个人信息保护不应当成为公共数据开放的阻碍,而是要在不断提高数据安全治理水平与能力的过程中,达致个人信息安全可控、市场数据运营有序的利益平衡状态,实现公共数据资源共享再利用的可持续循环。这项工作没有完成时、只有进行时,需要不断通过数据安全治理水平的提升进行完善。在此过程中要始终坚持和贯彻以人民为中心的价值追求,牢牢把握保护人民群众信息权益的工作定位,在推进数字经济繁荣与发展的同时筑牢个人信息保护的安全底线。
参考文献:
[1] 郑春燕,唐俊麒.论公共数据的规范含义[J].法治研究,2021(6):67-79.
[2] 钱童心.数据交易下一程:交易商要多起来,数据要跑起来[N].第一财经日报,2022-03-08(A9).
[3] 胡小明.从政府信息公开到政府数据开放[J].电子政务,2015(1):67-72.
[4] 吴亚光.政府数据开放中个人隐私信息的公开界限[J].图书馆学研究,2020(22):45-52.
[5] 孙丽岩.政府数据开放范围裁量权的法律控制[J].法学家,2022(5):44-57,192.
[6] 闫倩,马海群.我国开放数据政策与数据安全政策的协同探究[J].图书馆理论与实践,2018(5):1-6.
[7] 宋烁.论政府数据开放中个人信息保护的制度构建[J].行政法学研究,2021(6):78-89.
[8] 商希雪,韩海庭.政府数据开放中个人信息保护路径研究[J].电子政务,2021(6):113-124.
[9] 贵州省人民代表大会常务委员会.贵州省政府数据共享开放条例[EB/OL].[2022-12-08].https://flk.npc.gov.cn/detail2.html?ZmY4MDgwODE3N2U3NWY4ODAxNzg0MmQ5ZjA1MzVhZDc.
[10] 许峰.地方政府数字化转型机理阐释——基于政务改革“浙江经验”的分析[J].电子政务,2020(10):2-19.
[11] 国家计算机网络应总技术处理协调中心.2021年上半年我国互联网网络安全监测数据分析报告[R/OL].[2022-11-23].https://www.cert.org.cn/publish/main/upload/File/first-half%20%20year%20cyberseurity%20report%202021.pdf.
[12] 山东省通信管理局.山东省互联网网络安全月度通报(2021年2月)[EB/OL].[2022-11-10].https://sdca.miit.gov.cn/zwgk/wlaq/art/2021/art_92b1cec1c8dc4e4eac5bba096c6761ab.html.
[13] 胡华明.夯实政务云安全基础,保障政务系统安全[EB/OL].[2022-11-15].http://www.cac.gov.cn/2022-07/23/c_1660196909987785.htm.
[14] 广西壮族自治区信息中心.区块链助力破解政务数据共享开放难题[EB/OL].[2022-11-15].http://gxxxzx.gxzf.gov.cn/jczxfw/dsjfzyj/t11072134.shtml.
[15] 王京生.以数据要素市场为引领建设高质量的全国统一大市场[J].中国行政管理,2022(9):6-9.
[16] 北京市大数据中心.2021年度北京市公共数据开放白皮书[R/OL].[2022-11-22].https://data.beijing.gov.cn/ndbps/index.htm.
[17] 广西壮族自治区人民政府.广西电子政务云网安全防护体系助力数字政府保障网络安全[EB/OL].[2022-11-25].http://www.gxzf.gov.cn/zt/jd/szgxjszl/zxdt_27980/t8001907.shtml.
[18] 2022中国政企机构数据安全风险分析报告[EB/OL].[2022-11-20].https://www.djyanbao.com/report/detail?id=3368401&from=search_list.
[19] 复旦大学数字与移动治理实验室.中国地方政府数据开放报告(2020下半年)[R/OL].[2022-11-23].http://ifopendata.fudan.edu.cn/static/report/中国地方政府数据开放报告(2020下半年).pdf.
[20] 张文显.构建智能社会的法律秩序[J].东方法学,2020(5):4-19.
[21] 林洹民.自动决策算法的风险识别与区分规制[J].比较法研究,2022(2):188-200.
[22] 李芃达.隐私保护计算让数据资产增值[N].经济日报,2021-09-07(6).
[23] 嘎拉森,徐拥军.档案治理体系的构成要素与实现路径[J].档案学通讯,2022(6):61-69.
[24] 王伟玲.政府数据授权运营:实践动态、价值网络与推进路径[J].电子政务,2022(10):20-32.
[25] 浙江省人民政府.浙江省公共数据开放与安全管理暂行办法[EB/OL].[2022-10-13].https://www.zj.gov.cn/art/2021/12/21/art_1229604638_2382460.html.
[26] 程啸.论我国民法典中的个人信息合理使用制度[J].中外法学,2020,32(4):1001-1017.
[27] 武锋.加快大数据发展是大势所趋[J].全球化,2016(4):91-102,133.
[28] 中华人民共和国国家互联网信息办公室.中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见[EB/OL].[2022-12-08].http://www.cac.gov.cn/2022-12/20/c_1673174220234029.htm.
[29] 载郑磊,刘新萍,张忻璐,等.公共数据开放蓝皮书:中国公共数据开放发展报告(2022)[M].北京:社会科学文献出版社,2022:293.
作者简介:嘎拉森(1996-),女,中国人民大学信息资源管理学院博士研究生,研究方向:档案学基础理论、信息政策与法规;徐拥军(1975-),男,中國人民大学信息资源管理学院、档案事业发展研究中心教授,博士生导师,研究方向:档案学基础理论、企业档案管理、文献遗产保护。