档案数据开放中的个人隐私保护困境及完善路径
2023-05-21欧阳爱辉陈玉凤
文·欧阳爱辉 陈玉凤
一、引言
档案数据开放是“档案机构将收集保存的所有原始数据向公众开放”[1]。2016年国家档案局发布的《全国档案事业发展“十三五”规划纲要》中就提到了“要制定档案数据开放计划,落实数据开放与维护的责任”[2]。2021年出台的《“十四五”全国档案事业发展规划》进一步提出,要“推动档案全面纳入国家大数据战略……稳步推进开放档案全文在线查阅”[3]。可见,档案数据开放共享将成为当前时代的必然趋势,但各类现代数智技术的应用,也使得个人信息数据泄露的概率大幅度提升,个人隐私受到无限的透视和隐性控制。故而,探讨如何在保护个人隐私的前提下充分实现档案数据开放获取的社会价值,创造经济效益,以促进档案馆开放数据运动的发展,无疑是当前我国档案机构亟需解决的问题。
二、当前档案数据开放中个人隐私保护的主要困境
(一)个人隐私保护范围界定难
由于公私数据模糊混杂、数据容易被重新识别、涉及特殊群体等原因,档案数据开放中个人隐私保护范围的界定存在较大困难。首先,从数据保存方式的角度分析,隐私数据与公共数据大多混杂储存在计算机云端中,因而在如此庞大的数据集群中筛选出属于个人隐私保护的数据极其困难;其次,从数据识别过程出发,档案数据开放中与个人隐私相关的数据分为两类:一是可直接和快速地识别确切个体的信息,这一类信息往往被档案部门采取不开放的保守方式进行保护;二是无法直接识别出确切的个体信息但可与其他信息相结合从而重新识别个体的信息。个人隐私保护范围界定的复杂之处就在于即使最初阶段档案部门公开的数据中没有个人隐私或者个人信息已被匿名化,但是通过把这些开放的数据与其他数据相联系仍能够重新识别个人,并且人工智能、云计算等技术多是对信息的二次利用,甚至三次、多次利用,往往会通过再识别技术重新识别个体的画像、锁定确切的个体,从而严重威胁到个人隐私;最后,伴随着个体掌握着越来越多数据,这种数据被再识别的风险和评估难度将指数式提升。譬如,加拿大一家专门利用爬虫技术的数据分析公司hiQLab,其充分利用大数据技术的运作机制,通过爬虫技术和数据挖掘技术将毫无关联的分散数据进行“二次加工和集成”,将碎片化的静态单元数据通过时空整合的信息拼图,形成网状化的动态模块数据。由此这些不触及隐私的数据碎片经过叠加,便可以轻易追溯个人生活全貌,对个人隐私造成很大威胁。
(二)个人隐私侵权责任认定难
一方面,在当前数智时代,档案数据以及其所依赖的载体工具存在可分离性是档案数据区别于其他传统档案信息的一大特征,即档案数据的相关内容能够采用人工智能等技术手段从最初的载体中分离开来,并通过后续的复制、修改、处理等方式载入到新的载体中。而在档案数据开放过程中,会有档案部门对其进行归类整理并对外开放,档案数据开放后,档案数据利用者也往往为了不同的目的参与到其中对档案数据进行修改、整理并再次传播,故而使得档案数据被转载、复制、流转,导致参与整个过程的主体数量多、权责不清晰,难以确定侵权主体,造成侵权责任认定难。
另一方面,尽管数智技术使档案数据在整理、开放的效率得到了迅速提高,而这类技术如人工智能的广泛应用,又导致档案数据管理系统自身暴露出诸多缺陷,技术环节也存在不稳定和不安全的问题,故而极易造成档案数据被修改、丢失等风险。然而当前人工智能主体地位并不明晰,其法律责任也尚不明确,导致侵权责任的认定程序复杂。同时,第三方利用主体在二次增值处理过程中广泛应用区块链、云计算等技术,而在区块链技术中,其中心化的架构特征,中心化的隐私侵权自然人并不存在,如何认定侵权主体,至今仍是困扰理论界和实务界的难题,导致个人隐私保护责任难以明确[4]。
(三)个人隐私保护具体实现较困难
从法律层面看,我国2021年颁布的《数据安全法》《个人信息保护法》是与个人隐私保护较为密切的法律,体现了国家对数据及个人隐私保护问题的重视,但涉及档案数据开放中隐私保护的内容极少,这导致相关个人隐私保护具体实现起来非常困难。譬如档案部门在《数据安全法》中的地位,既未得到数据管理部门的认可,也未被档案部门充分认识。尽管《档案法》第27条对近年来个人信息泄露等突出问题,强调“利用档案涉及……个人信息的,应当遵守有关法律、行政法规的规定”,将档案利用中的个人信息保护提升到法律层面。《个人信息保护法》作为个人隐私保护的主要法律,只在附则第72条中简单规定“法律对各级人民政府及其有关部门组织实施的统计、档案管理活动中的个人信息处理有规定的,适用其规定”。这种法律彼此的简单“相互引用”,进一步导致档案数据开放中的个人隐私保护无所适从。
从技术能力层面看,技术安全隐患与技术能力不足加剧了档案数据开放中个人隐私保护的实现难度。技术发展使得档案数据收集更为便捷、档案数据传播更加快速、档案数据的利用方式和利用主体更为复杂,这令档案数据开放中侵犯个人隐私风险极大的提高。同时,商业利益的诱惑也不免会导致档案数据利用者见利忘义、借助大数据技术源源不断地悄悄采集、存储和循环再利用数据,忽视对个体权利的普遍尊重和保护。在反复挖掘和多次利用中,档案个人数据及隐私难免脱离可控范围,导致身份信息和个人隐私慢慢掌握到技术官僚、网络巨头公司手中,让不法分子有机可乘。而民众对此要么不知情,要么即便知情或感受到各类数智技术带来的权利弱化下的安全危机,也无能为力。
三、档案数据开放中个人隐私保护的具体完善路径
针对上述档案数据开放中的个人隐私保护面临的困境,笔者主张,应主要基于制度、组织、技术和素养四个层面促成个人隐私保护的具体完善路径。
(一)强化个人隐私保护制度设计
首先,在法律制定上。社会总是不断变化发展的,现行法律不可避免的存在滞后性,然而我们可以通过不断完善法律,使之具有更强的适用性。《档案法》对档案开放利用做了专章规定,但是有关档案数据开放的内容过于笼统且缺乏实际操作性,因此,一方面,《档案法》后续配套下位法的制定中,须明确开展档案数据处理活动损害个人合法权益时的适用法律,从而与《民法典》《侵权责任法》《网络安全法》《数据安全法》《个人信息保护法》等法律法规协调衔接。同时,明确档案数据开放的标准,尽可能减少因开放标准不统一而导致的隐私侵权问题;另一方面,可在《档案法》配套法律法规的制定中,增加对未经授权的档案数据访问、使用、披露、破坏、修改或销毁等行为的风险控制措施和救济条款,建立符合数智时代需要的个人隐私侵权需预防、监测和救济机制,补充数据空间的个人隐私保护立法。
其次,在贯彻落实国家立法层面的《民法典》及出台的《数据安全法》《个人信息保护法》前提下,结合档案业务需求,制定有关档案用户个人信息保护、档案用户隐私章程等的行业规范,平衡好档案精准服务与数据隐私安全之间的需求。另外,还可制定统一的《档案数据脱敏处理标准规范》和《隐私影响评估指南》,构建档案数据开放中隐私保护框架,提升数据开放的标准化、规范化,以便在档案数据开放共享、公布利用等工作环节中,应对各种黑客程序、网络病毒、蓄意侵权等行为给个人隐私保护带来的挑战,对档案中的个人隐私进行保护,尽可能减少个人隐私泄露侵权等风险发生的可能性。
最后,在制度运行工具上,应当建立基于整个数据生命周期的隐私影响评估机制,将隐私影响评估视为隐私保护制度运行的有效工具,并且考虑构建包含档案数据主体、档案数据利用者、档案领域专家、技术专家、档案部门等在内的利益相关者对话平台,建立一个贯穿档案数据开放前、开放后的对话磋商机制。由此,在档案数据开放前,可以充分考虑到开放档案数据和确切个体发生联系的可能性及其潜在影响,对“可直接识别确切个体的信息”,充分利用并及时更新匿名化技术实施数据开放审查,对“可间接识别确切个体的信息”,审慎考虑直接公开的风险及与其他信息相结合后使数据去匿名化的潜在风险。在数据开放后,也更能够通过迅速沟通协商启动隐私风险响应机制,及时化解档案数据被再识别化的风险。
(二)设置个人隐私保护小组
保护档案数据开放中个人隐私仅仅停留在法律法规层面是不够的,还需要相应机构进行协助和实施。需要建立健全相关制度监管组织,打防结合,强化对档案中个人信息侵权行为的治理。当前我国在档案数据开放领域设置专门的个人隐私保护机构还不具备条件,但可以考虑在相关数据安全管理机构中设置档案数据开放的专门隐私保护小组,负责履行涉及隐私保护政策的执行、推广、监督和受理隐私侵权投诉等职责,进而有效保护个人隐私。
(三)应用个人隐私保护先进技术
个人隐私保护先进技术的应用对有效保障个人隐私安全至关重要。一方面,应加大对隐私安全技术的投入力度,为研发隐私保护技术提供资金保障。除国家层面加大对个人隐私保护技术的资金投入外,国家档案局在科研项目评审中,也可适当倾斜于档案数据主体隐私保护技术的立项,以项目促研究、以项目推动隐私保护技术的研发;另一方面,在完善数据脱敏、匿名化、加密技术等技术基础上,适度引入以大数据、人工智能、区块链等新兴数字技术为依托的智能化推荐模型,根据档案工作者预设的风险感知模型自动做出合理判断,减少因风险不确定性造成的潜在损失,尤其以区块链技术具有的去中心化、时序数据、集体维护、可编程和安全可信等特点,刚好可用于满足隐私数据的完整性、可限制性以及可审计性等数据安全需求,实现个人隐私所有权、使用权、监管权的分离[5]。
(四)培育公民个人隐私保护素养
随着数智时代的到来,实现档案数据开放中的个人隐私保护并非档案部门一方之责和一方之事,而是也有赖于个人隐私保护的客体——公民一方的广泛参与和积极配合,其中,具有重要价值的便是公民隐私保护素养的提升。正如有学者指出,“对数字档案用户隐私的有效保护,需以提升档案用户隐私保护意识与能力为基础,从根源处避免隐私泄露的可能性[6]。”因此,为提高档案数据主体隐私保护素养,一方面,从教育部门到工信部门、档案部门都应加强隐私教育力度和宣传力度。教育部门应加大对基础教育中信息学科的重视,从小培养公民的隐私意识和信息保护观念。工信部门应充分利用国家网络安全宣传周等契机加大宣传力度,在全社会形成良好的公民隐私保护氛围;档案馆可通过讲座和海报宣传或将隐私保护教育课程、隐私风险感知测评模块嵌入档案网站、APP、数字档案馆开放平台以落实好个人隐私教育;另一方面,也可以鼓励公民自主学习相关法律知识,不断促使档案数据主体自觉地发掘并学习如何保护个人隐私的方法与技能。
四、结语
在信息日益走向开放的时代,档案数据开放无疑会愈发广泛,但其中涉及的个人隐私也越来越多。我们唯有根据中国实际需要不断展开理论和实践探索,才能真正有效促成档案数据的高效安全开放,切实维护好个人隐私,推动我国档案事业的高质量发展。