构建公民信息数据利用与保护的动态平衡机制
2019-04-17缪文升
缪文升
[摘 要]人工智能的基础是大数据,收集数据和运用数据的过程必然会涉及对公民个人信息数据的收集、归类和分析使用的合理性与适当性,并由此带来对公民个人信息数据安全利用与保护平衡的问题,即在充分发挥人工智能功能时如何规范对公民个人信息数据的收集、储存、利用,同时又能够有效避免数据的泄露和滥用,并确保信息数据的安全。基于此,当下公民个人信息数据应以合理使用、公共福利和数据分级管理为原则,构建以信息数据状态为中心的动态平衡机制,从而达致公民个人信息数据利用和保护并举。
[关键词]人工智能;公民信息数据;利用与保护;动态平衡
随着计算机运算能力日趋成熟,人工智能的发展具备了数据基础。①在此背景下的数据不仅成了智能机器人的“神经元细胞”,并以人类无法想象的速度成为个人、企业、国家据以预测和决策的基础与依据。这些海量数据都被永久性地保存并汇集成大数据,当大数据的占有者对其深度挖掘,可以将各种信息片段进行交叉、重组、关联操作,从而进一步加速了传统的模糊化、匿名化保护公民个人隐私方式的失效。由此带来了对公民个人信息数据安全利用与保护如何平衡的问题,即在充分发挥人工智能功能时如何规范对公民个人信息数据的收集、储存、利用,有效避免数据的泄露和滥用,并确保信息数据的安全。基于此,本文在梳理当下公民个人信息数据面临问题的基础上,提出以合理使用、公共福利和数据分级管理为原则,构建以信息数据状态为中心的动态平衡机制,从而达致公民个人信息数据利用和保护并举。
一、人工智能时代公民信息数据现状
从20世纪50年代,科学家就对人工智能进行探索,以麦卡锡、明斯基等为代表的一批年轻科学家提出了“人工智能”这一术语。当下,尤其是大数据的运用、云计算与深度学习已成为人工智能突飞猛进的关键推手。人工智能是一门扩展和延伸人类智能的理论、技术以及应用的新技术科学,其目的在于生产一种智能机器,是利用科学技术创造出来的“类人脑”或“超人脑”的智能机器、智能系统或智能软件。人工智能的快速推进得益于其以历史大数据为强大支撑,综合运用机器学习、神经网络、大数据、认知系统、演进算法,运用对人类智力根本无法理解的无结构数据的推理、计算、深度学习,从而按照预期目标完成对应行为的计算系统。
公民个人信息大数据最核心的技术特征就是超强的收集、存储、及时、精确地处理数据的能力以及精准的预测能力,这些信息数据对个人、商家或者政府来说都是一个价值连城的宝藏。“人工智能技术与个人信息及隐私联系密切:一方面体现在人工智能的研发阶段,该阶段需要大规模的数据储备作为机器训练与学习的基础;另一方面体现在人工智能的运行阶段,该阶段针对不同用户提供个性化服务的过程亦是一个收集用户信息、生成新信息的过程。”②人工智能的基础是大数据,收集数据和运用数据的过程,就必然会涉及对公民个人信息数据的收集、归类和分析使用的合理性与适当性,其结果是要求相应公共管理部门必须对大数据、云平台、物联网进行等级分类,从数据的基础设施和安全防范方面强化保护。公民信息数据既包括公开的个人信息,也包括隐秘的个人信息。公民信息数据可以分为三类:一是直接反映主体的自然情况和日常生活的数据,如姓名、长相、年龄、身份证号码、受教育程度、身体健康状况、婚姻状况等;二是主体因为网络行为所产生的活动轨迹,如网页浏览记录、社交网站聊天记录等;三是网络服务商通过对前两类个人信息數据资料的收集与挖掘,处理与分析而得到的个人信息资料,如相关个人的浏览习惯、消费习惯、购物偏好等再生数据资料。③
数据是人工智能时代最重要的资源,人工智能能够占用的公民个人信息数据越多,其功能的发挥效果越明显。公民个人信息大数据是“指无法在一定时间内运用常规软件对相关内容进行抓取、管理和处理的数据集合群,具有数据海量、种类繁多和更替迅速等特点”④。在实践中,尽管通过人工智能对公民个人信息搜索没有直接展现个人隐私内容,但在收集到海量数据后再利用人工智能对这些信息进行深度计算,必然会计算出特定主体的生活规律、个人偏好等带有隐私特征的内容。因此,人工智能时代网络搜索技术和大数据的深度运用显著增加了对公民个人信息数据的安全风险。据牛津大学哲学家尼克·波斯特罗姆调查,最常受访的前100位人工智能技术相关研究人员中超过半数的受访者认为,人类层级的机器智能对人类的影响将是“不太好的影响”或是“极其坏的影响(事关存亡的人类大灾难) ”,“75%的专家认为走向超级智能是必然的趋势,且多数杰出的人工智能专家已经认识到人工智能具有威胁人类存续的可能性”⑤。因此,在人工智能时代,要始终关注如何处理好公共利益和公民个人权利动态平衡,兼顾好人工智能技术的发展与公民个人隐私的保护。
二、公民信息数据利用与保护动态平衡的原则
人工智能的运行是基于对公民个人信息数据的收集和利用,在此基础上构建一个巨型体的数据库。⑥这一庞大的公民个人信息数据库给各方主体带来了便利,但同时存在着如何规避其中潜在的安全风险问题,诚如“行人乱穿马路的现象让很多城市管理者头疼,部分地方选择利用面部识别定位、将路人信息公布于大屏幕的方式来应对,效果固然有了,但显然是完全没考虑个人的隐私权,更遑论保护了”⑦。针对个人信息数据具有共享的基本特点,而且社会组织和个体在使用个人信息数据后并没有对信息造成损耗,我们认为个人信息数据的使用更应该秉持合理使用原则、公共福利原则和数据分级管理原则。
一是合理使用的原则。人工智能的根基是大数据,其健康发展必然要求对相关数据的权利与义务划定明晰边界,保护公民个人信息数据免受非法侵害和数据控制者的合法利益。因此,保护公民个人信息数据不等于禁止任何人在任何场合使用、开放和共享公民个人信息数据;同时,相关法律制度设计在应然地具备保护个人信息的目的之外,个人信息保护的目的还在于促进个人信息的合法流通和使用⑧,从而厘清公民个人信息数据保护与使用之间的关系,找到平衡两者各种关系的方法和原则,实现公民个人信息数据的合理使用。公民个人信息数据的合理使用原则,要求使用者在法律明确规定的合理限度以内,依法对个人信息进行利用,不得对个人隐私造成侵犯,合理利用数据。如我国台湾地区《个人资料保护法》明确规定将“促进个人资料之合理利用”作为与“避免人格权受侵害”并重的立法目的。⑨信息数据合理使用原则是出于合理的目的和用途,可以不经权利人许可使用其信息数据,是基于在信息数据权利人和未经授权的合理使用人之间寻求一个利益平衡,合理地消除公民个人、大数据控制者、数据使用者之间的冲突。以欧盟为例,欧盟在《一般数据保护条例》第6条中规定了除同意以外,可被认定为合理处理的其他情形,满足任意一项即可。其一,个人数据的加工是作为合同一方的数据主体履行合同所必需的或是为了满足数据主体订立合同前或订立合同时的要求;其二,数据控制者履行法律义务必须进行个人数据加工;其三,为了保障数据主体的重大利益而进行的个人数据加工;其四,在不侵犯数据主体更重要的基本权利及自由的前提下,控制者的合法利益需要通过保护个人数据而实现的,且数据控制者追求其合法权益是必要的,则所述加工行为可以被认定为合理。⑩故此,运用合理原则规制公民个人信息数据的使用大体包括信息使用主体获取公民信息数据不是其最终目的,只是将个人信息数据作为大数据的元素;使用公民个人信息数据是法律明确授予的权力;使用公民个人信息数据以确保信息数据安全为前提,不得损害信息数据主体的合法权益等基本要素。
二是公共福利原则。公民个人信息数据有多样化的应用场域,在各种情境下,冲突可能表现为不同的面向,如经济发展与个人权利的冲突、科学进步与个人权利的冲突、公共利益与个人权利的冲突。将个人信息数据作为公共资源,那么个人信息数据使用根本目的在于提高其公共福利。个人信息数据是社会交往和社会运行的必要工具,“目前个人数据在定义上几乎被视为公共领域的组成部分,是可以广泛获得和使用的。无论从实践还是从法律目的上,个人数据均处于公共领域。”就具体的主体而言,主体向社会推介、展示自己,必然使用自己的可识数据,这就造成个人信息数据被公开、外泄,为社会不特定主体所掌握;就社会其他主体而言,包括政府、社会组织、网络运营商等同样需要利用具体主体提供的信息数据和可被收集到的个人信息数据来了解、判断具体的主体。不管是信息主体的主动利用还是社会其他主体对数据的运用,这些数据或信息均是处于公共领域的公共素材或材料,这些素材或材料只是一种不同主体相互了解的媒介。因此,网络、传感器等记录的具体主体浏览记录,只是与特定主体产生了某些联系,赋予该个人信息数据某种含义,而不足以使该主体对此记录的个人信息数据拥有排他支配权,因为公民个人信息数据是其正常社会交往的基础,离开了个人信息数据也就无法判断和认知谁是甲谁是乙。因此,要将个人信息数据作为一种共享公共资源,确保社会成员可以在合理范围内获得、分享和使用这些个人信息数据,不能把个人信息数据归属于任何具体的单位或个人,任何具体的单位和个人也没有权利去阻止其他公众使用个人信息数据。这就要求在立法过程中明确将个人信息数据作为公共福利之一,并明确禁止任何社会组织和个体私自占有。
三是分级管理原则。公民个人信息数据只有充分流動、共享、交易,才能最大程度地发挥功能。关于个人信息数据分级管理的要求,一方面要区分信息的类型,并在保护态度、开发利用程度、侵权追责力度上有所不同。欧盟《通用数据保护条例》规定的敏感信息包括: 揭示种族或民族出身,政治观点、宗教或哲学信仰,工会成员的个人数据,以及以唯一识别自然人为目的的基因数据、生物特征数据,健康、自然人的性生活或性取向的数据。《美国—欧盟隐私安全港原则》规定的敏感信息包括: 医疗与健康、人种与种族、政治观点与宗教信仰、贸易组织的成员资格、个人性信息。我国台湾地区《个人资料保护法》列举的敏感信息有: 有关医疗、基因、性生活、健康检查及犯罪前科的信息。参考这些规定,我们可以将个人信息数据大体分为禁止获取使用的个人信息、限制获取使用的个人信息和自由获取使用的个人信息三类。其中,禁止获取使用的个人信息主要是指涉及个人隐私的数据。从概念上来看,个人信息与隐私具有明显区别,前者强调可识别性,后者强调私密性,但两者同样存在交叉。个人信息数据中包含私密信息,在对个人信息的规范中,多数国家在个人信息中区分出敏感个人信息,而敏感个人信息多具有私密性,归入隐私范畴。如果可识别个人信息数据属于隐私范畴,就必须遵循保护隐私的相关规范,不得泄露个人隐私。限制获取使用的个人信息则强调对个人信息的收集和使用需要满足国家法律、行政法规等规范性文件所规定的信息。如《俄联邦个人数据法》则规定,数据加工人(经营者)收集、系统化、保管、利用和传播信息时应提供取得个人数据主体同意的证据。另一方面,要区分信息数据开发与利用环节。收集和使用是公民个人信息数据发挥功能的两个主要环节,与信息收集相比,信息非法使用是目前公民个人信息数据遭受侵害的高发环节,必须将信息数据使用环节作为重点规制领域,将关注重点从事前转移到事中。
三、以信息数据状态为中心动态平衡利用和保护的关系
公民个人信息数据始终处于实时高速流动之中,相应而言其安全也处于一个动态过程,其中涉及信息数据的收集、处理、存储等各个环节的安全以及数据处理平台的安全等。而公民个人信息数据又得借助于数据企业、国家等信息持有和管理者的行为而实现,这就必然要求对公民个人信息数据的关注点发生转移。即从仅仅局限于私权保护向侧重规范信息数据合理开发中个人利益和社会公共利益的平衡,从而更好地发挥公民信息数据的公共产品功能。但我国许多现行的个人信息法律规范又呈现出义务创设和责任安排的前置特征,更多强调可能出现的侵犯个人信息的行为进行提前预防,而对电商企业、“两微一端”等大规模采集个人信息数据组织机构的约束力尚显不足。为此,必须学习和借鉴有益经验和做法,加强对公民个人信息数据的采集、存储、使用全过程的监管。如美国于2016年颁布了《国家人工智能研究与发展战略规划》和《为人工智能的未来做好准备》两个国家级政策框架。就具体的监管政策而言,《为人工智能的未来做好准备》提出了一般性的应对方法,强调基于风险评估和成本—收益考量的原则以决定是否对人工智能技术的研发与应用施以监管负担。日本在2016年出台了《第五期(2016——2020 年度)科学技术基本计划》,提出了“超智能社会 5.0”的概念,强调通过推动数据标准化、建设社会服务平台、协调发展多领域智能系统等各方面工作促进人工智能的发展和应用。
当前,借鉴相关国家的做法,必须形成一个行业自律和国家监管并重的全新信息安全生态监管体系。一方面,大数据时代个人信息数据利用的无序呼唤行业自律,通过行业自律引导行业隐私声明与隐私风险评估衔接,促成个人信息数据保护的实现。“在政府引导下,规范行业内个人信息处理行为,协助实施行业自律,探索并实现既能促进信息产业发展又能有效保护个人隐私二者之间的平衡。”早在2010年奇虎360与腾讯网络大战爆发时,就引发了企业主动承担保护个人信息隐私责任的争议。2018年版《360用户隐私保护白皮书3.0》发布,360提出“四不三必须”行为规范,且呼吁互联网同业者加以补充和完善。在个人信息处理所处的具体场景中进行动态的风险控制,即变僵化的合规遵循为灵活的风险管理,促进个人信息的“合理使用”,重点规制个人信息的“不合理使用”行为。另一方面,我国在网络运营领域还没有充分完善的行业自律规则和相应的伦理道德,必然要求政府在有关个人数据信息的搜集、使用等关键环节上加以干预,通过事前的备案、审批、监督和事后的追责制度来规范个人数据信息的使用过程,“必须给予信息业者收集、处理和利用个人信息的较大自由;必须保证国家机关为了国家安全和社会管理之目的,收集,处理和利用个人信息的权力和能力”。此外,应该充分发挥第三方平台更为客观的监控功能。例如,从2016年始南都通过多篇调查报道,逐渐深入了个人信息安全领域的话题,正在尝试以新闻报道与第三方评测监督的方式,促进业界对个人信息安全形成共识。
注释:
①李学龙、龚海刚:《大数据系统综述》,《中国科学:信息科学》2015年第1期。
②雷悦:《人工智能发展中的法律问题探析》,《北京邮电大学学报(社会科学版)》2018年第1期。
③陈奇伟、刘倩阳:《大数据时代的个人信息权及其法律保护》,《江西社会科学》2017年第9期。
④程士安:《以搜索引擎为导向的大数据时代网络信息管理》,《广告大观》(综合版)2012年第8期。
⑤[美]艾伦·达福,斯图尔特·罗素:《人工智能的真正风险》,《中国经济报告》2017年第2期。
⑥王秀哲:《大数据时代公共安全领域个人信息保护的政府责任》,《理论探讨》2017年第4期。
⑦曹昆、王倩:《让隐私保护跟上大数据时代》,《人民日报》2017年8月3日。
⑧齐爱民、盘佳:《数据权、数据主权的确立与大数据保护的基本原则》,《苏州大学学报(哲学社会科学版)》2015年第1期。
⑨齐爱民:《拯救信息社会中的人格:个人信息保护法总论》,北京大学出版社,2009年版,第34-58页。
⑩转引自江波、张亚男:《大数据语境下的个人信息合理使用原则》,《交大法学》2018年第3期。
Corien Prins, Property and Privacy: European Perspectives and the Commodification of Our Identity,16 Information Law Series 223-257(2006).
王玉林等:《信息服务与信息交易视野下的信息分类研究》,《情报理论与实践》2015年第12期。
王利明:《论个人信息权在人格权法中的地位》,《苏州大学学报》(法学版)2012年第6期。
王利明:《隐私权概念的再界定》,《法学家》2012年第1期。
肖秋慧:《俄罗斯信息政策和信息法律研究》,武汉大学出版社,2008年版。
Preparing for the Future of Artificial Intelligence.https: //obamawhitehouse.archives.gov/sites/default/files/whitehouse_files/microsites/ostp/NSTC/preparing_for_the_future_of_ai.pdf. 2017-8-14.
薛亮:“日本推动实现超智能社会‘社会5.0”,http: //www.istis.sh.cn/list/list.aspx?id=10535,2019年3月3日访问。
高秦伟:《社会自我规制与行政法的任务》,《中国法学》2015年第5期。
王秀哲:《信息社会个人隐私权的公法保护研究》,中国民主法制出版社,2017年版,第242页。
《360用户隐私白皮书》,http://www.360.cn/privacy/v3/bpsxy.html,2019年2月18日访问。
范为:《数据时代个人信息保护的路径重构》,《环球法律评论》2016年第5期。
张新宝:《从隐私到个人信息:利益再衡量的理论与制度安排》,《中国法学》2015年第3期。
南都報告:“1550家平台隐私政策测评结果出炉超八成透明度低”,http://news.163.com/17/1229/09/D6QJ2F8M000187VE.html,2019年2月18日访问。
(作者系江苏警官学院法律系教授)
(责任编辑 矫海霞)