保护个人数据隐私制度与技术创新并重
2021-09-16李礼辉
数字经济时代需要切实保护数据隐私。我国立法和执法的焦点在于:如何协调数字经济社会的宏观稳定与微观动力,如何划分数据资源固有的商业价值与数据挖掘应用产生的商业价值,如何平衡数据所有者的基本权利与数据占有者的商业利益。
2020年4月,中共中央、国务院颁发《关于构建更加完善的要素市场化配置体制机制的意见》,首次明确将数据纳入生产要素,强调推进政府数据开放共享,提升社会数据资源价值,加强数据资源整合和安全保护。这是关于数据作为生产要素的纲领性指引,切合数字经济社会发展的实际,切合数字化金融变革的趋势。
全面提升数据要素生产率,充分挖掘数据资源的商业价值和社会价值,是一个系统性工程。我們需要推进数字技术创新和数字技术应用,需要建立数据治理体系和数据技术标准化体系,需要保护数据权益和个人数据隐私,需要深化数据要素融合共享并维护数据安全,需要构建本土数据要素市场并参与全球数据要素市场竞争。
金融数据的要素化,是金融业数字化变革的重要特征。金融机构广泛应用数据,深度依赖数据。数据成为金融业的生产要素,算力成为竞争力;数据成为生产要素,涉及数据品质、数据孤岛、数据分类和数据隐私保护。
数据的品质
现代社会每时每刻都在产生海量的信息,当信息以数字形式被收集、存储和应用时,就形成数据。基于经济社会的要求,数据必须具备必要的品质。
一是具体的真实性。数据来自具体的主体:可以是个人,也可以是家庭;可以是企业,也可以是行业;可以是金融机构,也可以是政府部门。数据来自真实的行为:可以是商品交易,也可以是金融服务;可以是劳动就业,也可以是薪酬福利;可以是法定税收,也可以是行政收费。
二是可靠的一致性。数据的一致性要求,与数据的应用范围正相关。在一定的数据应用范围内,数据采集的标准和方法必须一致,数据存储的结构和路径也必须一致。无论是集中化的数据库,还是分布式的数据云,都必须做到内在逻辑正确,外部防卫严密,切实保护数据系统的可靠和安全。
三是足够的延展性。数据具有时间、空间两个维度足够的延展性,才可能具备统计学的意义。必要的数据长度和密度,一般与数据主体的延展性正相关。如果是个人或家庭,只要有12个月以上并具备一定密度的数据,就能揭示个人及家庭的消费倾向和支付能力;如果是大大小小的企业,那就需要按经营范围、服务对象区分的数据集合,才能分析和比较不同企业的市场竞争力和盈利能力;如果是特定类别的产品或行业,那就可能需要一个经济周期甚至更长时间的数据,才能准确反映特定产品、特定行业的市场需求变化和生命周期变化的趋势。
数据孤岛
数据孤岛现象已经引起社会的高度关注。
一是制度性数据孤岛。我国长期实行的以表格为中心的统计体系(以部门为中心的条块式),导致制度性的数据孤岛。例如,涉及企业法人的信用数据,分散在金融监管部门、金融机构、工商行政管理、税务、海关等不同的征信系统中,标准不尽相同,口径不尽相同。大多数小微企业的商业行为记录湮没在市场的海洋里,没有信用标记,无法积累信用,也就不能产生信用的正价值。对于小微企业来说,这是与生俱来的缺陷;对于市场经济社会来说,这是经济制度的缺陷。据波士顿咨询公司两年前的测算,信用体系的覆盖率,美国高达92%,而中国只有35%。
二是技术性数据孤岛。近10年来,随着互联网经济和大数据技术应用的发展,越来越多的信息被纳入各式各样的数据库。这一方面给我们的生活带来了巨大的便利,另一方面也产生了技术性数据孤岛的问题。万物互联意味着数据的集合,但集合并不能自动解决数据孤岛的问题,甚至会形成数据垄断。例如,互联网电商平台、移动通信运营商、连锁商场连锁超市连锁酒店、航空公司高铁公司物流公司、学校医院等,拥有大量的个人数据,而且形成数据孤岛。在这些海量的个人数据中,部分属于公共数据,更多的属于个人隐私数据。
技术性数据孤岛当然可以成为数据占有者的资源优势和竞争优势,但站在国家的立场,这种数据垄断有可能妨碍公共数据发挥应有的社会价值,也有可能因商业利益或安全疏漏发生侵犯个人隐私的问题。
数据分类
我认为,可以把数据区分为具有所有权属性的著作数据、具有社会属性的公共数据、具有隐私属性的个人数据。关于数据要素具体制度的建设,应该立足于数据性质界定和数据归属界定,追求数据资源应用价值的最大化。这里,著作数据的价值最大化取决于确权和市场交易,公共数据的价值最大化取决于透明度和资源共享,个人数据的价值最大化取决于隐私保护和融合应用。
一是著作数据的界定。将于2021年6月1日起正式施行的修订后的《著作权法》,对“作品”做了明确具体的规定。作品是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果,包括文字作品,口述作品,音乐、戏剧、曲艺、舞蹈、杂技等艺术作品,美术、建筑作品,摄影作品,视听作品,工程设计图、产品设计图、地图、示意图等图形作品和模型作品,计算机软件,以及符合作品特征的其他智力成果。我认为,作品的数字化表达和记载,属于著作数据,必须按照著作权法予以保护。
二是公共数据的界定。在立法的层面界定公共数据似乎不是什么难事。我认为,由政府行政部门、公共服务机构、社会团体、公益组织等具有公共属性的机构所收集和存储的各类数据,经过脱敏处理消除个人和企业的标记之后,应属于公共数据。目前的问题在于,公共数据的部门所有制甚至是部门割据影响公共数据资源的开放共享。
三是个人数据的界定。目前人们的认识并不一致。例如,智能手机已经成为人们的标配,手机与我们如影随形,我们不仅仅用手机通电话、发短信、拍照片、录视频,而且用手机看新闻、看影视、查资料,用手机购物、乘车、导航、挂号、开会。每一个人的行动轨迹、消费偏好、支付能力、兴趣爱好、健康状况,以及亲友圈、朋友圈、职业圈,都已经被“数据”。
如果只是对这些数据进行统计分析,将数据挖掘结果用于宏观经济管理和规划,用于供给侧和需求侧的结构性改革,用于产业链的布局和流程改进,用于城市智能管理系统,或者用于生产商的产品和服务优化,用于经销商的采购和物流优化,一般不会涉及侵犯个人隐私。
需要注意的是,这样一些数据已经被用于针对特定个人的阅读导引、出行指南、产品推销、金融授信。今天,因为自己的“透明度”,你是仍然会感到吃惊还是早已“习惯成自然”?如果一个陌生的电话能够准确报出你的姓名、住址甚至身份证号,你会不会为个人隐私得不到保护而担忧?如果手机的某個应用程序(App)要求你开放拍照、录音、图库等通道才能提供便捷服务功能,你是勾选“同意”还是拒绝?你是否愿意牺牲个人的隐私保护权利来换取生活上的便利?
我国的《网络安全法》《民法总则》《电子商务法》等法律对个人数据保护做了原则性的规定,但一些具体的法律规范有待进一步明确。例如,对于公共数据的界定、归属和管理,对于个人隐私数据的界定和商业利用,缺乏细致明确的法律规范。2020年2月中国人民银行发布的《个人金融信息保护技术规范》,2020年10月1日实施的《信息安全技术 个人信息安全规范》,以及中国人民银行2019年规章制定工作计划中的《个人金融信息(数据)保护试行办法》(征求意见稿),制定了个人金融信息数据保护的具体规定,不过,落实到位还需要一个过程。
个人隐私数据保护
在西方国家,保护隐私不仅仅见于法律,而且成为公民的自觉意识和行为规范。欧盟的《数据保护通用条例》(General Data Protection Regulation,简称GDPR)于2018年5月正式生效。该条例强调数据所有者对隐私数据不可动摇的权利,规定数据保护范围涵盖所有直接或间接与自然人相关的个人数据(姓名、身份证号等)和敏感数据(种族民族、政治观点、宗教信仰、健康和性生活等),数据处理涵盖数据收集、注册、系统化、存储、调整、使用、披露、传播、提供或汇集的任何行为。该条例订立了新的原则:一是隐私默认(Privacy as Default),企业收集及处理数据必须得到数据所有者明确、主动的同意;二是数据最小化(Data Minimization),限于约定范围收集和处理数据,不得无故收集或用作他用;三是数据遗忘权(Right to be Forgotten),数据所有者有权要求数据占有者删除涉及本人的所有数据。不过,由于欧盟各国数字经济发展差异等因素,这部被称为史上最严格的个人数据保护法律的执行并不理想。
数字经济时代更需要切实保护数据隐私。我个人认为,我国立法和执法的焦点在于:如何协调数字经济社会的宏观稳定与微观动力,如何划分数据资源固有的商业价值与数据挖掘应用产生的商业价值,如何平衡数据所有者的基本权利与数据占有者的商业利益。
一是维护数据所有者对隐私数据的基本权利。中国的国情与西方国家不同,我们不宜照搬西方法律的具体条文,但应该强调数据所有者对隐私数据的基本权利。例如,规定企业收集及处理数据必须得到数据所有者明确的同意,规定企业不得超越约定范围收集、处理和使用数据,同时给予数据所有者要求数据占有者删除涉及本人隐私数据的权利。
二是实现公共数据开放共享。应该穿透行政割据的数据孤岛,改变以表格为中心的统计体系。国家应该建立标准统一的公共统计制度,建立集中统一的公共数据库,建立互联共享的公共数据应用系统,形成能够支持数字经济发展的基础设施。
数字化金融监管系统应该由金融监管部门共建共享,能够覆盖所有的金融机构,穿透金融市场和金融业务,实现金融监管全流程、全方位的智能化,超越流程复杂、耗费资源的现场监管,降低监管成本和被监管成本。
在社会信用体系建设中,应该建立跨局域数据共享的征信系统,整合不同部门的数据资源,执行统一标准,采集企业和个人的金融业务、工商登记、税费缴纳、国际贸易、市场诚信等信息数据,注重为小微企业积累信用记录,赋予信用标记,实现信用增值。目前,部分城市已经开始建设共享征信系统。
三是建设专业化的数据库。例如,在健康医疗领域,建设几个跨行政区域和医院局域的全国性中心数据库,应用虚拟集成和边缘计算等技术提高数据库效率,做到按疾病分科并按病程细分,按药品分类并按疗程细分,按基因特征分层并按性别、年龄细分,形成能够支持智慧医疗、远程医疗、专业医疗、普惠医疗的基础设施。
四是通过技术手段实现数据要素融合应用和安全保护。例如,集成运用多方计算、联邦学习、数据脱敏、差分隐私、可信计算等技术,构建金融业数据要素融合应用系统。这类系统基于数据安全协议,可以利用多个参与方的数据,将散落在不同局域的数据联合起来转换成有价值的知识,同时可以保护数据隐私,实现数据可用不可见,形成一个支持安全多方检索、安全多方计算、安全多方学习、安全多方推理的智能化应用框架,在实现数据共享的同时保护数据隐私,在提升数据资源价值的同时保护数据安全。
(李礼辉为中国银行原行长、中国互联网金融协会区块链研究工作组组长。本文编辑/秦婷)