公共数据应平等开放,并确保个人信息安全
2020-07-16
㤌쌋쌋㤌㤌쌋쌋㤌
辛省志
在2020年7月10日举行的2020世界人工智能大会云端峰会数据智能主题论坛上,上海市宣布将针对防疫复工、卫生健康、交通出行等7个重点领域进一步加强公共数据资源开放力度,计划到年底开放数据累计达到5000项。当天上海市还启动了2020上海开放数据创新应用大赛,以丰厚的奖金鼓励对开放数据的分析和应用进行创新。
公共数据,指的是政府机关以及受公共财政支持的服务机构等在履职过程中所采集和产生的各种数据。2016年,国务院总理李克强曾在中国大数据产业峰会上指出,“数据就像一个钻石矿”,而中国超过80%的数据在政府手中,应该推动政府数据开放和利用。
公开公共数据,鼓励各方利用人工智能等大数据技术对这些数据进行创新性的分析研究和应用,可能为改善公共服务提出有效的解决方案。当有足够多的数据被公开后,将不同数据联系起来进行交叉分析,就有可能得出各种有价值的应用。在2019年深圳开放数据创新应用大赛中,就出现了“小区罗盘(根据政府开放数据,为租房者提供房屋周边交通、医疗等全方位信息)”“城市火灾隐患动态预测系统”等应用。
公共数据公开应贯彻平等原则,确保所有主体都能够以平等的条件获取数据。对公共数据的挖掘和利用可能产生巨大的商业价值。正因为如此,李克强总理才将其称为“钻石矿”,数据也才被当做与土地、劳动力、资本、技术等并列的生产要素之一。而政府部门作为这一矿藏的最大生产者,应保证所有合格的市场主体,能够平等参与对数据价值的发掘。这里的合格,只应该是技术性的,比如能够保证数据的安全,而与市场主体的大小、所有制性质等无关。
如果没有公开数据,那就只有少数大公司有可能与部分公共机构达成合作协议,获得相关数据进行分析应用,而小公司则无法获得数据。而在市场主体与公共机构私下合作的过程中,还可能产生寻租。这不是公平的市场竞争环境。
当然,公共数据公开,必须保护好公民的个人信息和隐私。个人信息泄露已经成为信息时代最大的安全隐患。而政府部门掌握的信息,有不少是与财产、健康情况等敏感的个人信息相关联的。一般来说,大数据信息应该做脱敏处理,删除能够联系到具体个人的信息后才可以公开。但是如果公开的信息粒度太小,过于细致的信息,还是有可能通过反推、与其他数据的交叉验证等方法将数据与具体个人联系起来。这就需要在公开时权衡数据公开的价值和潜在风险,合理设置公开数据的粒度,尽可能减少从匿名信息反推出个人的可能。此外,也应该立法禁止对公开数据进行反推处理以关联到个人,一旦触犯就要严厉处罚,并对个人信息被侵犯的个人予以补偿。
另外,作为个人信息的最终拥有者,个人是否有权要求将个人信息从公共数据中删除,也是有争议的问题。欧盟的通用数据保护条例(GDPR)规定了用户的“被遗忘权”,商业公司需要获得用户的明确授权才可以收集和处理用户信息,用户有权要求将个人信息从数据中删除。但是这主要是针对数据的商业处理而言的,GDPR还规定,基于公共利益或者法定义务等特殊需求,在对数据处理之前,可以不需要数据主体的同意。这是出于尽可能保证数据完整性的考虑,因为如果需要获取信息主体的同意,数据就无法覆盖那些不同意的主体,以这些不完整的数据为基础进行挖掘分析,得出的结论可能不正确,对政策制定等产生误导。在中国的公共数据公开中,这一问题也是需要考虑的,应该通过社会公开讨论达成共识。
而对于部分必须关联到具体个人的数据应用,比如为促进信贷审核便利而共享个人税收、社保、公积金、水电费账单等经济状况、信用有关的数据,必须对数据的使用者和使用过程进行严格的限制和监督,确保使用者不滥用公民的个人数据。