APP下载

云环境中科学数据的安全风险及其治理对策*

2021-01-07肖冬梅

图书馆论坛 2021年2期
关键词:数据安全法律科学

肖冬梅,孙 蕾

1 背景:数据密集型科学出现

随着云计算技术与服务的深度渗透,以高度协作、开放获取、数据共享、研究透明为特征的开放科学正在全球兴起[1]。开放科学改变了传统科研范式惯常的“假设—求证”逻辑,直接基于海量数据,借助大数据的相关关系,通过运算得出新的结论。其特征在于重视基于“相关关系”的验证,而非一味拘泥于“因果关系”进行推导,因而开放科学也可以说是数据密集型科学。数据密集型科学也称第四科研范式,是指“数据依靠信息设备收集或模拟产生,依靠软件处理,用计算机进行存储,使用专用的数据管理和统计软件进行分析”[2]。科研活动以数据为中心开展,科学发现以数据挖掘技术、云计算存储和处理技术等为工具,而以数据为生成要素的社会的形成,为科研活动提供了新的对象,由此催生了“全域科学数据”。数据成为科研活动的对象,意味着基于科研活动而产生的科学数据的范畴扩大,即不再只是局限于科研活动“后端”——经科研活动而生成的数据,而是扩展到科研活动“前端”——用于科研活动的数据。如果说科研活动是加工厂,那么投进去的要素(前端数据)和产出来的产品(后端数据)都是科学数据。由此,科学数据的安全就显得尤为重要,因为其准确性、可靠性直接影响后续理论建构的正确性。AI、基因工程等大样本科学数据滋生不一致、不精确、不完整、数据冲突等质量问题的几率颇大。按照GIGO(Garbage In,Garbage Out,即“垃圾进则垃圾出”)原则,如果科学活动中输入的数据存在问题,偏离客观事实,那么算法再好、超级计算机再先进,也难以达到预期目标,甚至可能带来严重恶果。美国医疗协会的统计表明,因数据错误而引发的医疗事故中,每年至少有9.8万例患者死亡[3]。所以说,数据被人为篡改,或因物理环境而引起的不完整性等,都可能导致数据不准确,归根到底还是数据安全问题。在第四科研范式活动中,科学数据的安全问题不止关系到学术成果的真伪,甚至还关系到国家安全(如核研究)、人类安全(如基因研究)等。有鉴于此,本文试图通过剖析典型的云安全事件,揭示云环境下科学数据面临的威胁;对重要的学术数据库、科学数据平台进行持续的安全性测试,观察云环境中科学数据面临的安全风险程度与主要风险类型;并在广泛研读相关学术文献和法律文本的基础上,总结和归纳云环境下科学数据安全风险的主要治理模式与演进路径,重点阐释当今已成为发展趋势的“技术+法律”联袂治理模式,以期在此基础上提出对策,有效治理我国科学数据当下正面临的云安全风险。

2 云环境中科学数据面临的安全威胁

云计算是新的IT资源组织和应用技术,引入了资源弹性共享、数据动态迁移以及多租户资源共享等新的应用架构和管理模式,在最大限度发挥IT资源集约化应用效益的同时,也为云上应用带来潜在的安全隐患。但迄今为止,云环境中有几类安全威胁并未达成共识,有观点认为是12类[4],也有观点认为是6类[5],引用较多的是云安全联盟(Cloud Security Alliance,CSA)提出的7类云安全威胁,包括云计算的滥用和恶用、不安全的接口和API、内部员工的恶意行为、共享技术产生的问题、数据丢失或泄漏、账号和服务劫持以及未知的风险场景[6]。这些威胁有些是人为导致,有些是技术特点或局限所致。其中,云计算的滥用和恶用、内部员工的恶意行为、账号和服务劫持皆是人祸,是人有意为之。云环境中黑客利用僵尸网络来传播垃圾邮件和恶意软件就是典型的滥用和恶用;有管理权限的内部员工窃取用户数据甚至删库跑路的恶性事件时有发生,如“SaaS第一股”微盟遭员工恶意“删库”,导致客户数据丢失[7];账号和服务劫持威胁包括中间人攻击、网络钓鱼、垃圾邮件以及拒绝服务攻击等,在云中几乎从未间断。软件接口或API、共享技术产生的问题、数据丢失或泄漏则是因云计算技术的特点或局限所致。比如,共享技术产生的问题体现在共享基础设施是IaaS提供商的一种服务方式,但其所基于的组件并不是为此设计的,因此带来安全威胁;疏忽大意也可能导致云中科学数据的丢失或泄漏;未知的风险场景则包括代码更新、脆弱性、入侵企图等。

由上可知,与传统网络环境相比,云环境中科学数据面临的威胁更甚,既面临传统的安全风险,也遇到新型的安全威胁。其中,不可忽略的安全威胁主要有两类:一类虽是传统安全风险,但在云环境中其威胁被放大;另一类是云计算带来的新型威胁。

2.1 科学数据面临的传统安全风险在云环境中进一步放大

事实上,即便是传统的安全风险如数据丢失或泄露,一旦发生在云环境中,其转化为安全事件的可能性、损害的严重程度等都会呈倍数增长。原因在于,基于云计算的海量数据挖掘成为可能,随着数据挖掘技术的发展其成本也大大降低,数据可能更容易被恶意挖掘、加工和利用,为祸尤烈。2019 年9 月,德国Greenbone Networks公司的漏洞分析与管理专家披露,存放在600个未受保护的服务器中的医疗放射图像数据泄露,涉及52国2,000多万人,泄露的图像超过7.37亿个,其中有4亿个医疗放射图像可以访问,或者能从互联网上轻松下载,包括从中国14 个未受保护的医学影像归档和通信系统(PACS)服务器系统上泄露的27.9万个医学成像数据记录。泄露的数据大多为敏感数据,主要包括患者姓名、出生日期、检查日期、检查范围、成像程序的类型、主治医师、研究所/诊所以及医疗影像对应的生物特征等[8]。如此大规模的敏感数据一旦落入不法分子之手,借助云计算、大数据技术进行数据挖掘,抑或进行黑市交易,其所承载的安全与隐私风险将被无限放大,后果不堪设想。

2.2 云环境中科学数据面临的新威胁

正如云安全联盟(CSA)所言,云服务共享、按需所取的特性带来了新的安全问题。表面看,云计算中心是最可靠、最安全的数据存储中心,云端存取科学数据似乎是更安全的解决方案。实际上,与传统的信息技术环境相比,云计算的应用使得科学数据面临许多新的安全威胁。具体而言,新型威胁主要包括3个方面:虚拟化技术广泛应用带来的安全威胁、基于云计算资源的安全攻击以及云服务商带来的安全威胁。这些威胁使云环境中科学数据面临的安全环境愈加复杂,影响到安全保障的技术与管理机制[9]。服务器虚拟化存在的诸多安全漏洞为攻击者留下可乘之机,利用这些漏洞能直接控制虚拟机的管理层hypervisor,从而控制物理主机上的所有虚拟机。虽然可以采用硬盘分区来实现逻辑隔离、选择具有TPM安全模块的物理服务器等方法以降低安全威胁,但迄今依然没有办法可以完全消除虚拟化的安全威胁。基于云计算资源的安全攻击事件时有发生,云计算拒绝服务攻击日渐由利用大量数据流进行暴力式攻击转变为针对基础应用程序的技术性攻击。2012年维基解密在遭到DDoS 攻击后,不得已迁移到云服务商CloudFlare上,2014年2月CloudFlare的客户再受攻击,包括4chan、维基解密在内的78.5万个网站的安全服务受到影响。2014年12月20-21日,部署在阿里云上的一家知名游戏公司遭遇长达14小时的DDoS攻击[10]。2013年美国MSSP Prolexic在全球的4个节点成功防护了一起大型的针对金融机构的DNS反射DDoS攻击(DrDDoS)。云服务商既可能带来内部威胁,也可能带来外部威胁。由于云服务存储着更大量的数据,云服务商成为越来越重要的目标,如果其安全策略与安全等级不理想,存放其云上的数据将面临严峻的外部威胁。此外,数据为一种参与社会分配的重要生产要素,云服务商及其在岗或者离职员工、系统管理员、外包人员、商业伙伴是否经得住数据红利的诱惑,不进行监守自盗?比如,美国Facebook公司擅用海量用户数据牟利,网络安全公司Avast被曝售卖4亿用户数据[11]。这种内部威胁也不可小觑。

3 云环境中科学数据的安全风险类型

云计算促进了数据的流动与利用,云环境中的数据由于脱离了数据主体的控制而滋生了比在传统网络环境中更高的安全风险。根据所涉主体与来源的不同,云环境中的数据安全风险主要分为4类:一是研发人员访问云中科学数据库所致的安全风险;二是作者通过云平台进行论文投稿所面临的数据安全风险;三是政府部门建立科学数据云平台并提供数据服务所蕴含的数据安全风险;四是别有用心的外国政府的持续监视与入侵活动给科学数据主体及其管理者带来的风险。

3.1 访问云中科学数据库的安全风险

访问云中科学数据库的数据安全风险有两类:科学数据库本身的安全问题和访问者的行踪被跟踪并被挖掘利用所致的安全风险。大数据专家与信息隐私专家舍恩伯格指出,大数据的价值不再单纯来源于它的基本用途,而更多源于它的二次利用[12]。大数据的红利与数据安全风险往往是一枚硬币的两面。

第一类安全风险主要是指,因科学数据库本身的安全问题使用户账号密码等置于不确定的风险之中。科学数据库因黑客攻击或内部窃取而发生数据泄露或损坏并不鲜见,在云端存储的科学数据库,往往是海量数据的汇聚,提供实时在线服务,其面临的数据安全威胁除常见的外部黑客攻击,也有“上帝之手”的隐忧。因为各类SaaS、PaaS和IaaS服务商对数据事实上享有不同程度的控制权,不管是有心(安装后门)、疏忽(技术漏洞)或是无奈(配合公权力部门执法),云服务商于科学数据库的数据安全而言,也是一类现实的风险源。科学数据库存在被黑客攻击或窃取,导致用户账号密码等数据泄露的风险,容易因黑客的“撞库”攻击而给用户带来财产乃至人身的损失或威胁。

第二类安全风险缘于访问者行踪数据,既关乎个人隐私,也关乎商业秘密。如果对某企业的研发骨干或研发团队访问数据库的踪迹数据结合搜索内容进行数据挖掘,难免暴露相关核心技术秘密。科学研究是有继承性的,这意味着科学数据资源是各国创新活动的核心要素,也是研发者进行创新的养料与基础。随着云计算技术在科技领域的普遍应用与深入渗透,海量科学数据在云端聚集。云计算为大数据挖掘与分析提供了算力的支持,使得通过大数据分析追踪竞争对手的研发机密成为可能。如果这类数据聚集到足够大的量,如对某国某技术领域核心研发人员的学术搜索记录进行跟踪和分析,则有可能泄露国家机密。我国科研人员几乎每天都在访问堪称须臾不可或缺的学术资源——欧美科学数据库资源,蕴含着机密信息泄露的隐患,即追踪科研人员在科学数据库中的检索行踪,利用大数据分析,掌握我国当前乃至未来一段时间的科研机密。

美国IT界“八大金刚”在中国信息网络体系的渗透颇深,我国学术机构也概莫能外,不管是学术机构的信息系统与硬件设备,还是研究人员的电脑、操作系统、输入法,思科的路由器、英特尔的芯片、微软的操作系统、苹果的手提电脑在各学术机构中随处可见。中国学术机构中由美国服务商提供的产品占相当高的比例[13]。美国《爱国者法案》规定:“通过系统所有者授权,政府可以监听正在使用中的计算机系统。”[14]这一定义十分广泛,可以解释为对于任何计算机政府都有权监听,实际上赋予美国政府获取所有美国公司客户数据的权利,背后蕴含的数据安全风险使得其自通过以来在美国一直有激烈的存废之争。但是,美国《澄清域外合法使用数据法案》(俗称《云法案》)更是通过立法方式明确美国情报机构等政府部门可以将手伸到他国领土,获取美国云服务商存储在全球任何地方的用户数据,在这样的法律环境下科学数据面临的安全风险显而易见。

3.2 期刊、会议论文投稿系统中的数据安全风险

2018 年8 月“NIPS 2018 论文提交系统”被曝存在安全漏洞,导致审稿信息泄露,双盲评审失效,即审稿人可以判断出单篇论文的姓名和机构。这是存在于整个论文提交和审稿底层系统的问题,NIPS 2018 论文提交系统采用的是MS CMT3 系统,该系统已被国际机器学习大会(International Conference on Machine Learning,ICML)、国际计算机视觉会议(International Conference on Computer Vision,ICCV)等1,000多个使用双盲和单盲评审的国际学术会议使用,仅NIPS 2018论文提交系统泄露的信息就涉及上万篇论文、上千名审稿人[15]。毋庸置疑,这些被泄露的科学论文及其相关数据被置于不确定的风险之中,而论文作者与审稿人账户信息的泄露同样蕴含安全风险,因为通过“撞库”可能会危及涉及其财产或隐私的其他信息系统的账户密码安全。

3.3 科学数据云平台服务中的安全风险

科学数据开放能加速知识的扩散与传播,推动科技创新,促进科研范式转变,助力重大科技成果的产出和国家科技创新能力的提升。但是,缺乏配套安全评估机制的科学数据开放计划背后蕴藏着国家科学数据安全风险。我国建有中国科技云[16]、中国科学院数据云[17]等平台,2018年前科技数据云应用主要停留在云存储、云归档等层面[18]。2018年4月12日上线的中国科技云是中国第一个服务科研人员的“云”门户,将科学家要在各个网站上寻找的数据和计算工具整合在一个网站上,分门别类地提供服务,按需使用。中国科技云是一个基于云计算的国家科研信息化基础设施,是为我国科技界打造的专有云,已集成基础设施、科研软件、信息资源、科研社区、超融合通讯等5大类科研支撑平台。用户实名注册中国科技云通行证后,即可享受全新的云服务,包括获取网络传输、云计算、云存储、通用型大数据处理环境、高性能计算网格、人工智能计算等多项基础设施资源服务,上传、评价、下载和在线运行科研软件,以及关联搜索和共享文献、知识产权、领域云数据库等科研信息资源。笔者对中国科技云与中国科学院数据云进行持续的安全测试,发现它们均存在明显的数据安全隐患。中国科学院数据云(http://www.csdb.cn)数据汇集入口http://www.scidb.cn/和中国科技云(http://www.cstcloud.cn)对应的IP都归属于中国科学院计算机网络信息中心,均采用标准的云架构,提供计算与存储等服务。嗅探中国科学院数据云网站,可知其web服务器采用开源的openResty,只开放80 和443 端口;而中国科技云web服务采用的是PHP服务器,只开放80端口。中国科学院计算机网络信息中心的技术支持方为青云软件。从技术视角看,上述几个网站的主要安全风险在于主要采用http 协议,仅部分采用https协议。http协议通信使用明文,内容容易被窃听,不验证通信方身份,有可能遭遇伪装;无法验证报文的完整性,传输的内容可能会被篡改,而且并未发现上述网站购买专业的第三方安全服务,也未做反爬虫机制的验证,可能面临零日漏洞与DDoS等多种安全风险。

3.4 外国情报机构监视与入侵带来的数据安全风险

云环境中外国情报机构的监视与入侵活动一直都在暗暗进行。美国除通过《爱国者法案》《云法案》等法律授权获取数据,其情报机构的监视活动也从未间断,这种监视对学术机构也未能幸免。斯诺登在2013年6月披露美国持续、高密度、集中式入侵清华大学的网络系统,而中国骨干网之一的中国教育和科研计算机网总控中心就设在清华大学,它支持和保障多项科研、教育类国家重要网络应用项目[19]。这意味着我国学术领域的国家机密——研发投入方向、研发布局与进展等数据和信息被置于险境。在信息经济时代尤其是大数据时代,科学数据是核心的创新资源与竞争资源,各国都毫无例外地重视科学数据的安全与保护,科学数据安全已成为国家信息安全战略的重要组成部分。发达国家普遍实施国家信息安全战略,将其作为国家在全球竞争中占据领先优势的重要武器。

4 云环境中科学数据安全风险的主要治理模式

云环境中科学数据安全风险的治理主要有3种模式:技术治理、法律治理和“技术+法律”治理,这也是云计算发展较早的国家所经历的3个阶段。不同发展阶段、不同类别的数据安全风险,采用不同的治理策略。从发展脉络看,云计算发展之初,云中的科学数据安全风险治理以技术治理为主。一方面是因为云计算技术发展早期相应的新规则尚未制定,另一方面是因为技术治理往往比其他治理手段成本低、见效快。随着云计算技术的深度渗透和广泛应用,云环境变得异常复杂,单纯的技术治理变得无能为力,破解数据保护难题的努力逐渐从技术层面向法律(规则)层面深度渗透。其后,云计算技术与云应用日趋成熟,科学数据安全风险的治理又逐渐过渡为“技术+法律”治理。为此,需要审慎选择如何配置好技术与法律资源,实现技术与法律的双轮驱动,治理好科学数据安全风险。

4.1 技术治理

一般来说,技术治理是最为快捷、成本最为低廉的治理举措,在云计算与大数据发展初期,通过技术手段实行自力救济往往是数据安全风险治理的首选模式。因此,在云环境下云安全产业快速发展。有些安全风险通过技术手段可以解决,如针对访问云中科学数据库的安全风险,不少数据库服务提供商开始承诺或采取安全技术措施,包括以用户协议承诺不收集数据库用户提交的数据或其检索痕迹数据,有些数据库平台还在检索界面提供可选择的数据“删除”按钮。譬如,某全球品牌数据库承诺不以任何方式存储用户所提交的图像副本,一旦完成对图像的分析,所有记录将从服务器删除,不保留用户检索的图像的任何记录。再如,专利数据分析系统Patentics在首页设有“删除”按钮,用户可点击该按钮,选择删除其在数据库的任何数字踪迹,以确保搜索记录不被记载。对科技论文投稿系统、中国科技云与中国科学院数据云等涉及的数据安全风险,也可以通过采取提高安全等级等手段来治理,如将http协议改为https协议,降低科学数据传输的安全风险。对于外国情报机构的监视与入侵风险,可以通过提高关键信息基础设施的安全等级来加以防范。

4.2 法律治理

并非所有问题都可以通过技术措施予以解决,当技术对数据的保护“无能为力”或成本过高时,法律成为构建DT(Data Technology)时代新秩序、解决普遍性问题的必然选择[20]。

(1)科学数据安全与数据保护法律制度的完备性密切相关。不同国家有不同的法律保障水平,蕴含着不同程度的数据安全风险因素。当然,同一个国家在不同的阶段,法律保障水平会发生变化,所面临的数据安全风险也随之改变。随着云计算技术的迅速发展与广泛应用,法律治理逐渐成为不少国家和地区科学数据安全风险的主要治理模式。实践表明,科学数据安全与数据保护法律制度的完备程度密切相关。数据法律保护最严格的是欧洲大部分国家、加拿大、美国、澳大利亚、韩国、中国,其次是新西兰、日本、阿根廷等,再次是俄罗斯、巴西、墨西哥等;数据法律保护最低级别的国家有印度、巴基斯坦、土耳其等[21]。

比较2015年与2020年的数据保护法律完备程度,中国数据保护法律环境发生了巨变:2015年尚处于最低保护水平,2019年跃至第二层级保护水平,2020年则位居数据保护立法完备的国家行列。这个结论正是对中国近5年在数据立法上所做的种种努力的肯定。中国在云计算、大数据技术方面比不少发达国家起步晚,但近年进入实践应用阶段的速度比其他国家快,市场广阔,用户庞大。由于网络空间是新的空间,原本就缺少治理相关的法律法规,大多数用户缺乏自我保护意识,对云服务商也没有相应的行业规范进行约束,且缺乏行业自律,所以建立或探索法律治理路径成为社会共识,并付诸行动。近几年中国开始步入数据保护和网络治理制度建设的快车道,2015年至今出台了一系列法律法规,如颁布《网络安全法》《密码法》等新法,《国家情报法》《消费者权益保护法》等利用修改契机增加数据保护条文,配套的行政法规和部门规章、标准规范等也相继推出,2019年又将《个人信息保护法》《数据安全法》列入十三届全国人大常委会立法规划。这些已成立或即将出台的法律法规正是我国数据保护水平从最低级跃居最高(第一)级的原因,意味着我国正努力为科学数据的安全风险治理提供重要的法律保障。

(2)美国之外的国家形成法律主导型治理范式。美国凭借先发型的网络技术力量形成“网络霸权”地位,而后依靠创新型的云计算、大数据技术巩固“数据霸权”地位,整体上形成“技术型主导兼顾传统法律或权利”的模式。欧盟、中国和其他大多数国家为应对美国数据霸权的侵袭,在互联网、云计算、大数据等领域的技术相对落后的现实情况下,主要通过制定专门性法律规范确立和保护“数据权利”,通过提供私权救济的方式来达到维护国家数据主权安全的目的,整体上形成“法律主导型”治理范式。相对于美国的“进攻态势”,其他国家处于“防守态势”。处于防守态势的国家普遍认识到:既缺乏数据科技实力,又没有相应制度保障数据安全,盲目地开放和共享本国的数据资源,有可能将数据优势异化为威胁总体国家安全的风险。因此,对没有技术优势而处于防守态势的国家无疑会倾向于选择法律治理范式为主导。

(3)亟待构建数据安全风险法律治理的国家间合作机制。与传统网络环境下相比,云环境中科学数据安全风险的法律治理更需要国家间协作。因为科研创新活动需要获取全球相关科学数据,国际学术合作与交流必然需要科学数据的跨国传输,在现有法律环境下,数据的跨境传输蕴含制度性风险。譬如,美国通过出台《爱国者法案》《云法案》赋予公权力部门强监管权,是对其他国家数据安全的威胁。如果存放美国服务提供商云上的用户数据能被美国公权力部门合法监控与获取,那么这对他国科研人员、科研机构乃至国家科学数据安全而言是可怕的风险和威胁。中国大多数项目成果发表在SCI、EI收录的国际期刊上,这些论文及其相关数据一般存储在欧美出版集团的云端数据库,而美国《云法案》赋予包括情报机构在内的政府部门长臂管辖权,可以将手伸到他国领土,获取美国云服务商存储在全球任何地方的用户数据,科学数据面临的制度性安全风险由此可以想见。

4.3 技术治理+法律治理

云环境中科学数据安全风险的致因,既有技术因素,也有法律政策因素。前一种致因形成的数据安全风险的治理主体一般是学术机构(成员)或服务提供商,后一种致因则往往针对公权力部门。科学数据安全风险治理还涉及国家与国家之间的博弈。以美国《爱国者法案》《云法案》为例,对其他国家科学数据资源而言,蕴含很高的安全风险,学术机构(成员)或服务提供商很难治理这类风险,必要时需要国家出手。为此,各国正在紧锣密鼓地构建更完善的数据风险治理法律体系。单一的技术治理范式或是单一的法律治理范式都有局限,对科学数据安全风险采用“技术+法律”双管齐下的治理范式会取得更好的成效,融合两种模式,能达到1+1≥2的效果。

虽然云环境中科学数据安全风险的“技术+法律”联袂治理比单一的技术治理或单一的法律治理意义更大,但两种不同的治理方式要实现融通从而达到联袂治理实属不易。因此,需要研究各类安全风险的技术治理或法律治理效果、成本等,根据持续动态的观察结果进行治理方式的选择、调整和优化,通过对云环境中科学数据安全风险进行类型化分析,重点研究与不同类别安全风险相适宜的治理方式,根据不同类型、不同阶段的安全风险,选择技术治理、法律治理或组合二者的治理。二者组合进行联袂治理需要解决的问题是:何时采用技术治理,何时采用法律治理,或者说哪一类安全风险采用哪一种治理方式最适宜。这也是云环境中各国在推进科学数据共享时难以回避的挑战。

5 我国科学数据安全风险治理的主要对策

在党的十九届四中全会《中共中央关于坚持和完善中国特色社会主义制度 推进国家治理体系和治理能力现代化若干重大问题的决定》中,数据首次被作为生产要素之一参与社会分配[22],这意味着数据的价值在我国得到前所未有的重视,科学数据的安全问题因此显得尤为重要。虽然可以通过技术措施来保障科学数据安全,或通过法律方式防范科学数据安全风险,但当前亟待解决的问题是:如何发挥二者之所长,使技术治理与法律治理相得益彰。笔者认为当下治理云环境中科学数据安全风险可采取三大对策:一是发展数据安全产业,以提升科学数据安全风险的技术治理能力;二是构建以《数据安全法》为核心的数据保护法律体系;三是加强数据监管部门与机制建设,强化政府数据监管功能。

5.1 大力发展云安全产业,提升云安全技术实力

云环境中科学数据的安全与存储科学数据的云是否安全关联甚密。我国科学云的安全既取决于是否具备领先的云安全技术实力,更取决于能否从产业的高度构建完善的安全生态。领先的技术实力包括部署足够数量的服务器、保障云平台的稳定高效运行,通过安全防护手段化解大流量DDoS等恶意攻击。而云安全技术实力能否领先全球,很大程度上取决于我国能否大力发展云安全产业,构建适宜云安全技术发展的产业生态。目前美、德、日等国大力发展云计算产业,美国出台《联邦政府云战略》,德国推出“云计算行动计划”,日本实施“智能云计算战略”。

与美、德等国家云安全战略与行动计划的实施几乎同步的是,2014年以来微软、IBM、思科、AWS、Oracle、VMware等巨头纷纷收购云安全初创企业,进行云安全领域的战略布局。我国云安全产业起步虽晚,但发展迅速。根据IDC(Internet Data Center)发布的数据,全球云IT基础设施收入前5的供应商中,我国占3家(HPE/新华三、浪潮和联想),2020年第一季度这3家企业所占市场份额超过21%,仅次于美国供应商。新冠疫情的全球扩散迫使各行各业在线办公与运营的模式被激活,云服务需求激增,全球云服务市场获得显著的反周期逆势发展[23]。可见,大力发展我国云安全产业,培育自己的云安全巨头,不仅具备很好的基础,也有广阔的市场前景,这也是提升我国科学数据安全风险技术治理能力的必由之路。

5.2 构建以《数据安全法》为核心的数据保护法律体系

目前我国亟须健全科学数据安全法律保障体系。需重点考察美国通过《爱国者法案》《云法案》等国内法授权其情报机构监测、获取境外科学数据资源的具体条款与实施情况,剖析欧盟《通用数据保护条例》的“长臂管辖”规则对我国科学数据安全所构成的新型风险与威胁,在此基础上评估我国科学数据面临的外部制度风险,研究如何通过《数据安全法》及相关配套政策法规的出台,为我国科学数据安全提供制度保障,对来自境外的数据安全风险进行防控,未雨绸缪。

以《数据安全法》为核心的数据保护法律体系的构建,私法路径和公法路径可以并用。

就私法路径而言,可通过立法赋予数据主体权利或设置数据控制者义务,如以数据法益为内核配置数据拒绝权、数据限制处理权等。随着数据主体对其权利的主张,数据收集与滥用的乱象可望得到有效治理,数据融合由此受到必要的约束。此外,可借鉴GDPR数据控制者的义务与责任设置,对数据控制者的数据处理记录义务、数据泄露通知义务与数据保护影响评估义务等予以明确,通过审慎设定数据安全义务主体的义务与责任,平衡数据主体与数据控制者、处理者之间的利益,在确保数据产业得以迅速发展的同时,使数据安全风险能可防可控。

就公法路径而言,主要可通过强化国家数据主权和行政监管权,以权力制约权力。比如,通过加强数据跨境流动管控,以及数据资源的域外控制能力,使掌握科学大数据的外国公司与外国政府的威胁大大减弱。我国2017年实施的《网络安全法》对个人信息或重要数据本地化存储和管制性数据跨境传输做了相应规定,在一定程度上为国家数据主权的维护提供了基本的法律保障,但仍存在诸如安全评估不明确、违法成本过低的缺陷。因此,除应将安全评估提升到总体国家安全层面,强化安全评估义务主体的责任之外,还可借鉴欧盟GDPR中对违反该条例的服务提供者处以高达2,000万欧元或全球营业额4%罚款的规定来提高违法成本。此外,我国《网络安全法》适用于“境内建设、运营、维护和使用网络,以及网络安全的监督管理”,范围狭窄,有必要借鉴欧美“长臂管辖”的规定,突破物理空间的划分,拓宽管辖范围。

5.3 构建数据监管体制,强化数据监管

“徒法不足以自行”,数据安全法律法规的落地,既需要配套制度,也需要司法机构和行政执法机构的健全与良性运行。与司法维权相比,行政监管似乎更加便捷可行。事实上,从欧盟GDPR生效伊始,数据监管部门也确实是承担着第一顺位的数据安全保护义务。近两年一旦发生数据泄漏、过度采集、数据滥用等重大事件,美国联邦贸易委员会、欧盟及其成员国的数据监管机构便开出巨额罚单。比如,美国雅虎、德国网络托管公司1&1、美国健康保险公司Anthem等因泄露数据、违反数据保护法受到数据监管部门处罚,2020年4月美国联邦贸易委员会(FTC)对Facebook开出的50亿美元罚款得到司法确认。虽然司法救济是可行选择,但不管是从时效、举证难易程度还是维权成本,行政执法都有其难以比拟的优势。在现实社会生活中,往往只有行政规制失灵时,才有其他手段介入。

当前我国政府的数据监管权分散在互联网信息办公室(网信办)、公安部门、市场监督管理部门等机构中,可谓“九龙治水”。这种分散型的数据监管体制因资源分散、专业化程度不够高的原因,导致监管主体难以识别潜在的数据安全风险,也就不可能监管到位,因此必须加快数据监管领域的体制机制变革。近年各省市陆续组建大数据管理局、政府数据服务局等,是对DT时代面临的新挑战的积极回应。但当下尚处数据监管新机制的探索期,各地大数据管理局的定位、功能、权责设定远未完善,各地做法亦不统一,主要原因在于,现行法律对数据保护与监管缺乏足够和直接的规范,各地新成立的数据管理局以及网信办、公安机关等机构内的数据监管部门针对数据乱象,往往采用“头痛医头、脚痛医脚”式监管,如对涉嫌过度收集个人数据、滥用数据的服务商采取频频约谈、处罚整改等手段进行监管,这些举措难以从源头上遏制数据的窃取、泄露与滥用等乱象。鉴于云环境中对科学数据安全风险的监管有较高的技术门槛,有必要整合网信办、公安、市场监管等部门的专业人员与资源,组建专门的数据监管机构,完善监管机制,提升数据监管的专业化程度与监管力度。

6 结语

随着5G商用与人工智能的深度应用,大数据时代疾步走来,科学数据日趋重要,但也蕴含着日益严重的风险。随着数据密集型科学的形成,科学数据的安全风险与随之而来的影响也日渐严峻。云环境中科学数据安全风险不仅蕴含在科研人员日常访问科学数据库或常规的投稿活动中,也潜藏在科学数据云平台的运行之中,还有防不胜防的外国政府的监视与入侵。总而言之,安全风险与科学数据的开放和共享如影相随,而科学活动的本质决定了科学数据必须开放和共享,因而安全风险治理将贯穿整个科学数据的生命周期。与云计算技术发展与应用轨迹几近同步的是,科学数据安全风险治理范式经历了单一的技术治理、法律治理,到复合型的“技术+法律”治理的演进路径,其缘由主要在于云环境下科学数据的安全风险致因既有技术因素,亦有制度根源,技术与法律联袂治理方能保障科学数据安全,而这已成为当前各主要国家的共识与不约而同的选择。当然如何用好技术和法律,尤其是如何融合技术与法律举措,为科学数据的安全开放与共享提供体制与机制保障,堪称一个异常复杂的问题,需要理论界和实践界更进一步的关注和探索。

猜你喜欢

数据安全法律科学
我国5G数据安全保护供给不足,“四步”拉动产业发展
法律解释与自然法
法律讲堂之——管住自己的馋嘴巴
点击科学
云计算中基于用户隐私的数据安全保护方法
科学大爆炸
建立激励相容机制保护数据安全
大数据云计算环境下的数据安全
让人死亡的法律
科学拔牙