浅谈大数据安全与隐私保护
2020-09-10冷同虎
冷同虎
【摘 要】进入20世纪以来,高新科技迅猛发展。移动通信技术的升级换代,使得智能穿戴设备、计算机等一系列高科技产品迅速地进入我国普通人的生活,同时也产生了前所未有的大量数据。目前我国大数据技术整体的发展阶段还处于初级阶段,有许多技术缺陷,实际应用中,数据安全与隐私保护方面有一定隐患。近些年,大数据方面研究成为相关部门和企业关注的重点对象。文章浅谈大数据环境下,信息和隐私保护,希望对大数据的合理应用有帮助。
【关键词】大数据;数据安全;隐私保护
一、大数据简单介绍
大数据这个概念起源于美国,大致从二十世纪初期,“大数据”开始流行于互联网信息技术行业。如今,大数据更是应用于各个行业,数据影响策略,数据大幅提高了社会智能化的程度。现在来说大数据有四个特征:数据的价值高、数据总量很大、数据产生速度极快、数据种类繁多。但是其价值密度低,就是海量数据中数据质量很低,有价值数据少。大数据的来源列举以下几个方面:1)个人产生数据。比方编写的文档、收发的图片、传播的音频、视频,以及交际媒体所产生的数据流等等。2)市场数据。例如电子商务数据、互联网浏览数据、企业系统数据、CRM系统数据、生产数据等。3)移动通信产生数据。智能生活设科技产品走进人们生活,产生大量数据。根据预测,2020年全球预计产生数据量50ZB左右,而已经过去的2019年为40ZB左右。大数据与每个人息息相关,它无处不在,影响着我们的工作、生活和学习,并将继续带来更大的影响。
二、数据安全与隐私保护相关面临考验以及法律法规
(一)大数据环境下,数据信息安全面临大量威胁
例如,搜集数据、存储信息、处理及分析数据、再銷毁某些数据[1]。安全的挑战包括大数据可信度、是否暴露了私密信息。在互联网框架下,这类安全威胁包含了存储信息、调取数据时的窃取隐私[3]。此外,如果没有配套完善的基础设施,数据很容易被偷听和窃取。此外,目前没有完善的数据安全相关的法律法规和标准,这会让有些不法分子钻空子,这涉及到数据安全和个人信息保护,使得大数据生态系统中的数据安全保护难度加大,个人信息泄露风险加剧。另一方面,大数据技术和平台安全也同样面临挑战,目前的大数据平台安全机制严重不足,大数据错综复杂的背景下,黑客的攻击意图更加明显,数据保护难度加大。
(二)我国有关隐私保护方面法律法规
当下,我国在保护个人隐私方面的法律法规有几十部,但仍缺少一部完整的网络数据安全隐私保护法,2020年,个人信息保护法与数据安全法也在拟定中,相信不久就会出台。我国目前存在的一些法律法规,如2017年实施《网络安全法》,就保护公民个人信息和网络空间安全做出了规定;2010年实施的《侵权责任法》规定划定被侵权人可以要求侵权人承当法律责任。这条法律说的范围较广,对于数据安全、隐私保护方面同样适用。对个人信息保护的还有2013年实施的《电信和互联网用户个人信息保护规定》,从事相关隐私信息工作人员履行职责中知悉了用户个人信息对应当保密,不能对这些数据进行违法行为。进行由以上列举的几条法律条文来看,我们迫切需要一部完整,紧跟时代的隐私保护法律,目前欧盟已经生效严格的数据、隐私保护法,我们可以积极借鉴。
三、大数据安全与隐私保护技术
典型的隐私保护技术手段包含:抑制、泛化、置换、扰动,裁剪等,也可以通过密码学技术保护隐私 [4]。
1.身份匿名
利用K-匿名模型,萨马拉蒂和斯威尼首先提出了适用于关系数据表的K-匿名模型;每个分组至少包含k条记录,因此,具有某个准标识符的每个记录至少k-1个都不能与其他记录区分开来,从而启用匿名用户身份保护[4]。该方法存在不足,不能抵抗链路攻击。K-匿名模型作为一种经典的身份隐私保护模型,在实际的隐私保护应用中仍然发挥着一定的作用,为用户提供了一定的隐私保护能力。
2.节点匿名
在图连接的信息社会网络中,攻击者可以通过目标用户节点的邻居社会关系形成的独特结构来重新识别用户。攻击者的背景知识大致可以分为三种类型:目标节点的节点度、节点附近子图的形状以及子图范围内节点的连通度[4]。这可以表现为三种不同的攻击方针对上述攻击,而节点匿名的目的是通过添加一定程度的抑制、替换或干扰来降低精确匹配的成功率。
3.属性匿名
社交关系也会泄露了用户属性,用户的社交网络记录已经成为隐私泄露的主要来源。用户部分属性与其社会结构有很高的相关性,属性相同的用户更容易成为朋友,形成密切相关的社区。结合其社会结构和朋友关系,可以推断出用户的未标记属性。人以群分,针对这一问题,需要制定一种关于属性社会网络的属性匿名保护方案。
四、结语
大数据是这个时代的必然产物,它为人类社会发展做出了巨大贡献,同时带来了巨大的风险,特别是隐私以及数据安全上,我们需要借助先进的技术,维护好大数据的隐私和安全,让大数据应用更加可靠。建议加强大数据技术在大数据生态系统功能安全和网络安全防护方面的研究,例如入侵检测、安全状态检测、网络攻击取证、威胁分析等,以利用大数据技术抵御对大数据生态系统的网络攻击威胁。目前这大数据产业化发展的安全技术、机制没有统一的标准,需要借助行业或团队标准等对国家标准进行丰富。
【参考文献】
[1]杨奔.试论大数据安全与隐私保护[J].计算机产品与流通,2020(06):115.
[2]叶晓俊,金涛,刘璘.大数据安全标准现状和思考[J].科技导报,2020,38(03):94-102.
[3]刘亮.大数据安全与隐私保护技术要点[J].信息与电脑(理论版),2016(06):218-219.
[4]冯登国 等.大数据安全与隐私保护[M].北京,清华大学出版社,2018:176-192.