APP下载

大数据安全与隐私保护

2017-10-21刘洪霞

科技信息·中旬刊 2017年8期
关键词:隐私保护信息安全安全

刘洪霞

摘要:在互联网技术快速普及的影响下,人们已经进入了大数据时代,这对人们的工作、学习与生活产生了颠覆性的影响。以网络为依托的大数据已经成为了产业界学者研究的焦点。由于网络所附有的开放性特质,所以我们必须要重视大数据时代下数据的安全性,做好数据的安全管理,采用先进的技术做好隐私保护。降低大数据的风险,才能够让其发挥应有的作用。下文中笔者对大数据安全与隐私保护方面的问题进行了总结,旨在对相关工作的落实有所帮助。

关键词:大数据;安全;隐私保护;信息安全;研究

现如今,大数据依托于科技以及相关产业已经逐渐受到了人们的关注,它已经成为“云计算”之后信息产业发展的新的增长点。大数据在创造巨大的经济效益的同时,其中暴露出来的问题我们也无法忽视。每天都有数以亿计的人在依靠大数据获取互联网信息,这个过程中他们的个人信息也暴露在了互联网之上,为了保障用户的信息隐私,我们需要提高对于安全以及隐私保护问题的重视程度,革新现有的技术。

一、大数据的基本概述

1、来源

从概念层面来说,大数据主要指的是复杂且数量庞大、无法用现有的数据管理工具来进行处理的数据群。大数据的来源渠道主要包括以下几种:首先人为产生,人们使用计算机网络在互联网上发布的图片、文字、音频以及视频等数据信息是大数据的主要来源,人为增加的这类数据信息会对人们筛选获取信息的过程产生一定阻碍。其次机器产生,存储在计算机中并且由机器产生的各类日志、数据库以及文件等数据信息也是大数据的主要来源。最后计算机进行的设备数据记录也是大数据中非常重要的一部分来源,例如企业仓库记录的各类产品信息,天文望远镜中计算所得的物品属性类信息等等。【1】

2、特征

大数据的特征主要体现在以下几个方面:首先规模性。依托于大数据而集结的信息庞大、复杂,信息总量也一直处在不断上涨的趋势之下。综合相关数据分析,近些年总信息量已经达到了8ZB,因此规模性是大数据最典型的特征。其次多样性。过去大都依靠文本来完成对于数据的搜集,此种状态下的数据也大都是结构化的数据,这降低了数据储存以及查看的难度。【2】现如今在技术发展的影响之下,信息储存的样式也在不断增加,在储存文本的同时我们也通常需要储存图片、视频以及音频等资料,如此非结构化的数据越来越多。最后价值性。大数据的价值性主要指的是对储存的数据信息进行分析統计的过程,提取出其中有价值的信息让使用者使用,以满足不同的需求。此外,当前人们对信息处理效率的要求正在不断提高,对实时信息的需求量也在不断增加,从某种层面分析,信息的时效性也是其价值的体现。

二、大数据时代所面临的安全挑战

1、用户隐私的保护

因为大数据中的信息量非常庞杂,所以为了保证用户隐私信息的安全性必须要对其进行妥善的处理。就用户隐私保护而言,我们可以将其分为未知隐私保护、标识符匿名隐私保护以及连接关系间的匿名隐私保护等类别。企业依托于大数据,对用户的行为以及生活状态进行分析预测,更助于企业掌握用户的生活习惯、爱好以及消费记录情况。【3】以此为切入点,有针对性的进行广告推荐取得的效果更好。结合实际分析,“匿名处理”因操作简便等优势已经成为了首选的隐私保护手段,但实际工作中,这种方式取得的效果实在非常有限。单纯的隐藏用户的真实姓名根本无法完成对于用户隐私的保护,若继续沿用此种模式必然会引发一系列的问题。综上,大数据时代下我们需要创新用户的隐私保护模式。

2、大数据的可信度

基于大数据,在人们的认识里逐渐形成了一个错误的观点:数据可以说明一切,数据本身即是事实。殊不知这一观点不仅片面而且没有根据,如果不能仔细甄别数据信息,那么即便是大数据也会诱导我们作出错误的结论。这就像人如果一味的相信自己的眼睛,必然会在自己“看不到”的地方出错一样。

当前大数据可信度的威胁主要包括伪造、刻意捏造数据以及数据在传播中逐步失真两部分内容。首先若数据的应用场景已知,那么数据信息的发布者为了诱导信息使用者得出某种有利的结论,便会刻意伪造某些数据来营造出某种“假象”。这些伪造的数据信息会藏在大量真实的数据信息之中,人们在短时间内根本无法鉴别其真伪,此时在这些被伪造的信息影响之下人们往往会得出错误的结论。这类问题常见于点评网站之上,某些商品的虚假评论会混在真实评论之中,用户根本无法分辨,最终有可能会选择劣质的服务以及商品。互联网之上虚假信息的产生以及传播越来越容易,仅依靠现有的信息安全手段想要甄别所有信息的来源是不现实的。此外,人工干预的数据采集过程很容易会出现误差,由此而导致的数据失真或是出现偏差最终会影响数据分析的准确性。数据版本的变更也有可能会导致数据逐步失真,由此现实情况的变化,早期采集的数据根本无法反映真实的状况,这也会影响信息使用者的判断。

综上,基于大数据时代信息的使用者应该具备判断数据来源以及传播途径真实性的能力,以此来了解各类信息数据的可信度,避免得出有错或是无意义的结论。

三、大数据安全与隐私的保护措施

1、针对数据发布的匿名保护技术

基于结构化大数据,要想增强用户数据安全与隐私的保护,就必须强化数据发布匿名保护技术的研究,不断改进完善匿名保护技术。现阶段,国内针对大数据的匿名保护仍处在较为初级的阶段,保护的范围也只是局限在一次性用户静态发布的数据之上。今后还需要相关技术人员不断研究,从而扩大匿名保护的范围。此外,在数据信息多变性的影响之下,信息的发布大多不是一次性的,所以现有的技术条件根本无法对数据的发布实行匿名措施。

2、针对社交网络的匿名保护技术

用户在社交网络中发布的数据包含大量的隐私信息,现如今这类数据已经成为了大数据的主要来源。因其中图结构的数据占的比例较重,所以现有的数据保护技术无法对这类数据进行有效的保护。入侵者通过分析点与边的相关属性会完成数据的分析整合,这能够重新鉴定出用户的身份信息。所以针对社交网络中的信息所进行的匿名保护,必须依托于图结构的特征展开,在发布信息时就应该对能够标识用户信息的数据进行处理。此外,也应该对用户间的关系进行匿名处理,以提高用户信息匿名保护的力度。【4】

3、数据水印技术

所谓数据水印技术就是将那些可以进行标识的信息在不影响正常的数据内容和数据使用的前提下,用相对难以察觉的方式嵌入到数据载体之中,其中在媒体版权维护、数据库和文本文件的比较中应用的相对广泛。根据数据水印的作用我们可以将其分为强健水印类和脆弱水印类两种,强健水印类能够很好的保护原作者的创作权,而脆弱水印类则能够确保数据的真实性。不过数据水印技术多是在小范围内应用,因此需要我们加强对其的研究和应用,更好的发挥其作用。

【总结】

大数据时代下,数据量呈现出了爆炸式的增长。大数据在给用户带来便利的同时,也对用户个人信息的安全带来了极大的威胁。未来我们必须加强大数据安全技术的运用,以技术为依托,保证信息在储存、传递以及应用环节的安全性。上文笔者对此类问题进行了总结,旨在对相关工作的落实有所帮助。

参考文献:

[1]曹珍富,董晓蕾,周俊,沈佳辰,宁建廷,巩俊卿.大数据安全与隐私保护研究进展[J].计算机研究与发展,2016,53(10):2137-2151.

[2]冯登国,张敏,李昊.大数据安全与隐私保护[J].计算机学报,2014,37(01):246-258.

[3]崔洪刚,唐浩,汪永超.试论大数据安全与隐私保护[J].科技风,2016(07):92-93.

[4]吕欣,韩晓露.大数据安全和隐私保护技术架构研究[J].信息安全研究,2016,2(03):244-250.

猜你喜欢

隐私保护信息安全安全
信息安全不止单纯的技术问题
基于模糊综合评价法的信息安全风险评估模型
基于模糊综合评价法的信息安全风险评估模型
大数据环境下用户信息隐私泄露成因分析和保护对策
大数据安全与隐私保护的必要性及措施
社交网络中的隐私关注及隐私保护研究综述
大数据时代的隐私保护关键技术研究
2014第十五届中国信息安全大会奖项