APP下载

浅析大数据安全与隐私保护技术

2019-12-24◆李

网络安全技术与应用 2019年2期
关键词:数据安全用户分析

◆李 晓

浅析大数据安全与隐私保护技术

◆李 晓

(太原市高级技工学校 山西 030021)

大数据技术的研究与开发是现阶段学术界的热点对象,对人们的生活与工作有着重要的影响。但大数据技术在当前阶段下仍存在着较多的弊端,在数据收集、数据信息存储及数据的使用方面仍有着较多的安全风险,隐私信息的泄露问题给用户的生活和工作带来了严重的影响,虚假数据问题能致使大数据分析结果的错误,甚至可能因大数据分析结果的错误造成严重损失。本文简要分析大数据的基本概述及特征,分析大数据技术在现阶段下的安全问题,研究分析大数据安全与隐私保护的关键技术。

大数据;数据安全;信息安全;隐私保护

0 引言

各行业领域都有着大量数据的统计与使用,需要大数据技术进行科学的管理与使用。大数据技术是在移动互联网技术、云计算技术以及物联网技术之后信息技术领域的重要标志。数据庞大而且结构复杂的数据管理系统,用户使用其进行数据信息的研究分析、统计与使用等有着较大的难度。数据庞大、结构复杂的大数据系统的处理及使用管理,不仅要重视数据信息的隐私安全问题,也要重视数据信息的真实性问题。大数据技术在当前阶段下的数据信息收集技术、综合应用技术等方面尚不成熟,大数据技术的使用存在着较多的安全隐患:缺乏数据信息的可靠性保障,用户隐私信息的泄漏问题等。信息技术行业为此需要进行不断的研究与探索以改善问题。

1 大数据

1.1 大数据的来源和特征

大数据的出现是由于现有的数据库管理技术或数据信息处理手段难以满足相应的技术要求。大数据是规模庞大与结构复杂数据信息的集合。这些数据信息的来源途径可分为:(1)人们自愿分享或发布的数据信息,如人们发布在互联网上的各种图片信息、文字信息、音频信息等;(2)机器运行产生的各种数据信息, 储存在计算机里的各种类型的日志数据、文件信息、数据库信息、媒体资料数据等;(3)物品属性类型的数据信息,设备信息数据记录,如仓库库存记录的各种类型的产品信息数据等。

大数据的特征:(1)规模性——大数据涵盖的信息数据庞大而且复杂,根据相关的统计数据分析,2012年统计所得的全球总信息量大约是2.7ZB,而2015年的统计数据分析得出已增加到8ZB;(2)多样性——为了使信息便于储存及查看,传统的手段主要是将数据信息以文本的形式存在。而如今社会发展的需要,记录信息数据的载体形式呈现多样化,如图片载体或音频载体等非结构化的信息载体在日益增多。(3)价值性——对总体数据信息进行针对性的分析和科学统计,从中筛选出有利用价值的数据信息,是大数据基本功能之一。(4)高速性——在信息数量呈爆炸式增长的时代,人们对庞大信息进行高效的处理并准确获取实用信息的需求不断增加。

1.2 大数据目标分析

大数据统计与分析技术通常用于科学领域、医学领域、商业领域等,不同领域涉及的数据信息各有不同,大数据的用途也有较大的差异。但无论什么领域对数据分析统计的目标通常是以下三种。

(1)为提取有利用价值的数据信息,原始数据信息数量大多较为庞大,而且较为复杂,利用大数据根据需要进行不同角度的数据分析、统计整合,最后统计出准确的信息数据,人们从而得以清晰知道事物的本质,把握目标事物的发展运作规律,才能准备预测事物接下来会如何发展。例如时装销售企业,其工作人员可对消费者的消费数据进行科学的分析与统计,便可掌握消费者的消费习惯及其消费需求,从而销售对应的产品,迎合客户的需要提升经济效益。

(2)对积累的信息数据进行多维度的统计与分析,使人们能清楚大体上的群体特征的同时,还能对不同个体之间进行差别的描述,企业能根据得出的分析数据信息为客户提供更加针对性的优质服务。

(3)在如今的社会网络无处不在,信息能经由网络迅速传播到指定地方,数据信息真假性的辨认识别尤为重要,需要大数据进行科学的分析。决策需要以数据为根据,错误的数据信息能使用户制定错误的决策,甚至是会导致难以挽回的损失。

2 大数据所面临的安全考验

2.1 大数据中用户隐私保护

近些年出现了关于用户的信息泄露事件,从这些事件来看,用户隐私的泄露成了用户的隐患。从保护用户隐私的内容来看,用户隐私可以分成以下几类:对标识符的匿名保护、对未知的隐私保护、对连接关系间的匿名保护。然而,用户隐私的泄露并不是用户的唯一困扰。有些企业为了得到用户的喜好、消费水平和习惯等,它们常常利用大数据分析来预测用户当前的日常行为和生活状态,并根据用户的习惯等推送广告,进而对用户产生困扰。现在,大部分企业在收集到用户信息时,只是简单地对用户隐私做匿名处理,他们觉得只要是不公开用户的标识符就能够保护好用户的隐私,实际上并没有很好地保护用户的隐私。关于用户信息收集、管理等方面的标准和条例目前尚未形成,企业在进行这些作业时,主要靠他们的自律。当然,用户有了解自己的信息在商业活动中怎么使用的权利。

2.2 大数据的可信度

大数据里有些数据本身具有迷惑性,甚至含有虚假成分。因此需要对数据进行认真细致的分析,以防上当。这种数据之所以会出现,是因为这些数据是由那些为了达到自己目的而随意编造出来的假数据;或者这些数据在工作人员收集时,由于工作人员的粗心而导致数据失真,使得最终收集到的数据和实际信息不同,进而影响到数据分析的结果;另外,信息数据的传播过程也可能造成数据的失真。因而,数据信息的可信度需要得以保证,数据信息的使用者要熟悉数据信息来自何处、数据信息的传播渠道以及其加工处理经过的过程等,谨防得到错误的结论。

3 大数据安全与隐私保护技术

3.1 数据发布匿名保护技术

对于结构化的数据信息来说,要切实保护用户私人数据信息的安全,数据科学应用匿名保护技术是重要的措施,但此项技术仍存在着不足需要改善。在当前阶段下的数据信息匿名保护技术的基本性理论,设定的环境基本上是使用者一次性的、静态的发布数据。但通常情况下现实是容易变化的,数据信息的发布基本上是连续的、次数较多的。在大数据信息庞大结构复杂的环境里,数据信息发布匿名保护技术的实现存在较大的难度。攻击者能从不同地方、不相同的发布渠道得到各种类型的信息。

3.2 社交网络匿名保护技术

有着许多用户隐私信息的非结构化数据大部分是来自于社交网络,这些类型的数据信息最为显著的特点是图结构,因此数据发布保护技术对这些类型数据难以进行有效的隐私安全保护。攻击者一般情况下会使用点与边的一些属性,经过相应的分析与信息整合,从而确定出用户准确的身份信息。因此,在社交网络技术中要科学应用数据安全与信息隐私保护技术。要切实结合图结构的性质特点,将用户进行标识的匿名保护和属性的匿名保护,并且要对用户间关系进行匿名保护,才能更好的起到隐私保护作用。

3.3 数据水印技术

水印技术的应用是在数据信息的原始内容及其使用不受影响的情况下,将可标识的信息以难以察觉发现的手段嵌入到相应的数据载体里。通常是应用在媒体版权的保护工作里,部分数据库技术和文本文件也利用水印技术。根据数据水印技术的应用作用可分为强健水印类型和脆弱水印类型,强健水印类型通常是应用于证明数据信息起源的作用,脆弱水印类型则应用于证明数据信息的真实性。

3.4 数据溯源技术

数据溯源技术的研发与应用最初是在数据库技术领域里,如今被科学应用到大数据信息安全与隐私保护技术中。为数据信息标记其来自何处,可有助于用户对数据真假性的判断,也有助于用户检验数据分析结果的准确性。

4 结束语

大数据技术的研发与应用,为其他技术的发展提供了支持,但同时也会面临更多的新问题、新的挑战,其中大数据信息安全与隐私信息保护技术的研发更是其中关键问题。分析大数据安全与隐私保护技术在现阶段的发展情况,并进行具体的研究以及相应的技术挖掘,简要分析了匿名保护技术、水印技术以及溯源技术的研究与应用可能对信息安全和隐私保护的研究有着重要作用,当然仍需要研究开发更多先进的隐私保护技术,才能更利于大数据的发展和应用。

[1]游康泽.大数据安全和隐私保护技术体系的关键技术研究[J].电脑知识与技术,2016.

[2]刘亮.大数据安全与隐私保护技术要点[J].信息与电脑(理论版),2016.

[3]于仕.大数据安全与隐私保护技术研究[J].数字技术与应用,2017.

猜你喜欢

数据安全用户分析
隐蔽失效适航要求符合性验证分析
云计算中基于用户隐私的数据安全保护方法
电力系统不平衡分析
建立激励相容机制保护数据安全
大数据云计算环境下的数据安全
关注用户
电力系统及其自动化发展趋势分析
关注用户
关注用户
大数据安全搜索与共享