关于大数据安全与隐私保护
2020-02-03刘金芳
刘金芳
(广西科技信息网络中心 广西壮族自治区南宁市 530000)
随着社会经济水平的不断发展,人们的安全隐私意识也逐渐觉醒,攻克种在计算机使用过程中可能造成的隐私泄露问题。在大数据的背景之下,信息来源十分复杂,对用户数据的过度收集是侵犯用户隐私的主要问题之一。同时,由于一些商家企业对消费者信息保护工作不到位的情况,导致许多重要的个人信息。被不法分子利用,发生了网络诈骗等问题,给用户的数据安全和财产安全都带来了严重的影响。在大数据支付逐步成熟的过程中,应当把对用户的信息安全问题作为一个重要的研究方向,通过技术升级和相关法律法规的保护措施避免发生隐私泄露的问题。
1 大数据技术的概述
1.1 大数据的概念
大数据技术是指通过收集大量基础信息,对用户的行为习惯和个人喜好进行针对性的预判,这一分析判断是基于用户的行为推断而来。大数据技术的重要依据就是庞大的数据量分析,通过对大概率事件的计算,找到用户的行为规律。对于许多商家企业来说,使用大数据技术对客户进行有效分析是提升其服务能力的重要方式之一。同时,通过对大量的用户行为进行分析判断,够有效保证企业的某一规划实施的有效性。
大数据信息基础的来源主要有两个方面。一方面,人在工作和生活中主动产生的大量信息是大数据信息最主要的来源,包括了人们主动在网络上发布的文字、图片等。这种主动产生的基础数据信息量很大,但可靠性较低,需要通过算法对比的方式来保证分析结果的有效性[1]。另一方面,由人的活动产生,在某些物体或机器上进行记录的数据也是组成大数据的一个部分。相较于人们主动发布的数据信息,这些由物体和机器记忆的信息更加准确可靠,通常也是作为验证主动信息准确性的参考依据。
1.2 大数据的特点
图1:大数据给用户数据带来的安全威胁
图2:安卓软件越界获取隐私权限总体
大数据技术具有规模庞大和虚拟结果两个基本特点。第一,大数据技术对基础信息的依赖性很强,只有足够庞大的数据支撑才能够保证分析结果的有效性。在用户的行为习惯不断培养和改变的过程中大数据的数据容量也在不断增加,其庞大的规模为算法计算和存储带来了许多问题[2]。第二,大数据技术的推测是面向未来的一种行为概率分析,其结果具有一定的虚拟性,需要使用者对结果进行甄别和判断后加以应用。如果盲目信服大数据技术的分析结果,可能会对商家企业的经营方向带来一定的偏差,导致经营出现不顺畅的情况。
2 大数据的安全与风险性
2.1 用户数据安全
大数据技术的不断推行和使用,给用户的数据安全造成了一定的风险。以商家企业的经营分析为例,商家需要通过用户的授权对用户的真实姓名联系方式等个人信息进行登记,通过消费记录和银行账户等关联可以掌握用户大量的基本信息。如果商家企业缺少必要的安全保护意识,对用户的信息没有进行妥善处理而造成了信息泄露,很有可能给不法分子留下作案余地。尤其是一些警惕意识不足的中老年,在犯罪分子能够准确报出个人的姓名电话时,很容易轻信他人的话语而造成财产损失[3]。另外,还有一些商家对隐私保护的观念有偏差,在设计消费案例的过程中,没有对用户的隐私进行保护,仅仅是隐去了用户的真实姓名,而保留了其他的许多数据,给用户造成了较大的影响。大数据给用户数据带来的安全威胁如图1 所示。
2.2 虚拟结论分析
大数据技术的工作原理是通过对用户大量基础数据的收集,对用户的行为和习惯进行一定的预测和判断。但是,由于基础数据信息的来源十分广泛,在收集过程中也很少加以甄别,导致推断出的结论有一定的虚拟性。大数据技术的研究对象是人,在实际生活和工作过程中产生的大量基础数据不一定都是真实有效的。如在对个人的消费能力进行估计时,可以通过银行流水数额进行判断。但在实际中,一些人的实际消费存在者以信用卡支出作为超前消费的支撑,大量的银行流水并不能证明个人的实际储蓄。基础数据信息在录入过程中也是由人工完成的,很有可能会因为操作失误而引发数据信息都错乱,在此基础上判断出的结果有时会有一定的误导性[4]。我们在大数据技术上的发展还处在初级阶段,必须要通过升级技术、完善算法的方式来提升大数据结论的可靠性。
2.3 访问链接安全
因为我国人口基数众多,人们的日常活动也较为复杂,产生的数据信息量十分庞大,数据在访问、提取和存储的过程中都会存在一定的安全风险。一是目前的大数据技术中还没有建立起完善的协调组织,不同的商家企业在提取用户数据的过程中需要一定的访问授权。在这种跨部门、跨企业的数据信息收集过程中,系统很难区分提取对象的权限性,可能会导致提取困难或信息丢失的风险。二是大数据的信息量十分庞大,如何对其进行妥善存储处理关系着数据信息的安全性。目前的大数据信息存储主要采取了云的方式,开辟大量的云空间来保存。由于云的处理方式打破了地域环境和实体存储的限制,在目前没有明确的法律法规对其所属权利进行划分,导致一部分数据信息受到侵犯的用户维权困难的问题。
3 提升用户安全与隐私的对策
3.1 完善相关技术
由于当前我们在大数据技术方面的研究还不够深入,存在着或多或少技术问题需要不断进行优化和解决。
(1)在大数据进行信息预测的过程中需要对算法进行优化,以提高分析结果的可靠性。由于大数据技术的工作原理是通过大量的基础数据推断出用户的喜好和行为,对数据信息来源的广泛性提出了一定的要求,只有基础数量充足的数据支撑才能够有效避免个别虚假数据对结果带来的影响[5]。在蚊虫的数据收集工作之后,还需要通过对比相关数据之间的差异来判断数据有效性,对于数据量差异较大的两个数据可以同时进行舍弃。
(2)在云计算和云存储的过程中,要注意对数据库的建立工作,提升大数据计算的稳定性,保证大量的数据资源能够进行妥善管理。如图2 所示。
3.2 健全法律法规
大数据技术的发展时间较短,国家还没有建立起完善的法律法规对用户的隐私信息进行有效保护,这也是目前属于大数据技术的一个弊端。
(1)一般认为在得到用户授权之后可以对其其信息进行提取和收集,但前提是建立在商家企业要将信息收集相关工作的内容、用途等详尽地告知用户,若出现隐瞒和未告知的情况下,用户的授权可被认定为无效。
(2)用户对商家企业的授权仅限于当次的数据信息提取,并不代表商家企业有权利对用户的信息进行二次加工或售卖。若存在倒卖用户个人隐私情况的商家企业,必须通过法律法规的手段对其进行严厉的惩罚。
(3)在使用云数据计算的过程中应当明确数据信息的所有权归属,云存储方是否有权利对复制信息进行提取和使用需要通过计算机专家的研究来决定,并和用户签订必要的隐私协议。
3.3 使用匿名保护
使用匿名保护技术是对用户个人信息的重要方式,但同时也会带来一定的网络问题,如何兼顾网络实名制和隐私匿名保护手段是需要计算机专家进行深入研究的一个重要方向。
(1)通过对用户真实姓名、联系方式等基础信息进行匿名保护的方式,可以从数据的提取和使用方面进行有效防护。通过不同的权限设计,保证了用户的实际隐私数据不会随意被工作人员恶意提取售卖,提高了数据保护的质量[6]。
(2)通过匿名保护的手段对数据的有效性进行了清晰的划分,能够对用户行为和喜好进行有效预测的数据和涉及用户个人隐私的基础数据进行了不同等级的匿名保护,在需要使用数据进行预测分析时再施加不同程度的还原手段,以计算机算法工作的复杂性有效保护了用户隐私泄露的可能。
3.4 添加数据水印
对于一些涉及著作版权和数据来源的重要隐私数据,可以通过添加数据水印的方式实施有效保护。
(1)一些高精尖的科研实验数据十分重要,对其科研的结果有很大影响,如果被不法分子恶意盗取,会产生如著作权、知识版权等方面的纠纷。为了避免这一现象的发生,可以在数据的传输过程中添加一些来源水印,在提取时这标明了数据信息的所属情况,又不影响提取者的阅读和使用[7]。这种添加数据水印的方式也是在许多图片、视频领域中的重要保护方式。
(2)由于对隐私数据添加水印的手段涉及一些嵌入式的技术手段,在实际使用过程中的应用范围较小,还需要进行大力的推广和研究,将数据水印的添加手段不断普及化。
3.5 完善监督管理
在目前的大数据技术使用过程中缺乏明确的第三方监督,对涉及与信息隐私相关的商家企业,必须有绝对权威的管理部门来保证工作的正常开展。首先,从大数据技术的运行过程中来看,信息来源十分广泛,经常会出现跨部门跨企业的信息采集工作,必须建立起一套完善的大数据技术应用处理流程,才能够保证健康发展。对大数据的应用实行监管需要依靠政府部门和计算机领域内的引领企业共同完成,制定合理的工作规范,在运行过程中保证对用户隐私的合理处理。其次,由于我国的大数据技术还在不断探索和完善的过程中,只有明确了监督和管理的职责才能够促进行业积极发展。当用户发生了隐私泄露的问题时,也能够找到明确的职能部门进行处理。
3.6 明确数据存储
使用云的存储方式对大量的基础数据进行存放是一种打破了地理限制和实体存储限制的重要方式,同时也是一种更加高效的存储和提取手段,相关的数据存储开发企业必须在日常工作中,完善和明确数据存储的方式,做好用户隐私管理的最后一道防线。
(1)在建立数据库对用户大量的基础数据进行存储的过程中,必须要建立明确的安全访问模式,并通过强制要求商家企业完善信息安全提取的模式来保证用户隐私不发生泄露[8]。
(2)云存储企业必须要向用户承诺,当用户想要通过移动端对个人的数据信息进行清除时能够快速完成数据销毁工作,并不在用户未授权的情况下,私自对用户的数据信息进行复制存储。为了提升云存储的有效性,在数据录入的过程中需要进行合法定位,防止数据保存时出现混淆和错误的情况。
3.7 提高安全意识
用户在使用于大数据技术相关的服务时应该提高个人的安全意识,把握好隐私泄露的源头。一是在手机,电脑和其他商家企业提供的服务时,应当谨慎授权。用户应该使用从正规渠道获取的应用软件,防止移动设备出现中毒的情况,并对系统提醒存在安全风险的应用及时关闭其访问权限,避免在不知情的情况下发生了个人隐私的泄露。二是用户应当掌握基本的数据保护常识,如不点击陌生链接、不随意输入重要密码等。如果出现了个人隐私泄露或财产损失的情况,应当及时报警处理,避免问题的进一步扩大。用户应当对大数据技术秉持着正确的态度,不盲目信服大数据的分析结果,同时也不畏惧大数据技术的正常应用。
4 结束语
总之,我们在大数据研究的领域发展时间较短,相关技术和法律法规都不够完善,还需要从实践应用的过程中不断发现问题、解决问题。在数据结构化的过程中使用匿名保护手段是对用户数据信息的重要保护方式,但具体应当如何合理平衡匿名保护和实名制使用还需要网络专家进行深入研究。通过对个人数据信息添加水印的方式能够快速定位数据信息的来源,对于有版权保护和其他重要应用的起源数据有较好的保护作用。在数据信息不断进步的背景之下,人们也应该提高个人的数据安全意识,在使用过程中加强自我防护,共同防护隐私泄露问题。