“大数据”时代下数据分析存在的问题及对策研究
2018-12-07陈岳飞田明棋徐文见柏文琦
陈岳飞 田明棋 徐文见 柏文琦
1.中国计量科学研究院战略研究所 北京 100029
2.湖南省计量检测研究院 湖南长沙 410004
随着信息技术的迅猛进步,物联网、云计算、移动互联网和其他新兴技术的发展,使得计算机、传感器、移动装置和其他信息的持续流动快速增加。世界已经悄悄地进入了“大数据时期”,这些庞大的改变使我们使用以前的传统计算工具无法再应对各种新的挑战,这也引起了商业界、科学界和国家各个部门的注意。大数据指的是那些在当前主流软件工具的合理时间内,为了得到更好的信息,捕获、掌控、处理和分析信息。人们普遍认为,它有四个主要特点:大量数据、多个数据类别、快速生成和快速处理、低值性不高。美国政府将大数据视为“将来的命脉”,其应用能力将成为国家综合国力的标志,同时也将成为各国的重要资产。然而,随着数据的持续集中和信息量的增多,处理模式的变化也给我们带来了信息安全方面的一些新问题。
1 大数据时代带来的机遇
大数据技术的重心从传统的信息保存和传递到信息的提取和运用,给整个世界的商业形式带来巨大的变化,它的潜在应用意义将产生一个新的大市场。面临随处可见的数据,提出了对信息安全的新需求,随着技术的发展,信息安全产业的快速发展必然会到来,大数据技术有关的产业链也将迎来一个新的进步阶段。2012年,奥巴马政府发表了一份“大数据分析和进步倡导”,包括美国联邦政府的六个地域,目的是为了提高从大规模和复杂的数据中提取信息的能力,成为了美国“信息高速公路”规划和关键科技进步的新形式,此外,日本、英国、澳大利亚和其他国家发出了相应的策略和大数据技术,可以看出,大数据技术在未来科学技术发展中的关键地位以及它所带来的众多机会已经得到了全世界的重大重视。
2 信息安全技术在大数据时代面临的挑战
世界各地不同产业的大量数据的出现,要求更高的数据处理和分析的时效性以及有效性,这促进了大数据技术的迅猛进步。大数据是一个相对较新的含义,从某种程度上说,它是各种新技术的综合表现,包含一些新的分析技术、存储数据库、分布式测量等,与传统技术比较,它的构造、信息种类和工作形式都发生了很大改变[1]。许多新技术的整合和系统的工作将不可避免地带来许多新的问题。面对大数据技术需要分析的大量数据,我们在信息安全方面面临着以下新的挑战:
2.1 大数据将成为网络肆意攻击的目标
随着大数据中涉及的信息快速增长,其变得更加复杂和灵敏,所包含的价值更高,因此自然会导致更多攻击者的重视。一些定期扫描数据的安全系统也难以容纳如此大的容量。由于数据越来越集中,黑客的一次成功将给用户带来更多未知的缺损。由于最终用户比较复杂,传统的保护方法更难判断最终用户的合法性。
2.2 个人隐私信息的披露风险更大
由于网上购物、社交品台和在线输入信息需要使用更多的敏感个人信息,信息泄露的频率越来越高,自然地会使个人隐私信息被盗取的风险大大增加,如果用户对个人灵敏信息的使用不符合实际条件,可能会导致与各种信息的盗取。
2.3 信息存储和安全保护面临新挑战
由于要处理数据的几何增长,各种种类的信息以集中的方式聚集在一起,如果管理不合适,可能会导致数据被盗取,并直接影响信息分析的速度。有了如此大量的数据,传统的存储和安全保护方法就不能再适应安全需求了
2.4 大数据技术可用于网络攻击
由于大数据是对很多原始信息的阐述和处理,犯罪分子可以通过社交平台、微信、电子邮件和其他手段获取有用的数据,从而为网络攻击做好铺垫,使网络攻击更具针对性和有效性。
2.5 大数据成为先进的可持续攻击载体
大数据的特征为攻击者提供了良好的隐藏条件,使其能够进行可持续的数据处理和攻击,通过将攻击隐蔽在大数据当中,很难区分传统的真实配对分析和检验,因为先进的可持续攻击是一个明确的实际过程,很难实时捕捉到。攻击者可以很容易地装上攻击仪来误导安全监视。
3 大数据时代的信息安全应对办法
大数据时代给我们带来了新竞争和机会,面对全球信息的快速普及,各国和各机构不断使相关技术得到进步,以应付大数据时代所面对的竞争,同时促进世界科技发展,大数据时代信息安全领域的对策主要从以下几个方面思考。
3.1 制定相关政策
中国在“十二五”计划中纳入了物联网的发展,但在大数据方面却没有相应的回应和办法。大数据技术将在个人工作、企业策略乃至国家运转中扮演越来越关键的角色。每个国家都在竞争这一新的技术战略的高峰,国家有必要制定相关政策和计划来指导和支持这一战略。
3.2 加强对个人隐私信息的保护
由于在互联网上个人信息的使用次数越来越高,一些敏感信息很容易被泄露,而且由于大数据技术可以通过多种信息方式搜集和应对目标,处理相应的数据,并在某些领域加以使用[2]。例如,对一个人的消费目标、爱好等的准确分析,以及对个人的灵敏准确定位,对此类信息的拥有权和使用权应当在法律层面上准确规定和束缚,相应的监管机构应当严格保护个人的隐私信息不泄露。
3.3 加强网络安全
信息收集范围的扩大、类别的增多,使得网络信息的传递越来越频繁,大数据处理出来的信息含金量极高,这对网络攻击者的吸引力越来越强烈,导致他们使用各种方法取得信息,一旦攻击成功,将导致极大的物质和心理的不良影响。因此,保证网络安全在大数据时期产生着重要的影响。
3.4 注重发展安全防护技术
对于个人和组织,一些现有的信息安全政策和方法无法与大数据技术发展的要求相一致,面对大量数据,怎样进行合理的安全保护是面临的一个重要问题,在大数据时代,保护技术分析和发展的新信息、适应安全需求是我们应该努力达到的目标。
3.5 利用新技术应对先进的可持续攻击
随着大数据的进步,相关的关键技术包括:人工智能、机器模仿、语言分析、情绪处理、网络处理、空间处理、回归处理、聚类处理、时间序列处理、数据提取、遗传计算、神经系统、数据结合等此类技术的创新运用,已经显示出结果。面对先进的可持续攻击、攻击路径、通道不精准性、攻击时间长,隐藏性强的特征,总流量审计计划可以结合存储计算和人类的处理能力,产生巨大的实际监控能力。
4 大数据的特征
除了数据爆炸和数据构造演化等最基本的特征之外,个人还认为大数据拥有以下特征:首先,它是可以改变的,也就是说,数据随着事物的改变而改变;第二个是真实性,我们获得的数据并不完全正确,可能存在问题,收集的数据不是我们所想要的;第三是价值性,数据的价值有一定的时间限制,时间的流逝会导致其价值不复存在,如股票市场信息;第四是脆弱性,数据可能丢失或改变;第五是可视性,数据应该以合适的方式传递给用户,并适当地阐述,否则,很多用户都无法理解数据;第六是可证实性,包含数据的分析结果必须是可证实的,以验证它是否正确[3]。
5 结语
大数据时代已经渐渐到来,它使传统的信息系统结构被改变,将信息仓库转变为一个循环的、链接的和信息公用的数据天台,使人们能够使用以前无法有效使用的多种数据种类,把新的机会和竞争带给我们的世界。大数据时代的信息安全应全面思考到这些机会,同时也要全面思考所面临的竞争,并从多个角度、多个层面和多个方面确保信息安全运行。