大数据应用模式与安全风险探究
2017-03-27黄世荣
黄世荣
摘要:随着信息技术的广泛使用,各行业在近几年所积累的数据成倍增长,对数据的分析与使用已经成为了专门的学科领域。随着大数据生成速度的不断加快,数据量也不断膨胀,给数据安全带来更大风险。本文从大数据的定义出发,探讨大数据应用的本质特征并对大数据的风险进行简要的探究。
关键词:大数据;应用模式;安全风险
中图分类号: TP309 文献标识码:A 文章编号:1672-3791(2017)01(a)-0000-00
一、大数据的定义及应用特征
随着数据数量的不断增长,大数据的重要性日益得到了广泛的认同。但是,目前对大数据的概念还有不同理解,人们似乎还认为大数据是个抽象的概念,从大数据的本质出发,更深刻的理解大数据在社会经济等各方面的内涵,对于探讨大数据的应用模式和安全风险控制具有重要意义。
1.大数据的基本定义
2011年,全球麦肯锡咨询公司将大数据的根据形象的描述为下一个时代创新与生产力的最前沿。生动的指出了大数据是基于创新思想,超出了传统数据库范畴的,用来收集、存储、管理和分析数据信息的方式。首先,大数据的数量是随着时间的增长而不断增长的。其次,不同层级的机构拥有和需要的数据集是不同的,当前通用的大数据计算单位是TB。第三,大数据从数量、速度和各类三个维度对大数据进行描述,从而也从这三个维度对大数据进行控制。因此,数据不断庞大,拥有时效性和数据存在形式的多样性,使大数据理论颠覆了传统的数据库理论,使信息技术站在了时代的最前沿。虽然学界对大数据的定义莫衷一是,数据的生成、采集、存储、处理(分析)是大数据的基本要素。
2.大数据的主要应用特征
大数据的主要应用特征有以下几方面:首先,大数据的数据量巨大,数据增长量通常以几何级数的形式来进行计算。其次,数据类型繁多、原始类数据、多元型数据、函数数据等种类多样。第三,数据处理速度不断加快,随着计算机技术的快速发展,数据运算和处理的能力越来越强,在数据分析中会为用户提供大量有价值信息。通过对大数据的研究可以发现,大数据可以用来进行趋势推测,可以对个体数据进行剔除,可以用来对社会现象进行预测,也可以用来进行个性化的预测。大数据的应用范围广泛,数据处理能力越来越强,可以更长的时间和更广的范围为用户提供依据。通过对大数据的分析,还能对真相进行有效辨识。
二、大数据的应用模式
大数据的应用模式建立在大数据的分析方式基础之上,布隆过滤器、散列法、索引等方法都可以根据数据的规模,对数据进行有效的分析,从而为应用提供良好的基础。大数据的应用有自身从不成熟到成熟的演变过程,最后广泛的应用于社会经济的各个领域,从而为广大用户熟知和使用。
1.大数据的应用演化
大数据最初的应用是海量数据进行检索的互联网搜索平台,在互联网搜索平台的助推下,大数据逐渐演出多种应用模式。首先,在商业系统,最初是将企业的数据收集存储到关系型数据库系统中,以便于查询和联机处理。随着互联网用户的增多,点击商业网站用户的信息日益增加,数据日志、用户行为可在网站上获取,从而为企业分析用户提供了基本数据。其次,互联网最初只用来传递电子邮件,在线社交的频繁,视频、图片、音频等不同结构类型的数据增加,使非结构化数据技术不断成熟。第三,科学研究领域为了收集大量数据,研究了数据分析、共享的平台,使大数据广泛应用成为可能。历经上述演化过程,根据数据的产生方式和结构特点,大数据主要应用在结构化数据、文本、WEB、多媒体、移动数据这6个领域里,并形成了相应的数据应用模式
2.大数据的主要应用模式
在科学的数据分析的基础之上,大数据的应用主要有以下几种模式:首先,租售数据的模式。通过广泛的收集数据,采用相关的数据分析技术,过滤到无关联的数据,保留时效性较强的数据,定期为各行业提供数据服务的模式。有效而且庞大的数据库是其它这种数据应用模式的基础。其次,租售信息的模式。这种模式集中于某一行业或领域,广泛收集行业有关数据,再庞大数据处理能力的支持下,对数据进行有效整合,从而采集到对行业发展有价值的信息,向行业内企业出售信息来获取回报的应用模式。第三,数字媒体的模式,主要利用新型网絡媒体,充分发挥新媒体传递信息速度快,可以实时进行传递、可进行有效互动的优势,对准特定的客户群体,提供精准的快捷信息服务,同时能获得有效的反馈信息。第四,空间运营模式。主要是为了抢占更多的数据资源,从而获得数据资源的独享性。第五,云计算服务。主要针对用户的个性化需求,提供依托互联网的动态虚拟化的信息资源,企业不再需要购买大量的设备设施,只需要向服务商交纳相应用的使用费用即可。
三、大数据的安全风险控制
大数据的出现开户了新的时代,使数据的价值变得日渐重要,也为数据的安全带来的广泛的担忧。由于数据的规模更大、数据的各类更多,数据的结构也更加复杂,使维护数据安全的成本也随之不断提高,如何保证数据的安全转移,如何控制数据不出现冗余的问题,都是数量安全需要研究的问题:
1.保持大数据的隐私
数据信息量的海量增加,数据处理的不断开放,数据获取渠道的增多,给数据隐私带来了极大的挑战,面对大数据时代的互联网,数据隐私主要考虑两方面的问题:首先,如何保护个人的隐私。数据信息采集技术越强,数据分析能力进步的越快,用户就会在毫无察觉的情况下,将个人的兴趣、爱好、特征等信息被潜在的获取,用户甚至对已经被大数据分析出来的信息毫无察觉。其次,大数据获得的信息未经用户的许可,就将信息随意的传输和使用,在传输使用的过程中很可能存在着泄露的风险,如何保证大数据时代个人信息与隐私的安全,是大数据安全风险研究的首要命题。
2.保证大数据的质量
大数据的价值不仅源于庞大的数据量和快捷的速度,而且更来源于数据的质量。低质量的数据不仅浪费了互联网资源,而且还无法被有效利用,甚至阻碍了大数据的发展。数据的质量与数据的生成、数据的采集、数据的传统和存储都有关系。数据的质量突出的表现为数据的精准性、完整性、冗余度和一致性,虽然学界致力于消除数据的冗余问题,加强数据的质量,还应当充分的考虑数据的自我修复和自我检测的功能研发。
3.有效的安全机制
大数据种类的不断丰富,给数据的安全带来更大的风险,以往小规模加密的方法,不可能有效的在大数据时代应用。研究更高级别的密码学方法,应当针对不同的数据结构和非结构数据,采用不同的数据加密方法,从而更好的促进数据安全。同时,在当前大数据使用越来越广泛今天,需要加强研发对数据的隔离措施,要建立对数据的可追溯机制,要使数据的可用性、可控性和完整性在高效的前提下都得到较好的保持。
4.大数据在安全领域的应用
保证大数据的安全,是信息技术研究的课题。同样大数据也改革了信息技术,从而为信息安全技术发展带来了革命,使信息安全技术走向了新的舞台。例如,通过对入侵日志的分析,就可以发现潜在的安全漏洞,从而可以应对更高级别的安全威胁。通过对计算机病毒和漏洞的分析,就可以掌握某类型病毒或漏洞的特征,从而对更有效的应对这类威胁采用更好的方法。
结语:对于大数据应用模式的研究,应当从社会发展的实际需要做起,要根据实际情况,有效的整合云计算为代表的数据处理技术和存储技术的研究,开发出更先进的应用模式,使大数据的深化历程加快发展。通过对大数据风险的控制,可以更好的促进数据广泛的应用于社会经济各个领域。
参考文献:
[1]黄伟.基于SDS架构的多级DDoS防护机制[J].计算机工程与应用,2014,(05):26-27.
[2]冯永强,张良,冯怡,朱尚杰. 大数据应用的现状与展望[J].信息化建设. 2015(12):118.