APP下载

大数据管理:概念、技术与挑战

2016-12-31刘韵张遥中国电子科技集团第28研究所

数码世界 2016年6期
关键词:数据管理结构化挑战

刘韵 张遥中国电子科技集团第28研究所



大数据管理:概念、技术与挑战

刘韵张遥
中国电子科技集团第28研究所

摘要:大数据是一种未来社会高度智能化、统一化的信息利用方式。大数据需要以通过各种渠道收集的大量资料、信息和数据,具有信息量大、处理速度快、数据多样化、价值性高等特征。大数据的到来,让社会发生了巨大的变革。为了面临大数据时代的到来,如何对数据进行管理和利用,成了全社会广为关注的问题。本文将针对大数据的概念进行简单阐述,并且对一些关键技术进行分析,列举一些大数据管理上面临的挑战。

关键字:大数据 数据管理 云计算

云计算、物联网、等技术的兴起,标志着我们已经逐步进入大数据时代。大数据时代的到来,已经引起了全世界各国和信息行业的广泛重视;联合国在2015年5月发布了关于大数据的专题报告,详细阐述了大数据时代给世界各国带来的基于和挑战;全球各大媒体也对大数据展开宣传和报道。这些都说明了大数据已经深入影响到人们的日常生活。但是在这种火热景象的背后,普通人民对大数据并没有足够的认识,大数据的发展还面临着一些挑战,技术需要进一步的完善。

1 大数据的概念

大数据的概念,最初代表着数据规模的庞大,但是随着大数据管理技术的发展,这一简单的阐述已经不能完全概括大数据的内涵。仅仅是数据规模上的庞大,似乎与以往的数据管理方式没有什么本质上的改变。大数据的具体概念,要包括其数据处理的所有特点。现在广为公认的大数据定义是:在数量巨大、类型复杂、价值含量高的数据信息基础上,实现对数据高速处理的数据管理模式。

2 大数据的关键技术

大数据要体现其包含的信息价值,离不开多种数据应用技术的支持。云计算技术,就是其中最为重要、最为广泛使用的一种。云计算是一种用户购买网络资源和网络服务,省掉其中的硬件设备和服务器设施的服务形式。这一技术的出现给各种大数据的应用提供了实现途径,具有强大的数据存储、管理与分析功能。Google公司就是云计算技术应用的成功典范之一[1]。

物联网是另一种大数据时代的关键技术,是遥感技术、远程控制技术和智能化技术集合在一起的产物。所谓物联网,就是通过各种物品连接到互联网,或者在物品和物品之间实现信息交换。物联网技术能够通过多种设备进行远程的数据处理和信息传递,实现了人们对设备的远程控制,大大方便了人们的日常生活。

3 大数据面临的挑战

3.1数据集成管理

数据信息量的增加和数据类型结构的复杂,给大数据的数据集成管理带来了很大困难。一方面,大量的数据各有各的来源,具有结构化、半结构化、非结构化的不同特征[2],存储方式也各有不同,需要进行复杂的转换才能集成管理;另一方面,数据的质量参差不齐,在集成管理的过程中需要进行信息的筛选,淘汰掉无用的信息,集成管理的数据筛选标准难以确定。

3.2数据的分析

以往的数据分析体系,能够实现对结构化数据的有效分析。但是大数据中包括大量半结构化和非结构化数据,这就让以往的数据分析体系不再适合新时代的数据管理。首先,现有的数据分析体系不能够及时处理半结构化和非结构化的数据,需要花费大量额外的时间,数据分析缺乏时效性;其次,大数据环境当中的数据处于一种动态的变化环境,索引方案不能够根据具体的场景来进行调整;最后,传统的数据分析结构对于数据的类型、属性、取值范围已经有了一定了解,而对半结构化和非结构化数据,就难以理清数据内部的关系,缺少高效处理的先决条件。

3.3隐私问题

由于大数据时代的信息传播越来越容易,数据的隐私问题也随之越来越严重。

由于人们在互联网的不同节点留下自己的信息,单个节点的信息不容易暴露用户的隐私。但是如果能够把多个节点的用户信息综合起来,就会暴露用户的大量隐私。另外,大数据时代需要进行大量数据的公开,来促进社会和经济的发展。信息公开的标准如果不合理,也容易造成个人隐私的暴露,造成信息公开与个人隐私的矛盾[3]。这些都是大数据时代的个人信息保护所需要注意的。

4 结论

信息时代的数据,无论在数量上还是种类上都出现了几何式增长。大数据时代的到来,既是社会发展的机遇,也是给社会带来的挑战。对此,要加强云计算、物联网等技术的技术的应用和推广,解决数据集成管理、数据分析和隐私方面的难题,将大数据的管理水平提升到一个新的高度。

参考文献

[1]于浩.大数据时代政府数据管理的机遇、挑战与对策[J].中国行政管理,2015,03:127-130.

[2]赵苏阳,李艳军,钱小燕,曹愈远,许振腾,乔磊,汪雷.大数据基本概念、技术与挑战[J].现代计算机(专业版),2015,08:51-54+60.

[3]米允龙,米春桥,刘文奇.海量数据挖掘过程相关技术研究进展[J].计算机科学与探索,2015,06:641-659.

猜你喜欢

数据管理结构化挑战
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
航发叶片工艺文件数据管理技术研究
改进的非结构化对等网络动态搜索算法
深度学习的单元结构化教学实践与思考
结构化面试方法在研究生复试中的应用
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
数据挖掘在学生成绩数据管理中的应用研究
数据挖掘在学生成绩数据管理中的应用研究
第52Q 迈向新挑战