有关云计算和云数据管理技术的分析
2014-07-02崔超
崔超
摘 要:现阶段,计算机和网络正在快速发展,并在生产、生活中发挥着越来越重要的作用。与此同时,人们对计算机和网络的有关功能也提出了更高要求。在此推动下,云计算和云数据管理应运而生,能够为不同的用户提供相应的计算服务、存储服务、其他软件服务。本文将基于云计算和云数据管理技术进行相应的分析,以期为同行提供一些有益的参考。
关键词:云计算;云数据;管理技术
1 云计算概述
1.1 工作原理
云计算工作原理如下:无需借助本地计算机(或者是远程服务器)[2],便能够将计算合理分布在一系列分布式计算机上,以实现对企业数据中心运行的有效优化,并和互联网形成有效对接。如此一来,企业便能够将所需资源及时而准确地切换到相关应用上,然后结合实际需求对相关计算机及存储系统进行即时访问。云计算属于一项极具实用价值的新技术,使计算能力具有商品性质,并通过网络予以兜售,不仅节约了销售成本,同时还具有实用快捷的优点。
1.2 体系结构
云计算体系结构具有一定的复杂性,且较为庞大,以“云”网络为中枢,连接一系列并发的网络计算以及相关服务,能够在虚拟化技术的帮助下,对各个服务器的能力进行扩展,并借助云计算平台把一系列资源有机地结合在一起,从而为用户提供强大的计算能力及存储能力[3]。一个相对完整的体系主要包括四大部分,一是云端用户,二是服务目录,三是管理系统,四是部署工具、监控、服务器集群。
2 云数据管理技术
2.1 特点
云计算中数据主要具有三大特点,一是海量性,二是异构性,三是非确定性。
2.2 相关技术概述
GFS技术,Google文件系统是一个大型的分布式文件系统;BigTable技术,建立在GFS和MapReduce之上的一個大型的分布式数据库;Dynamo技术,是一个高可用,专有的键值结构化存储系统,或分布式存储系统;MapReduce技术,即MapRedace编程模式。
2.3 云数据管理技术分析
随着研究的不断深入,以GFS为代表的一系列云计算数据管理技术也得以不断完善,并围绕云计算所涉及的海量数据计算、存储以及应用问题,提出了诸多创新,云数据管理技术的总体架构如图1所示。
云计算数据管理可被归结为4个层次:⑴数据组织与管理。在分布式存储技术的帮助下,可对大型数据予以访问,可对分布式数据予以访问,还可对大量数据予以访问,以GFS技术为代表,能够适应于一系列相同或者类似的普通硬件上,具有强大的容错功能,从而保证了用户对数据的访问、获取及存储需求,不仅可靠,而且高并发,还具有高性能的特点。⑵数据集成与管理。针对数据所具有的海量性、异构性以及非确定性特点,借助以Bigtabe为代表的一系列分布式数据管理技术以实现对大规模数据的高效分析及系统处理,从而为用户提供更为及时、准确、优质的服务。⑶分布式并行处理。在分布式环境下,为了实现对数据的深层次挖掘和高效处理,采用建立在云计算这一基础之上的并行编程模式,以MapReduce技术为例,能够对任务予以自动划分,使其成为多项子任务,先后经过映射及化简处理,便能将任务在大型化规模计算节点中进行理想调度和有机分配。在此过程中,无论是后台并行执行,又或者是后台任务调度,均以透明、公开的形式面向编程人员及用户。⑷数据分析。对于云计算数据管理而言,在最后阶段,需对数据展开相应分析及深层次发掘,并为一系列应用提供服务,通常借助专业的数据挖掘引擎以实现对数据的综合布局和合理调度。另外,还可借助浅(深)层语义分析技术以实现在不完全确定知识的前提下对数据展开深层次的挖掘,如此一来,便能够从结构化关系数据库所包含的一系列数据、文本(有可能以半结构化存在)、图形及图像信息中提取出潜在的、事先尚未获知的、有价值的、且能够为用户所读懂的数据。
3 结束语
云计算由于具有海量性、异构性以及非确定性等一系列优点,因而在现阶段得到了广泛应用,且展现出了良好的应用前景。然而云计算的云计算管理毕竟发展时间不长,还存在诸多不完善之处,机遇和挑战共存,有鉴于此,本文提出了基于数据组织与管理、数据集成与管理、分布式并行处理、数据分析的4层次云数据管理方式,这也是未来一段时间内,云计算数据管理的一个主要发展方向。
[参考文献]
[1]全快.分析云计算和云数据管理技术[J].无线互联科技,2012,10:84.
[2]高伟.浅淡云计算和云数据管理技术[J].无线互联科技,2013,02:29.
[3]南志海.云计算和云数据管理技术探讨[J].硅谷,2013,06:7+3.