云计算和云数据管理技术
2017-06-02马桂英
马桂英
摘要:进入二十一世纪,计算机和互联网技术得到了较快地发展,尤其是近些年云计算和云数据管理技术被广泛应用到互联网之中。云计算和云数据管理是一种建立在云计算基础上的新型数据管理技术,本文主要对云数据管理技术、数据存储技术以及云计算原理等关键技术进行分析,最后对云计算和云数据管理技术的发展进行了展望。
关键词:云计算;数据管理;互联网;技术
中图分类号:TP311.13 文献标识码:A 文章编号:1007-9416(2017)04-0234-01
1 云计算的概念和特征
云计算最初仅用于互联网搜索引擎的数据计算和分析,它是一种高效的互联网计算技术,而且成本远低于传统的计算方式,这对于处于起步阶段的互联网企业来说具有重要意义。云计算不同于其他实体计算,它是一种基于计算机技术的虚拟计算方式,它可以实现网络资源的合理配置,降低用户的成本,提高计算效率。云计算的原理是将计算过程合理分配到网络系统中的计算机上,这样就能把大量的复杂计算进行分解,化繁为简,化难为易,缓解用户本地计算机的压力。用户可以根据自身需要访问计算机和存储系统。云计算同时还具有操作简单、准入门槛低的特点,这就使得广大互联网用户可以轻松使用云计算,而不需要再进行专业培训,从而使得云计算在较短的时间内得到了非常广泛的普及。
2 云数据管理技术
云数据管理技术是利用云计算技术对分散的、海量的信息数据进行分析和处理,云数据管理技术需要满足的条件是管理海量数据和高效处理数据。云数据管理技术的主要特征包括:海量性,互联网数据的存储量是非常惊人的,在这些庞大的数据中提取出我们所需要的數据是一件非常复杂的工作,所以提高云计算技术筛选海量数据的效率和准确性是云计算技术的关键;异构性,由于云计算所服务的领域非常广,而各个领域所采用的数据采集和存储方式有着非常大的差异,这就要求云计算存储器可以存储不同种类、不同形式的数据,同时能够对这些数据进行合理划分和整理;非确定性,在云数据管理系统中,每位用户存储、查询和分析数据的方式不尽相同,没有一个特定的标准,这就导致了云数据管理技术具有较大不确定性的特征。在云数据管理技术中主要以两个数据管理模块为主,分别是Big Table技术、GFS技术、Map Reduce技术,下面对这三种主要的云数据存储技术进行介绍。
2.1 Big Table技术
BigTable技术是一个非常庞大的分散式数据库,它可以存储超过1PB的数据,其工作原理是将需要处理的数据形成一个巨大的表格。BigTable可以看作是一个稀疏的、多维的坐标系,该坐标系由横轴、纵轴和时间轴组成,坐标系中的每一个点都有唯一的坐标,这项技术在进行操作时能够对任何Table进行分配,按照指令将数据分配到相应的Table服务器上,同时该技术还利用master服务器对子表负载进行监视。
2.2 GFS技术
Google File system简称GFS,它是一种Google 文件系统,是一种大型的分布式文件系统,它可以为用户提供海量的信息内容。在GFS技术中,所有节点被划分为三种角色,分别是:Client(客户端)、Master(主服务器)以及Chunk Server(数据块服务器)。Client 是指访问接口,它主要提供库文件。相关的应用程序根据不同需求对数据库进行调用,与此同时,应用程序本身也与这一库紧密的链接在一起。Master在 GFS中起到了非常重要的作用,人们通常把它看做是 GFS 的大脑。Master的主要任务是对海量数据进行存储和分类,Chunk Server 所负责的项目主要是具体的存储。这三个模块在工作过程中相互联系,协调配合。
2.3 Map Reduce技术
Map Reduce是一种效率较高的编程模式,利用Map Reduce技术可以对网络资源进行更加高效的使用,它将存储器中的不同种类的数据进行了划分,一类是Map,另一类是Reduce。其中Map的工作原理是将一项复杂的任务分解成为多个小任务,保证这些小任务可以在单个计算机上运行,这样大大提高了数据存储和分析的下效率。而Reduce技术是将Map技术得到的计算结果进行归纳,分析得到最终的结果。
3 结语
云计算和云数据管理技术现在处于仍然起步阶段,在技术上和管理上都面临着巨大的挑战和机遇,随着互联网技术的发展,这项技术会逐步应用到更多的领域,特别是一些需要处理和存储大量数据的行业,云计算和云数据管理技术有很大的发展前景,需要研究人员付出更多的精力去开发和研究,使这项技术更加成熟,更好地服务我们的工作和生活。
参考文献
[1]刘正伟,文中领,张海涛.云计算和云数据管理技术[J].计算机研究与发展,2012(4):26-31.
[2]孟燕,郭冬梅.云计算及其数据存储与管理技术研究[J].信息技术与信息化,2012(7):73-76.
[3]吴吉义,傅建庆,张明西,等.云数据管理研究综述.电信科学,2010(5):34.