APP下载

浅谈云计算关键技术在数字档案馆中的应用

2016-11-25柳州市工人医院卢杰森

办公室业务 2016年16期
关键词:海量虚拟化档案馆

文/柳州市工人医院 卢杰森

浅谈云计算关键技术在数字档案馆中的应用

文/柳州市工人医院卢杰森

本文拟通过介绍云计算的概念及主要技术,分析云计算环境下数字档案馆建设的现实需求,探讨云计算在数字信息发展建设领域中的影响。

云计算;数字档案馆;虚拟化;资源共享

随着计算机技术与网络通讯技术的飞速发展,人类社会进入了网络信息时代,为档案馆信息资源的收集、整理和开发利用创造了高效的技术环境。数字档案馆作为网络信息时代的产物,是传统实体档案馆在信息时代的新型组织形式。作为一种全新的基础设施和信息环境,数字档案馆必须加快引入新技术提高自身服务水平,加速尝试新的服务模式的应用,提高数字档案馆自身的服务途径。由于档案工作涉及安全性、保密性等诸多问题,档案界一直对云计算的应用还在强烈争论与探索之中。数字档案馆建设过程中,合理利用硬件设备资源、以较少的花费为利用者者提供准确、高效的访问服务,并使之具有灵活的共享性是数字档案馆建设中应该考虑的首要问题,而云计算模式的出现,恰好为解决这些相关的问题提供了较好的解决方案,它能够最大限度地降低数字档案馆建设的运营成本,真正消除数字档案馆资源孤岛状态,实现全球级的数字化档案馆资源的共享。

一、云计算的基本原理及关键技术

(一)云计算的基本原理。云计算(Cloud Computing)是一种基于互联网的超级计算模式。它是分布式计算、并行计算和网格计算的发展。其基本原理为:“利用非本地或远程服务器(集群)的分布式计算机为互联网用户提供服务(计算、存储、软硬件等服务)”。这使得企业能够将资源切换到需要的应用上,根据需求访问计算机和存储系统。“云计算是一种生产者——消费者模型,系统采用以太网等快速网络将若干集群连接在一起,用户通过因特网获取云计算系统提供的各种数据处理服务”。其实现技术是采用集群来存储和管理数据资源,运行的任务以数据为中心,即调度计算任务到数据存储节点运行。

(二)云计算的关键技术。云计算是分布式处理、并行计算和网格计算等概念的发展和商业实现,其技术实质是计算、存储、服务器、应用软件等IT软硬件资源的虚拟化,云计算在虚拟化、数据存储、数据管理、编程模式等方面具有自身独特的技术。云计算的关键技术包括以下几个方向:

1.虚拟机技术。虚拟机,即服务器虚拟化是云计算底层架构的重要基石。“在服务器虚拟化中,虚拟化软件需要实现对硬件的抽象,资源的分配、调度和管理,虚拟机与宿主操作系统及多个虚拟机间的隔离等功能,目前典型的实现(基本成为事实标准)有Citrix Xen、VMware ESX Server 和Microsoft Hype-V等”。虚拟化的使用者可以是最终用户、应用程序或者是服务。虚拟化技术降低了资源使用者与资源具体实现之间的耦合程度,让使用者不再依赖于资源的某种特定实现。虚拟化的常见类型有服务器虚拟化、存储虚拟化、系统虚拟化、软件虚拟化和网络虚拟化等。

2.数据存储技术。数据存储技术主要是分布式存储,它的目标主要是利用多台服务器的存储的资源满足单台服务器所不能满足的存储需要,因为该系统需要同时满足大量用户的需求,并行地为大量用户提供服务。分布式存储必须具有分布式、高吞吐率和高传输率的特点,并且存储资源能够被抽象表示和统一管理,能够保证数据读写操作的安全性、可靠性、准确性等各方面的要求。目前数据存储技术主要有Google的GFS(Google File System,非开源)以及HDFS(Hadoop Distributed File System,开源),目前这两种技术已经成为事实标准。

3.数据管理技术。数据管理技术即是对海量数据的处理。它是指对大规模数据的计算和分析,通常数据的规模可以达到TB甚至PB级别。“基于互联网时代的数据统计和分析很多是海量数据级别的,其典型的例子如搜索引擎、数字图书馆”。由于数据量非常大,一台计算机不可能满足海量数据处理的性能和可靠性等方面的要求。所以如何提高数据的处理能力、更新速率以及进一步提高随机读速率是未来的数据管理技术必须解决的问题。“云计算的数据管理技术最著名的是谷歌的BigTable数据管理技术,同时Hadoop开发团队正在开发类似BigTable的开源数据管理模块”。

云计算的基本原理和关键技术提供了安全可靠的数据存储、方便快捷的云服务以及不同设备间的资源共享,结合数字档案馆的基本属性和特征,笔者认为云计算作为一种全新的技术在网络中应用,必然会形成新的信息管理与信息服务体系,这种新的管理与服务体系的目标正是数字档案馆基本特征和属性的表现。这种新兴的云计算服务有望从基础设施层面解决许多长期困扰数字档案信息资源管理与服务中存在的问题,例如档案信息资源的开发与利用、数字档案资源的存取问题、档案信息资源共享中的版权等问题。

二、云计算关键技术在数字档案馆中的应用

云计算的关键技术带给我们以全新的视角去审视目前的数字档案馆的信息管理与服务的新模式,本文结合上述内容尝试从信息存储、信息处理、信息资源共享层面入手,来探析云计算在数字档案馆中的应用,以此促进数字档案馆能够更好调整服务方式,增强数字档案信息服务功能以及拓宽服务空间。

(一)云计算环境下的虚拟化信息存储。数字档案馆的建设和运作对数据的共享备份和调整存储访问具有很高的要求,云环境下的虚拟存储系统能够有效地适应数字档案馆数据的海量存储和数据的不断增长,同时又能满足当今网络环境复杂性和扩展性的不断提高,对海量数据进行存储和备份。具有海量存储能力的虚拟存储系统是数字档案馆建设和运作的重要保障。

此外,云计算虚拟存储技术能把数字档案馆现有的各类存储设备DAS、NAS、SAN架构存储汇集成一个"虚拟存储池",它使系统性能最大化,消除数据存取瓶颈,缩短寻道距离,同时也加快了访问时间。云计算还能保障档案信息资源的安全,因其数据集中存储,更容易安全监测,是一种安全性比较高的技术。数据中心有专门的管理者对数据进行统一管理、分配资源、控制安全,并进行可靠的安全实时监测。有效地保证网络计算环境的安全性和方便性。还能保证数字档案馆中的档案信息资源的安全存取和通信,保证不同用户对档案信息资源的不同访问权限,满足档案信息资源的特殊安全要求。

(二)云计算环境下的海量信息处理。数字化档案馆所要处理的数据通常非常大,其数据的规模可以达到TB甚至PB级别,经常存在需要海量信息处理能力的业务,如多媒体数据存储格式的转换、大量信息的扫描识别、资源数据库的索引倒排等。云计算本身的特点是对海量的信息存储、读取后进行大量分析,数据的读操作频率远大于数据的更新频率。云计算有利于档案信息资源的数据处理随着档案信息化进程的加快,档案馆中需要处理的档案数据越来越多,云计算能够充分利用现有资源,更好地解决海量数据的计算处理和分析问题,云计算提供了无限大的存储空间,为数字档案馆日益增长的海量数据提供了解决途径。此外,云计算能够为超复杂的计算联合处理提供优于网格技术的技术支持。通过云计算的运用,可以智能地分配和优化档案信息资源,更快地解决档信息资源的数据处理和检索利用问题,从而以更短的时间、更低的成本实现海量数字档案信息资源的数据处理。“运用云计算模式,用户使用手机、PDA等设备也可以使用数字档案馆中的非保密行的电子资源服务”。

(三)云计算环境下的信息资源共享。云计算可以实现数字档案信息资源共享实现资源全面共享是云计算的出发点和目的之一云计算技术屏蔽了信息资源的多样性格式,它将网上所有资源连通,消除信息孤岛,为用户提供“一站式跨库”检索,实现信息资源的智能共享。“档案作为十分重要的信息资源,利用云计算的共享性,可将分布在不同地域、不同部门异构档案信息资源集成起来,实现各档案馆、各档案部门之间档案信息资源共享,同时还能为用户提供统一的访问接口,选择适当的访问协议来实现用户提出的服务请求”。基于云计算的数字档案馆将异构分布环境下不同来源的海量数据资源进行统一整合,实现信息资源的智能共享,也极大地提高数字档案馆资源的利用效率。而且在云计算模式下,运用云网强大的计算能力和几乎无限的带宽可以为档案信息资源共享提供一个良好的交流环境,有助于档案部门及时了解用户的要求,提供准确、有效、个性化的档案信息服务。云计算是一种开放式的环境,在这一环境下,可以运用云计算平台功能强大的整合播客、维基百科、博客等服务方式,提升档案信息资源个性化服务的能力,这不仅有效满足用户的个性化需求而且还有助于档案信息的宣传提高了档案利用的社会意识。

三、云计算关键技术在数字档案馆中应用的意义

云计算的出现宣告了低成本提供超级计算时代的到来,它以超强的计算能力和低成本、高安全性等优势将人类社会推进了一个超共享时代。但是,目前云计算技术的应用还处在探索阶段,相关工具和技术还在不断完善中,将云计算应用于数字档案馆建设领域还只是处于实践探索的过程中。"对于数字档案馆的建设来说,要注意的是:充分掌握各种云计算服务的技术实质、特征、基本属性与应用价值,然后有所选择地引入数字档案领域,从而进一步提升数字档案馆的服务能力"。相信随着云计算技术在其他领域的成熟应用,必定在数字档案信息资源服务与管理中得到广泛的应用,对推动数字档案馆的建设与服务管理具有非常重大的应用价值与现实意义。

[1]Li zhe W ang, Gregor von Laszew ski. Scientific Cloud Com puting:Early Definition and Experience [EB/O L].[2009-12-09].http://cyberaide.googlecode.com/svn/trunk/papers/08-cloud/vonLaszew ski-08-cloud.pdf.

[2]陈全,邓倩妮.云计算及其关键技术[J].计算机应用,2009(9):2565-2566.

[3]马林山,赵庆峰.云计算环境下图书馆服务的创新[J].大学图书情报学刊,2011(1).

[4]http://baike.baidu.com/view/1316082.htm l

[5]王平.云关键技术在数字图书馆中的应用于研究[J].情报资料工资,2010(5).

[6]http://baike.baidu.com/view/1316082.http

[7]施海燕.云计算和移动图书馆[J].图书馆建设,2009(9):10-12.

[8]严真.云计算环境下的图书馆变革[J].图书馆工作者研究,2010(2):45-46.

[9]彭小芹,程结晶.云计算环境中数字档案馆服务与管理初探[J].档案学研究,2010(6).

猜你喜欢

海量虚拟化档案馆
一种傅里叶域海量数据高速谱聚类方法
海量GNSS数据产品的一站式快速获取方法
太原市档案馆牵手百年胡氏荣茶共寻文化脉络
云南省档案馆馆藏《东巴经》
海量快递垃圾正在“围城”——“绿色快递”势在必行
基于OpenStack虚拟化网络管理平台的设计与实现
一个图形所蕴含的“海量”巧题
服务器虚拟化的安全威胁及防范分析
when与while档案馆
浅谈虚拟化工作原理