基于数字图书馆的云系统研究
2020-09-02张艳红高振
张艳红 高振
摘要:
云计算是目前新技术中最重要技术之一,在数字图书馆服务系统中发挥着非常重要作用。以数字图书与云计算相关概念为切点,并以此为理论基础,从系统总体架构、云服务平台数据库服务器架构、云服务平台应用服务器架构、云服务平台网络架构与集中存储架构等方面设计论证数字图书馆向云演进的系统的构建。
关键词:
数字图书馆; 云计算; 演进
中图分类号: TP 311
文献标志码: A
A Study of Cloud System Based on Digital Library
ZHANG Yanhong, GAO Zhen
(Library, Shandong University, Jinan, ShanDong 250100, China)
Abstract:
Cloud computing is one of the most important technologies in the new technologies. It plays a very important role in the digital library service system. In this paper, based on the concepts and theory of digital books and cloud computing, the system architecture, the architecture of the cloud service platform, database server, the application server architecture of the cloud service platform, the network architecture of cloud service platform and the centralized storage architecture are designed. These are used to demonstrate the system of the evolution of the digital library cloud construction.
Key words:
digital library; cloud computing; evolution
0引言
關于数字图书馆的概念,笔者查阅大量文献资料,发现有数十种不同的解释。笔者选择大众比较认可的360百度对数字图书馆概念的描述:数字图书馆是利用数字技术处理(即上传、下载、储存、修改、查询等)各类图文兼有的图书、影像、视频等文献。其本质上是属于一种多媒体制造出来呈分布状态的信息系统。其把不同类型的载体、在不同位置的信息资源通过相关数字处理技术连接在一起,从而为不同地区的用户提供方便、快速地使用图书馆的信息。换言之,数字图书馆就是属于一种虚拟图书馆,是以网络环境为基础,建立共享性知识网络系统,给用户使用图书馆资源带来极大方便,而且还不受时间、区域等限止[1]。笔者总结所谓数字图书馆概念就是具有数种不一样的多媒体内容的数化信息资源,通过相关新技术,比如互联网技术、信息技术、通讯技术与数字化技术等,为用户(读者)提供快速、便利与高效的一种服务体系。
云计算目前还是处于一个正在发展与不断完善阶段,学界还没有一个统一的概念。对于云计算概念有着多种理解与不同的认识。比如维基百度对云计算的概念解释为:这是以互联网为基础的新的计算形式,再通过互联网导购、自治服务等,从而为企业与个人提供需求,而产生的服务云计算方法,就被称作为云计算。又如美国加州大学分校一份报告对云计算的概念的解释:在现代网络上存在无数种不同类型的服务模式,在这些服务模式中也包括了以数据为核心提供帮助的各种不同的软硬件[2]。笔者认为云计算就是依托互联网所有有关资源进行整合与优化,这里资源主要指软硬件与相关平台资源,再依据资源实际使用情况进行收费的一种新服务模式。
1系统总体架构设计
1.1图书馆两大资源池
数字图书馆两大资源池即为数字图书馆管理资源池与个人信息资源管理池。笔者依据目前我国高校数字图书馆系统软件设计,可以把整套系统分为两大主要部分,即图书馆管理关键系统与用户个人信息资源管理系统[3]。
在对此系统进行开发设计时,对两部分软件系统配置了相应的硬件设施进行支持,同时还使用物理服务器与虚拟服务器两种形式对不同软件模块支持。
1.2关于系统总计架构设计
笔者依据某高校数字图书馆的需求与系统分析,本论文所构建的数字图书馆向云演进的系统基本架构,如图1所示。
集中化原则是该系统架构中存储与网络所坚持最重要原则,对各资源池应用进行统一支持。计算机资源对资源池却存在不一样处理方式,是依据实际业务的需要,对资源池进行具体划分。不过这措施对集中化原则进行较好的反应,使得资源得到最大化利用,从而提升资源的利用率,同时还有利于资源管控。
从整个系统业务功能方面分析,在开发本系统之前计划分成信息服务应用区、中心数据库区与开发测试区三个逻辑区。信息服务应用区主要是集中设置图书馆管理系统、息信检索系统等系统应用服务器,此区域均是使用虚拟化X86服务器;中心数据库区的数据库是通过应用UNIX服务虚拟化技术来进行设置的;开发测试区利用X86的虚拟化技术来满足各大模块设计需求。
信息服务应用区、开发测试区和中心数据库区这几个区均与以太网络中心连接在一块,其能与外界通信完全是因为是借助接入交换机来对数字图书馆平台关键交换器进行连接,同时还设置所对应的硬件设施对服务负载均衡进行实施[3]。
2云服务平台数据库服务器架构设计
2.1关于数据库服务器总体方案设计
笔者参考其它有关数字图书馆管理系统设计,再与虚拟化技术相结合,关于数字图书馆向云演进系统构建的数据服务架构设计,如图2所示。
在对本系统中数据库架构设计中加强对虚拟化技术(IBM Power VM)使用,再以逻辑分区技术对本系统数据库架构划分为三个分区,每个区均配置相应设施,比如网络、CPU与存储资源等。这样每个分区均能看成一台与其它没有啥关系的逻辑服务器应用,再在每个区设立Oracle数据库,从而构成了三台逻辑服务器。
2.2关于数据库访问
此平台的原数据库平台根本无需要重新设计,其完全可以搭建在当前图书馆服务系统的数据库平台的基础之上,该数据库访问形式,只需要遵照XML语言规范与XHTML规范,再经过对应数据库访问语句就可以对相关数据库页面进行访问,从而才能完成相关服务操作,比如数据查询、数据库访问等。
3云服务平台应用服务器架构设计分析
3.1构建虚拟化服务器集群平台
虚拟化服务器集群平台构成,如图3所示:
3.1.1X86计算机服务器
虚拟机是由正常工作的虚拟化软件提供资源。虚拟软件还能为虚拟机运行提供支撑,同时还把许多配置相近的X86的计算机服务组合在一块,另一方面与相同的存储子系统和网络相互衔接,建立非真实环境中资源集合,从而形成虚拟化服务器组,为资源管理带来便利,不过服务器在型号选择上注意整齐规划统一。笔者建议选择配置类似的4CPU的服务器,而此服务的内存卡与网卡等均安装在同一PCI插槽里。
3.1.2存储网络
光纤通道SAN阵列是属于一种应用非常普遍的存储技术,此技术是由虚拟化系统对其进行支持,因此才能对本系统数据库存中储需要进行满足。通过存储区域网络服务组之间共享存储阵列,就能完全实现存储资源的集合,此外,倘若把这些资源划分给虚拟机时,就能使资源储存更加具有一定灵活性[3]。
3.1.3IP网络
计算机资源带宽加大,均是由于每台计算机服器有过个以太网络接口卡。由于带宽加大,计算机网络的可用性效果会更好。此外,虚拟机将通过IP网络提供许多服务,资源池所有网络管理均是经过IP来实施的。由于数字图书馆具有一定繁琐性与网络扩展性,服务器虚拟化将会应用到以前的网络系统,同时还会应用到当前的交换机接口,不对网络系统进行改动。
3.1.4虚拟化管理服务器
此管理服务器能够为资源池提供单一的控制节点,其提供了如各种软硬件配置、各种性能控制、用户访问控制等虚拟架构管理服务,从产品的成熟度、市场占有率,以及技术资源获取等各方面进行全面考虑,虚拟化平台基础软件为VMware应用。
3.2选择虚拟化服器
在对服务器选择方面,应坚持两方面原则:首先是选择统一的产品架构。当前,虽然AMD与Intel两种不同类型的CPU,均得到此软件同时的支持,不过从虚拟化平台建立与作用的整体实施情况来看,对于混合型CPU服务器并不是没有限止的。其次是为了使服务器负载更具有稳定性与高效性,尽量使用配置统一的服务器。倘若配置差距较大,就容易使得资源分配与服务器出现障碍后,导致资源再次分配而产生了漏洞,从而使其影响更加广乏的范围[4]。
目前只有刀架式与刀片式两种类型务服器,两者进行比较,到底选择哪种类型服务器?笔者建议在虚拟化平台上的服务器,应该选用机架式服务器。但是要注意以下一些因素:一是偿若采购服务器数量小,考虑到刀片式服务器成本高,就应选择机架式;二是刀片服务器的I/O性能有一定限制,每片刀片获得网络与存储端口少,选择机架式服务器较合理。其原因是虛拟化性能要求高;三是虚拟化技术会导致服务数量降低,那么刀片服务器在某些方面优势就会明显降低。
3.3关于VMware虚拟化管理工具
为了更好对服务器虚拟架能够较好地管控,笔者建议设置相应的物理服务器作为vCenter服务器,vCenter其功能就是能够为构建的本系统环境提供较为集中的管理、自动化操作、以及对资源高效利用等。
从vCenter虚拟化平台方面来分析,vCenter是属于核心组件。不但在于全部对虚拟化平台的管理与配置均能通过此控制平台来实现,而且还在于vCenter是属于某些功能所进行依靠的组件,倘若没有vCenter就根本没有办法来实现。除此之外,对于vCenter平台的控制功能与信息收集等均需要通过vCenter来实现,如图4所示。
正因为vCenter有如此重要作用,就非常有必要为其设置两台相配套的服务器,而且还要通过VMware的Heartbeat功能实现两台服务器之间状态与数据同步[5]。
4关于云服务平台网络架构与集中存储架构设计
4.1云服务平台网络架构设计分析
云计算服务器虚拟化的网络架构是指数字图书馆建立虚拟化平台后,要求网络结构在没有虚拟化之前,变化不明显,只是原数据传输终端结在与网络端口(交换机)相接触,再进行虚拟化,由于多了一层虚拟交换机,数据传输就会转变成在交换机虚拟端口上的终结。如此,虚拟机就可以通过虚拟化平台内再分配到不同的交换机上。它的基本原理与物理网络架构很相似[5]。路由与数据传输具体关系如下:
(1) 一样的虚拟机倘若在同一物理服务器上,就能够在虚拟化层上进行数据传输。
(2) 一样的虚拟机倘若在不同物理服务器上,就不能直接在虚拟化平台传输数据,而需要从外界接入交换机再转发到其它物理服务器的虚拟机上。
(3) 不是同一台虚拟机,不管是在何种物理服务器上,均需要在网络三层上进行路由转发,由于间路由只在关键的交换机上实现,全部数据包均要通过关键的交换机路由。
(4) 网络配置不发生变动的情况下,将来倘若依照服务器功能进行规划,就能够在关键的交换机上设置交换器访问控制对不同功能服务器群之间的安全隔离进行实现。本系统的网络架构,如图5所示。
4.2云服务平台集中存储架构设计
云服务平台集中存储架构系统设计均是采用SAN存储架构,面向数字图书馆全部服务模块,而且还能与服务器虚拟化技术存储应用相适应,本系统使用范围主要包含以下几点:
(1) 数据库系统。海量数据储存于各大服务版块,对其要求“高三”(高可靠性、高性能与高可用性)。
(2) 服务虚拟化系统。重点是X86服务器的VMware虚拟化系统,其功能就是能够向各台VMware ESX服务器提供共享存储支持。
(3) 关于开发环境的检测。培训服务器与开发环境的检测也需要较小的空间来对数据进行存储。
(4) 关于与此类型不同的文件数据存储。根据本系统开发的实际情况,存储架构均是使用统一存储结构,这种结构就是一种以立足SAN技术基础上的结构[6]。
4.3云服务平台实现流程
某高校数字图书馆云服务平台(以下简称“某高校云平台”)在进行云计算时,还要按相关流程操作,不同云服务平台供应商他所提供云计算方案大致是统一的,不过在细节方面还是有所不同的。该服务平台实施过程详如图6所示。0
从总体上来分析,云计算服务平台的实现流程,重点从前端、应用服务器、应用管理节点与服务群四个方面进行完成。
(1) 前端。其功能在云服务平台正常工作过程中,对所发出的请求进行转发,以及在使用静态文件与负载均衡进行转发。
(2) 应用服务器。其主要功能对服务器相关功能正常运转程序进行支持。
(3) 应用管理节点。此节点功能够为云服务平台提供很多较为复杂的使用程序,比如开启、停止与计费等。
(4) 服务器群。为云服务平台提供被融合在一起各种各样服务。
4.3.1关于实施Google APP Engine流程
某高校云平台运用Google APP Engine 案例实施流程为:
首先用户根据自己的实际情况,填写资料进行Google账户注册,倘若已册过了,就可以直接登陆。
(1) 新建立应用,一般来说一个用户能够新建数个不同应用,其空间均仅为500MB。
(2) 对相关应用程序信息进行填写,但需要提醒的,应用标识符注册完成之后,
不能更改,所以在填写时,就务必要注意。
(3) 采用Java与python语言对数字图书馆应用程序进行设计。
(4) 应用程序设计完毕,还需要进行本地测试,确保整个数字图书馆应用程序能够
正常运转,才算合格。最后才上传至Google APP Engine。
4.3.2关于亚马逊AWS流程的实施
还是以某高校数字图书馆为类,数字图书馆云服务平台对亚马逊AWS案例实施流程为:
(1) 与实施Google APP Engine案例一样,也是首先注册亚马逊帐户,如果已经注册了就可以直接登陆了。
(2) 依据用户需求的实际状况,选择平台能提供的服务,不过在平台向用户提供服务之前,还要依据用户实际情况填写相关资料,进行注册。
(3) 在正式应用之前,还要对所需要资源数进行确定,另一方面对于一部分服务还需要设定相配套的参数。
(4) 对等待处理的文件或数据上传。对于不一样的服务其上传的数据资源类型也是存在差异的,有时系统为给自身处理带来便利也会让用户上传一部分文件之外或数据之外的附加程序。
(5) 上传结束后,就是系统实施过程,在实施过程中,对用户完全公开的,因此用户根本不必了解系统实施过程中每个细节。
(6) 当系统运行停止后,系统不需要人為操作,自然将为用户传输相应的结果。
(7) 用户在使用结束后,就能够支付相关费用,需要说明的是,使用亚马逊AWS全部服务均是依照实际使用量计算相关费用的。
5总结
随着我国经济水平、通信息技术、以及互联网技术的快速发展,越来越多的人感受到新技术无论给我们生活方式,还是企业生产,政府办公或者其它方面均带来全新的改变。而云计算就是当下新技术中最重要技术之一。在数字图书馆方面能效地解决图书馆纷繁复杂海量信息管理与安全等方面问题,从而达到构建一个用户使用方便的数图书馆目的。因此探讨数字图书馆向云演进系统设计具有很重要现实意义,本文首先对数字图书馆与云计算相关概念进行简要阐述;然后以系统总体架构设计为本系统设计框架;接着重点分别从云服务平台数据库服务器架构与应用服务器架构两大设计展开探讨构建数字图书馆向云演进的系统,同时还花了一定的篇幅对服务平台网络架构与集中存储架构设计进行分析;最后还对此系统的服务平台的Google APP Engine与亚马逊AWS两大方案流程的实施进行详细的论述,从而对构建数字图书馆向云演进的系统全方位进行论证。
参考文献
[1]
秦中云,杜建萍,马栋萍.云计算环境下多校区图书馆智慧服务平台研究—以北京联合大学图书馆为例[J].图书馆建设,2019(10):7478.
[2]谢静华,王银惠,王琛.基于动态博弈技术优化配置数字图书馆共享资源模型[J].图书馆理论与实践,2014(7):7477.
[3]佟庆云.数字图书馆信息资源管理与建设研究[J].图书馆理论与实践,2014(7):7880.
[4]于秀静.基于云计算的安徽高校数字图书馆联盟平台建设研究[D].合肥:安徽大学,2013.
[5]靳晓恩,丁邦友. “互联网+”时代云计算在数字图书馆资源整合中的应用[J].图书馆学研究,2017(1):5152.
[6]王刚,张屹.移动云计算环境下数字图书馆信息服务协同机制研究[J].大学图书情报学刊,2018(3):2730.
(收稿日期: 2020.02.20)