基于联盟域特色资源数据库的私有云设计
2014-01-16都平平郭琪苏贺涛李雨珂鲍劼邓志文
●都平平,郭琪,苏贺涛,李雨珂,鲍劼,邓志文
(1.中国矿业大学a.图书馆;b.安全学院,江苏徐州221116;2.格坦斯克大学商学院,Poland)
基于联盟域特色资源数据库的私有云设计
●都平平1a,郭琪1a,苏贺涛1b,李雨珂2,鲍劼1a,邓志文1a
(1.中国矿业大学a.图书馆;b.安全学院,江苏徐州221116;2.格坦斯克大学商学院,Poland)
特色数据库;私有云;数据聚合;联盟域泛在服务
高校的特色资源数据库是面向特定读者的定向专业化服务资源,为了保障数据存储和服务中其数据的专有使用性、方便易用性、唯一整合性及安全可靠性,本文阐述了利用私有云对多个高校的同一学科联盟特色资源数据库的建设方法。以云计算技术为资源管理模式,并采用私有云的架构布局特色资源数据结构,让各类数据库数据资源聚合在云端的存储器中,各种资源可以借“云”统一结合起来,内容化零为整集成融合为“域”,保障数据的安全性和服务的高质量。
构建域联盟云服务共享系统,即建设具有云计算技术的数字图书馆资源存储服务系统,受到图书馆界的广泛关注,它解决了系统部署的重复性和单一服务器承载单一服务而造成设备和资源利用率低的问题。
私有云(Private Clouds)是为一个域或单个机构单独使用而构建的。在建设科学资源共享域时,为最有效控制数据的安全性和实现服务的高质量,采用私有云的方式建设专题数据库并在域中提供特定有效的专有服务。建立在私有云上的云计算服务主要是通过用户自己的服务器来建立一套私有的云计算架构,为一定范围内的用户提供数据使用、服务专指和安全性的高效保证。同时,私有云可以部署在自有的数据防火墙之内或者托管到安全服务中心,并在私有云服务上部署应用程序为用户提供服务。我们所做的高校域联盟的特色资源主要是在联盟高校域的所属基础设施上部署私有云应用程序,完成安全、专有、特定、有效的区域特定学科资源服务。[1]
1 学科联盟域私有云的布局和实施
1.1 现有问题及采用私有云的必要性
学科联盟域一般包含相同学科的多个高校,学科资源分布在不同区域的不同高校的不同存储设备上,具有分散性,存在以下问题:(1)多服务器管理复杂,由于高校区域不同,单独承担数据资源和服务,服务器数量每年都在增大,数量越来越多,服务器的整合规划管理面临巨大挑战。[2](2)数据建设缺乏标准化。单体建设,很难采用统一建设标准和实施标准。(3)设备和资源利用率低。各服务器为运行单个操作系统和单个应用程序设计,检索资源要多次检索,大部分资源无法统一检索,服务器的CPU没有被充分利用。(4)统一部署问题。各存储配置不同,应用系统之间缺乏共享机制和兼容性,致使每增加一个应用就要求重新安装系统,进行各种技术参数配置,不仅耗费了大量人力,也增加了系统管理的复杂性。[3](5)数据长久保存机制和安全保障功能。高校图书馆用户群体的专一性以及资源的特有性要求它相比其他数字资源应具有更高的数据备份和安全保障功能,但不宜做到。
综上所述,技术支撑下的高校域的统一资源布局势在必行。
1.2 私有云支撑下的学科联盟域特色资源库建设思路
利用私有云技术搭建适合学科联盟域的特色资源存储和服务体系是特色库建设的有效建设模式。把原有分散的建设改为集中建设模式,统一建设标准,使其具有互操作性、学科特定性、体系完整性、媒体多样性、平台相互整合及统一检索性。在私有云的环境下,规范的建设模式为不同机构的相同学科资源提供了同一标准的整合建设服务,云环境下联盟域资源库可以提高资源的组织能力和基于知识链共享使用效果,可以扶持学科、机构的合作,特别有助于振兴资源偏弱的机构,也是学科信息资源建设发展的趋势。
2 私有云框架结构设计
2.1 私有云模式选择和框架结构布局
目前,国外比较流行的开源云计算平台有Abi-Cloud、ⅠOgenMongo DB、Nimbus和Eucalyptus。其中,以提供开源私有云服务的平台提供商开发的Eucalyptus从技术和应用角度来看都是比较成功的私有云开源框架,能够很好地提供目前图书馆应用开发研究所需的硬件资源。[4,5]
特色资源库学科域私有云平台以Eucalyptus云计算软件框架、中间件、Portlets技术为基础,通过虚拟机资源和操作系统模板等方式向不同用户提供单位硬件资源和软件资源服务。学科域数字资源的私有云平台主要建设三部分构架:基于GridSphere布局云计算域资源门户系统、基于Euca2ools中间件系统、基于DLCloud(DigitalLibraryCloud)域资源云平台。[6]见图1、图2。
图1 学科域资源私有云平台的架构[7]
(1)GridSphere门户作为访问学科域特色数据资源库私有云平台的入口,即防火墙,是普通用户访问和使用私有云服务和管理员管理云资源的入口,提供了用户登录、注册、验证等用户管理功能。同时,用户使用各种终端(电脑、平板、手机等),利用浏览器访问GridSphere门户子系统,通过管理和使用DLCloud云平台提供的虚拟机上的域范围的学科特色资源及特色资源所用的操作系统资源或平台上阅读、媒体播放工具等,可以实现虚拟机管理、模板管理、ⅠP控制管理、安全保障管理、存储空间管理等主要功能。安装了Euca2ools工具和访问Eucalyptus平台的相应证书信息,其作为访问私有云的中间件,用户可以通过协议访问DLCloud云平台,并通过输送相应命令,对DLCloud云平台进行操作。DLCloud云基础设施是整个架构的核心模块,为特色数据库私有云平台提供操作系统、虚拟机等资源,由Eucalyptus(Elastic Utility Computing Architecture for Linking Your Programs To Useful Systems)开源云平台和硬件资源两部分构成。[7](2)FTP服务器:用于存储上传至私有云的镜像文件和存储图书馆各系统。(3)外部存储:作为私有云的外部存储,实现虚拟机的备份与快照,同时还存放了门户系统所用到的Mysql数据库。
私有云平台考虑的一个出发点就是云端数据的安全性和单独可用性,从这个角度出发,云网络环境的架构采用三层网络体系架构,形成三层防护屏蔽入侵者,即,(1)使用防火墙;(2)隔离带通过主机在内堡垒,外包过滤路由器构成子网态势;(3)应用网关。
2.2 硬件平台建设
DLCloud云基础设施硬件环境,由三台专用物理服务器、两台存储以及四台个人PC机组成,利用Eucalyptus开源平台,将物理机的CPU、内存、硬盘等虚拟化,通过集群方式收集相关资源,返回给云控制器,最终通过GridSphere门户子系统及Euca2ools中间件,服务器将学科域特色资源库内容提供给用户使用。[7]
主服务器架构使用基于Ⅰntel处理器的机架服务器。处理器支持Hardware Execute Disable(硬件执行禁用)以及硬件虚拟化,配有核心处理器,具有一定的内存物理容量。
存储架构为直接附加存储+SAN iSCSⅠ存储,容量达到TB级。
主服务器上网卡数为6块。其中一块网卡用作主机的管理,其他网卡用来作为虚拟机。另外两块用作MPⅠO iSCSⅠ通信。
私有云技术的架构由三台物理主机构成,分为前端和后端。前端安装了Eucalyptus云平台的四大组件: CloudController、Walrus、ClusterController、Storage Controller。Cloud Controller是用户进入Eucalyptus云的主要入口,管理云体系的各类组件中的可用资源以及正在运行的实例;Walrus负责管理Eucalyptus内的存储服务的访问,允许用户存储持久性数据;Cluster Controller管理整个虚拟实例网络,维护系统内的所有NCs,部署和管理在节点上的实例;Storage Controller使用AoE或者iSCSⅠ协议为实例提供块存储等服务。[8,9]
后端包括两台ⅠBM高性能服务器,由于机器配置较高,可用的ⅤM虚拟机的资源就比较多,这样需要安装Node Controller组件,作用是用来运行虚拟机。每个虚拟机的ⅠP分为公共ⅠP和内部ⅠP,内部ⅠP仅仅用于虚拟机内部通信管理,而用户要访问一个虚拟机,必须使用公共ⅠP。
2.3 软件条件
Ubuntu10.04服务版,自带Eucalyptus1.6.2版本;CentOS5.4系统和Eucalyptus1.6.2的NC组件;Euca2ools工具包。
3 私有云平台在学科域资源的使用及功能实施
学科域的高校特色数据库作为面向特定读者的专业化服务资源,是高校教学、科研的专业信息,需要保障其安全性。高校学科域特色库的专业性以及唯一性要求它相比其他数字资源应具有更严格的数据安全保障。
3.1 多校学科资源库的整合
私有云技术建设和实施是高校学科数据库建设需要提高和信息资源的高度整合,让各种媒体类型的学科特色数据库聚合在云端的存储器中,多类型特色资源可以借由一朵“云”统一结合起来,内容高度融合,就像是当下流行的“信息共享空间”概念的升级版,用户通过私有云集成数据获取所需的特色文献。
3.2 私有云设计的选择及数字资源建设架构的实施
系统主要由三部分构成(见图1),最上端是客户端,最下端是数字图书馆私有云,中间是由应用服务器Tomcat所支撑的GridSphere门户系统和与私有云进行通信的中间件Euca2ools。Eucalyptus提供的都是在Linux系统下通过命令行访问云平台的形式,[10]而门户系统把传统的命令行的形式转换成用户简易操作的图形界面形式,将中间件工具和命令进行封装,这样,用户通过浏览器登录门户系统后,访问私有云变得方便快捷,系统对Eucalyptus所提供的云服务进行了二次开发,使用户能够得到更多的云服务。
图2 域资源架构
4 使用私有云的优势及不足
4.1 利用私有云的优势和对服务的保障
(1)增强了数据安全性和安全保障。私有云特色数据库是为一个局域单位独立使用而构建,可进行安全加密存储,相关的“私有”技术提供数据安全性,保障数据处理和服务质量的最有效控制和管理,数据库私有云平台觖决了公有云系统潜在的病毒和黑客的攻击,可以有效防范外部非法用户,这也是私有云在安全方面优于公有云的优势之一。
(2)资源集成利用率高优化服务级别。将图书馆的硬件资源与软件资源以虚拟机和操作系统服务方式提供,从而改变了过去静态系统部署所带来的资源利用率低等问题。私有云可以利用高校图书馆现有的硬件资源来构建,降低购买成本和管理成本:数据在统一平台,方便统一管理,可以有效开展高校图书馆联盟服务和共享合作,极大地降低数字图书馆的运行成本和运行效果。[11]
(3)部署维护简单。提高云服务的可用性,私有云可以由自身ⅠT机构来进行构建,也可由云提供商协助进行设施建设,方式比较灵活。将域联盟中数字图书馆不同的数据应用系统,规划制作成为相应的应用模板,部署在虚拟机下运行。例如,统一检索系统模板与操作系统无缝整合,加工成为数字图书馆统一检索应用模板,部署简单,使用效果一致。
(4)扩展性高。可以方便、灵活地添加服务器硬件及布置自己的数字资源至该私有云平台下,满足应用系统对各种类型虚拟机资源的请求,私有云平台可扩展域联盟数字图书馆的泛在建设。支持虚拟存储,部署的虚拟机可以是一虚拟,也可以是多虚拟。
(5)管理容量需求满足度高。私有云的部署是在本地机房中,而不是在某一个遥远的数据中心,所以,当图书馆读者访问那些基于私有云的信息资源应用时,其服务质量相对稳定,不会受到互联网不稳定的影响。[12]
4.2 利用私有云的不足
(1)私有云系统可提供的虚拟机的类型是由镜像模板文件决定,系统构建的模板文件有限,使用时局限在这些模板上,如果要满足更多用户的需要,还需增加更多的镜像模板。
(2)目前还无法实现操作系统和应用软件间的动态组合,做到即需即用。如何实现用户对软件和平台的按需所用,是一个值得研究的问题。
(3)提供给用户登录虚拟机的方式是登录名和密码的方式,如何实现多样的私有登录是需要研究的。
(4)在域范围内还无法实现域用户对本单位的数据实现单独备份、存储、灾难恢复等功能。
5 结语
私有云下一步将创建含有开发工具包的应用模板,提供给开发用户使用,例如Office 2007、Java开发工具(JDK+Tomcat+Eclipse+数据库)等,以及有关数字图书馆应用系统的备份、存储、灾难恢复等问题,使得云计算在数字图书馆方面更加实用。目前,提供给用户登录虚拟机的方式是登录名和密码的方式,后续可考虑为用户提供密钥登录虚拟机的方式。总体上讲,私有云对联盟域特色库的建设和服务是可行的,具有一定的优势。
[1]盛宪锋,等.基于虚拟化技术的私有云APCS平台设计[J].计算机工程,2012,38(8):210-212.
[2]孙福权,等.基于Hadoop企业私有云存储平台的构建[J].辽宁工程技术大学学报(自然科学版),2011,30(6):913-916.
[3]赵凯.基于校园网的私有云设计[J].科技通报,2012,28(8):210-212.
[4]刘娟.简述三种私有数据库云模型[J].信息安全与技术,2011,(12):50-51,63.
[5]杨章伟,等.基于Hyper-Ⅴ的校内私有云构建研究[J].萍乡高等专科学校学报,2012,29(6):56-58.
[6]刘捡平,等.云计算科技服务系统平台设计研究[J].科技通报,2012,28(10):19-21.
[7]马少兵.数字图书馆私有云平台的构建和应用开发的研究[EB/OL].[2013-12-17].http://tgw. lib.tsinghua.edu.cn/2010report/219.
[8]赵美凯.基于Eucalyptus的数字图书馆私有云服务系统的研究与实现[D].北京:北京邮电大学,2012.
[9]樊光辉.云计算技术在高校实践教学中的应用研究[J].电脑编程技巧与维护,2012(22):125-126,128.
[10]EMCⅤPLEX专访:让数据在私有云自由流动[EB/OL].[2010-05-26].http://cloud.doit.com. cn/article/2010/0526/9883998.shtml.
[11]ⅠDF2012英特尔中国开源私有云实践[EB/OL].[2012-05-07].http://www.cdus.org/bbs/forum.php? mod=viewthread&tid=7177.
[12]吴广印.基于“云服务”架构的国家科技文献服务系统的设计与实践[J].数字图书馆论坛,2012(3):1-6.
TP393;G250.74
A
1005-8214(2014)11-0091-04
都平平(1965-),女,中国矿业大学图书馆研究馆员,副馆长,研究方向:数字图书馆,发表论文100余篇;郭琪(1974-),女,中国矿业大学图书馆馆员,研究方向:高校图书馆与地方文化经济发展,发表论文近10篇;苏贺涛(1991-),男,中国矿业大学硕士研究生,研究方向:计算机技术与应用;李雨珂(1992-),女,格坦斯克大学(Poland)国际经济关系专业学生,研究方向:经济信息管理,发表论文6篇;鲍劼(1980-),女,中国矿业大学图书馆馆员,研究方向:数字图书馆、云计算、虚拟化技术,发表论文10余篇;邓志文(1983-),男,中国矿业大学图书馆馆员,研究方向:智能信息处理,发表论文5篇。
2014-01-17[责任编辑]王岗
本文系中国矿业大学中央高校基本科研业务费社科基金“域联盟机构知识库建设研究”(项目编号:2012W02)的成果之一,江苏省教育科学“十二五”规划2013年度课题重点项目“高校域联盟机构知识库资源建设研究”(课题编号:B-b/2013/01/025)研究成果之一。