基于云计算的数字图书馆建设与实现
2021-04-20于芳
于芳
(哈尔滨工业大学(威海)图书馆,山东威海 264209)
信息网络技术的发展,给传统图书馆的建设和文献资源的管理带来了巨大变化。信息资源的利用由传统的物理空间向虚拟空间转变,由模拟状态向数字状态转变[1-3]。云计算作为数字图书馆的应用架构模式,实现了数字信息资源的集约化整合,为数字资源共建提供了新的解决方式[4-5]。目前,国内外众多企业都投入到云计算新模式中,以IaaS、PaaS、SaaS为服务模式提供各种数字化服务[6-8]。如LibLime 公司发布的订购托管服务Koha Express,通过全功能的图书馆系统(ILS)实现在LibLime 云计算的开发,并构建了分布式数字图书馆云服务平台[9]。Google 提出的Web2.0 理念和技术,基于Google Analytics 来获得图书馆目录和网站数据信息,并提供详细的图表式报告,实现对图书资源的综合化利用,为用户提供更便捷的服务[10-12]。
从相关研究可以看出,基于云计算的数字图书馆能极大改善图书馆服务,成为当前性价比高、扩展性好的图书馆建设方案[13-15]。但由于云计算在图书馆的应用还处于初始阶段,存在一定的问题,如数字图书馆信息资源的安全问题,信息资源的完整性和用户访问控制权限等问题。在相关研究基础上,构建云计算的数字图书馆应用模型拓扑结构、模型体系架构和数据库服务架构,实现云计算数字图书馆的资源共享和数据传输。
1 云计算的数字图书馆模型构建
1.1 模型体系结构
基于云计算的数字图书馆服务平台利用分布式、虚拟化功能,将异地操作平台软硬件资源进行整合,实现对资源的云服务[16]。图1 所示为云计算数字图书馆模型体系架构,主要分为基础设施服务层、平台服务层、应用服务层和云客户端。
图1 云计算数字图书馆体系结构
基础设施服务层作为云服务体系框架的基础,处于框架体系的最底层,该层通过虚拟技术的管理功能实现系统各类硬件资源的融合。其中包含了两个部分的主要内容:第一部分利用互联网、主机硬件等进行集群、虚拟化、抽象画处理,将功能及设备在虚拟化技术下集群在同一区域平台,搭建云计算基础层,用户根据自身的需求下达指令即可从“云服务”中提取需要的硬件资源;第二部分为用户提供服务管理、负载管理、数据存储等接口服务功能,提升数字图书馆的动态灵活性。
平台服务层作为管理中间层,也是整个云服务框架的第二层,主要负责网络安全管理、程序管理、信息资源管理和读者管理等。网络安全管理是为了保障云计算免受外界的恶意攻击和骚扰,其中包括病毒防护、控制访问、身份认证等技术;程序管理负责执行用户提交的任务,其中包括程序调度、程序回馈、程序部署等功能;信息资源管理负责各云计算资源节点的均衡使用,并实时监测节点的运行状态,一旦某一节点发送故障,通过中间层对故障节点进行屏蔽或者回复处理,并统计资源的使用情况;读者管理作为数字图书馆的重要组成部分,主要为用户提供用户交互接口、管理和识别用户身份等。
应用服务层作为第三层,同时也是整个云计算服务体系结构的核心层,主要为用户提供满足使用要求的各类应用服务。数字图书馆根据用户需求,采用软件服务(Saas)应用,通过购买或租借的形式向用户提供图书馆的核心服务项目,包括数字资产管理、个性化服务咨询、资源搜索、原文传递服务、科技评估服务、信息服务统计等。
云客户端作为云服务框架的最上层,是链接底层和云服务器的载体工具,它摆脱了计算机的限制,可以利用任何能访问云服务网络的终端设备实现各类终端对云服务器的访问。
1.2 网络拓扑结构设计
云计算模式下,网络成为信息服务的传送媒介。根据数字图书馆的功能需求,系统数据库以区为单位,在各分区间独立运行,并采用接口卡连接。文中将整个数据库系统划分为3 个分区,各分区间分别配置2 个网络接口卡。利用云计算服务器虚拟化技术将原本终结在交换机的网络端口数据转移至虚拟交换机端口终结。采用虚拟化网络平台实现同一物理服务器具有相同功能的虚拟机间的数据传输,而具有相同功能,处于不同物理服务器的虚拟机执行数据传输和交换机间的转发。对于不同功能的虚拟机,路由工作只能在核心交换机上进行。当根据服务器功能对网络拓扑结构划分时,直接在核心交换机上隔离不同功能的服务器群,图2 为设计的云计算数字图书馆网络拓扑结构图。
1.3 云服务实现流程
云计算数字图书馆平台功能需遵守严格的使用流程,如图3 所示为云服务平台实现流程。将整个云服务平台分为应用服务器、服务器群、前端、管理节点。应用服务器主要执行相关程序;服务器群将系统服务进行整合,形成一个服务器群,并向用户提供各类服务模式;前端主要负责系统负载均衡,并将接收到的响应转发给对应服务器,形成静态文件;应用管理节点主要提供复杂应用的启动和停止、应用费用的计算。
图2 云计算数字图书馆网络拓扑图
图3 云服务平台实现流程
针对数字图书馆满足数据信息资源的服务器虚拟化和集中存储需求,该系统所有数据基于SAN 存储架构系统采用集中式的存储和保护方式。对数据库系统,由于信息存储量较庞大,要求性能较高、可靠性和应用性较强,因此虚拟化服务器系统采用适用于X86 服务器的VMware 虚拟化系统来提供共享存储服务,通过内配置磁盘阵列分区实现不同文件的数据存储。
2 数据库整体架构设计
2.1 数据库服务架构
基于云计算的数字图书馆数据库采用集中部署方式,即数据库系统和业务系统为一对一关系,各物理设备通过一台数据库服务器连接,采取分区的数据库虚拟化技术解决物理位置的集中问题[17-18]。
根据数字图书馆的需求分析和设计方案,系统采用核心为IBM Power 570 的数据库服务架构。通过虚拟服务器为虚拟分区提供I/O 服务,实现多个VIO 虚拟客户分区的资源共享,有效降低了运行成本。IBM Power 570 中采用共享以太网和虚拟SCSI支持共享网络和磁盘I/O。微分区允许虚拟分区在占用最小CPU 资源下执行需求操作,由于物理服务器采用的是共享数据库,因此虚拟服务器不受限于物理服务器限制,能够基于不同服务器执行。在微分区基础上,通过一种未封顶的共享处理器逻辑分区来提升CPU 授权容量,且授权容量能够释放到创建的CPU 配置文件中。这样在突发的CPU 密集时期,系统可调用空闲的CPU 资源,以一种动态方式简化工作负载管理。
动态分区与迁移(LPAR)将正在运行的逻辑分区LPAR 由一个物理服务器转移到另一个服务器,允许专用处理器分区利用空闲CPU 资源,通过多个处理器池实现荷载均衡,提高数据吞吐量。同时动态分区迁移可直接在Linux 分区运行,不需重新编译操作,实现了对LX86 的Linux 应用服务器的整合。
工作负载分区与迁移(WPAR)将逻辑分区拆分为未配合内核的工作负载,利用WPAR 作为LPAR的组成部分,降低了AIX 映像对象的维护数量。WPAR 中多个分区共享一个物理内存池,各分区间可根据承担的负载情况来调配内存资源,负载分区也提供了手动功能,管理员也可手动为分区分配转移内存资源。
如图4 所示,本系统在IBM Power VM 虚拟化技术的基础上,选用两台Power 570 服务器,服务器间通过Power HA 和Oracle RAC 技术构成热备份集群环节。根据逻辑分区将服务器划分为3 个分区,各分区均具有独立的CPU、存储介质和内存,同时在每个分区间设置相应独立的Oracle 数据库,建立3 台独立的逻辑计算机服务器。
图4 云服务数据库服务架构
2.2 数据库访问
基于云服务数据库服务框架设计的数字图书馆数据库平台在保留原有系统基础结构下构建云计算数字图书馆服务平台,通过XML 和XHTML 语言规范以及准确的Oracle 数据库访问语言就能实现对该数据库的访问。用户利用数据库和互联网网络页面间的相互交叉关系来实现对数据库服务的查询和访问功能。
3 云服务安全性设计
3.1 用户权限安全性
基于云计算的数字图书馆的安全风险主要包括用户认证风险,数据隔离、数据泄露、数据存储的风险,以及云计算平台的系统安全漏洞、用户隐私保护、应用程序安全风险等。
系统登录是云服务安全设计的第一个屏障。用户必须通过正确的用户名和安全秘钥才能通过用户认证流程。为确保用户的安全访问,系统提供了接入层认证和应用层认证两种安全访问方式。接入层认证首先根据用户名、密码和附加码判断注册用户使用权限;应用层认证验证接入用户是否合法,用户是否具备该内容的访问权限等。此外,根据认证机制的不同,又分为单独应用层认证和应用服务器认证。单独应用层认证中,当用户接入系统后,针对用户认证分为两次,即用户接入时的认证和接入通过后的验证。第一次认证以非透明的方式验证用户认证信息,由平台中心认证服务器响应认证请求,确认用户访问是否合法,并将用户ID 返回应用服务器,响应服务器授权请求,给定特定权限的访问服务范围,第二次认证采取透明的方式,不需要用户的任何认证信息,认证服务器响应服务器授权请求,并将开始信息和使用记录传递至中心数据库,系统自动对用户信息认证,通过这种认证方式一次性完成了接入层和应用层认证。
云计算数字图书馆数据库是存储用户资料的唯一设备,采用重定向的方式进行用户身份的验证,即将所有应用服务器请求统一由中心认证服务器进行。在重定向认证中,当用户对系统服务器发出请求时,服务器对用户身份信息验证,同时确认用户访问的合法性,并给定特定的权限范围,图5 所示为重定向认证方式。用户访问服务器时,由中心认证服务器发出认证请求,数字图书馆系统中心响应认证请求,并提示用户输入认证信息,查验用户信息是否满足数据库数据。当输入信息与保存信息相同时,为用户分配用户ID。中心服务器向用户发起授权请求,由认证服务器响应授权请求,并认证业务权限,认证服务器发送信息至中心数据库并记录用户使用记录。当服务结束时,应用服务器向中心认证服务器发送服务结束请求,认证服务器确定服务结束。
图5 重定向方式
3.2 模型组网安全性实现
系统采用简易模型网络拓扑结构来实现系统功能和安全需求,图6 所示为云计算网络拓扑结构。首先,在系统中添加防监听盗窃设备,当系统启动具备监听防盗等功能的设备时,设备接收到数据,将携带的MAC 地址与网络所有端口MAC 地址循环比对,查找到对应的MAC 地址接收端口后,将数据帧发送到对应端口。同时,系统中加入防入侵功能设备,网络中采用VLAN 技术,利用交换机或路由器端口控制将网络IP 进行分段,将内部系统与外部互联网网络断开,当用户访问系统时,首先对用户身份进行验证,只有通过系统认证才可以访问数据库服务器数据信息。最后,系统中引入存取控制表技术用于路由器和交换机、VLAN 和VLAN 间的数据交换,有效限制了用户在网络中的访问范围。此外,系统中还添加了硬件防火墙设施,避免了外部用户的非法访问。
图6 云计算网络拓扑结构
4 结束语
以基于云计算的数据图书馆服务平台为对象,逐步分析了数字图书馆云服务的体系结构、服务模式和系统功能。基于云服务的数字图书馆服务平台采用基础设施服务层、平台服务层、应用服务层和云客户端四层体系架构,实现各类软硬件资源的整合。基于SAN 存储架构系统,采用X86 服务器的VMware 虚拟化系统提供共享存储服务。服务架构利用IBM Power VM 虚拟化技术实现物理适配器供多个VIO 虚拟客户分区共享,提高了网络利用效率。为保证系统安全性,采用重定向认证的两层认证技术进行用户登录身份和用户访问权限的认证,确保用户正常进入系统路径,避免非授权用户侵入系统网络。