超融合技术在医学图书馆知识服务中的应用
2019-08-15
随着信息技术的不断发展,图书馆经历了传统图书馆、数字图书馆、移动图书馆、智慧图书馆发展趋势的演变。近年来,云计算、移动互联、物联网、大数据和人工智能等新技术的出现和广泛应用,对图书馆的服务和管理产生了革命性影响,创造了图书馆服务的新空间和新形态,提高了图书馆服务的效率和效能。医学图书馆作为医学文献信息资源的集散地,需要管理大量与医学相关的数据资料,新技术对医学图书馆发展与服务创新的作用不言而喻。
近年来,知识服务的理念逐渐渗透到图书馆领域,医学图书馆如何合理存储和管理海量医学数据,通过深度挖掘和分析,对知识资源进行发现、整合、重组,开展个性化、专题化和智能化服务成为医学图书馆未来知识服务的发展方向。知识服务需要强大的智能分析计算能力和高效的数据获取存储能力作为支撑,这对医学图书馆的软硬件基础设施提出了巨大挑战。传统数据中心基础架构下的存储容量和性能与计算能力已无法满足知识服务进行高速数据存储访问和分析计算的需求,因此需要一种新技术解决传统架构的不足,为医学图书馆知识服务提供有效支撑,超融合技术应运而生。
1 超融合技术
超融合技术,又称“超融合架构技术”,是指在单个一体化基础架构中同时具备计算、存储、网络和虚拟化等资源和技术的架构。超融合架构打破了传统的服务器、网络和存储的孤立界线,将CPU、内存、存储、网络、虚拟化技术整合在一台设备上,每一台设备作为一个单元节点,多节点通过网络聚合实现模块化的无缝横向扩展,形成统一的资源池[1]。
超融合架构以通用x86服务器为基础,通过集成计算、存储、网络及虚拟化技术,汇聚单台服务器的存储形成跨多个节点统一存储池的集群,提供更好的性能和扩展性。通过增加集群中的节点数量,即可扩展整个集群的计算性能和存储容量,并通过集群各节点间彼此的数据复制与备份,提供服务高可用性与数据保护能力[2]。
2 超融合技术的特点
2.1 融合
传统架构下的计算资源和存储资源是分离的,服务器通过SAN交换机与存储设备连接获取存储空间。超融合技术改变了传统服务器、存储、网络相互孤立的基础架构,实现计算资源、存储资源和网络资源的统一融合,每一台超融合节点单元可同时提供计算资源和存储空间。超融合架构采用软件定义的体系结构,不再依赖于硬件,计算、存储、网络完全虚拟化并由软件控制。服务器和存储得到了统一的部署和管理,并为整个虚拟化体系提供了简单、通用的管理和自动化平台。
2.2 敏捷
超融合技术通过软硬件一体化的融合,实现设备快速交付、架构弹性伸缩、业务敏捷部署和系统精简运维。超融合一体机在出厂时已根据需求完成硬件的集成和软件的安装,设备上架开机即可交付使用,极大简化了设备安装调试的复杂度。超融合技术基于虚拟化和软件定义,构建扁平化、随需而变、弹性可扩展的敏捷架构,所有资源均可按需部署、灵活调度和动态扩展。传统架构下的计算资源、存储资源和网络资源由不同的设备提供,管理者必须分别通过不同的管理工具管理多种设备,超融合架构下只需通过单一的平台即可同时管理计算、存储和网络资源,降低运维难度,实现精简运维。
2.3 安全
超融合技术实现了计算、存储和网络资源的融合,原来分散在不同服务器和存储设备上的数据全部集中在超融合节点本地磁盘上,系统及数据的安全风险随即凸显。超融合架构采用集群管理方式,系统出现故障时能够自动在其他节点设备上重启,避免物理环境的单点故障。数据多副本机制实现数据分散存放,不同数据副本放在不同的超融合节点上,当一个节点出现故障时,仍然可以依靠其他节点上的数据副本继续对外提供服务[3],有效保障业务连续性和数据安全。
2.4 开放
超融合架构采用软硬件解耦架构,在服务器层面,超融合架构能够在任何x86服务器上运行,与物理服务器的硬件配置无关,无需修改上层系统和应用即可运行;在存储层面,超融合架构支持与各种类型的外置存储进行对接,将数据存储到外置存储或使用外置存储作为备份介质;在网络层面,超融合架构无需依赖任何支持特定协议的网络设备,支持与现有网络设备组网连接。超融合架构能够为上层应用屏蔽底层复杂和异构的基础架构,对主流操作系统和应用进行兼容性适配和性能优化集成。
3 超融合技术在医学图书馆的应用
医学图书馆作为医学文献资源的汇聚中心及医学知识传播中心,在医学科研支撑和医学知识传播中发挥着重要作用[4]。医学图书馆由于自身的专业性,拥有大量数字化的专业图书、期刊和数据库等结构化数据,以及用户信息、借阅信息、浏览记录、检索历史等非结构化数据[5]。随着医学文献资源类型的多样化,数据量及非结构化数据的迅速增长,需要不断扩大存储空间和计算规模[6],数据中心服务器数量、网络复杂程度及存储容量急剧增长,传统数据中心架构的弊端也逐渐显现,烟囱式的建设模式导致设备种类繁多,设备配置独立,管理割裂,不仅带来高昂的硬件成本和运营成本(空间、电力、制冷、管理人员等),而且新的服务器、存储和网络设备部署周期较长,导致业务部署缓慢。随着虚拟化技术的不断发展和广泛应用,医学图书馆通过采用虚拟化技术有效解决了资源利用率和高可用性的问题,但并未改变业务部署过程中的复杂性。而且,传统虚拟化架构极度依赖外部存储磁盘阵列,只能通过专用的存储网络访问存储资源,计算资源与存储资源分离的部署模式依然没有改变。因此,医学图书馆数据中心基础架构必须能够优化计算、网络和存储资源之间的关系,实现真正的灵活部署以及弹性扩展,才能支撑起知识服务的应用需求。
3.1 解决方案
超融合架构(图1)是基于软件定义数据中心理念下的解决方案,能够实现计算、网络、存储资源的全面融合,通过全虚拟化的方式构建基础架构资源池,所有资源均可按需部署、灵活调度、动态扩展。通过超融合一体机或超融合操作系统能够在短时间内充分利用现有硬件基础架构,将业务系统安全、稳定、高效地迁移到超融合平台中,满足业务应用高性能、高可靠和高可用的要求,提高基础架构的自动化水平。
图1 超融合架构
如图1所示,超融合架构以通用x86服务器或超融合一体机为基础架构,单台服务器或超融合一体机通过交换机进行网络聚合,实现具备横向扩展能力的基础架构。基于虚拟化技术构建超融合架构层,实现网络虚拟化、服务器虚拟化和存储虚拟化,通过软件化的方式构建统一的资源池,实现基础架构资源的管理和调配,提供数据中心基础架构所需的全部资源。多业务模板层能够快速构建出业务逻辑,实现虚拟资源的动态调配和灵活扩展,部署简单快速,管理轻松便捷。应用层通过超融合架构实现云服务模式,提升组织管理和业务管理效率,降低平台运维难度和运营工作量,提升应用服务的敏捷性和快速响应能力,从而提高医学图书馆业务管理水平和服务效率。
3.2 主要技术
3.2.1 服务器虚拟化
服务器虚拟化是整个超融合架构中的核心组件,基于裸金属架构的虚拟化程序直接运行在服务器上,实现对服务器物理资源的抽象,将CPU、内存、硬盘等服务器物理资源转化为一组可统一管理、调度和分配的逻辑资源,并基于这些逻辑资源在单个物理服务器上构建多个同时运行、相互隔离的虚拟机执行环境[7],实现更高的资源利用率,减少系统管理的复杂度,加快对业务需求的响应速度,提供高可靠、高可用的应用服务。
3.2.2 存储虚拟化
存储虚拟化是将集群各节点服务器上独立的硬盘存储空间进行组织聚合(图2),构成一个共享的存储资源池,所有的存储资源在这个存储池中统一管理,实现存储资源的自动化管理和分配,构建高效灵活的存储架构与管理平台,提供高可靠、高性能存储。
如图2所示,存储虚拟化基于分布式存储系统,融合了分布式缓存、SSD读写缓存加速、多副本机制等多种存储技术,在功能上与独立共享存储完全一致。存储虚拟化通过SSD缓存,可以大幅提升服务器硬盘的I/O性能,实现高性能存储和业务高效可靠运行。存储虚拟化采用多副本机制,一份数据同时存储在多个不同的物理服务器硬盘上,提升数据可靠性,保障关键业务安全稳定运行。此外,由于存储和计算完全融合在一台服务器上,省却了外置磁盘阵列的控制器、光纤交换机等设备,达到了降低成本的目的。
图2 存储虚拟化
3.2.3 网络虚拟化
网络虚拟化通过实现网络中所需的各类网络连接服务(包括路由、交换、安全、负载均衡等)按需分配和灵活调度,提供了全新的网络连接运维模式,解决了传统硬件网络的众多管理和运维难题,可满足业务应用对网络快速、灵活自动化部署的需求(图3)。
图3 网络虚拟化
如图3所示,网络虚拟化与服务器虚拟化相结合,以底层物理网络作为数据包转发底板,在虚拟机和物理网络之间构建网络虚拟化层,以软件形式提供一整套完整的逻辑网络设备、连接和服务,实现与物理网络的无缝互连,降低网络复杂度,简化网络的配置管理。网络虚拟化可以快速完成不同应用系统的网络部署、网络配置的自动化调整、网络故障排查等工作,提供灵活且适应性强的网络连接功能,提升网络调配速度并精简运维,显著增强了网络安全性,大幅降低网络建设成本。
3.3 应用效果
3.3.1 基础架构简化
超融合技术实现了计算、存储、网络的融合,原有服务器依靠交换机连接存储控制器和磁盘阵列的架构模式,现只需要超融合一体机和交换机即可满足业务需求,架构简单。传统架构无法支持存储空间和性能的横向弹性扩展,超融合架构具有很高的自动化程度,扩展简单方便,只需将新的服务器加入原来的集群,即可实现性能和容量的自动同步扩展。
3.3.2 降低成本
超融合技术能够有效降低数据中心基础设施成本和运营维护成本,包括物理空间、机柜、网线、电力、制冷和人力成本等。采用传统虚拟化架构模式,虽然服务器数量有所减少,但存储、光纤交换机等设备的投入却明显增加。超融合架构能够控制和减少服务器数量,明显提高服务器资源利用率。由于省却了外置存储磁盘阵列的控制器、存储交换机等设备,极大降低了建设成本,并避免了传统存储无法平滑扩展性能,且需要迁移存储数据带来的风险。
3.3.3 提高运维效率
与传统架构相比,超融合架构管理更为简单,能够实现资源的高效部署、运维、管理[8]。传统架构下,服务器、存储、网络设备和虚拟化系统来自不同的供应商,需要分别进行管理配置,运维复杂繁琐。超融合将计算、存储、网络、虚拟化集成到一个界面上,通过同一运维界面,可以对物理主机、服务器虚拟化、存储虚拟化、网络虚拟化等设备和组件进行资源管理和调配、负载监控、网络拓扑部署、网络策略配置、系统数据备份等操作,实现资源的全面管理和调度,极大简化了复杂的运维工作。
3.3.4 高可靠
超融合技术通过多副本机制保证数据的可靠性,与传统存储的RAID方式不同,多副本机制把每份数据复制成多份副本进行存储,同一份数据在不同的物理服务器硬盘创建2~3个相同的副本,当服务器或硬盘发生故障时,可通过分散到其他服务器节点上的副本读取数据,不会中断存储服务。当数据发生变化时,所有副本通过网络进行同步,确保了数据的一致性。多副本的同步存储方式能够在最大程度上确保数据的互备效果,实现存储的高可靠高可用性。
3.3.5 高性能
传统存储架构基于SAN进行数据存储访问,存储控制器决定了存储的整体性能。随着业务的不断增长,当I/O需求大量增加时,巨量的数据访问请求会导致控制器阻塞,造成性能瓶颈,而且传统存储的SAS硬盘、SATA硬盘读取缓慢,难以满足众多应用系统高速数据访问的性能要求。超融合技术以软件定义存储代替传统SAN存储,在集群各服务器节点上部署快速的SSD盘和大容量传统SAS、SATA硬盘,借助于SSD盘的高效缓存技术,大幅提升服务器硬盘的I/O性能,增强存储的响应速度,满足数据快速访问性能要求和大容量存储空间的需要。
4 结语
随着医学图书馆知识服务的广泛开展,数据中心业务快速增长,各类业务应用对数据中心的性能要求直线上升。超融合架构能够突破以硬件为中心的传统架构的限制,不仅具备极大的易用性和简化部署,还可以有效提升业务敏捷性和响应速度。采用超融合技术,将传统服务器、存储、交换机和其他网络设备的竖井式叠加架构模式,简化为只有 x86 服务器和交换机的扁平式架构模式,不仅能够实现计算、存储、网络的统一管理,还极大降低了数据中心的成本和运维压力。因此,超融合架构能够有效提升数据中心的运行效率,为医学图书馆知识服务提供有力支撑。