基于医院虚拟化平台改造升级项目的数据迁移技术研究
2024-04-06李刚
李刚
关键词:VMware Esxi虚拟化平台;平台升级改造;超融合;数据迁移
中图分类号:TP311 文献标识码:A
文章编号:1009-3044(2024)03-0088-03
1 概述
安徽医科大学附属阜阳医院是一所集医疗、教学、科研、康复、保健、预防为一体的现代化综合性三级甲等公立医院,于2017年7月开诊运营。因医院临床业务数据增多、大量新业务系统上线等原因,数据中心已不能满足日益增长的信息化需求,需要进行升级改造。
本文结合医院虚拟化平台改造升级项目案例,重点探讨虚拟化平台改造升级中的数据迁移技术。
2 改造升级方案
2.1 项目背景
改造升级前,医院有两套虚拟化平台和二十余台X86物理服务器承载临床业务系统,主要存在以下四种部署方式。
1) VMware Esxi虚拟化平台:由三台物理机承载,通过两台SAN交换机连接三台存储设备,承载PACS、病理管理、病案统计、LIS等30多个业务系统。
2) 华为Fusion Compute虚拟化平台:由十台物理机承载,通过两台SAN交换机连接三台存储设备,承载心电网络、合理用药、自助机打印、合理用血等40多个业务系统。
3) NAS平台:由五台高性能物理服务器承载,通过NAS技术共享一台存储设备,分别承载HIS、EMR数据库、EMR应用、集成平台数据库、集成平台应用五个重要的业务系统。
4) 单服务器:二十余台低性能物理服务器,每台服务器承载一个非常重要的业务系统。
改造前IT系统架构如图1所示。
改造前的IT系统主要存在以下问题:
1) 设备型号老旧、软件无法升级:承载虚拟化平台的服务器(华为RH2285H V2) 、存储设备(华为Ocean?Stor S2600T) 设备型号老旧,已到使用寿命周期。华为虚拟化平台版本為1.0版,版本老旧且无法升级。
2) 架构可靠性低:HIS、EMR、系统集成平台等核心服务器均为单台部署,无双活或主备机制;存储设备均为单机部署,无冗余设计,存在单点故障,架构可靠性低。
3) 平台拓性能低下:存储设备型号老旧,存储无法挂载存储柜扩容;SAN交换机及服务器HBA卡均为8GB,传输速度慢。
2.2 需求分析
由于承载虚拟化平台的物理服务器和存储设备型号老旧,性能下降严重,架构可靠性存在安全隐患、业务拓展性差,需要建设一套新的虚拟化平台,并迁移业务数据系统到新的虚拟化平台。
2.3 升级方案
以虚拟化技术为基础,结合Vmware软件,将医院现有生产业务系统部署到超融合虚拟化平台上,利用万兆以太网支撑系统间的数据交换,实现计算、存储、网络等资源的统一管理[1]。
1) 超融合架构:超融合架构是指在同一套单元设备中具备计算、网络、存储和虚拟化等资源和技术,多节点通过网络聚合以用来实现模块化的横向扩展,形成统一资源池架构。由于稳定可靠、优异的性能、快速搭建等优势,已渐渐取代传统的光纤存储架构(FCSAN交换机+光纤存储),而成为数据中心虚拟化平台首选[2]。本次部署6台高性能4U超融合服务器,搭载7.0版本Vmware软件,搭建一套基于超融合架构的全虚拟化业务平台。
2) 核心存储:由于HIS、EMR、集成平台是医院最核心业务系统,选择两套15T全闪存核心存储设备,将现有HIS、EMR、集成平台的数据集中存储在全闪存存储阵列上,在两套存储之间采用双活技术实现存储级别的容灾保护,并新增一台容灾存储,作为核心存储的数据备份,增强数据安全性。
3) FC-SAN交换机:目前SAN交换机均为8GB,本次采用两台主流的16GB-FC SAN,作为本次超融合平台计算与存储资源的数据桥梁,提高数据访问速度。
改造后IT系统架构如图2所示。
3 数据迁移问题与探索
数据迁移是本次虚拟化平台改造升级的重点。迁移指的是把源主机上的操作系统和应用程序移动到目的主机,并且能够在目的主机上正常运行[3],主要分为冷迁移和热迁移。冷迁移是指在源主机停止服务的状态下,使用迁移工具将整个源主机的数据移动到目的主机。热迁移是指在源主机不停机的状态下,把数据迁移到目的主机。冷迁移方式可以创建一份和源主机最为一致的数据,因为在迁移期间源主机的数据库数据不会被写入,应用系统数据也属于停止写入状态,因此迁移后的目标主机和源主机的数据最为一致。在允许停止业务的情况下,一般推荐使用冷迁移方式。但由于医院信息系统使用环境的特殊性,例如HIS、LIS、电子病历系统停用较长时间,会对病人、医生造成极大的不便,影响病人就诊和医生及时诊疗。除此之外,医院业务系统较多,各业务系统之间数据交互、数据共享复杂,因此本次数据迁移时不但要保证数据的安全性和完整性,更要尽可能地保证各业务系统的持续服务。本项目通过信息系统项目管理知识,根据不同场景采用多种迁移方式,进行不完全停机数据迁移。
3.1 项目管理
数据迁移工作十分烦琐且庞杂,需要制定合理的计划。本项目采用信息系统管理的进度管理、沟通管理、风险管理的相关知识。
进度管理阶段:首先搜集待迁移业务系统数量、业务数据量、数据库空间、操作系统版本等信息,定义超融合服务器安装、存储设备安装、联合调试、迁移服务器等活动节点,估算各项活动的持续时间,最终制定合理的施工进度计划,确保每个活动在预定时间内完成。
沟通管理阶段:本次升级改造中涉及的应用软件厂家、项目技术人员、医院科室较多,由于不同角色对该项目的期望值不同,因此在项目实施中,采用了头脑风暴、问卷调查、建立微信群等方式,定期召开项目沟通协调会,保持沟通流畅。
风险管理:在迁移业务系统前,根据医院业务系统的重要程度,划分为核心、重要、一般、非重要四个业务等级,并对每个系统进行定性风险评估和定量风险评估,制定了应急方案,方案内容包括迁移详细步骤及迁移失败后的应急操作步骤及恢复所需时间。
3.2 数据迁移技术探讨
本次虚拟化平台改造升级,共涉及145台服务器的迁移,数据库主要是Oracle和Sql server数据库。数据迁移应遵循尽量不停业务、降低影响范围、能够应急恢复等要求。
1) 同一类型虚拟化平台迁移:源虚拟机平台和目标虚拟机平台都属于VM架构,但不在同一个虚拟化平台,需要跨vCenter Server 进行计算资源和存储迁移。本次采用V2V业务系统在线热迁移方式,实现不停机在线迁移业务系统。采用方式为:把源VM虚拟机平台由6.0版本升级到6.5版本(目标VM虚拟机和源虚拟机平台均需在6.5版本及以上),采用VM自帶的Advanced Cross vCenter vMotion 工具,把源虚拟机平台内业务系统的计算资源和存储一起热迁移到超融合VCENTER管理平台。
2) 不同类型虚拟化平台迁移:针对物理机、华为虚拟化平台的业务系统,利用“VMware vcenter Con?verter”迁移工具进行P2V方式迁移。首先在超融合VM虚拟化平台内新创建一台虚拟机并安装VMwareConverter软件,指定待迁移的源虚拟化平台和目标虚拟化平台,在迁移即将完成前几分钟,通知业务部门停止写入数据,等待所有数据同步完成后,老的业务系统停机,迁移后的系统更换成老业务系统的IP地址,完成整个迁移工作。
3) 异构系统迁移:异构系统切换升级是一个数据资源迁移的过程[4]。HIS、EMR、集成平台是医院核心的业务系统,均部署在windows2008 R2操作系统,采用oracle 11.2.0.1数据库。此次迁移,HIS服务器迁移后采用Centos系统,EMR、集成平台的操作系统升级到WINDOWS 2016版本,数据库都统一升级到oracle11.2.0.4 版本。在oracle 数据库迁移中,本次采用ORACLE DATAGUARD 和RMAN工具保证数据库的无缝迁移。步骤如下:首先在超融合内部署虚拟机及操作系统、数据库,在迁移准备阶段,开启归档并在目标虚拟机内搭建ORACLE DATAGUARD,建立Win?dows与LinuX/Windows的数据同步机制并进行检查,确保数据库具备主备切换条件。在数据库割接阶段,根据提前和临床科室沟通好的割接操作时间,目标服务器更改为源服务器的IP地址,并完成主备数据库的切换工作,并交付给应用使用。在应用上线阶段,对应用测试,确认是否具备上线条件,如测试数据正常则确认应用切换成功,否则按回退方案回退至原生产环境,启动应用交付使用。
3.3 数据迁移注意事项
由于医院临床业务系统业务连续性、数据准确性要求较高,迁移数据时要注意以下几点:
1) 系统迁移前,提前搜集各业务系统的业务数据量、数据库数据量、操作系统版本、IP等信息,预估各系统迁移时间,切换的时间,并根据业务系统的数据量,通过事前测试,掌握数据迁移的耗时,落实各个操作的时间点[5]。
2) 迁移过程中,应做好充分的准备工作,因需要的迁移工具较多,在数据迁移时,要注意各工具出现的报错信息,及时排查。迁移时,提前做好备份,万一出现迁移失败,可以通过备份文件及时恢复。
3) 数据迁移完成后,要登录到业务系统服务器及时进行数据校验,进行服务、数据库数据验证。如出现应用报错,应及时回退到原生产环境。
4) 利用信息管理系统进行精细化管理。在数据迁移中,要注意做好管理计划、风险管理、沟通管理等工作。
4 典型问题分享
本次迁移中,出现了一些数据迁移典型问题,进行分享。
问题一:输血系统在迁移时,进度条长时间卡在1%,界面显示报错信息:“Connecting to the Converterhelper server on the destination virtual machine.”。
解决方式:由于源虚拟机的防火墙处于开启状态,阻止了443端口。由于443端口用于HTTPS服务, 因此一直迁移不成功。关闭防火墙,解除对443端口阻止即可。
问题二:低性能物理服务器利用VMware vcenterConverter 迁移时,提示“Error Clonevolume:detected awrite error during the cloning”报错。
解决方式:由于VMware vcenter Converter软件不支持部分服务器导致。本次利用Netbackup工具,选择自定义RMAN脚本备份方式,进行“全量+增量”方式进行迁移。
5 总结
本次通过分享医院虚拟化平台升级改造案例,重点探讨了虚拟化平台改造升级中的数据迁移技术。通过本次升级,实现了一个管理平台管理所有医院内网业务系统,在提高IT基础运行环境、提供安全可靠性的同时,也方便了后期运维,助力医院信息化更加稳定运行。
【通联编辑:光文玲】