医院容灾解决方案
2018-11-05李瑞雄
李瑞雄
摘要:医院对应用系统的连续性要求极高,需要全面的灾备保障服务。机房、电源、空调、服务器、存储、交换机,任何一个硬件的故障都有可能导致医院应用系统崩溃,进而影响医疗业务的正常运行。以医院本地机房为主生产中心,以电信天翼云为灾备中心,基于中国电信天翼云、政务外网或云专线、容灾备份软件可以面向医院提供全方位的灾备保护。
【关键词】医院容灾 天翼云 应用级容灾 容灾解决方案
1 医院容灾需求
医院对应用系统的连续性要求极高,需要全面的灾备保障服务。机房、电源、空调、服务器、存储、交换机,任何一个硬件的故障都有可能导致医院应用系统崩溃,进而影响医疗业务的正常运行。如果在医院本地平台故障时,有第三方平台能够快速接管医院的应用系统,则能够在最短时间恢复医疗业务的有序运行。
本文结合实际项目和公有云灾备方案对医院云容灾解决方案进行探讨。
2 方案概述
本方案以医院本地机房为主生产中心,以运营商公有云为灾备中心。基于运营商公有云、政务外网或云专线、容灾备份软件可以面向医院提供全方位的灾备保护。当医院本地机房或平台出现故障时,公有云灾备中心能够快速接管应用系统。
3 医院云容灾解决方案
医院云容灾解决方案是基于三层IP网络的应用级容灾方案,以公有云为应用级容灾中心,根据需要容灾保护的服务器数量,开通相应的云主机。
3.1 數据同步机制
平时,应用系统在医院本地的生产中心运行,容灾软件将生产中心服务器上的变化数据实时复制到公有云的云主机上。
3.2 网络配置同步机制
公有云平台一般支持用户自定义云主机IP,医院本地服务器的IP地址,都可以一模一样地配置到公有云上,以保持服务器之间的组网逻辑不变。
院内服务器与云上服务器配置一样的IP地址,为避免IP地址冲突,需在医院内新增2台防火墙,与公有云上的虚拟防火墙通过专线互联,通过NAT进行网段隔离。
3.3 容灾切换机制
当医院生产中心应用系统故障时,维护人员可通过容灾控制台将应用系统切换到天翼云容灾中心运行。
为保证应用系统切换至云灾备中心之后,院内PC和医疗设备可顺利访问云灾备中心的应用系统,需要引入2台负载均衡设备,部署在院内机房。
负载均衡设备将院内的服务器和公有云上的服务器通过VIP面向院内PC、医疗设备提供服务。平时,负载均衡的VIP指向院内的服务器,当应用系统切换至云容灾中心时,维护人员将负载均衡VIP指向云灾备中心的服务IP,以保证电脑、医疗设备与容灾中心的应用系统交互。
平时客户端访问服务端的数据流如图1所示。
容灾切换后,客户端访问服务端的数据流如图2所示。
当医院本地生产中心的环境具备生产条件时,通过容灾控制台和负载均衡设备将应用系统回切到本地生产中心继续运行。
4 方案优点
4.1 生产中心和容灾中心互不影响
本方案为基于三层IP网络的应用级容灾方案,与二层网络的容灾方案相比,优点在于生产中心和容灾中心保持独立运行,不会因为容灾中心或线路故障而影响生产中心的业务运行。
4.2 容灾演练便捷
整体容灾平台建设完成后,需要定期的功能验证及演练。容灾演练在提升故障处理熟练度的同时,可对数据一致性及功能完整性进行全方位的不定时验证,确保整个灾备平台在任意时刻都是完整有效的。一般方案设计上的容灾演练周期为一个季度或者半年。基于云平台灵活管控机制及基于三层网络的容灾机制,本解决方案可很方便的提供封闭环境下的演练模式,保持两个数据中心不冲突的同时在线,进行数据及功能的访问对比,达到整体演练的目的。
4.3 方案实施对医院现有业务基本无影响
容灾方案的实施对现有业务系统的最主要影响是客户端访问服务端IP的变化。由于负载均衡VIP与医院服务器IP可以并存,客户端既可以访问服务端的真实IP,也可以访问VIP。因此,无论客户端中内置的服务IP是否变化,应用系统都是正常使用的。