基于混合云的医院容灾系统设计与实现

2020-03-15张云何懋周帆帆

电子技术与软件工程 2020年23期

张云何懋周帆帆

（昆明医科大学第一附属医院信息中心云南省昆明市 650032）

近年来，大型综合性三甲医院通常建设有数据中心，以承载以电子病历为核心的HIS、EMR、PACS、LIS 等信息系统的运行，为医院业务工作的开展提供了平台技术支撑。随着互联网医疗、大数据、人工智能、智慧医疗等技术的不断应用，医院信息系统不断发展壮大，医院管理、科研、教学、医疗越来越依赖于信息系统支撑和数据的支持，庞大系统应用，信息数据海量增长，信息数据逐渐发展成为医院核心资产。信息系统高度集中和信息存储网络化，加大了各类风险的发生概率和信息资产的脆弱程度。

1 数据中心现状

昆明医科大学第一附属医院是一所集医疗、教学、科研、干部保健于一体的大型三甲综合医院，编制床位4500 张，年出院17.28万人次，门诊量396 万人次，每年产生结构化数据（HIS/EMR、LIS、PACS 等）和非结构化数据（PCSA 影像）约28TB。拥有同城两个院区，分别建设有B 级标准机房和数据中心。主院区数据中心核心网络区：利用万兆交换机通过交换机多虚一集群技术实现跨交换机的链路聚合，提供万兆网络接入服务。服务器区：数据库服务区主要采用X86 物理主机集群方式，利用Oracle RAC 实现服务器本地双活，支持HIS、EMR、PACS、LIS、ICU 等核心业务应用，保障医院业务7X24 小时持续运行，满足业务系统高性能、高可用、高可扩展性、高稳定的需求。应用服务器采用虚拟化方式形成计算资源池，采用多节点的虚拟化平台进行建设，通过资源管理平台对计算资源进行按需分配和动态调配。

2 需求分析

医院信息化的深入发展，医院信息系统成为迄今为止世界上企业级信息系统中最为复杂的一类[1]，使得医院业务活动离开信息系统就难以运行的地步。源源不断涌入的人群，7×24 的业务运行方式，使得医院信息系统数据以TB 级增长，通过定时备份与恢复，可能导致数据恢复时间长，停机时间长、造成备份时间点到故障发生时间点的数据丢失。

综上所述，为保障医院业务持续性和数据的安全，在异地建设与生产中心主机性能按比例匹配、架构相同或与之等同的应用系统，即灾备中心，一旦生产中心意外瘫痪，灾备中心可以接替业务中心来对外提供持续的服务。

3 灾备方案设计

3.1 RTO/RPO值分析

目前业界以系统恢复时间（RTO）和数据丢失量（RPO）作为灾备系统建设标准。恢复时间目标（Recovery Time Objective，简称RTO）表示从灾难发生直到业务流程再次运行（即被恢复）的时间。RTO 有两个组成部分，明确灾难发生后指示恢复流程开始的决策时间和进行灾难恢复流程的实施时间。一般来说，恢复时间（RTO）越短，那么灾难恢复方案的成本就越高，灾难造成的业务损失就越小。结合医院实际RTO/RPO 值如表1 所示。