APP下载

基于Oracle GoldenGate和Cloud Data Replication的灾备解决方案研究

2023-12-15中国民航信息网络股份有限公司刘建辉郝立平陈本锡修姗姗

中国信息化 2023年11期
关键词:灾备日志备份

文 | 中国民航信息网络股份有限公司 刘建辉 郝立平 陈本锡 修姗姗

一、引言

随着信息时代的到来,企业信息化发展越来越快,导致积累的数据越来越多,这些数据对于企业来说是非常宝贵的资源,尤其对数据信息依赖程度很高的行业更是如此。要保障业务系统稳定而且持续的运行,就要保证数据的安全性、完整性和可用性。数据备份是数据安全最基础的保障,它几乎是任何信息化系统中必需的组成部分,意外断电、系统崩溃、操作失误、硬件损坏都可能造成数据库文件的破坏或丢失,而这些文件往往包含着珍贵数据,一般的数据库自身带有一些备份机制,可以形成本地备份避免一些数据丢失。但是对于重大自然灾害(火灾、洪水、地震、飓风、龙卷风、台风等)对数据安全带来的威胁,有可能是导致数据中心机房损毁。如果这样的灾难发生,不管在本地采用什么样的安全措施,都有可能造成很大的损失。在这种情况下,如果本地数据损毁,数据没有异地备份,对数据的保存可以说是一个致命的打击。

在异地数据备份即在异地建立一套完整的、与本地数据系统相当的备份应用系统,当出现灾难时,远程应用系统将迅速接管或承担本地应用系统的业务运行而保证业务的连续性。同时,在实现上述需求的同时保障RPO最小,即当灾难发生时丢失的数据最少,对于企业来说损失将会最低。所以需要数据容灾系统可以实现异地数据灾备,同时保障RPO最小。

本文研究基于Oracle RAC、Oracle GoldenGate(以下简称OGG)软件和Cloud Data Replication(以下简称CDR)软件的本地高可用、异地实时备份的解决方案架构实现。

图1 Cloud Data Replication平台架构

二、软件介绍

(一) Oracle GoldenGate

1.简介

Oracle GoIdenGate(以下简称OGG)软件是一种基于日志的结构化数据复制备份软件,它通过解析源数据库在线日志或归档日志来获得数据的增量变化,再将这些变化应用到目标数据库, 从而实现源数据库与目标数据库同步。OGG可以在异构的IT基础结构(几乎包括所有常用OS平台和数据库平台)之间实现大量数据亚秒级的实时复制, 从而可以在应急系统、在线报表、实时数据仓库供应、交易跟踪、数据同步、集中/分发、容灾、数据库升级和移植、双业务中心等多个场景下应用, 同时它可以实现一对一、广播(一对多)、聚合(多对一、双向、点对点、级联等多种灵活的拓扑结构。

2.技术原理

OGG通过Capture进程实时读取日志信息,捕捉增量数据写到本地Trail File中,通过Pump进程将本地Trail File推送到远程目标服务器,远程服务器通过Delivery进程解析Trail File文件,形成标准SQL语句,将数据投递到目标数据库。

3.关键特性

实时-亚秒级处理大量数据;

异构-不同数据库和平台之间捕获和交付(Capture& delivery);

事务完整性-事务数据保持可靠和参照完整性。

(二)Oracle RAC

Oracle RAC(Oracle Real Application Cluster)即Oracle真正应用集群。它是由若干个物理计算机组成,每个叫作一个节点,这些节点间通过私有网络连接。各个节点通过HBA卡或光纤线连接到共享存储上,形成“shared—disk”的体系结构模式。RAC的共享磁盘结构模式不但有着更高的可用性,同时也拥有更佳的易扩展性。

(三)Cloud Data Replication

1.简介

Cloud Data Replication是一个集解决方案管理、配置、监控、告警的集中管理平台,图形化集中管理配置服务器及灾备场景,实时的监控告警机制协助关键系统保持 24*7 小时运作,满足业务系统持续可用的要求。

双硫-烯的光引发反应 ······························刘光耀 苗 苗 安泽胜 (1,83)

2.技术原理

Cloud Data Replication采用工业标准的技术以及开源技术开发的一套高性能和轻量级的Web架构,CDR通过API与OGG进行底层通讯,可以快速的获取OGG信息,通过与数据库交互,获取数据库信息,实现对整个链路场景的管理监控。

平台包含以下功能组件:

CDR Agent:Agent组件有两种模式,一种模式是管理服务器通过定时器的方式主动发消息给GoldenGate来获取GoldenGate的进程信息、检查点信息、状态信息、延迟信息和统计信息以及配置信息等等。另外一种模式就是Agent部署在GoldenGate服务器端,Agent在收集GoldenGate信息以后,会把这些消息发给管理服务器。比如GoldenGate的安装部署、进程监控、事务级监控(心跳表功能)、统计信息等定时任务都是通过Agent来完成的。

Administration Server:管理服务器主要是完成GoldenGate自动安装部署、数据库相关环境配置、解决方案的应用场景配置、相关进程监控、检查点信息管理、事务级监控、延迟监控、告警管理、用户管理、服务器和数据库的元数据管理、GoldenGate进程配置、数据验证功能等等。管理服务器会记录所有相关的GoldenGate历史进程信息和参数信息以保证出现故障可以找到恢复点。

MySQL资料库:资料库主要是保存用户权限信息、服务器配置信息、GoldenGate进程信息、配置信息、日志错误信息、延迟监控信息、统计信息、检查点信息以及应用场景信息,通过这些信息用户可以建立完善的运维体系和应用场景管理。

3.关键特性

CDR提供了一个实时地基于日志捕获变化数据的数据复制平台。这个平台可以大规模地部署和实施异构数据平台之间的数据捕获、路由、转换和数据应用复制。利用这个平台客户可以实现真正业务连续性和实时地集成数据以便快速、容易地访问正确的和实时的业务系统数据。解决方案有以下关键特性:

自动化-从安装到配置,一键化、自动化部署;

流程化-解决方案流程化显示,清晰拓扑架构;

精细化-进程级、事务级监控精细化监控信息;

快速化-实时监控,及时告警,快速定位解决问题 ;

可验证-验证源端和目标端的表结构、数据量差异性,保障备份随时可用;

扩展性-采用模块化可扩展架构设计,基于标准的Web的API以及开源技术实现,并采用插件技术,具有很好的兼容性及可扩展性。

图2 数据一致性验证解决方案

三、双活业务中心架构设计与实现

(一)架构设计

生产端与灾备端数据库采用Oracle RAC双实例单数据库的共享存储体系结构,利用OGG建立双向复制链路,将生产端增量数据实时同步到灾备端,利用CDR实时监控数据库及OGG复制链路场景,当有异常发生及时监控告警,保障RPO最小。

(二)解决方案特点

1.高可用保障业务连续性

采用Oracle RAC双实例ACFS(ASM Cluster File Systems )自动存储管理文件系统,OGG安装在ACFS上,所以当当前节点发生故障时,配置应用自动漂移到另一节点IP,并在另一节点拉起OGG,保障业务连续性,并且数据复制链路不停。

当生产数据中心瘫痪,由于OGG实时将生产数据同步到灾备端,所以应用可以switchover到灾备端,原灾备中心变为生产中心,此时反向链路数据同步起作用,由于原生产数据中心瘫痪,数据无法投递,OGG会将当前生产中心的增量数据抽取到本地,当数据中心故障修复后,将累积的数据投递到数据库,保证数据零丢失。

2.数据验证保障数据一致性

Cloud Data Replication提供一种高速、低影响的数据验证解决方案,可以在无需中断正在进行的业务流程的情况下,进行验证数据库之间表数量差异、表结构差异、表数据量差异以及数据库之间的RPO,并报告数据库之间的差异。使用这个应用程序,企业可以最大限度地减少人为错误的影响,并快速解决潜在问题,保证主库与备库的数据一致性。

四、结语

本文研究了基于Oracle GoldenGate和Cloud Data Replication结合实现的灾备解决方案,通过Oracle GoldenGate实现双向数据同步,基于Cloud Data Replication实现监控管理、实时告警、数据验证,通过此方案既可以保证数据同步的时效性,又可以保证数据同步问题的及时发现处理,降低RPO指标,具有较高的实用价值。

猜你喜欢

灾备日志备份
“备份”25年:邓清明圆梦
一名老党员的工作日志
扶贫日志
创建vSphere 备份任务
游学日志
旧瓶装新酒天宫二号从备份变实验室
企业级信息系统应用级灾备建设与应用
轨道交通清分系统灾备升级方案研究
深蓝云海“云灾备”正式上线
应用级灾备系统的研究与设计