任务关键型企业数据库零数据丢失保护技术研究与应用
2024-07-01薛雁丹李功梅卜言彬
薛雁丹 李功梅 卜言彬
【摘 要】当前,金融、电信、制造等行业的大部分大型组织依旧采用传统的存储解决方案定期备份其任务关键型数据库。传统的解决方案无法满足任务关键型企业数据库的备份要求,存在数据丢失、备份窗口长、生产环境负担重、防勒索及数据库级别的可恢复性验证能力弱、难于满足不断增长的数据库需求等问题。论文提出,需要引入新的数据保护技术,提升备份效率,确保数据零丢失,满足现代组织在业务和合规上对RPO和RTO的苛刻要求。
【关键词】数据保护;零数据丢失保护;实时推送;永久增量;虚拟全量;RTO;RPO
【中图分类号】TP311 【文献标志码】A 【文章编号】1673-1069(2024)04-0131-03
1 引言
在数字化转型和AI技术大爆发的今天,各类组织都高度依赖IT系统支撑其业务的开展,特别是大型组织,服务着千万级,甚至十亿级的用户,一旦IT系统失效导致业务停顿与瘫痪,甚至核心业务数据的损坏或丢失,则势必带来灾难性的后果,在经济受损的同时,可能引发社会群体性事件。
调查发现,金融、电信、制造等行业的大型组织的任务关键型数据库高可用主要依赖本地数据库集群、传统的数据备份技术、本地或远程容灾,在应对机房设备物理故障与自然灾难方面有所建树。但是,传统的数据库备份技术在确保数据的安全性、完整性、准确性、可验证性和可恢复性方面面临诸多挑战,需引入新的数据保护技术,消除数据丢失风险,满足任务关键型企业数据库的RPO和RTO要求。
2 任务关键型企业数据库数据保护的挑战
目前,市场上用于保护业务数据的存储解决方案均无法满足任务关键型数据库的应用需求,这些解决方案的问题根源在于:第一,备份和恢复方法基于已使用数十年的全量、增量、加归档日志夜间备份的模式,每次恢复都可能丢失多达一天的数据,无法实现RPO=0;第二,数据库全量备份,无论数据是否更改,生产服务器、存储和网络在每次备份时都要处理所有数据库数据,开销极高;第三,数据不断增长导致备份窗口越来越长,恢复时间更是漫长,无法满足RTO的要求;第四,备份设备扩展性、数据消重与压缩能力有限,无法为组织内所有数据库提供保护;第五,缺乏权限控制机制,对删库、删备份跑路及勒索防范能力不足;第六,缺乏对整个数据保护生命周期的可见性和控制力,黑盒备份,无法验证数据库的可恢复性。
3 零数据丢失保护技术
当前,97%的《财富》500强公司都在使用Oracle解决方案。截至2021年,以业务系统数量为计数单位,我国金融行业Oracle数据库占比为55%[1],电信、制造等行业的业务系统也普遍基于Oracle数据库开发[2]。为解决这类任务关键型企业数据库的数据保护难题,Oracle研发了一个突破性的数据保护解决方案,即零数据丢失恢复一体机(以下简称“恢复一体机”)。
恢复一体机与Oracle数据库中相应的功能以及Recovery Manager(RMAN)备份工具紧密集成,通过实时重做传输、永久增量备份、自动合成虚拟全备、自动端到端持续验证数据、分布式软硬件优化集成、灵活复制架构等创新技术,实现了真正的零数据丢失保护,并且大幅降低生产服务器的负载。零数据丢失保护总体技术架构如图1所示。
3.1 消除数据丢失技术
零数据丢失恢复一体化解决方案,创新性地引入了实时备份数据库重做日志、保护备份数据免遭灾难和确保备份数据可恢复等技术。
3.1.1 实时备份数据库重做日志
重做日志(Redo Log)是在Oracle数据库内实施事务性变化的基本手段。所有Oracle 11g及更高版本的数据库都可以从内存日志缓冲区中直接向恢复一体机持续发送重做日志,恢复一体机实时接收重做日志并自动生成归档日志。这提供了独特的、类似于Data Guard保护程度的实时数据保护,可确保数据库受到亚秒级的保护。
3.1.2 保护备份数据免遭灾难
本地恢复一体机的备份通过集成的备份软件和相关的技术可快捷地复制到远程恢复一体机、云端、磁带、NAS等设备中,以防站点中断和区域性灾难。其支持多种灵活复制拓扑架构,例如,两个恢复一体机之间可以单向或者双向实时复制,还可以多对一复制等。用户可以根据合规的要求对复制拓扑结构进行量身定制。在所有拓扑结构中,恢复一体机均仅复制更改的块,从而极大地减少了网络和存储的占用。如果本地恢复一体机不可用,可以直接从远程恢复一体机或者磁带中运行恢复操作。
3.1.3 确保备份数据可恢复
与Oracle数据库深度集成,恢复一体机可识别Oracle数据块的格式,支持深度数据验证,所有备份数据和重做块在发送至恢复一体机、复制到磁带及远程复制时都会自动接受验证。此外,恢复一体机存储软件会定期对磁盘上的备份块进行验证,还会定期检查底层硬盘,如在验证过程中发现数据损坏,则自动读取镜像副本中的正常数据块,并立即修复受损数据块,确保恢复操作始终恢复有效数据,相当于定期进行恢复演练。
3.2 永久增量备份技术
为了将生产数据库系统上与备份相关的处理减少至最低,恢复一体机采用一次全量、永久增量的备份架构。该架构以增量推送和增量存储两项创新技术为基础,只传输和存储生产库发生更改的数据,消除不必要的备份处理,由此极大地降低了对生产系统的影响。
增量存储可对传入的更改数据块进行验证,然后执行压缩、编制索引和存储操作。数据库虚拟完全备份是截至某个增量备份时间点,对物理完全备份的一种基于指针的表示,即每次增量备份后,基于指针生成一个虚拟全备。当需要执行恢复操作时,可以按需恢复某个时间点虚拟完全备份,然后恢复归档日志。
另外,恢复一体机将所有与备份相关的处理都卸载到本机上,包括耗时的压缩、备份删除、验证和维护操作等,释放生产系统资源。
3.3 具备云级的数据库保护及服务能力
恢复一体机通过基于策略的数据保护管理、数据库感知的空间管理和大规模云级基础架构等多种创新技术为数据中心成百上千个数据库提供云级数据库保护服务。
根据每个数据库的恢复目标制定保护策略,并进行分组。恢复一体机可以根据各个数据库的恢复窗口目标,全面地管理所有备份存储空间。如果存储空间允许,恢复一体机将保留比恢复窗口目标更早的备份,从而提供更长的恢复窗口。在出现任何空间压力之前,恢复一体机会主动根据历史空间占用自动清理恢复窗口目标之外的备份,并为各个数据库重新供应空间,以便达到每个受保护数据库的恢复窗口目标。
恢复一体机单个机架可提供PB级的可用存储容量,并可提供12~24 TB/h的数据备份与恢复速率,可多个机架级联组成更大的备份资源池。
3.4 抗击勒索及人为故意破坏的复原力和恢复能力
恢复一体机被设计成与生产数据库故障隔离,自动验证所有传入的、磁盘上的和复制的备份数据块的正确性和可恢复性,任何被恶意破坏的备份数据会被检测、记录,并告警,强制执行不可改变的备份,严格按DBA和设备管理员职责分工进行系统访问控制,传输加密,实时重做传输允许恢复到攻击发生前的最后一笔交易等。因此,如果勒索软件或者人为攻击生产数据库,恢复一体机不会受到影响,不会导致数据丢失。
4 通用数据保护方案与零数据丢失保护方案对比
各类组织的任务关键型数据库的保护都有严苛的要求,当前的通用存储备份方案与零数据丢失保护方案对数据保护的关键需求响应如表1所示。
5 零数据丢失保护技术应用示例
当前,越来越多的组织采用零数据丢失保护技术保护其核心数据资产,以便在遭遇灾难性故障、逻辑故障、人为删除、勒索加密、合规稽核等情况下,确保数据可快速恢复,并保证数据的完整性和准确性。
以下为一个大型组织采用零数据丢失保护技术方案的真实情况。该组织的IT系统服务着上亿客户,数据库实时备份到恢复一体机上,同时,卸载备份到容灾中心的磁带机上,并定期复制磁带异地保存。零数据丢失保护技术的管理界面如图2所示。
从管理界面可以看出,该组织纳入零数据丢失保护的数据库有5个CDB(名称和保护策略已模糊处理)。所有数据库采用相同的保护策略,即目标恢复窗口为60天,实际上当前恢复窗口均在60天以上,其中,最大的数据库恢复窗口已达112天,即该库可以恢复到过去的112天以内的任何时间点。数据未受保护的窗口均小于1 s,即RPO为亚秒级,甚至为0。当前,最大的数据库达到102 TB,在保留112天恢复窗口后,实际使用存储空间62 TB,数据去重比达到124倍,存储空间使用效率非常高。
恢复一体机引入永久增量备份、自动合成虚拟全量备份技术,每天在40 min内,只需备份500 GB以内的有效变化的数据即可得到百TB级的全库备份。
单台恢复一体机可提供12~24 TB/h的数据备份与恢复速率,可同时并行备份与恢复多个数据库。实际备份与恢复速度受数据库基础平台能力的影响较大,特别是IO、网络带宽的影响,实测基本可达到数据库平台短板硬件能力的上限。
6 结论
使用传统的数据库备份解决方案,只是把数据库当作简单的通用文件来复制副本和存储,并不是当作具有特定数据完整性、性能和可用性要求的交易系统来处理,会出现业务数据丢失、备份恢复时间过长、很难保证RPO和RTO要求等问题。另外,备份部署和管理复杂,备份数据的安全性和有效性难以保证。零数据丢失保护技术可以很好地解决传统数据库备份与恢复所遇到的挑战。
零数据丢失保护技术以一种创新的、先进的方法重新定义了数据库保护领域。其通过将先进的数据保护技术与数据库技术、高性能硬件深度优化融合,以软硬件一体化的方式快速提供数据库备份服务。通过实时备份消除数据丢失,永久增量备份消除对生产的影响,高效的复制架构保护数据免遭灾难和防勒索,自动合成虚拟全量及重做日志,实时备份允许恢复到恢复目标窗口期内的任何时间点。
零数据丢失保护技术可以很好地解决客户严苛的RPO和RTO要求,越来越多的客户案例也证明了其有效性。
【参考文献】
【1】中国信通院.数据库发展研究报告(2021年)[R].北京:中国信息通信研究院云计算与大数据研究所,2021.
【2】中国信通院.数据库发展研究报告(2023年)[R].北京:中国信息通信研究院云计算与大数据研究所,2023.