浅谈数字化条件下的数据备份管理
2023-01-02朱润娟魏能强肖菊香
朱润娟,魏能强,肖菊香
(航空工业成飞,四川 成都 610091)
数据备份是指为了防止系统故障或人为操作失误等因素造成生产数据的丢失或损坏,影响公司科研生产正常运行的事件发生,而将生产的文件系统或数据库数据从应用主机的硬盘或磁盘阵列备份到专用备份存储介质的过程,是对备份数据进行有效管理的一系列工作。
1 备份方式
1.1 人工备份
人工备份比较简单,一般通过数据库或者系统自带的命令来实现,简单的几条脚本语句就能完成相关数据的备份工作,备份数据存放于本地,适合规模较小的生产环境。但是,当备份需求的规模或是数据量达到一定程度时,对于数据备份的基本管理就有了更进一步的要求,部署简单的几个备份脚本已远远无法满足管理的需求,这就需要通过专业的备份软件及备份设备对数据进行统一的管理。
1.2 系统备份
为了满足种类繁多、数据量大,数据保护要求高的备份需求,企业通常会采用集中、统一管理的备份系统对数据进行自动化备份,即在专用的服务器和存储设备上部署专业的备份软件,同时,在需要进行数据备份的各类平台上部署备份客户端对数据库或文件系统进行自动化备份,由备份系统负责调度备份任务的执行及备份数据介质的管理等。
两种备份方式相对而言,人工备份成本较低,容易实现,但其备份效率较低,数据保护的时效性较差,无法满足数据量较大且对数据保护要求较高的场景。而通过备份系统进行数据备份的方式虽然成本较高,且对备份人员的技术水平要求较高,但其系统稳定性好、备份效率高、数据保护性好,符合各类场景的数据保护需求,成为目前主流的数据备份方式。
2 备份内容
数据中心包含一个企业几乎所有的信息系统,但并不是所有的数据都要进行备份,要区分清楚哪些数据需要备份。
首先,与科研生产密切相关,数据一旦丢失,将影响科研生产正常运行的数据,如操作系统数据、数据库数据、文件系统数据等。其次,信息系统原始的配置参数信息,如果信息系统崩溃,关键时候用来进行系统恢复的数据,如原始安装文件、配置参数等。
此外,备份系统本身的配置信息、调度信息和介质信息,这些数据关系到备份作业的运行状态,一旦备份系统出现故障,可通过这些数据进行分析和恢复,如备份系统日志文件等。
3 备份策略
一般包括备份频率和备份时间窗口,备份频率是指多长时间进行一次数据备份作业,一般根据备份内容的重要程度,分为日备份、周备份、月备份和年备份,并根据备份内容的类型和数据量大小采用不同的备份方式及数据保存期限。通常采用几种备份频率相结合的方式进行数据备份,提高了备份数据的有效性和安全性。
备份时间窗口一般指的是数据备份时间段,配置备份策略时,首先,要考虑什么时候执行备份操作,因为在数据备份过程中,会产生大量的读写操作,从而占用部分I/O资源,因此通常会选择在非业务时间或者业务不繁忙的时候进行数据备份,避免对正常生产业务造成影响。
4 备份角色
备份角色一般包括备份系统管理人员、应用系统管理人员和数据库管理人员,其中,应用系统管理人员负责提出数据备份的需求申请,包括备份内容、备份启动窗口及备份数据保留期限等,同时,配合备份系统管理人员分析处理备份异常问题。
数据库管理人员负责提供数据库备份脚本,通过备份系统调用实现数据备份,同时配合备份系统管理人员分析处理数据库备份异常问题。备份系统管理人员根据已沟通确认的备份需求,结合实际备份资源情况,制定备份策略,包括备份启动窗口、备份频率、备份级别等,同时,负责监控备份任务日常运行情况,对备份异常情况进行处理,必要时,需要联合应用系统管理人员和数据库管理人员一起进行故障处理。
最后,应用系统管理员、数据库管理员和备份系统管理员需要相互配合制定恢复方案,对备份数据进行恢复测试,校验备份数据的有效性,包括恢复对象、恢复方式、恢复时间点等,由备份系统管理员负责执行数据从备份存储到应用存储的恢复操作,由系统管理员或数据库管理员执行备份数据到应用系统的恢复操作。
5 备份操作
掌握了以上基本信息,接下来应该考虑如何进行备份操作。数据备份的意义在于当意外发生时,如何通过数据备份规避数据丢失,保障生产业务连续性。
首先,要明确备份对象,即需要备份的是数据库还是文件;其次,需确认备份频率,即多久备份一次,备份级别是全备还是增量;然后,确定备份时间窗口,即什么时候开始备份,大致什么时候可以完成备份;最后,确定备份数据的保留期限,即备份介质保存多久后可以回收再利用。
在确认了以上几点后,就可以有针对性地配置相关的配置参数进行备份。制定备份策略有以下思路。
(1)当生产系统对数据丢失的容忍度较低,即RPO值尽量小时,一般可通过提高备份频率来实现。例如,Oracle数据库的在线备份可以适当提高归档日志备份频率。(2)当生产系统对恢复时间的容忍度较低,即RTO值尽量短时,一般有两种解决方案,一是提高恢复的速度,比如,可通过SAN网络传输备份速度来提高恢复速度;二是减少恢复的数据量,比如,可以每次进行全备,在恢复时可直接恢复全备即可,而无须再进行全备加增量的恢复步骤,省去了增量数据的恢复时间。(3)当备份数据的保留时间较长时,需要考虑备份介质的寿命,设置合适的备份保留时间,在介质寿命到期前进行介质转换储存。(4)当需要备份的时间窗口尽可能短时,可以选择在业务空闲时间进行备份,同时,可以通过源端去重技术和全备结合增量备份的方式减少备份数据量,从而缩短备份时间。
总之,备份策略的制定需要具体情况具体分析,针对不同的备份需求进行综合考虑,根据实际情况来制定最合适的备份策略,再按照备份策略及备份软件的操作手册进行相应的部署实施工作。
6 备份数据保存
为了避免备份数据在需要时找不到相应的数据或者备份数据损坏无法恢复,我们需要妥善保存备份数据。备份数据存放在备份介质上,备份介质通常是磁盘和磁带。备份介质应进行专人管理,建立备份档案,对备份介质存放与提取进行严格管理,实行审批并登记;选择适合备份介质保存的环境,包括温度、湿度和磁场三方面,存放温度建议控制在5~40℃,湿度控制在20%~80%RH,同时避免磁场干扰;根据磁带使用情况定期进行转储,通常磁带寿命一般为5~10年,读写次数不超过2000次,对于长期保存的磁带,需要定期进行转储,防止备份数据过期失效。
7 备份数据恢复演练
数据备份的最终目的就是在需要数据恢复时,能够及时地将数据恢复出来。为了验证备份数据的可恢复性,需要在平时做好数据的恢复演练,做好测试验证,确保在关键时刻体现出备份数据的意义和价值。
8 数据备份监控
备份系统管理员应该每天对备份系统的运行状态进行监控,查看备份系统整体运行是否正常,备份任务是否按计划成功完成,如发现异常,则需进一步查看相关的日志信息,及时处理备份故障,确保备份数据的时有效。
一般按照监控对象的不同分为备份硬件监控和备份软件监控。
硬件监控:机房实地巡查设备是否有指示灯告警,或者远程登录设备查看硬件状态,确认硬件正常运行。
软件监控:登录备份软件查看备份任务、备份存储和备份磁带库的运行情况,若有备份失败,通过报错日志分析原因并及时处理,必要时,请应用系统管理人员和数据库管理人员共同协调解决备份故障。
9 结语
目前,现有的备份技术和备份手段越来越成熟,已形成一套完善的数据保护体系。但大多数软硬件产品依然采用国外品牌,未完全实现国产自主产权,国产化备份软件及备份设备品牌较少,数据备份应紧跟软硬件产品的国产化替代步伐,在信息技术国产化的过程中,及时做好数据保护工作,为科研生产的正常运行保驾护航。