容灾技术在电力企业的研究与应用
2018-04-18欧阳志成
欧阳志成
(广东顺畅科技有限公司,江门 529100)
1 引言
容灾的基础是数据备份。数据备份是为预防业务系统在出现人为操作失误或系统设备故障导而致数据丢失,而将业务系统的所有或者按照重要程度选择其中一部分数据从服务器的内置存储或外挂存储设备中复制到其他的存储介质的操作。随着时代发展,企业信息化程度的提升,业务数据成几何级的增加,很多企业开始采用新的备份方法üü网络备份。网络备份是为通过数据存储管理软件结合配套的服务器设备、网络设备以及存储设备来实现数据的复制备份[1]。数据备份的目的,是保护数据免受人为误操作或蓄意破坏。其实现方式简单,在系统中配置自动磁带库设备和自动备份管理软件,由管理员根据情况,制定好备份策略,系统就会根据策略定时、自动地备份数据。
2 容灾技术在广东某市供电局的应用实例分析
2.1 容灾建设的背景与目标
在电力企业中,公司业务数据、财政数据以及需要备份的重要历史文件等,都是需要需进行保护的数据,一般来说,信息系统将保存到数据库中,因此数据库文件为重点保护数据。不单要将这些数据库文件保存在性能良好、可靠性高的存储设备上外,数据库应用也要采取数据保护措施[2]。最重要的是,这些关键数据库文件应该在本地与异地容灾中心之间维持相同状态,当灾难发生后,业务系统可以尽快从异地容灾中心上恢复数据,恢复业务运转。实现数据的异地容灾复制备份的要求,可通过软件、硬件两种方式。软件方式是通过数据复制代理软件来实现,需要在业务系统以及数据备份系统上,同时部署专门的数据备份同步代理软件,这种方式不需要投入硬件设备,一般情况下成本较容易控制。硬件方式需要进行数据同步的系统之间使用硬件进行数据复制备份,需保护的数据传输在存储设备之间,并不需要主机的参与及管理。在实际的数据同步系统中,由于系统的环境不同,安全性要求不同及采用的软硬件产品不同,数据复制过程的工作机制也不尽相同。概括地讲,数据复制的工作机制主要包括同步和异步两种。同步复制是安全级别最高的工作方式,当主系统主机数据发生变化的时候,同步把变化传送到数据同步系统的数据中,这一机制确保在两个存储设备中的数据在数据块级别的高度一致。异步复制的工作机制是主系统内主机的数据复制到数据同步数据中并不是实时的,也就是说,当主系统数据发生一定量的变化后才把数据输入到数据同步数据中。但是这样两个系统中的数据就可能存在不一致,这也就是采用异步复制机制的代价[3]。
为了妥善应对和处置广东电网某市供电局营销系统突发事件,建立健全某市供电局营销系统安全应急保障和恢复工作机制,提高应对突发事件的组织指挥能力和应急处置能力,保证应急指挥调度工作迅速、高效、有序地进行,满足突发事件下某市供电局营销系统及其承载的数据业务保障和恢复工作的需要,确保关键业务、关键时段、关键部门的相关应用系统的正常运行,并且结合某市供电局已经建立完成的数据同步中心,开展数据同步系统应急营销系统演练。
2.2 容灾系统建设的可行性研究
在数据复制平台方面,某市供电局采用软件方式来实现。在数据复制的实时性方面,考虑到营销数据的重要性,某市供电局采用数据库的是同步复制方式,保证主系统和数据同步系统数据的一致性。某市供电局经过多年的信息化建设,目前已经完成包括运行于城网平台的营销系统、生产管理系统、综合管理等业务系统,其中主要的核心系统均采用了Oracle数据库基础平台,重要的数据和信息都集中存储在Oracle架构的数据库磁盘阵列上。在这种情况下,某市供电局信心中心的生产数据库承担着所有全市范围内电力服务业务正常运行的重要责任。此时,由于信息和处理的集中,以及不可预见的故障和灾难,导致生产系统中存在很多受灾难性破坏的故障隐患。由此可推断,在集中的业务系统内与外部环境下,不管是哪一个重要的环节出现不可恢复的灾难,所有的业务工作将遭受到不可挽回的损失,对全市电力业务体系的正常运作将造成严重影响。因此,灾难防范和容灾系统建设是非常重要的。
3 容灾中心建设过程介绍
3.1 系统建设
数据同步中心的建设,最大化地保证某市供电局用电营销系统数据的安全,避免一些不可预见的事故发生对数据造成损失。建立重要数据的定期数据备份机制,每天进行一次完整的数据增量备份。应对关键数据进行同城和异地的实时备份,保证业务应用能够实现实时切换。制定灾难恢复计划并定期进行测试,确保各个恢复程序的正确性和计划整体的有效性。
3.2 简述容灾方案
根据某市供电局网络现状,结合现有生产中心业务运行情况,对整套容灾方案进行规划。在本方案中,整套容灾系统由生产中心、同城容灾中心两个中心组成,构成两地的容灾体系[18]。生产中心和同城容灾中心配置完整的接入平台、应用处理平台和存储平台。整体容灾架构图设计如图1所示。
容灾中心系统架构设计从城域网网络设计、光纤存储设计、数据复制链路设计、主机系统设计、数据库系统设计、备份系统设计、系统平台性能优化、设备迁移和网络系统设计等模块进行详细的阐述。在某局容灾项目的建设过程中,保持生产中心平台架构不变的情况下,建立一套业界成熟的、基于SAN存储系统、虚拟化服务器架构、负载均衡设备、域名解析系统、Oracle数据库同步复制的容灾系统。本容灾系统不仅在生产中心正常运行的情况下,可以可靠和稳定运行,还可以为生产中心提供实时数据备份的功能,保证生产中心数据不会丢失。而当灾难发生时,容灾中心又能够快速恢复数据和应用系统,降低灾难发生后的数据损失情况。在本方案设计中还考虑到容灾业务的可扩展性问题,随着生产中心业务的不断增加,势必容灾系统也需要不断扩张,而容灾中心的扩展模式也是相当灵活的,只需要对网络带宽、服务器性能和存储空间进行增加就可以满足需求,避免了容灾架构的调整所带来的设备更换支出,提供了最经济、最有效的全方位容灾体系。由于当时方案讨论的时候并不要求零停机时间、零切换时间的要求,同时也考虑到可能由于电脑的误判断,造成自动切到换容灾系统而导致的数据不一致问题,所以还是使用了更可靠的人手切换容灾流程。这也是本容灾系统区别于其他双活节点容灾体系的特点。
图1 某市供电局信息系统容灾总体架构图
在实际的生产中心往容灾中心业务切换过程中,除了在设备、数据同步技术上保证数据切换的可靠性之外,还针对切换过程中所涉及到的设备、人员、时间节点,结合用户的实际业务,组织完整的切换流程和完善的通知流程,为实际的业务用户提供了透明的业务访问切换过程。
4 结束语
通过参与本次容灾项目的设计与实施,对容灾系统的前中后期规划有了更加清晰的了解,对 小型机+SAN存储+Oracle数据库 平台的建设技术有了充足的认识。虚拟服务器应该是以后IDC机房发展的主要方向,然后慢慢转向云计算的模式,让用户的业务系统更加稳定可靠的运行。容灾系统也会随着技术的发展和终端用户的需求变得更加完善、简单、智能和一体化。
[1] 刘锦,刘晓洁,李涛等.一种异地容灾系统的设计与实现[J].计算机应用研究,2007,24(8):294-296.
[2] 王彦龙,李战怀,郑然.多平台数据容灾系统的研究与设计[J].计算机应用研究,2007,24(2):215-218.
[3] 王树鹏,云晓春,余翔湛等.一种容灾中间件的设计与实现[J].通信学报,2005,26(7):68-75.