基于LAN-Free 组网技术的数据保护技术研究
2022-09-17朱润娟肖菊香汤云富
朱润娟,郭 丽,肖菊香,汤云富
(航空工业成飞公司,四川 成都 610091)
数据备份已被普遍应用在国内外相关行业中,早期的数据备份主要是采用物理磁带库,通过指令调度将生产数据写入磁带进行数据备份,这种方式备份效率较低、备份数据类型较少,数据恢复难度大且恢复时间较长。随着企业信息化业务的不断增长,信息数据的类型越来越多,数据容量越来越大,生产数据的备份需求不断提高,新的数据保护技术也应运而生,技术人员开始通过专业的备份系统,根据不同的数据保护需求配置相应的数据备份策略,通过LAN 网络进行自动化数据备份[1]。
而传统的LAN 网络架构无法满足数据量较大、备份时间窗口紧张时的备份需求,多个备份任务并行抢占LAN 网络资源,容易造成网络堵塞,严重时会影响生产业务的网络带宽,甚至造成业务访问故障,影响生产业务的正常运行。为了解决LAN 网络架构存在的上述问题,许多信息化部门开始采用LAN-Free 存储网络架构进行数据备份,提高备份效率,减少生产系统的网络负载,同时保障生产业务连续性和生产数据的安全性。
1 LAN-Free 组网技术
常用的数据备份组网技术包括LAN 备份、LAN-Free 备份等[2],传统的LAN 备份和LAN-Free 备份技术采用的主要协议不同,具体如下。
LAN 备份:在LAN 环境下,使用TCP/IP 协议,由1 台主备服务器和多台介质服务器组成,在每台生产服务器上安装备份客户端,在生产服务器和备份服务器之间,通过备份指令集的调度,将备份请求发送到主备服务器,主备服务器再通过指令集来判断备份请求属于哪种类型,并将备份任务派发给相应的备份介质服务器,备份介质服务器响应前端生产服务器的备份请求,对生产数据进行加密和压缩,最终将处理过的备份数据通过LAN 网络传递到备份存储或物理磁带库上。
LAN-Free 备份:在SAN 环境下,使用SCSI 协议,备份系统由1 台Master 服务器和多台Media 服务器组成,在数据备份时,需要在生产服务器上增加一块HBA卡,通过SAN 交换机将生产服务器上新增的HBA 卡端口和备份Media 服务器的光纤卡绑定在同一个Zone内,给备份数据流建立一条专用的SAN 网络通道,在备份Media 服务器上识别生产服务器的光纤通道并进行软件调试,在数据备份时,备份任务通过LAN 网络将备份指令集发送给Media 服务器,Media 服务器在备份指令集的驱动下,读取需要备份的数据并对其进行加密和压缩,最终将需要备份的生产数据通过SAN网络传输到备份存储和备份磁带库上。
采用LAN-Free 组网技术,在备份服务器与生产服务器以及生产服务器和备份存储之间通过SAN 网络建立高速的数据传输链路。通过LAN 网络进行Master服务器、Media 服务器和生产服务器之间的网络通信,通过SAN 网络进行备份数据流的高速传输,实现了数据备份控制流和数据流的分离,备份任务不再占用宝贵的LAN 资源,生产业务系统的LAN 带宽得到极大的释放,降低备份操作对生产系统的影响,不仅能有效提高数据备份效率,使备份任务在计划时间内完成,同时也能有效降低备份作业对生产网络完成的资源负载,为企业科研生产数据的安全防护做好保障。
2 LAN-Free 技术实施
2.1 基于LAN-Free 组网技术的网络架构
基于现有的SAN 存储网络,在生产服务器、备份服务器、物理磁带库和备份磁盘阵列上配置独立的HBA 卡,将这些设备各自作为独立的光纤节点,通过SAN 交换机分Zone 划分连接到SAN 网络中。建立备份任务时,根据生产数据的类型及重要程度,在备份服务器上配置不同等级的自动化备份策略,当备份策略启动时,生产服务器和备份服务器之间通过LAN 网络发送数据备份指令请求,双方建立请求链接后,备份数据流通过SAN 网络写入备份存储[3]。备份架构如图1所示。
图1 LAN-Free 组网技术架构图
如图1所示,虚线箭头标注的备份客户端和Media服务器进行了SAN 备份配置,其中SAN Cleint 客户端用于备份的HBA 卡和FT Meida Server 中target 模式的HBA 卡在一个SAN Switch Zone 里面。FT Meida Server中initiator 模式的HBA 和备份目标端的Disk 或者VTL或者PTL 在同一个Zone 中。备份任务启动时,Master服务器通过LAN 网络向FT Media 服务器发送备份调度指令,FT Media 服务器通过SAN 网络将备份客户端的数据流写入备份存储,备份数据流不经过LAN 网络,实现了备份网络与生产网络的分离。
2.2 FT Meida Server 和SAN Client 规划
激活光纤传输服务的客户端,类似于Shared Storage Option 的SAN 介质服务器类似,备份自己的数据,通常要求高带宽的关键数据用于备份,通过光纤通道连接到介质服务器。
如图2所示,FT Meidia Server 中需要2 块支持特定功能的HBA 卡,其中一块HBA 卡修改为target 模式,目的是模拟虚拟的类似驱动器资源,这样SAN Client 端就能够识别到类似Tape Drive 资源,另一块HBA 卡initiator 模式保持不变,这块HBA 卡可以连接VTL、PTL 或者DISK。最终达到的目的是备份数据流从SAN Client 端传通过target 模式的HBA 卡传送到FT Meida Server,然后通过另一块HBA 卡传送到备份目标端,达到LAN-Free 备份的目的。
图2 SAN 境准备示意图
2.3 配置SAN 光纤通道传输
将备份系统改造成基于LAN-Free 方式后,备份系统客户端变为具有SAN 属性的LAN-Free 客户端,可以将磁带或磁盘用作LAN-Free 客户端和光纤传输功能的目标存储单元。须先配置SAN 并使其可以正常运行,然后才能配置和使用光纤传输(FT)机制。FT 介质服务器中必须有足够的HBA 端口,以支持来自SAN客户端的FT 管道。在FT 介质服务器上,QLogic 光纤通道主机总线适配器(HBA)端口将连接到SAN 客户端。介质服务为这些QLogic HBA 上的端口提供了一个特殊的目标模式驱动程序,目标模式驱动程序将替换默认的启动器模式驱动程序。
将介质服务器和SAN 客户端连接到SAN 交换机,将FT 介质服务器上的HBA 端口连接到光纤通道交换机端口,将每个SAN 客户端HBA 端口连接到同一光纤通道交换机上的端口,在交换机上定义区域,以使客户端与服务器位于同一区域内。注意必须通过物理端口ID 或全球端口名称(WWPN)定义NetBackup FT介质服务器目标端口。目标模式驱动程序WWPN 不是唯一的,因为它们源自光纤通道HBA WWPN。可以通过端口ID 或WWPN 定义SAN 客户端端口。
另外,SAN 客户端要求连接到备份软件主服务器和企业介质管理器服务器。因此,必须确保所有防火墙(软件或硬件)允许客户端与备份软件主服务器和EMM 服务器通信。通常,备份软件主服务器承载EMM服务器,因此可能仅需要允许与其中一个系统通信。
2.4 配置SAN 客户端光纤模式
SAN 客户端是激活光纤传输服务的备份客户端。SAN 客户端与用于Shared Storage Option 的SAN 介质服务器类似,它备份自己的数据。但是,SAN 客户端基于更小的备份客户端安装包,因此具有更少的管理要求,使用更少的系统资源。通常SAN 客户端包含要求高带宽的关键数据以用于备份,它通过光纤通道连接到备份介质服务器。
SAN 客户端可以是基于Windows 系列的操作系统平台,也可以是基于Unix 或Linux 系列的操作系统平台。可以是单机,也可以是集群架构,但无论是哪种平台,前提是其服务器硬件设备上必须配备并激活相应的HBA 卡。不同备份软件配置SAN 客户端介质服务器HBA 端口的方式不同。以NBU 软件为例,配置介质服务器HBA 驱动程序过程的第一步是启动nbhba模式。nbhba 模式将备份软件提供的ql2300_stub 驱动程序绑定到主机上的所有QLogic ISP2312 和ISP24xx HBA 端口。ql2300_stub 驱动程序阻止标准的启动器模式驱动程序绑定到这些端口。如果QLogic 驱动程序绑定到HBA 端口,则备份软件命令将无法对希望在目标模式下工作的端口进行标记。目标模式驱动程序也无法绑定到HBA 端口。ql2300_stub 驱动程序还允许备份软件读取和修改QLogic 端口的NVRAM 中的设备ID。在启动nbhba 模式并对连接到SAN 客户端的QLogic HBA 的端口进行标记后,这些端口将在目标模式下工作。
2.5 配置SAN 客户端存储目标
SAN 客户端存储目标可以是传统的集群磁盘阵列存储,也可以是当下流行的分布式存储,可提供足够的带宽和读写速度以接受备份软件光纤传输机制提供的大量数据。同时,SAN 客户端也可以将磁带用作目标存储单元,某些磁带驱动器的速度足以读写备份软件光纤传输机制提供的大容量数据。将磁带用作目标,可以使用多数据流将客户端的自动备份划分为多个作业。由于作业位于不同的数据流中,因此可以并行发生。可以通过一个或多个FT 管道将数据流发送到FT介质服务器。介质服务器可将它们一起多路复用到一个或多个磁带介质卷上。例如,如果您的数据库服务器可提供多个数据流,则可以通过多数据流方式将那些数据库备份传输到FT 介质服务器。FT 介质服务器将数据流多路复用到介质上,从而提高了总体性能。可以使用SAN 客户端替换SAN 介质服务器,然后继续备份到磁带。与SAN 介质服务器相比,SAN 客户端使用较少的系统资源(包括磁盘空间和处理器两方面)。
数据的传输过程中可以像LAN 网络一样对数据进行加密和压缩,只是数据压缩或加密可能会降低备份和恢复的光纤传输管道性能。试验证实,如果在备份过程中使用数据压缩或加密,则备份和恢复的光纤传输管道性能会显著降低,所以一般使用LAN-Free组网技术进行数据备份时,在数据的传输过程中尽量不进行加密和压缩,而是在数据进行最终落盘时再对数据进行加密和压缩保护。处于数据安全性能的保护要求,通常不同的备份软件其加密算法都不一样[4]。
2.6 实施应用
SAN 客户端相关配置完成后,在客户端介质服务器启动光纤传输服务,并在启动时及设备发现过程中验证客户端系统的内核和驱动程序堆栈。该验证会检查内核和驱动程序是否处于受支持的级别。如果验证成功,则表示SAN 客户端支持FT 管道传输,此时可以执行FT 管道传输。如果验证失败,则无法执行FT管道传输。
在实际应用中,以大型制造行业的企业资源管理系统为例,作为企业的核心应用系统,企业资源管理系统承载了企业内部的生产模块、经营模块、流程治理等业务域的信息化实现功能,随着数字化生产的不断推进,企业资源管理系统承载的生产任务越来越重,功能模块开发越来越繁多,数据库运行越来越庞大,累积数据量越来巨大,数据越来越重要,对数据的备份要求越来越高。采用传统的LAN 网络备份对数量高达几个太字节(TB)的企业资源管理系统进行数据备份时,为了不影响生产数据库的正常运行,数据库管理人员和数据备份管理人员会根据实际生产情况进行综合考虑,将数据备份策略制定在非工作时间。但由于数据量太大,备份任务并不能在规定的时间窗口内完成,使本该在非工作时间完成的备份任务延长至工作时间。但实际上各个企业的网络带宽不尽相同,而且由于投入成本和实施难度的原因,大多数企业并没有专门进行备份网络独立组网,这就导致备份任务和生产任务同时在生产网络中运行,大大增加了企业内部的网络负载,轻则导致核心系统的备份任务失败,重则影响生产系统的正常运行。
针对数据量较大的企业资源管理系统数据备份任务无法在规划实际内完成的问题,很多公司为了提高核心系统的备份效率,保障生产数据的安全性,对核心系统进行基于LAN-Free 组网技术的备份网络优化。在企业资源管理系统的数据库服务器上配置2 块HBA卡,其中一块HBA 卡通过SAN 交换机连接至生产存储阵列,用于生产数据流的读写传输;另外一块卡进行SAN-Client 光纤模式配置,通过SAN 交换机连接至备份介质服务器,用于备份数据流的读写传输。在企业资源管理系统服务器上打通其SAN 光纤通道,启动SAN-Client 服务,SAN 目标存储单元配置在线的集中备份存储磁盘阵列和离线的物理磁带库存储,对生产数据进行双重保护。在备份系统配置备份任务,首先通过SAN 网络将备份数据写入备份存储磁盘阵列,并二次转储至备份物理磁带库。按照理论预估,改造后的SAN 网络备份效率比传统的LAN 网络备份效率提高了4~6 倍。同一台备份客户端,同样的备份数据量,同样的备份策略,LAN 网络备份效率约为28 497 KB/s,单次备份用时6 h 左右;SAN 网络备份效率约为181 890 KB/s,单次备份用时1 h 左右。
3 结束语
通过LAN-Free 组网技术的实施,旁路现有基于业务网络的备份架构将备份数据流从业务网络分离开来,一方面极大地提高了数据备份效率,确保数据备份与恢复作业能够在预定窗口时间内完成,保障备份数据的安全性及有效性,另一方面避免了数据备份对业务访问带宽的占用,可以有效地提高应用系统业务响应能力,保障应用系统高效稳定运行。