APP下载

基于双机热备技术的水利邮件系统备份方法探讨

2010-03-27张贵芳河南省水利厅信息中心

河南水利与南水北调 2010年1期
关键词:热备磁盘阵列双机

□张贵芳(河南省水利厅信息中心)

一、系统现状

水利邮件系统在2002年建成之后,一直在不停的运转,其中也出现多次停运情况。由于服务器要长年累月的工作,其存储的数据就越来越大,一旦服务器出现问题,则数据就会丢失,这个时候备份工作就必不可少。现在大部分用户都习惯用邮件来传递、共享文件,所以,一旦服务器瘫痪,需要重新装系统,恢复服务,恢复数据,而这个过程需要一定的时间,时间一旦过长,就会对水利职工的工作产生非常严重的影响。这个时候,数据的高可用性和系统的连续运转能力就显得极其重要。

二、双机热备技术

双机热备就是将中心服务器安装成互为备份的两台服务器,并且在同一时间内只有一台服务器运行。当其中运行着的一台服务器出现故障无法启动时,另一台备份服务器会迅速的自动启动并运行(一般为1min左右),从而保证整个网络系统的正常运行。双机热备的工作机制实际上是为整个网络系统的中心服务器提供了一种故障自动恢复能力。

双机热备分2种形式:一种是纯软方式双机热备。对于纯软件的方式,通过镜像软件,数据可以实时同步复制到另一台服务器上,这样同样的数据就在两台服务器上各存在一份,如果一台服务器出现故障,可以及时切换到另一台服务器。由于可以节省共享存储硬件部分的大量投资,纯软件方式可以在一定程度上降低成本,并且由于在多个地方拥有数据的副本,数据的可靠性反而有所加强。但是纯软件方式需要占用部分系统资源,而且大数据量环境初始镜像时间较长,对于较大的并且变化频繁的数据,可能会存在传输延迟现象。

另一种是磁盘阵列方式。数据库放在共享的存储设备上。当一台服务器提供服务时,直接在存储设备上进行读写。而当系统切换后,另一台服务器也同样读取该存储设备上的数据,这种方式由于数据的一致性由共享存储设备来保障,不占用系统资源,而且没有数据传输的延迟,因此是中高端用户及拥有大量关键数据的用户的首选方案。

三、双机热备系统设计

(一)Linux下的HA简介

随着Internet技术的迅猛发展,网络技术、性能的不断提高,高伸缩性、高可用性、可管理性、价格有效性的网络服务技术将成为网络服务技术的主导。各种平台下的技术方案应运而生。作为一个日益得到企事业单位重视的操作系统平台,Linux操作系统上拥有众多成熟的HA解决方案。从构成结构和用途来分,目前Linux下的HA系统通常可以分为3类:一是HA容错集群;二是负载均衡集群;三是HPC高性能计算机集群。

在这次设计中,我们面临的主要问题是如何通过HA方案提供一个更可靠的邮件运行环境。由于HA容错集群是在不可间断服务的环境下,提供冗余的容错备份,在主节点失效后,能够立即接管相关资源并继续提供相应服务。因此,我们主要考虑的是第一类HA系统。这种集群通过多台主机共同工作,将数据通过某种方式进行共享,通过网络或者串口线达到状态监控,最终完成在故障情况下的主机切换和数据访问。

(二)基于Linux的双机集群

建设一个双机容错集群所必须的元素有:

1.2台可以各自独立运行的主机。每台都能提供完整的服务。

2.2台主机之间必须有单独而直接的连接以进行状态监控,例如第二条网线,串口线等。也就是通常所说的心跳线。

3.2台主机必须都能各自访问完整的数据。

以上3条中,比较重要的是第3条。对于邮件系统来说,系统中存储的大量用户信件是系统服务的重要部分。当主机出现故障时,备机必须能让用户访问到所有已经存在的邮件信息,因此,备机必须能够访问到所有的用户数据。而邮件的用户数据相当庞大,对于一个拥有2000人的邮件系统来说,如果每个用户平均拥有100封信,那么系统就拥有20万个信件文件。并且考虑到每秒钟都会发生的数十个用户信件访问操作。因此,邮件系统的数据共享必然是构建双机容错系统的核心问题。

目前双机方案中数据存储的解决方案主要采用磁盘阵列。此种方案采用可共享的磁盘存储设备,主备服务器同时连接上存储设备,当故障发生时,备服务器在接管服务的同时接管存储数据。

(三)邮件系统双机热备设计方案建设步骤

1.首先需要配置两台各自都能独立完成所有用户服务的服务器,其硬件以及基本软件配置完全一样。每台服务器将安装标准Redhat Linux以及现运行的邮件系统。

2.两台主机配置两个不同的虚拟地址。主机通过一个虚拟网络设备绑定对外服务的IP。备机在正常情况下不绑定该IP。

3.双机均安装双网卡,一个网卡用于连接集群系统,另一个作为冗余心跳线路连接双机。采用串口线+以太网口做为冗余心跳线路,以确保双机热备份的可靠性,消除由于主负载调度器或心跳线故障带来的集群单点故障。

(四)硬件配置方案

硬件配置方案见下表1:

表1 硬件配置表

四、结论

目前自动化程度高,各单位对服务的安全性、可用性、依赖性变大。24h不允许停机,在这种情况下,服务器的双机热备就显得非常必要及迫切。

水利邮件系统若采用了双机热备的设计方案,那么就要同时用两个服务器,共同运行邮件系统,当其中一台服务器因为某种原因出现故障,如死机、主机断电、病毒发作、硬盘损坏等,不能继续提供服务时,另外一台服务器能够在非常短时间内接替主机的服务,继续提供服务,而且数据保持同步,从而达到不停机的服务。目前,作为实时服务器与数据保护解决方案,双机热备提供了数据的高可用性、运行系统的自动切换及最少的恢复时间。

需要注意的是,水利邮件系统的双机热备方案,并不是没有缺陷的。一般意义上的双机热备都会有一个切换过程,这个切换过程可能是1min左右。在切换过程中,服务是有可能短时间中断的。但是,当切换完成后,服务将恢复正常。因此,双机热备不是无缝、不中断的,但它能够保证在出现系统故障时,能够很快恢复正常的服务,业务不致受到影响。而如果没有双机热备,则一旦出现服务器故障,可能会出现几个小时,严重时会出现一天甚至几天的服务中断,对业务的影响就可能会很严重。

还有一点需要强调,若使用磁盘阵列的形式,那么一旦磁盘阵列出现问题,则数据安全就会没有什么可言了。所以,若使用磁盘阵列来做双击热备,那么对磁盘阵列上的数据就还要做一下备份。

还应指出的是,一些其他的防护措施如磁盘阵列(RAID)、数据备份虽然是非常重要的,但却不能代替双机热备的作用。

猜你喜欢

热备磁盘阵列双机
热备动车组配置方案优化模型
东海区实时海洋观测数据库双机热备系统解决方案
双机、双桨轴系下水前的安装工艺
一种应用于分布式网络的地址分配及热备技术
更换磁盘阵列磁盘
双机牵引ZDJ9道岔不同步问题的处理
Loader轴在双机桁架机械手上的应用
电视播出机房磁盘阵列预防性维护
存储虚拟化的三个层次
蓝天双雄——歼八II双机编队