关于计算机服务器系统的容错技术
2016-05-08史飞
史飞
摘 要:进入二十一世纪以来,我国各行各业对于计算机技术的应用已经非常广泛,计算机服务器系统是计算机技术中非常重要的技术之一,服务器技术能为国防、医疗、金融、教育等各行各业提供计算机系统的不间断服务,但是服务器系统一旦出现问题,就可能会给使用单位带来巨大的损失,因此发展计算机服务器系统的容错技术对我国各个领域都显得尤为重要。基于此,本文着重对计算机服务器系统的容错技术进行讨论。
关键词:计算机;服务器系统;容错技术
中图分类号: TP302.8 文献标识码: A 文章编号: 1673-1069(2016)18-171-2
1 容错技术概述
二十一世纪以来,计算机技术得到了很大发展,从第一代计算机已经发展到了目前的第五代,现在各行各业都是使用计算机系统来为自己提供信息服务,在使用过程中计算机系统或多或少都会发生故障,这些故障有大有小,小故障我们自己可以解决,但是一旦出现大故障就会给我们带来数据丢失,服务器瘫痪甚至网络瘫痪等巨大损失。
为确保计算机系统高效、安全的运行,当计算机系统出现故障时,就必须有适当的措施来解决计算机系统的故障。为此人们提出了两种解决计算机系统故障的办法:一种是避错。另外一种是容错,即计算机系统在运行时如果出现了错误,那么系统会按照事先规定好的一组程序来执行程序中的指令,在执行了这组程序后,执行的结果不会因为系统的故障而出现差错。提高计算机系统可靠性的重要手段就是计算机系统的容错技术。
计算机故障是指由环境影响、操作错误等原因引起的计算机系统软硬件错误。容错技术可以在计算机系统发生故障时排除故障并且保证系统的正常运行后得到正确的结果。
2 容错技术的概念及分析
容错是在计算机系统出现或者即将出现故障时,计算机系统为能保证正常运转采取的一种不影响输出结果的措施。冗余方法是容错技术中消除故障的重要方法,因此冗余技术可以成为计算机容错技术的基础,冗余技术按照方式分类可分为如下四种:
①硬件冗余:是指在计算机系统中增加一定的硬件设备来达到屏蔽错误的目的。硬件冗余技术包含完全冗余和部分冗余两种方式。完全冗余又可分为热备、冷备、温备以及双施工四种主要工作方式。
热备方式 :即一共有两台服务器,这两台服务器互为冗余,且都处于带电工作状态。其中一台服务器是主服务器,另外一台则是热备服务器即备用服务器,正常状态下热备服务器不输出结果,只是处于准备状态。但是当主服务器发生故障后,则热备服务器启动接手主服务器的工作。若主服务器处理完毕,则主服务器继续工作,备用服务器停止重新进入备用等待状态,若主服务器无法继续工作,则备用服务器就一直接替主服务器工作。
冷备方式:冷备方式与热备方式在系统运行时就一点不同,即冷备方式中备用系统不处于加电工作状态,一旦主系统出现故障,则冷备系统开始加电工作,待主系统故障处理完成后,冷备系统停止工作。
温备方式:与热备方式相同,都有两个服务器系统,且两个都处于带电状态,其中一个是主服务器,另一个则是备用服务器。主服务器正常工作,备用服务器则一直处于等待备用状态,若主要机器发生故障, 处于等待状态的机器就接手主机器继续工作,待主机器恢复后自动变成备用等待的机器。
双施工方式:即有两台服务器,这两台服务器按照程序同时进行工作,分别对输出的结果进行比较,两台机器无论那台出现故障,对于最终的结果只需要对结果进行比较即可。
②软件冗余:与硬件系统的故障研究相比较,软件系统的故障则显得较难。目前对于软件系统的可靠性、设计错误的检测还没有形成一套完整的、可靠的、行之有效的办法。
前向恢复策略和后向恢复策略是当前应用最广的两种解决软件故障的策略。前向恢复即让计算机当前错误的计算状态继续,而将以后的状态恢复到正确的连贯状态上。后向恢复即将系统状态恢复到前一个正确状态中。
前向恢复:前向恢复的目的是减少各个软件在表决点上出现错误的概率,其主要方法为N-version Programming方法工作方式。
后向恢复:后向恢复方法主要有恢复块方法和防卫式程序设计方法。恢复块方法就是将系统分成很多块,其中只有一个主块,其余都是备用块,当主块出现故障后,主块可以指定一个备用块继续运行,直至所有的备用块都运行完,主块和后备块保证互相独立,运行时互不干扰。
③信息冗余:为了使系统能够对故障进行检测且恢复,我们利用在原始的数据中加入冗余信息的方法来带到目的,这种方法就是信息冗余。加入的冗余信息包括检错和纠错编码二种。我们利用检错编码来自动检验错误,而利用纠错编码可以纠正错误。
④时间冗余:目前流行的时间冗余方式有两种,一种是 RSHW,即对一组数据执行同一指令时,通过在不同的时间片,但是在相同的硬件上来执行。第二种是使用数据延迟设备及表决电路结合,将一次数据处理的输出结果通过设置不同的延迟大小而复制成多个版本并在表决器处进行比较。
3 服务器容错技术对比
目前最为流行的服务器容错技术主要有以下三类:服务器群集技术、双机热备份技术和单机容错技术。它们的级别由低到高,集群技术级别最低,双机热备份技术级别居中,单机容错技术级别最高。
3.1 双机热备份
双机热备份技术是一种软硬件结合的应用方案。该方案的组成为:两台服务器,一个共享磁盘阵列柜,及相应的程序。在这种双机热备份技术中,专业人员对数据进行管理,且数据是存放在磁盘阵列柜中的,这就确保了数据的安全。工作中,数据是由中央存储器进行读取和存储的,在工作时,其中的主服务器出现问题,则另外一台服务器就会立即启动接替主服务器进行工作,确保了系统的安全运行。
为确保双机热备份系统的正常工作,该系统运用了两台服务器互发通讯信号的方法保持两台服务器的相互联系,两台服务器按照事先约定好的时间间隔互相发送信号,以表明自己目前的状态是否正常,若一台服务器没有在约定时间内收到另外一台发过来的信号,这就可以认为这台没有发送信号的服务器出现问题,则系统管理软件会迅速启动备用系统,确保不间断、正常的工作。
在双机热备份方案中,共有双机热备模式、双机互备模式和双机双工模式三种工作模式。
①双机热备模式:在该模式中一共有主服务器和备用服务器两台。两台服务器同时写入数据,确保了数据的同步。一旦主服务器在运行时发生故障,可立即将备用服务器激活, 确保了服务器的不间断运行。
②双机互备模式:即共有两台服务器,且这两台服务器同时运行两个独立的应用,运行时无论那台服务器出现故障,另外一台都可以将出现故障的服务器运行内容进行接管,确保了服务的连续运行,具有很高的安全性,且该种对服务器的配置要求也较高。
③双机双工模式:即共有两台服务器,这两台服务器同时工作,且运行的程序一致,实现了负载的均衡。应用这种方式较多的是WEB服务器或FTP服务器。
3.2 单机容错
简单的讲单机容错技术就是只使用一台服务器进行高性能的容错。相对于其他的容错技术其最大优势就是可以将发生故障模块自动分离出去,并且将故障模块和备用模块进行调换,一旦故障被排除,容错技术就会让系统重新开始运行。为实现真正意义上的容错,单机容错服务器通过系统内所有冗余部件进行同步运行。现在市场上基于IA架构的服务器是市场的主流,它能够实现与视窗(windows)系統的兼容。现在在RISC系统实现的容错也能在视窗(windows)系统实现。目前市场上的单机容错产品除了兼容性等优点外,还具有支持包括主板在内等关键硬件的热插拔功能。制造业等对于连续性要求不严格的企业适用双机热备份模式。金融、证券等对业务连续性要求很高的企业适合使用容错服务器。在实际应用中,单机容错服务器实际使用有一台服务器,而双机热备份模式在实际应用中至少需要2台服务器,因此双机热备份模式的投入比单机容错方式多1倍。
4 总结
随着计算机技术的发展,人们越来越重视计算机系统的可靠性,容错技术的发展使计算机系统的可靠性进一步增强,我们有理由相信未来容错技术必将得到更快的发展。
参 考 文 献
[1] 吴玥.浅析计算机服务器系统的容错技术[J].无线互联科技,2012(10).
[2] 吴辉明.关于计算机系统的容错技术[J].网络与信息工程,2015(12).