关于计算机服务器系统的容错技术
2016-10-11周凤凌
周凤凌
摘 要:伴随着当今时代信息技术地不断发展,计算机服务器系统在我国得到了非常广泛的应用和普及。在中小企业和电力、国防、卫生等一些重大的行业中也都离不开计算机服务器系统提供着不间断的工作。所以,一旦计算机服务陷入崩溃或者是发生故障,那么就有可能带来巨大的经济损失。、
关键词:计算机;服务器系统;容错技术
由于我国当前信息技术的飞速发展,各个行业中需要用到计算机系统的应用越来越多。其中,计算机系统的发展也为各类业务提供了可靠及时的基础支撑。然而,我们还应该注意到计算机系统中的软硬件都会产生一定的故障,对于这些故障的处理如果稍有不慎就有可能会对企事业单位,尤其是一些国防、卫生以及电力等重点行业带来一些较大的损失情况。但是伴随着容错技术的引入,我们就能够很好地解决这个问题,还能够进行正常、不间断的工作。因此,本文就旨在对计算机服务器系统中的两个主要容错技术:软件错误容错技术和硬件错误容错技术进行一定的分析,能够为相关的理论和实践带来一定的借鉴意义。
一、计算机服务器系统容错系统的概述
我们所说的计算机故障,指的是由于计算机不见的物理实现、操作错误或者是设计错误等原因引起的计算机系统硬件或者是软件错误的状态。故障的诊断、检测和恢复技术主要是作为计算机容错技术的重要组成部分,如果计算机系统要进行故障恢复的操作,首先就要进行检测、诊断的技术来对故障所处的位置进行定位。作为恢复的前提,我们还应该在恢复技术的作用下使得计算机系统能够恢复到无故障时候的状态并且开始正常工作。当前运用的计算机容错技术最基本的方法是冗余技术,而硬件冗余、软件冗余、信息冗余以及时间冗余技术是作为冗余技术的四个主要组成部分。
二、计算机服务器系统容错技术分析
1.硬件错误容错技术
(1)在硬件错误容错的技术中,我们采用的硬件冗余技术也主要分为部分冗余和完全冗余这两种主要方式。我们通过分析完全冗余的方式,可以发现工作方式的不同主要分为冷备、热备、温备和双工等这四种方式。这四种方式的工作形式如下所述:
热备工作方式:在该工作方式之下,我们对于两个互为冗余的计算机服务器系统都处于加电工作的状态,但是由于热备计算机系统并不能够对系统的处理结果进行输出以及计算。所以一旦主计算机系统在发生了故障的前提下,热备计算机系统就会在继续的工作中接手,直到系统故障修复完毕之后,热备的机器就开始重新编程备机。
冷备工作方式:这一种方式跟热备方式不同的是,冷备工作方式的备用指的是计算机系统是在处于不加电状态下的工作。只要主机发生了故障,那么冷备机器就会接受继续工作,故障解决之后就会重新变成备用机。
温备工作方式:冗余的两个系统都处于加电状态,一个在工作状态的时候,另一个就开始处于等待状态。如果工作的机器发生了故障,那么另一个就会开始接受继续进入工作状态。等到故障恢复之后,就会变成备用等待的机器。
双工工作方式:在该种工作方式下,两个机器开始同时进入工作,也开始同时进入处理结果的输出。在发生了故障之后,我们对两个机器的结果进行输出的比较。
(2)所谓的信息冗余,指的就是在原始数据中附加若干位的冗余信息用来达到检测故障或者是恢复故障等目标的容错技术,其中就包括了检错编码与纠错编码这两种。检错编码可以通过自动扫描来发现错误,而对于纠错编码具有自动发现错误以及纠正错误的能力等。我们在编码技术常用到的是信息的传输和存储以及处理过程中去。
(3)我们在时间冗余中,在一些非硬件冗余以及一些非强实时的系统中,可以利用使用时间冗余技术来达到容错的目的。时间冗余的工作方式主要就分为两种,一种是RSHW,指的是在同一个硬件上对于同一数据在不同时间片中执行同一指令集。第二种是使用数据延迟设备及表决电路结合,将一次次的数据处理的输出结果通过设置不同的延迟大小而复制成多个版本并在表决器处进行比较。
2.软件错误容错技术
在面对硬件系统故障研究的时候,软件错误就显得比较困难了。由于当前还没有能够形成一套成熟而又完整的方法来应对软件系统可靠性以及设计错误等检测结果。现在应用比较普遍的软件故障恢复策略主要有两种,一种是前向恢复,另外一种是后向恢复。我们在面对前向恢复的时候,总是习惯将计算机当前的计算状态继续进行下午,从而将之后的状态恢复到连贯的正确状态。而对于后向恢复来说,字面理解上来说就是将计算机系统状态恢复到前一个正确的状态。
目前应用的前向恢复状态主要由N-version Programming的方法,该种方法的基本思路是通过不同的团队独立设计,以及使用不同的方法来对不同的设计语言和不同的开发环境以及工具来进行完美的实现。主要目的就是为了减少各个版本软件在表决点上出现的一些关于错误的概率,其中相关的工作方式也是较容易实现的。而对于当前应用较普遍的后向恢复法来说,主要由恢复块方法和防卫式的程序设计方法。我们通过恢复块方法来说,其中一个功能之下,存在有主块和若干个后备块的概念,一旦主块开始投入运行后就没有通过验收的测试,也就可以指定第一个后备块运行,从而也就成为了主块。在依次按顺序开始耗尽所有后备块的基础上,设计的主块和后备块之间就尽量保证了相对的独立性,不会因为主块出现了错误而干扰到后备块的运行。
三、结语
综上所述,我们对于计算机服务器系统的基础支撑可以发现,其中最主要的还是容错技术的保障,能够对其稳定而又不间断的运行提供了重要技术。每个企业都应该对此引起足够的重视,而本文通过对计算机服务器系统中的硬件容错技术和软件容错技术进行了仔细的分析,相信未来我国的计算机系统规模将会进行进一步地扩大。
参考文献:
[1] 吴玥. 浅析计算机服务器系统的容错技术[J]. 无线互联科技. 2015(11) .
[2] 周荣. 容错技术研究[J]. 商情(教育经济研究). 2016(05) .