探究嵌入式计算机控制系统容错策略
2015-05-30吴婧
吴婧
【摘要】 随着社会经济的不断发展,人们逐渐进入信息时代。当前是一个互联网高速发展的时代,计算机也就成为我们日常生活中不可或缺的重要工具。计算机控制技术是实现宇航、航空以及各种工程设计的科学控制的重要手段。由于其设计的领域具有相当重要的作用,因此计算机的可靠性成为一项重要的因素。做好计算机故障策略,即计算机控制系统的容错设计成为一项需要解决的重要问题。本文对嵌入式计算机的容错设计进行了简单的介绍,提出了相应的解决控制系统容错的策略。
【关键词】 嵌入式计算机 控制系统 容错 策略
容错设计是提高计算机可靠性的重要方式,加强对嵌入式计算机控制系统的了解,对容易出错的地方进行深刻的分析,以良好的解决方案提高计算机控制系统的可靠性,实现更好的控制。
一、嵌入式计算机容错概念
当电源产生不足以及硬件出现故障等情况时容易造成计算机系统临时中断,从而造成数据丢失等情况。计算机容错控制系统是运用于军事、航空航天、工业控制以及银行、通信等领域的重要控制系统,其主要由软件和硬件系统两部分组成,减少及避免由计算机失效而引发的重大事故的发生[1]。计算机容错系统是结合计算机失效的不同情况进行针对性的故障检测。
二、嵌入式计算机控制系统容错的工作模式
1、故障限制。将故障的影响控制在一定的范围之内即所谓的故障限制,使计算机的其他部分得到很好的保障。做好限制故障可以通过故障问题进行线路的检测,在操作前进行一致性的检验,同时进行多次询问确认,从而缩小故障影响的范围。
2、故障检测。在线检测和离线检测是故障检测的最主要方式,其中进行离线检测时的系统必须停止工作,像卫星控制、银行等不能停机的控制系统只能进行在线检测。
3、重试。由于计算机控制系统出现的故障具有多样性,一些瞬间故障的发生可能使系统发生短时间的故障,从而使整个运行系统发生错误。这时就需要对操作进行重试,以获得正确的结果。对于没有产生物理破坏的暂时性故障,重试可以起到很好的作用。
4、重组和修复。重组是针对永久性故障所进行的。其主要是通过对系统的组件进行重组,对于失效的部件进行隔离、切除或替换,以保证系统的正常运行。修复在离线与在线的情况下都能进行,其中进行离线修复可以拆下所要修复的部件,整个系统处于停机状态。而在线修复是对发生故障的部件进行及时的更换。
三、嵌入式计算机控制系统容错设计
1、指令冗余。操作码和操作数是计算机指令的重要组成部分。其中CPU所完成的操作由操作码进行指明。而操作码的操作对象为操作数。程序计数器PC负责对操作码、操作数等指令进行控制。因此在PC遭遇干扰时会影响其他指令的正常进行,使程序脱离其运行的轨道,即跑飞。有效减少跑飞现象的发生,将跑飞的程序迅速待会既定的轨道需要尽量运用单字节指令,并将NOP指令插入到关键位置,即所谓的指令冗余。其中将单字节的NOP指令插入到双字节指令和多字节指令之后,可以有效提高指令间的紧密度,使其后的指令不易被拆散[2]。其中NOP指令作为一项空操作指令能够减少跑飞在操作数上的程序对其他指令的影响,促进程序的正常运行。其次进行重要指令重执,将一些重要的指令进行重复写上,进一步确保指令的正确运行。最后对重要数据进行程序的复核,对于重要的数据需要将其在程序中进行复核,通过复核及时处理程序中错误,修改相关数据,以保证其在指定的范围内进行。
2、软件陷阱。利用软件陷阱中的引导指令对跑飞程序进行及时有效的扑捉,并将其引向复位入口。在这一过程中对程序中产生的错误进行处理。未使用的ROM空间、运行程序区以及中断服务区都是软件陷阱的常用手段。结合软件规模的不同,在系统设计中需要让ROM空间留有一定的空余,将引导指令 填满非程序用区的空位,这样就可以将跑飞的程序迅速的引导回来,找回其既定的程序入口地址,保证程序正常运行。运行程序区主要对跑飞程序进行抑制,以提高程序运行的可靠性。利用模块化的设计,使程序在既定的模块中执行。在用户程序模块空余单元放置陷阱指令组,从而将跑飞程序拉回正常轨道。中断服务程序区就是在主程序的运行区间设定计时器,实行定时中断。当跑飞程序到达所设定的中断运行区内时进行定时中断。例如将ADD1——ADD2区间设为主程序的运行区间,中断断点地址为ADD。当ADD
结束语:嵌入式计算机控制系统容错策略对提高计算机控制系统的可靠性具有重要作用,能够更好的保证远程控制系统的正常运行。本文主要介绍了计算机控制系统容错的基本概念,同时提出了计算机控制系统容错策略。希望有更多的学者能够在嵌入式计算机控制系统容错上作出更多的研究,促进计算机控制系统的不断完善。
参 考 文 献
[1]李璟.高可信嵌入式计算机系统的安全性与易用性设计[D].哈尔滨工业大学,2011.
[2]陈熙.计算机控制系统的容错技术[J].消费电子,2014,(8):172-172.