计算机系统可靠性设计方案
2017-03-22李群
李群
摘 要计算机的核心是系统,系统运行的可靠性与安全性,直接影响着计算机运行的效率,因此加强计算机系统可靠性研究,有着现实的意义。文中对影响计算机系统可靠性因素,进行了简单的分析,并且提出了计算机系统硬件与软件设计的具体方案。计算机系统可靠性设计方案,除了重点考虑计算机系统内部因素外,还需要考虑外在因素的影响,全面的设计系统方案。
【关键词】计算机 系统 可靠性 设计方案
计算机被广泛的应用于各个领域,而且发挥着重要的作用,若计算机系统运行的可靠性较差,则极易影响工程的项目设备运行的安全性以及稳定性。计算机控制系统可靠性差,主要受到各种因素的影响,包括软硬件系统,以及外部环境因素的影响,对此在开展计算机系统设计时,要进行全面分析。
1 计算机系统可靠性分析
计算机控制系统即CCS,其指的是利用计算机,借助相关辅助部件,并且与被控制对象相互联系,以此达到控制目的。计算机系统可靠性分析,即控制系统可靠性分析,主要是针对影响控制系统运行安全与可靠性的因素,包括元器件设备、系统运行参数、系统各单元MTTR等。在进行计算机系统可靠性设计前,则需要对上述影响因素,进行详细的分析,再进行系统设计。
2 计算机系统可靠性设计分析
2.1 系统输入可靠性分析
计算机系统运行,需要输入指定命令,由系统输入运行结果看,若输入错误,则极易造成系统输出结果错误,对此则需要仔细的选择传感器,确保传感器的适用性与可靠性。如果系统选用的模拟传感器,则输入的放大电路,其最好是绝对值放大电路设计,并且需要设计输入保护,以及滤波处理输入信号,以此防止由于输入信号较大,给系统接口造成损害。除此之外还需要仔细的研究传感器故障原理,以此保证传感器的可靠性与安全性。
2.2 系统输出可靠性分析
影响计算机系统输出的安全性与可靠性的因素较多,主要分为输出执行器、输出传输线、输出接口电路、输出软件等,这些因素的可靠性,直接影响着计算机控制系统输出的可靠性与安全性。因为系统输出主要依靠驱动执行器,驱动执行器属于高速运转元件,极易受到外界因素的影响,使得所存内容被破坏,最终造成系统操作错误。
2.3 诊断技术可靠性分析
当计算机系统运行时,需要借助诊断技术,对检测信号做有效判断,以此判断计算机系统是否处于正常运行状态。若想准确的判断计算机系统故障位置,则可以利用事故现象和系统故障之间的对应关系,来确定故障位置,以此减少系统故障修复所花费的时间,同时还能够提高计算机系统运行的可靠性与安全性。
2.4 冗余与容错可靠性分析
计算机系统可靠性影响因素中,冗余与容错设计比较重要。冗余技术主要分为工作冗余与后备冗余。工作冗余能够支持系统设备进行多次重复配置,当系统运行时,若任意设备发生故障,则其会脱离控制系统,不会给系统造成影响。后备冗余指的是配置两台设备,将其中的一台留作备用,若运行设备发生故障,则后备设备将会投入系统中运行,进而确保系统的可靠性。计算机冗余系统主要包括并联系统(冗余设计)、备用系统、表决系统,冗余设计的应用性较强。容错设计指的承认系统故障,確保系统故障后能够继续运行,为了提高计算机系统容错能力,通常加设冗余设计,以此实现接替容错单元功能,确保系统正常运行,同时故障系统能够自动修复,以此确保系统运行的可靠性。
3 计算机系统可靠性设计
3.1 硬件系统设计方案
计算机系统主要可以分为硬件系统与软件系统,因此可以作为设计的两大部分。硬件系统主要是由各元器件以及信息技术等构成,为了确保系统的可靠性,则需要做好运维措施以及合理设计,可以遵循以下要点:
3.1.1 冗余容错设计方案
该方案的应用较为广泛,基于硬件运行特点,则可以分为电路级冗余、静态冗余、动态冗余、混合冗余。电路级冗余设计,则需要遵循计算机控制机烯烃原则,即对系统模块电路中的极管进行冗余设计,以此确保运行模块故障后,容许电路能够代替原有电路元件运行;静态冗余容错设计,多采用表决模块,以此屏蔽系统异常,该设计方案中,主要是将单模块,利用三模冗余进行交替;动态硬件冗余容错设计,主要是基于控制系统特点,将系统设计为多各模块,构成故障检测模块、故障定位模块、系统恢复模块等,进而实现容错技术功能。混合容错设计方案,主要是将静态冗余容错与动态容错系统融合,实现系统可靠性运行目标。
3.1.2 系统可靠性运维方案
提高计算机系统运行可靠性,则需要尽量做好系统维护措施,使用高性能元器件。元器件使用性能,与其运行环境有着直接影响,尤其是温度因素,对此需要设置电源散热装置和配置,提高元器件运行可靠性。同时需要考虑元器件是基于功能组建在一起的,为了确保运行的可靠性,则需要做好元器件焊接位置检查,以及接触部位检查,防止出现系统运行故障。除此之外元器件的可靠性,直接影响着系统运行,因此其结构设计要简洁,减少元器件使用个数。基于计算机控制系统运行环境特点,做好相关的防护措施,针对主要影响因素,包括雨雪因素、温度因素、气体因素等。
3.2 软件系统设计方案
计算机控制系统可靠性设计,主要是进行软件容错设计与软件编程规范。
3.2.1 构建冗余系统
软件系统的容错能力设计,需要构成冗余系统。基于相关原理,简化系统单元模块,提高系统运行的可靠性,将控制系统分散设计为各个控制系统,再将其分解为独立单元,基于系统性能,将其构建为不同模块。为了避免通信系统运行节点故障,给计算机系统造成影响,可以使用CANBUS总线,以此来解决通信系统缺点,使其具备多主结构特点,确保系统在任意节点内,均能实现信息交互。
3.2.2 降低单元的MTTP
计算机系统中多采取模块化设计,以此来降低单元MTTR,进而使得系统故障时,能够实现快速定位与维护,缩短系统MTTR,进而提高系统可靠性。同时将系统设计成诊断故障模块,运用诊断技术、自动隔离技术等,提高系统故障处理速率。
3.2.3 软件编程规范
计算机软件系统编程规范,其主要包括设置自检程序、指令冗余法、设置软件陷阱、WATCHDOG、输入信号与输出信号的抗干扰技术,将上述技术进行组合与完善,则能够极大程度上提高计算机系统的安全性与可靠性。
3.3 计算机系统可靠性设计分析-通信系统
计算机通信系统设计,则可以遵循以下设计要点:
(1)利用冗余技术以及设备,实现系统运行故障监测,确保故障发生后的交替工作;
(2)利用现代化技术,提高网络级别。
(3)优化网络系统结构,合理组合设备,减少系统建设成本。
(4)使用高性能网络产品,同时考虑网络升级需求以及扩容需求。
层次化通信网可靠性设计要点:
(1)接入层网络体系中,使用OSI模型。该模型的首层是集线层,设备与集线层连接,则能够实现资源共享,交换机的使用,能够提高集线器的性能,具有网络连接优势,能够实现资源完整转发,以及端口识别,自动判断资源是否传送,进而提升系统可靠性。
(2)核心层设计。合理设计核心层,能够为计算机系统,提供高性能数据链路,确保网络数据传输的稳定性以及速率。同时能够将核心层路由协议,转变为负载模式,实现网络资源调度,快速恢复系统故障。
(3)分布层可靠性设计。设计分布层,则能够实现访问請求信息审核以及过滤,同时能够拒绝不合理资源访问请求,若接入层和核心层路由协议,发生排斥或者不协调问题,则需要重新分布资源信息,进而确保通信网络速率。通信分布层合理设计,则能够使其具有较高的性能,确保网络系统的稳定性,提高系统的可靠性。
4 结束语
计算机系统构成较多,集成了各子系统功能,进而实现系统控制,为了提高计算机系统可靠性,则需要对影响因素进行全面的分析。对计算机系统进行可靠性设计,主要分为硬件系统设计与软件系统设计,同时做好细节优化设计与各系统结构优化设计,以此确保系统的可靠性以及安全性。
参考文献
[1]柳孔明,徐宏哲,黄俊.三余度飞控计算机架构及其可靠性研究[J].现代电子技术,2012(06):102-106.
[2]赵豫峰,张善从.一种双机热备的嵌入式计算机系统设计[J].国外电子测量技术,2013(06):75-78.
[3]吕进,肖嘉熙.计算机通信网的可靠性设计方案优化策略[J].无线互联科技,2016(15):6-7.
[4]杨菊平,董妍,程俊强.民机飞控计算机余度设计及可靠性分析[J].计算机技术与发展,2014(06):211-214.
作者单位
武汉职业技术学院纺织服装工程学院 湖北省武汉市 430074