APP下载

FMEA故障模型在计算机维护中的应用研究*

2015-12-16秦莲童常新宇

微处理机 2015年4期
关键词:计算机硬件计算机预测

秦莲童,常新宇

(沈阳工业大学网络管理及电化教育中心,辽阳111003)

·微机应用·

FMEA故障模型在计算机维护中的应用研究*

秦莲童,常新宇

(沈阳工业大学网络管理及电化教育中心,辽阳111003)

针对目前计算机维护还处在先故障后维修的亡羊补牢式的维修方式,导致即使故障修复,但损失已酿的结果,提出了建立有预测功能的FMEA故障模型解决方案。先对计算机硬件设备故障进行分类,建立FMEA故障模型。然后,综合各部件故障数据生成FMEA分析表,通过分析表了解各故障部件之间的联系,预测故障机率,从而得出可能出现故障的预测结果,进而采取相应措施消除故障隐患,同时可以对易损部位做充分准备。通过分析研究和实际应用表明,对计算机硬件设备建立FMEA故障模型,可大幅度降低故障发生率,且对不可规避的故障也可以有准备地最快最简便的排除,减少损失。

计算机;FMEA模型;硬件;故障;预测;分析

1 引 言

随着计算机技术在各领域中的广泛应用,它对人们的工作生活学习各个方面影响越来越大,同时对其依赖程度也越来越深。人们在享受其给我们带来的巨大利益和方便的同时,也无法回避的要面对并承担它发生故障时给我们带来的不便和损失。目前国内的计算机设备维护人员还处在把维护重点放在发生故障之后对故障的处理和总结阶段,并未对故障的预测给予足够的重视。因此,以计算机硬件设备中的I/O设备为例,对其建立一个具有预测功能的故障模型——FMEA故障模型[1],通过该模型达到预测故障,进而在故障发生前排除潜在威胁,或是在突发故障时有有效的应对措施,避免或减少由于故障带来的损失。

2 FMEA简述

2.1 定义

FMEA(Failure Mode and Effect Analysis),即失效模式和效果分析或故障模式和影响分析,是一种用来确定潜在故障模式及其原因的分析方法,主要包括三个方面[2]:

1)分析系统潜在的故障模式;

2)分析故障对系统造成的影响;

3)如何纠正系统的故障和延缓故障对系统造成的影响。

2.2 作用

FMEA是一种可靠性分析的重要手段,能对系统的内部关系和潜在故障提供详细的预见,通常广泛应用于系统开发的概要和初期设计阶段[3],它能保证每个可能的故障模式都被考虑到,以便提供对潜在故障的准确估计。具体来说,通过实行FMEA,可在产品设计或生产工艺真正实现之前发现产品的弱点。而被设备维护员看好的正是其对故障的预测性,可以利用FMEA模型分析的这个特点,在故障发生之前,进行合理且有目的性的维护,排除故障隐患,并做好应对突发故障的技术准备和零部件的备件工作。这样就可以将故障的发生率和危害程度降到最低。

2.3 发展和现状

最初FMEA思想于上世纪五十年代由美国提出并用于军事航天,到八十年代引入微电子工业[4]。由于其作为一种策划用途的预防措施工具,其主要目的是发现、评价产品/过程中潜在的故障和缺陷及其后果,找到能够避免或减少潜在故障和缺陷发生的措施并且不断地完善[5]。

1)能够容易、低成本地对产品或过程进行修改,从而减轻事后修改的危机;

2)找到能够避免或减少这些潜在故障和缺陷发生的措施;

3)故障未发生,但可能会发生,又不一定会发生。

故此,目前FMEA故障模型的运用大都是在工程或系统的研发设计阶段,目的是预测新建工程或新开发的系统中可能出现的故障点和故障诱因,从而在最初的设计阶段就将故障隐患消除掉。其实FMEA模型的运用不应局限于设计阶段,在生产和维护过程中都可以发挥重要的实际作用。而对于一个工程和系统来说,使用周期要远远大于它的设计周期,所以在其生产和维护阶段采用FMEA模型同样具有实际意义,这样可以使FMEA模型的应用更为灵活和广泛。

3 I/O设备的故障类型

I/O设备主要包括显示器、鼠标、键盘等,是人机交互的主要途径。而要准确地预测其故障,首先要将各种故障进行分类,然后建立FMEA故障模型,对其故障提出预期。要建立FMEA模型,就要先从各部件的故障现象、原因、后果等方面作以归纳,划分故障类型。而由于角度不同,划分故障类型的方法有很多种。

3.1 从故障影响来划分

1)一般性故障

这种故障是系统中某个设备或设备的某个部分局部失效,但不影响整个系统实现其主要功能,仍可完成主要工作。

2)严重故障

该故障的发生导致系统或设备完全丧失其功能,不排除故障无法实现正常工作。

3.2 从故障可见度来划分

1)可见性故障

可以直观地通过故障现象,找到故障部位,确定故障原因的故障。

2)隐匿性故障

无法直观发现,必须通过仪器检测和逐步分析诊断,方能确定故障部位和原因的故障。

3.3 从故障的复杂度来划分

1)简单故障

通过简单的操作或修理就可排除的故障。

2)复杂故障

通过多步骤和运用多部仪器设备才能诊断和修复的故障,这种故障处理起来往往耗时费力。

3.4 从故障对元器件损坏程度来划分

1)可修复性故障

通过技术手段可以修复设备或元件的损坏处,使之继续发挥其功能的故障。

2)不可修复性故障

无法通过修理来恢复设备或元件的功能,只能更换新的电子元件或设备的故障。

对故障类型进行了划分之后就该建立FMEA模型来对故障进行分析了。

4 对I/0 设备FMEA模型分析

故障模式和故障影响分析不同于以往的故障发生后所做的分析,是贯穿于整个微机室组建设计、计算机运行、以及故障分析和排除阶段的。在微机室组建最初或维护过程中都可以运用该方法,以便在故障发生之前对潜在的故障可能进行分析和预测,对计算机的I/O设备则可以进行有针对性的防护和配置,防止重大事故的发生。

FMEA可以对整个系统进行分析,也可以单独对系统中的部件进行分析处理[6]。对I/O设备系统的FMEA分析包括常见设备的故障分析。其中对设备的分析,主要是对显示器、鼠标、键盘进行FMEA分析,参考对应设备的故障数据,生成分析表1。通过该表能简单地了解这些设备故障的因果联系。通过分析每一个潜在的问题模式,确定其产生的影响程度,从而识别I/O设备系统组建、运行中的薄弱环节,为制定改进措施提供依据[7]。

分析表的结构是按照各设备预期故障的因果关系设置的:首先,故障模式,描述各种故障现象;其次,故障原因,将可能导致故障的原因一一罗列;再次,故障影响,将故障可以导致的结果预期出来,也可以看出故障的危害程度;最后,纠正措施,采用何种方法可以避免或修复故障。

5 故障应对策略

根据FMEA故障模型分析我们可以看出计算机I/O设备的常见故障现象及部件部位,进而采取相应措施避免和应对故障的发生。对于故障形成原因的不同,应该分别采取相应的措施。

5.1 对可预防的故障采取调整措施

表1所示,显示器的故障分析中关于磁化的故障,可以在显示器被磁化前通过清除磁源和加强管理等方法,杜绝显示器被外界磁源干扰磁化的情况发生[8];鼠标、键盘都有因为人为大力拉扯使USB或SP/2插头松动或插针弯曲而导致设备接触不良,进而发生故障;或是将饮料等具有腐蚀性液体洒进键盘,导致电路板被腐蚀发生断路或短路[9]。这些就要通过加强上机管理,严格操作章程,采取严禁个人私自插拔USB或SP/2插头和在操作计算机时饮食等行为的措施,来避免潜在故障的发生;由于操作台摆放的过于紧密,通常会对I/O设备的数据线造成严重挤压,导致数据线中金属线断裂而发生故障。如此可以在放置操作台的时候保留数据线的空间,或是在操作台易挤压处放置一个坚硬的中空防护套,将所有数据线囊括其中,保护其不受到损伤。对于这些可以规避的潜在故障,应该预先采取措施,对管理制度和维护方式方法作以相应调整,避免发生设备失效。

表1 计算机I/O设备FMEA分析表

5.2 对不可预防或不确定发生的故障做充分准备

5.2.1 检测和维修的专业工具设备必须齐备

表1所示,显示器和键盘故障中,有很多是集成电路板或电子元件发生断路这样的隐匿性故障,因此可快速检测电路和元器件故障点的专业检测工具和设备是必不可少的。而找到发生断路的故障点就需要将断路重新连通,这时焊接设备也必须备齐。例如表1中显示器行幅突然变窄的故障,必须用万用表测量行管集电极电压是否为正常(150V),然后再进一步检查行宽度调整管没有损坏,检查S校正电容,发现其一引脚有虚焊现象,最后补焊修复[10]。所以,完备的检测和维修设备是故障发生后,快速查找故障点,并排除故障的硬件必要保证。各种检测和维修设备必须齐备,工欲善其事必先利其器。

5.2.2 易损设备或元件必须备件

对于不可恢复类型的故障我们只能更换新的设备或零部件。很多维护员认为购买备件是浪费,买少了可能出现故障部件备件没买,而备件的部件还没坏的情况。或是买的比较齐全,故障部件可以及时更换,还有很多没发生故障的备件闲置浪费,增加了维护成本。现在FMEA故障模型正好解决了这个问题,可以通过FMEA对故障分析预测所生成的分析表看出,易发生故障部位和易损部件都有哪些,这样就可以有针对性的进行备件,既避免了不必要的浪费又可以在故障发生时有件可换。同时在备件时还要建立节约意识,如键盘或鼠标等在更换新设备时可以将旧的设备入库保留,在发生键盘按键因复位橡胶老化而失去复位功能或损坏、丢失时,以及键盘或鼠标数据线损坏时,可以将旧设备上的相应零件拆卸下来作以替换,这样可以大大减低维护成本。

6 FMEA模型结果分析

FMEA分析表通过描述故障模式,分析故障原因,阐述故障影响这种故障因果关系对故障做出了全面详细的预测,最后给出多种解决方案,根据具体情况可以选择最适合的解决措施。

FMEA分析表的生成有其严格的要求,如表1所示:一定要按照部件、故障模式、故障原因、故障影响、纠正措施这种前后因果关系排列。这样排列的好处可以使维护人员有章可循,容易掌握分析规律,提高维护效率。而表中各项也有相应的要求:故障模式,要求将故障现象表述的全面、准确;故障原因,要求分析的仔细、准确、具体;故障影响,要求预测的准确,不可夸大,也不可缩小;纠正措施,要求有可操作性和多样性。

运用FMEA模型对故障进行分析预测,结果究竟如何?对计算机维护发挥了多大效果?我们通过表2具体分析。

表2 2010年-2013年微机室120台计算机I/O设备故障统计表

表2是对微机室120台计算机I/O设备故障四年的数据统计。从数据统计结果不难看出在未使用FMEA模型对故障进行预期分析以前,2010年-2012年的故障数是逐年递增趋势。而2013年采用了FMEA模型维护方法之后,故障数显著下降。这里需要对表中的两处数据进行一下说明;第一处是2013年在使用模型后故障数比起未使用的2010年的故障数似乎并未有所减少。众所周知,计算机硬件设备是随着使用期限的增加而老化磨损的,从而导致故障逐年增加。因此,按其发展规律,2013年如果未使用FMEA模型,那么故障率应该高于2012年,应为四年中最高的一年。但在采用FMEA模型维护之后却将故障降至2010年机器刚投入使用时的状态,可见其对计算机硬件维护的巨大实际作用;第二处是在使用FMEA模型后怎么还会发生故障,并未完全消除故障。故障分为可预见和不可预见两种,FMEA模型是对可预见故障做预测分析,在故障发生前采取相应措施消除隐患,对不可规避的不可预见性故障只能采取相应的准备措施,无法消除。其实任何一种模型都有其局限性,目前为止没有一种方法可以使计算机硬件的故障数为零。通过实际的数据对比,已经可以清楚的看到采用FMEA模型的维护方式比起以往盲目的维护方式有了很大的进步和实际意义,达到了预期目的,并且取得了巨大成果。

7 结束语

以计算机I/O硬件为例,对其进行故障分类,然后建立FMEA故障模型,对其故障作分析预测,并且通过实际数据看到FMEA模型成功地规避掉相当一部分潜在的故障威胁,有效地降低了故障发生率。今后要更多更好地运用FMEA故障模型,将计算机硬件设备的维护意识转变为防护意识,以防为主,预防加维护,这样才能有效降低故障的发生机率,降低维护成本,提高维护效率。FMEA故障模型的功能和用途远不止于此,在对计算机软件和网络维护方面同样可以发挥巨大作用,希望广大同仁可以继续深入研究。

[1] Goble,William.The FMEA method[J].EN,2012,59(2):14-16,18,20.

[2] 祝庚.铁路信号计算机联锁系统的故障模型建立及故障诊断方法的研究[D].合肥:合肥工业大学,2003.ZHU Geng.Research on Fault Modeling ang Diagnosis of Microcomputer Interlock Sysytem in Railway Signals[D].Hefei:Hefei University of Technology,2003.

[3] Brian Gervais,Deirdre M.D&rsquo,Arcy.Quality risk analysis in a cGMP environment:multiple models for comprehensive failure mode identification during the computer system lifecycle[J].Drug Development and Industrial Pharmacy,2012,40(1):46-60.

[4] Srivastava,Nishit Kumar,Mondal,Sandeep.Development of a predictive maintenance model using modified FMEA approach[J].IUP Journal of Operations Management,2014,13(2):7-16.

[5] Carlson,Carl S.Preventing Problems[J].Appliance Design,2009,57(5):26-29.

[6] Flori,Albert.Identifying software failures using FMEA and fault tree analysis[J].EN,2012,45(9):30-35.

[7] 孙宝琛,贾希胜,程中华.基于FMEA和模糊Petri网推理的装备保障过程诊断研究[J].计算机应用研究,2013,26(8):2973-2984.SUN Bao-chena,JIA Xi-shengb,CHENG Zhonghuaa.Study on diagnosis model for support process based on FMEA and fuzzy reasoning Petri nets[J].Application Research of Computers,2013,26(8):2973-2984.

[8] 叶丽丽.略谈计算机硬件维护原则与方法问题[J].软件,2013,34(6):108-109.YE Li-li.Discussion on the computer hardware maintenance principle and method of[J].sofeware 2013,34(6):108-109.

[9] 张文平.计算机硬件维护原则与方法问题探讨[J].煤炭技术,2012,31(1):252-253.ZHANG Wen-ping.Discussion about Computer Hardware Maintenane Principles and Methods[J].Coal Technolog,2012,31(1):252-253.

[10] 李家斌.关于计算机硬件维修的探讨[J].煤炭技术,2012,31(7):236-238.LI Jia-bin.Discussion on Computer Hardware Repair[J].Coal Technolog,2012,31(7):236-238.

Research on FMEA Fault Model in Computer Maintenance

Qin Liantong,Chang Xinyu
(Network Management and Educational Technology Center,Shenyang University of Technology,Liaoyang 111003,China)

Now,computer maintenance mode is still in the primary step,maintenance performed after the fault occurs,which results in the loss even if the fault has been repaired.A solution of FMEA fault model predictive capabilities is proposed in this paper.First computer hardware equipment failure is classified to establish FMEA fault model.Then,FMEA analysis table is generated by integrating failure data of each component to understand the relationship between the failure parts and predict the probability of failure.The predicted result for the parts to be failed is obtained to take the appropriate measures to eliminate hidden faults and fully prepare the vulnerable parts.The research and application show that FMEA fault model,made for computer hardware,can significantly reduce failure rate and fully perform preparation for troubleshooting the failures and reducing losses.

Computer;FMEA model;Hardware;Fault;Forecast;Analysis

10.3969/j.issn.1002-2279.2015.04.017

TP307;TP206

A

1002-2279(2015)04-0064-05

辽宁省博士科研启动基金项目(20111043)

秦莲童(1978-),男,辽宁省辽阳市人,硕士研究生,工程师,主研方向:计算机维护、计算机网络、物联网技术与应。

2014-12-31

猜你喜欢

计算机硬件计算机预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
计算机操作系统
基于Unity的计算机硬件组装仿真教学系统设计
基于计算机自然语言处理的机器翻译技术应用与简介
计算机多媒体技术应用初探
浅析基于医院特点的计算机硬件维护研究
计算机硬件设备驱动程序分析
中职计算机硬件课程教学策略探讨