对设备维修中人为失误的控制
2010-09-16AlexanderSandyDunn澳大利亚
Alexander (Sandy) Dunn (澳大利亚)
大量研究证实,超过50%的设备在维修之后过早地失效了。更无奈的是,正是维修人员的维修行为加快了设备失效的速度。在近期学术研究和实践经验的基础上,笔者列出了维修管理人员应该注意的问题,以便减少或消除人为失误对设备维修造成的不良影响。首先,人为失误是不可避免的,绝不能忽视;其次,制定合理的预防维修计划以最大限度地减少人为因素对维修的影响;再者,维修质量管理对于维修管理工作很重要。
一、介绍
在以可靠性为中心(RCM)的维修技术建立之初,Nowlan和Heap发现,对数百例飞机的机械、结构、电气组件的失效分析显示,故障率变化规律主要有图1所示的六种不同类型。
图1
有趣的是,有超过2/3的故障是在早期发生的。据估计,在1982至1991年间,维修失误是仅次于飞行控制,导致飞机失事的第二大原因(尽管在此期间,RCM已经在航空产业中应用)。
一项对燃煤发电厂的研究显示,一周内56%被迫停机是发生在计划维修和故障维修之后。
其他研究也证实了这个发现,但是直到现在,也没有任何调查显示这其中的原因,笔者所了解到的可能的解释包括:①就维修人员来说,在维修或更换工作中,如缺乏应有的知识和技能,那么就会导致人为失误。②如果设备在高风险维修之后不进行相应测试就投产,会导致系统错误。③设计时,用低性能、低质量的零件代替高性能、高质量的零件。④错误地选用不适合的或劣质的零件。
JamesReason总结了三项调查的结果,其中两项调查由美国的原子能机构开展,另一项调查由日本电力产业研究中心开展。通过这三项研究,发现超过一半的设备性能故障被确认为与维修、校准、测试有关,相比之下,在正常条件下,这些能源站平均只发生约16%的故障。
对波音飞机的调查结果显示,在飞行中引起引擎失灵的最主要的七个原因是:①不完整安装(33%)。②安装中遭受损坏(14.5%)。③不恰当安装(11%)。④装置未安装或遗失(11%)。⑤遭受外物破坏(6.5%)。⑥不恰当的故障隔离、检查、测试(6%)。⑦设备未启用或停用(4%)。由此可见,以上只有一个原因与维修活动无关,至少80%的引擎失灵故障由维修活动引起。
如果说在高度规范和高危险性的产业(如原子能站和民用航空),不恰当的维修会导致如此多的事故,那么在您所在的企业中,维修引发的设备故障率又将是多少呢?
维修所导致的失效结果是什么?很明显,要看您所从事的行业,通常都会潜藏着重大的安全和环境风险。对于不恰当的维修所带来的灾难性的后果,这里有一个较长的记录,其中包括:Flixborough、三里岛、Piper Alpha、美国航空公司191次班机、Bhopal、日本航空公司123次班机等。
除安全风险之外,维修失误造成的又一严重后果恐怕要数经济损失了。通用电气估计,每个飞机引擎的失灵会给航空公司带来50万美元的损失。所以,建议采取以下较合理的措施来减少由维修带来的设备故障:①人为操作失误在维修中是不可避免的,因此在进行系统和工艺设计的时候必须考虑到这一点。②正确使用工具,保证未对设备进行过度维修。③提高维修质量,包括尽可能地避免维修失误。
二、人为失误是不可避免的
通常,工程上有两种处理维修失误的方法:要么惩罚、教育、培训相关人员,要么制定新的工作条例以避免事故再次发生。不幸的是,最近由行为心理学家开展的研究和实践表明,两者均不能有效消除维修失误。
Reason和Hobbs的工作解释了为什么维修活动会诱发设备失效,并且强调,试图通过改变人来减少人为失误的做法是徒劳的,因为在维修工作中,人为失误是常见的、可以预见的,所以应该改变的是工作条件。
Reason和Hobbs总结了一些促成人为失误的生理学和心理学因素,包括:(1)人类的长期记忆能力和意识工作区是有区别的。尤其是,所谓的注意力是与意识工作区的活动紧密相关的,并且意识工作区有以下这些相当有限的能力:①注意力是一种极其短暂的产物——总是被其他的事情分散。②我们只能将有限的注意力集中于部分采集数据上。③无关的事情会转移注意力。④注意力要保持几秒钟都很难。⑤集中注意力的水平很大程度上取决于记忆库的容量。⑥如果我们的操作已经相当熟练且作为习惯固化下来,那么就不会分担太多的精力。⑦正确的操作需要适当投入精力。(2)警戒意识的放松——巡检员从事巡检工作的时间越长,他们越容易忽视一些明显的故障,尤其在采样数稀少的时候。(3)疲劳所致:①人们日常工作的节奏证明,我们很容易在早晨的几个小时里犯错误。②来自身体、社会、药物、工作节奏、个人因素等的压力。(4)激励机制——过多或过少的激励都不利于员工的工作。(5)偏见对思考和决断的影响。不存在“常识”这样的东西,我们总是受以下因素影响:①试图去证明已有的判断。②感性导致冲动。
由上述因素导致的最常见的故障类型有:(1)识别错误,包括:对目标对象、信号、信息的错误识别及未检测到故障状态。(2)记忆功能失效,包括:①输入失败——对存储项目缺乏足够的了解。②存储失败——记忆材料损坏或受到干扰。③输出错误——不能马上回忆起我们知道的东西。④忽略的步骤——将被忽略的步骤重新排列;⑤提早退出——在完成所有任务之前就结束工作。(3)技能减弱。一般与自动化程序有关,包括:“分支”错误——例如你周末准备去高尔夫球场,但却走错路,来到了办公室。“过头”错误——例如在回家路上想买些东西,却错过了商店。(4)基于规则的错误。大多数维修工作都具有高度的流程化,典型的基于规则的错误包括:①滥用规则——将条款运用在不恰当的场合。②错误地使用规则——某条款可能会在特定情况下奏效,但会产生负面的影响。(5)基于知识的错误。当某人第一次执行某任务时,错误不一定是由他(没有经验的人)所犯的。(6)违反规程。
三、避免不必要的预防维修
Nowlan和Heap等人的研究表明,设备的过度维修不仅费钱费时,而且还增加了设备故障的风险,造成不必要的损失。RCM技术是根除过度维修的极有效的方法,可以优化预防维修的流程。我们通过对客户的预防维修工作进行分析,了解到不必要的例行维修在几乎所有企业中都大量存在。在某些情况下,现有的预防性维修工作中只有不到10%是合理的,有一半的工作是浪费时间。澳大利亚西部一个海上油气平台经综合考虑,削减了约25%的预防维修和25%的改善维修。可见,相当一部分的预防维修不但没有起到预防故障的作用,反而诱发了故障。
要想消除不必要的例行维修,首先要明白这些例行维修为什么会存在。这是Assetivity关于快速设备发展策略的流程,这是基于RCM原则的,并且有以下10个步骤:确定分析范围;核实设备性能;识别故障模式;分析故障模式、影响和后果;选择推荐的维修作业;识别其他的改善工作;巩固计划并整合操作策略;取得同意并实施推荐的措施;跟踪成功;超越RCM和PMO。
据示范观察,该品种属弱冬性品种,幼苗微匍匐,叶色深绿,株高较矮,平均株高70cm左右,株型紧凑,穗层整齐,根系生长健壮,分蘖力强,成穗率高,越冬抗寒性较好,抗倒伏能力强,中抗条锈病、白粉病、叶枯病,耐阴雨,抗穗发芽能力较强。适宜在肥力中等以上,特别是高水肥田块种植。
本文未对该流程进行详细描述。如果您还没来得及实施该流程,强烈建议您首先对现有的预防维修方案进行一次评估以便有效管理维修中的人为失误。
四、维修质量管理——主要原则
根据Reason和Hobbs的研究,维修质量管理系统必须遵循以下原则:(1)人为失误的发生是正常的。(2)失误未必是坏事,成功和失败是同源的。只有吸取失败的教训,才能更接近成功。(3)你不能改变人,但是可以改变人的工作环境。导致错误的因素有两个:精神状态和环境状况。我们很难改变人的精神状态,但是可以改善工作环境。(4)没有人做的永远是对的,最有经验的人也有可能犯最低级的错误。(5)人为失误是无意犯下的,所以责备和惩罚无济于事。但这并不意味着肇事者不应该对此负责以及从中吸取教训。(6)与其说过失是造成故障的原因,不如说它是结果。过失是人、团队、任务、工作环境和组织因素等综合作用的结果。(7)有很多失误是曾经发生过的。超过一半的过度维修情况以前就发生过很多次,所以重点解决好这些重复发生的维修错误是最有效的办法。(8)重大安全问题会不同程度地存在于系统中。失误越多,安全性越差。(9)从最广义上讲,工作环境是易控的因素,人则不是。(10)维修质量管理是要将合格的员工变得更加优秀。(11)没有绝对好的方法,不同的维修质量管理方法适用于不同的企业和工作环境。(12)有效的维修质量管理的目标是持续改善,而不是局部修理。可以应用一些维修质量管理工具,适用于不同企业,此类工具组合包括以下内容。
1.人员措施
给员工提供培训。培训维修人员,使他们意识到那些容易导致人为失误的因素和条件。他们应该认识到人的行为限制、短期记忆力的限制、疲劳的影响、外界干扰的影响、压力的影响、所犯错误类型、环境因素等。一旦维修人员意识到这些,则可以检测到易发生问题的报警信号,并采取行动防止其发生。
执行措施,减少有意违规。避免违规的传统方法是约束人的行为,但是更有效的办法是在员工中制造抵制有意违规的舆论。
在员工执行任务前进行精神动员。大量事实(基于外科医生和运动员的)证明做好精神动员工作对保证维修工作的质量和可靠性具有非常积极的作用。
控制力分散。预知可能发生的控制力分散并且采取解决它的策略有助于加强工作的质量。
2.团队措施
提供团队培训。重大事故往往在低效的团队中发生,例如特纳利夫岛发生的飞机失事,造成500多人遇难。因此高效的团队合作培训应包括:沟通技巧、组员发展和领导技能、工作量管理和技术熟练程度。
3.工作环境和任务
在员工执行任务前,要保证其已接受过适当的培训并具备一定资格。合理安排值班时间和加班时间,将员工疲劳对工作的影响降到最低。
有证据显示工作节奏和完成工作的质量有关联,工作节奏过快和过慢都有造成故障的高风险。因缺乏经验而工作节奏过慢带来的故障风险较大,同时也有因技术熟练而懈怠并出错的。这些都是分配工作时候应该考虑的,可以帮助降低人为故障率。
保证设备、工作的合理设置。为了减少维修中的人为失误,设备在设计之初考虑其可维修性。包括:①零部件的方便拆卸、更换等。②相关的组件应该组装在一起。③零部件应该被清楚地标识出来。④应具备对特种工具的最起码的要求。⑤设备不一定具有很高精度。⑥设备在设计时应该具有简单的故障诊断功能。
强制执行良好的清扫标准。车间杂务的整理情况能够较好地反映企业文化和员工素质。良好的清扫标准能够规避由疏忽而造成的险情,省去了定期的清理。
确保备件和工具管理得当。在维修中,如果备件和工具供应不及时,势必会影响维修质量。所以应该设置备件和工具供应区和供应流程以满足生产需要。
编写并使用维修工作须知。关键步骤的遗漏是最常见的维修错误。一些评估表明,在维修活动中,在所有因人为因素导致的问题中,由疏忽造成的占一半以上。因此,制定并运用有效的维修工作须知是处理此类问题的重要方法。
4.组织措施
有效分析、研究已发生的故障和问题。运用高效的分析流程来分析重大故障是非常重要的。高效的故障分析流程应该能够全面解析造成故障的原因,不论是物理因素、人为因素,还是组织因素。为防止此类故障再次发生,最有效的办法是弄清楚导致故障的组织原因。然而,为了有效分析人为导致的故障,有必要在组织内部生成一个汇报的传统,不论是多么微小的故障,都应该被写入报告中。这需要管理层和基层的通力配合。对于达到“高可靠性”水平的组织而言,高水平的故障报告是他们的一个很重要的特色。
恰当应用主动维修来评估将来可能会发生的人为过度维修,要想追求高品质的维修,仅仅预防故障的重复发生还远远不够。为了判断人为失误的可能性是否很高,一个前瞻性的办法是实施维修活动风险评估,这是一个可进行维修质量管理的方法,风险评估的范围可能包括:各级别维修人员的知识、技能和经验;员工士气;维修工作所需的工具、设备、零件是否齐备;劳动人员的疲劳、压力;值勤表;维修流程和工作须知是否合格。
一个应用于航空产业的风险评估案例是19世纪90年代早期由工程安全卫生管理组织实施的,该组织最初是由英国航空公司设立的,现由新加坡接手管理。
此外,还有一些特殊的故障诊断的评估问题,包括:是否为高风险的作业单独安排了合理的检验?是否遗漏或简化了一些功能测试和校验?当作业不符合要求时,是否会整体取消该作业?维修后的设备是否在投运之前经过了全面测试?最后,即使恰当地采取相应的措施也不能避免人为失误的发生,但综合来看,它能够加强组织抵制人为失误的能力。
五、结语
人为失误对维修质量、维修成本、安全和设备可靠性的影响很大。我们尚在探求是什么原因引起了维修故障,并试图开发更好的工具、技术以便尽可能地降低这些故障的影响。本文列举了一些最新的研究成果,希望能够帮助您及所在组织来应对过度维修所致不良结果。