核电相关管理技术用于火电以提升机组可靠性的分析
2015-05-14陈华桂高爱民
陈华桂, 周 平, 高爱民,黄 磊
(1.江苏方天电力技术有限公司,江苏南京211102;2.江苏核电有限公司,江苏连云港222042)
提高发电设备可靠性,减少非计划停运是发电行业生产管理的重要内容。大容量发电机组的异常停运会危及电厂和电网的安全稳定运行,由此带来的电量损失、设备修复费用、启动燃油消耗、设备使用寿命损耗等也会给发电企业造成经济损失。近年来,核电机组的非计划停机停堆事件大幅下降,最为典型的是大亚湾核电基地1号机组连续10 a未发生非计划自动停堆事件。核电设备可靠性的提高,主要得益于核能行业在设备可靠性管理上引入了国外先进的管理经验,同时结合我国的实际状况,进行了诸多创新和实践,建立和完善了适应核电站的设备管理运作模式,逐步形成了以设备可靠性分析和设备维修策略优化为核心、以设备状态监测和设备缺陷管理为手段、覆盖日常生产活动和大修活动的电站各职能部门全范围参与的设备可靠性管理体系,其中不少管理方法值得火力发电企业学习和借鉴。核电机组安全稳定运行的基础包括2个方面:一是杜绝人因事件;二是加强系统和设备的管理。同时为确保核电站长治久安,还必须重视中长期技术项目的管理。文中旨在通过对核电厂技术管理体系的分析和研究,为火电厂的技术管理提供良好的借鉴。
1 核电设备可靠性管理体系
以设备信息管理为基础,优先处理和机组热点问题相关的工作,同时围绕设备可靠性,建立状态监督管理、维修规划管理、维修质量管理、设备技术管理等4个方面为主要内容的设备管理体系。从状态监督到维修规划、设备质量管理、设备技术管理,再回到状态监督,实现一个闭合的设备管理循环,使设备可靠性得到一次提升,在此基础上进入第二次循环,以此实现设备可靠性的稳步提升。核电站设备可靠性管理体系主要包括6方面的内容。
1.1 设备分类及识别
要识别出与安全及可用率相关的关键敏感设备,并加以重点管理。首先建立设备分类准则,通过对重要功能的识别,对关键部件、非关键部件和可运行至失效部件进行分类管理。
1.2 预防性维修
其目的是采用预测性维修技术在设备失效前探测设备的性能,用优化的预防性维修提高设备的可用率,并降低维修成本。首先根据预定的维修策略编制维修大纲,并据此实施预防性维修、预测性维修和定期试验;反馈设备维护过程中的执行情况以及设备的运行状态,提供可靠性分析的数据基础。
1.3 性能监测
设备性能监测的目的在于保证所有设备在设计工况下能够满足其性能要求。首先根据设计文件和功能分析确定设备的性能准则,对系统、设备性能趋势进行监测,对性能降级等异常进行分析,并确定纠正措施。此外,性能监测也为预测性维修提供支持。
1.4 纠正行动
识别关键敏感设备的失效及失效原因,并确定相应的对策;对发生的设备失效进行根本原因分析,防止重复发生。通过设备缺陷管理系统对设备缺陷进行分类管理,组织和实施纠正维修,并控制其风险;对维修策略进行必要的反馈和调整。
1.5 持续改进
根据设备分类识别、性能监测、纠正行动等功能模块的反馈,调整预防性维修项目和周期,优化维修策略,并启动必要的改进。
1.6 寿期管理
定期评价系统、设备的健康状况,建立系统设备长远健康策略;识别设备老化,并采取措施缓解和消除老化因子;识别产品淘汰问题并采取对策,将系统设备寿期管理纳入到公司经营管理计划中。有了完善的管理体系,还需通过职能的划分落实到运营管理的各个环节。在公司内部,为实现上述设备可靠性管理职能,结合公司的组织机构进行相应的设置。
2 核电站人因可靠性管理
随着核电站设备 (硬件和软件)可靠性的不断提高,由人的因素而诱发的事故已成为最主要的事故源之一[1]。人与系统的交互作用影响主控事故序列的进程,人因失误对核电站的安全风险具有显著影响。防止人因失效是核电企业管理的基础,核电企业已形成了行之有效的防止技术人因失效的九大工具。
2.1 注重现场调查
深入现场,结合理论分析,可以有效查到问题的根本原因,为后续的技术方案制定打好基础;结合现场的技术方案最具可实施性,也能最大限度地考虑方案实施后的现场可操作性和可维修性。
2.2 严格遵循标准
遵循法律、法规、规章制度、标准、行业规范是防止技术失效的重要工具[2]。在技术方案制定、设备与参数选择、安全等级的确定中,必须遵循标准要求。在遵循标准工作,应注意以下几个问题:(1)按照以下优先级别,确保最高级别的法规标准得到遵守∶国家法律、法规、规章制度、标准、行业规范。(2)在各标准之间存在不一致的情况下,在确保安全的基础上,借鉴同行实践,采取保守决策。
2.3 细致认真的态度
技术工作中的每一个环节都需要细致认真地核查。为了完成一项技术工作,技术人员需要调查现场、咨询设计单位、了解技术动态、查询技术标准、借鉴同行经验、讨论技术细节,确保不出差错。
2.4 独立审查与验证
独立审查是指不参与技术方案制定的人员对技术方案进行审查,可以由同级、上级人员审查,也可以委托独立的机构进行审查。对于没有成熟经验的技术专题,还需要进行设计验证,在新技术应用前确保其安全性。设计验证包括:设计评审、其他计算方法、将所设计与已证实的类似设计进行比较、鉴定试验等。
2.5 借鉴运行经验
回顾已往教训、借鉴同行经验,可以有效地防止同类事件的重复发生。这种经验包括:对某一专业知识认识上的局限性而导致技术失效;对某一工程实践缺乏经验而导致技术工作走很多弯路;人因导致的技术故障等。及时进行经验反馈、改进工作中的弱项,逐步提高技术技能水平,防止技术失效。这种运行经验可以在安全例会、工前会、日常工作中不断强化。
2.6 质疑的态度
要善于对已有的技术文件、技术方案提出质疑;对于供货商提供的信息、设计单位提供的技术信息提出质疑;对原设计文件、参考文件提出质疑;对于技术人员自行进行的技术工作的细节提出质疑;技术人员之间、上级对下属甚至是下属对上级的技术工作以质疑的态度进行校对、审核。
2.7 保守决策
以技术方案的安全性、可实施性、经济性为优先排序,确保将核安全置于第一位;最大限度地保持纵深防御体系的有效性;确保问题在开展下一步工作之前予以解决;在未确证方案的安全性时,需要考虑安全分析、安全评审或设计验证;防止因时间的压力而在技术准备中考虑不周而出现安全问题;在遇到没有想到的或是不确定的情况时,应该停下工作,将设备或者电厂置于一个已知的安全状态,重新审视技术准备工作。
2.8 “三向”交流
交流包括3个要素:表达、倾听和复述。交流的要求是清晰、简洁、完整、没有双重含义。关键信息尽可能采用面对面交流,以最大程度保证信息的有效传递。复杂、重要的信息除了当面交流外,还需以文字记录。
2.9 工前会议
技术方案付诸实施前,必须召开工前会,对前期技术准备工作进行交底:技术工作的背景介绍、任务的关键步骤、任务执行过程存在的主要风险、防止事件发生的有效屏障、执行任务的各方信息沟通与协调等。工前会议可有效防止技术方案实施过程中可能出现的工业安全事件、人因事件、技术原因导致的问题。
3 火电厂非计划停机统计与分析
至2013年底,江苏电网技术监督网络成员单位共有49家,分属于11个发电集团公司,共147台火力发电机组,其中单机容量最小为135MW,最大为1000 MW。不同量等级机组的非计划停运次数统计如表1所示。近3 a引发机组异常停运原因如图1所示。
表1 不同容量机组非计划停机平均次数统计
3.1 非计划停运的主要原因是设备故障
引起火电机组非计划停运原因包括锅炉设备、金属材料、汽机设备、电气设备、热工设备、检修维护、运行操作。归纳起来同样可以分为设备故障和人因因素两大类。造成机组非计划停运的主要原因是设备故障。
3.2 由人为因素导致非停机次数有所提高
图1 近三年引发机组异常停机原因统计
虽然总停运次数有所下降,但由人因导致的非计划停运次数有所提高。随着大容量、高参数机组的投运和全能值班的广泛推行,运行人员事故处理经验不足、应急能力不够,没有及时果断采取有效措施,将异常影响降到最低,导致非停发生,反映出运行人员的事故处理技术水平和心理素质还需进一步提高。
4 火电行业减少非计划停机的策略
从核电站运行实践看,设备可靠性和人因可靠性管理对降低非计划停运、提高机组的安全运行业绩、获得良好的经济效益起着重要的作用。由于行业法规和标准的差异,核电站的管理技术照搬到火电厂很可能达不到预期效果。火电企业可以将相关的管理理念结合行业自身特点加以借鉴。主要从日常设备管理、大修设备管理和人因管理3个方面来减少或避免机组异常停运,提高机组的可靠性。
4.1 日常设备管理
火电厂的日常设备管理,包括设备状态监测、设备巡视管理、特殊环境下的设备保全管理和设备遗留问题管理等方面。设备的状态监测通过监测设备的相关参数了解设备的健康状态。火电机组现场的设备巡视主要是运行巡视,今后应参照核电增加维修专业巡视、设备管理巡视和管理巡视。火电发电企业也可采用大修前找缺陷、大修中消缺的专项评比竞赛,鼓励员工深入现场,发现设备隐患。特殊环境下的设备保全管理包括电站防高温管理、防抗台风、雷击、暴雨(三防)管理等,防其目的是:在高温天气和台风、雷击、暴雨情况下,通过执行既定的行动导则,使火力发电企业各职能部门分管范围内各项预防行动得到有效实施,保证人员和设备的安全,保证机组稳定运行。
设备缺陷和遗留问题直接影响机组的长期稳定运行,须进行有效跟踪和处理。为了提高设备缺陷和遗留问题管理的效率,应建立设备缺陷报告制度和设备缺陷和遗留问题管理系统,用以规范设备缺陷和遗留问题的确立、跟踪、处理和关闭流程,明确流程所有环节的职责,以及与流程有效运作相关的操作和管理规定。从问题的确立开始直至问题的关闭,给出工作过程的主要步骤及负责人,并在具体实施方面进行明确的规定,同时也为每一步骤规定必要的控制或验证活动。
符合下列条件之一的问题被认定为设备遗留问题并进入系统进行跟踪管理:(1)系统或设备不能按设计要求发挥功能,其整改工作只能等机组大幅度降负荷或停下来后才能进行。(2)消缺工作需要外来专家、特殊技能或规程来执行。(3)对机组可靠性或对正常生产构成威胁,而且需要待根本原因明确后制定处理方案的问题。(4)需要3个月以上的时间进行整改工作准备的问题。(5)设备或系统出现重复性故障而根本原因不明的问题。(6)影响实现火力发电企业目标的悬而未决的不符合项或改造项目。
对于那些不影响机组可靠性和可用率,且对生产成本影响很小的设备问题,以及根本原因明确,能立即消除故障或缺陷的,不列入遗留问题进行跟踪管理。如果设备遗留问题已查找出根本原因并且落实了纠正行动,或明确为人因事件,负责项目的专业工程师提出关闭申请,并经由设备部向生产协调会汇报,得到同意后即可关闭。
4.2 大修设备管理
大修是对设备进行定期维护的关键时期。大部分定期预防性维护工作和预测性维修活动是在大修期间进行的,日常遗留的设备缺陷处理和设备更新改造也是火电厂大修的重要目的。大修期间各类生产活动质量直接影响设备的可靠性,对今后一段时间发电设备的安全可靠运行有决定性作用,因而必须加强大修期间的设备管理,通过大修了解、改进设备的健康状态。
大修设备管理主要包括以下几个方面:大修前的设备状态评估与排查、大修中的设备技术问题管理、关键敏感设备的大修监督,重大技改项目的实施监督,以及机组停机、启动阶段的重要设备运行状态监督等。
4.2.1大修前的设备排查
在每次大修前,各专业工程师对其负责的系统设备的运行状态进行评估,对发生的异常进行原因分析(设备、人因、维修质量等),并制定纠正措施;在大修准备阶段对重要系统设备上的遗留问题进行清理和排查,提出大修期间的纠正行动。除此之外,各专业工程师要在此阶段,将日常设备缺陷和遗留问题系统中的项目、不符合管理中的项目等日常技术问题纳入到大修技术问题管理流程中。
4.2.2大修中的设备技术问题管理
大修期间是设备缺陷暴露的高峰期,也是消除设备缺陷的最佳时期。因此,必须对大修期间出现的技术问题保持最强的分析、处理和跟踪力度,争取在大修中尽可能地消除缺陷和隐患。即便不能彻底解决,也要通过采取缓解措施控制其对安全和生产的影响。
大修技术经理负责协调大修期间设备技术问题的跟踪和处理。在大修中,大修技术经理组织各专业工程师对设备技术问题进行密切跟踪,牵头组织各个专业工程师,对复杂、重要设备上的缺陷进行研究,制定处理方案,并跟踪措施实施情况以及再鉴定情况。
4.2.3机组启停阶段的重要设备监督
火电机组的停运和启动是一个高风险生产时期,也是设备状态改变最复杂的时期。各专业工程师在大修前后的机组停运、启动阶段,对重要设备的性能进行监督,能够了解设备状态,掌握设备性能参数。同时,通过停机期间的状态监督,能够及时发现重要设备上的缺陷和隐患,以便在大修期间采取适当处理措施。
4.3 人因可靠性管理
火电行业在人因可靠性管理方面主要强调严格执行工作票和操作票制度。可学习核电从本质上提高人因可靠性的做法,如提高员工质量意识,加强技术培训,摈弃不良习惯,加强过程风险管理等。
4.3.1提高员工质量意识
加强员工质量成就感,改善员工间的人际关系与交流以及建立员工的公司价值观念等,提高员工的工作积极性与主人翁责任感,从而提高员工质量意识。此外还应加强现场质量管理监督力度,对不符合质量管理要求的工作行为给予坚决的纠正。
4.3.2加强员工技术培训
以请进来、送出去的方式,开展技术培训,开阔专业技术人员的视野,提高设备维护的自主化能力。针对影响停机的锅炉、汽机、电气、热工等关键设备状况,开展事故预想,进而采取针对性的培训,以把影响机组运行的设备风险控制在最小。
4.3.3摈弃不良工作习惯
根据专业特点列出不良工作习惯清单,并有针对性的组织学习。同时明确文明生产管理要求。对历年由于不良工作习惯造成的非停事件,以案例分析的形式写进培训教材,对员工进行培训。对危害性较大的不良工作习惯,采取发“整改通知”的形式,限期整改。
4.3.4加强过程风险管理
根据现场作业所带来的风险,将现场工作分为三大类:第一类是能直接引发停机的活动;第二类是能间接导致或成为停机因素的活动;第三类是没有停机风险的活动。在风险控制中,重点针对第一类的高风险活动,其控制方法主要分成几个要素,一是工作前的风险分析,所有一类工作在工作计划安排阶段就须甄别出来,以作为后面工作风险控制的基础,相应的工作计划与工作票上均注上特殊风险的标志;二是在工作执行时的工作人员行为的控制,工作前召开碰头会,对一类工作在工作时严格实行一人唱票一人操作。三是高风险工作人员的资格授权控制。
5 结束语
对核能行业相关管理技术应用于火电厂以减少机组非计划停机的可行性进行了分析,旨在给火力发电企业打开一扇窗户,了解核电机组在提升机组的安全性、可靠性、经济性,实现可靠性指标持续提升过程中实行的有效的管理技术,为火电厂减少机组非计划停运,改进电厂的综合业绩提供参考。
[1]周 平.仪表控制系统故障和人因失效引发核电站非计划停机停堆事件分析[J].核动力工程,2008,29(5):69-71.
[2]沈荣发.核电厂运行的人因失效分析和预防[D].上海:上海交通大学,2010:56-57.