故障预测与健康管理系统研究与应用现状分析
2024-01-05李思雨程中华刘子昌王沁蓉贾希胜
李思雨,程中华,刘子昌,王沁蓉,贾希胜
(1. 陆军工程大学石家庄校区 装备指挥与管理系,河北 石家庄 050003;2.西北大学 信息科学与技术学院,陕西 西安 710068)
随着传感器技术和检测技术的进步,故障征兆探测手段越来越多,探测的准确度越来越高,探测的时机越来越早[1]。故障预测和健康管理(Prognostics and Health Management,PHM)是传统的机内测试技术、外部自动化测试设备、故障监控和诊断技术的拓展,一个真正的PHM系统应具有状态监测、故障告警、故障诊断、状态评估、寿命预测、维修决策支持和装备大数据管理等功能[2-3]。
现役武器装备更新换代加快,装备的自动化、复杂化、综合化、智能化程度不断提高,其机械结构日趋复杂,功能也更加多样,对装备的使用和维修保障提出了更高的要求。随着装备动用更加频繁,运行环境更加复杂恶劣,发生故障和运行失效的可能性也逐渐增加。一旦装备在运行过程中发生故障,极有可能影响训练开展,甚至造成严重事故。如何及时、准确地对装备进行状态监测、故障诊断和健康状态评估,进而科学有效地制定维修策略,确保装备正常运行,避免严重事故发生,是当前武器装备保障领域亟待解决的现实问题。
维修决策是现代维修理论和决策科学的高度融合,是以维修思想为指导,结合现代决策方法建立起来的理论和方法,核心是研究各种维修策略下的维修目标建模和维修参数优化等决策问题。针对复杂装备的PHM技术研究时,设计和选择合适的维修检测方法,则有可能使维修决策符合更广泛的实际应用情况。装备维修保障作为保持武器装备体系正常运行,确保装备战备完好、效能正常发挥的一项重要工作,如何适应新的战争形态和作战需求,为部队提供适时、适量的精确化保障,显得尤为重要。故障预测与健康管理的定义是通过不同类型的传感器采集到设备运行的数据信息,进行诊断、健康状态评估、预测剩余使用寿命及智能维护,为设备管理人员提供合理化建议,确保设备安全、稳定的运行[4-5]。在军事领域展现出良好的应用前景,已成为PHM建设发展的新引擎。研究PHM系统/技术的军事和经济价值如下:
1)通过预测装备剩余寿命,及时控制装备使用,可以实现以最低的费用保持装备可靠性、安全性[6]。
2)通过智能化决策支持,使维修的计划性增强,装备利用率和战斗力(生产效率)得到有效提升[7]。
3)通过运行PHM系统,可总体、定量、直观掌握装备运行状态,大幅提升装备的信息化管理水平[8]。
1 国内外PHM发展现状
1.1 国外PHM现状分析
伴随微电子技术、集成技术的迅猛发展,大型的机械装备广泛配套了功能齐全的微电子设备,无疑给试验、操作、维修带来了严峻的挑战[14]。针对电子设备的故障诊断、预测、健康管理等问题,欧美技术发达国家在电子设备领域运用PHM取得了很多成就。英国从上世纪90年代开始,进行了深入的研究和探索,研发出了使用和状态管理系统(Health and Usage Management System,HUMS),进行监测关键系统和部件的状态,涵盖悬翼状态平衡、发动机功率衰减、齿轮箱运行和传动系统稳定、分析疲劳情况、提供维修决策等。PHM在国防军工应用广泛外,在航空、商用飞机、车辆、大型机械设备、冶金等民生领域应用也成果丰硕。美国波音公司把PHM技术研发运用到民航客机系统即“飞机状态管理(Aircraft Health Management,AHM)系统”。并成功装备在日本、德国、美联航和韩国等航空公司,如波音777、737空客A330、A340等。运用AHM可以大大提高飞机的安全飞行系数和节省航空公司的25%维护成本,避免仅因维修飞机停飞而造成的维护成本。另一方面,可以快速判别出之前出现过的故障和退化趋势。
PHM概念和应用导致了美海军历史上首次订购单发舰载机。订购前提是PHM系统能够提前一个飞行架次做出故障预警[9-10]。公开数据表明,PHM系统在F-35上的应用效益:维修人员减少20%~40%,保障规模减少50%,出动架次提高25%,保障费用减少50%。美F-35战斗机中PHM系统由三级(零部件、子系统、系统)状态信息采集与处理模块、信息上报模块、维修分析模块、维修规划模块、维修执行模块构成,装备嵌入式功能模块由采集与处理模块和信息上报模块组成,执行飞行任务中运行,装备外部功能模块由维修分析模块、维修规划模块、维修执行模块组成,飞机落地后运行[11-13]。
1.2 国内PHM现状分析
从1950年起,我国开始进行相关PHM研究。工程实践方面,我国在PHM系统实际应用与欧美国家有明显差距,目前科研成果仅能部分转化为实际应用,例如在国防军工集团的可靠性技术咨询、技术攻关、试验评价等方面[15-17]。
天津大学王大全等基于灰色模型和支持向量机对冷水机组进行了故障预测研究[18]。江苏大学的李捷辉团队同样利用灰色模型和蝙蝠算法改进的支持向量机模型对故障分类进行了预测,提高了预测精度[19]。青岛科技大学胡明刚根据醋酸精馏塔的运行状态进行了故障预测研究[20]。哈尔滨工业大学的孟悦等针对转子早期不平衡的故障问题进行预测,先基于传统方法提出了改进的特征融合支持向量机模型,该模型能够预测转子潜在的4种故障状态故障[21]。清华大学航空发动机研究院任祝寅等针对航空发动机燃烧室设计和生产过程中成本高、难度大等问题,提出了基于数字孪生驱动的PHM设计技术[22]。海军装备研究院荆晶团队对PHM技术应用于海军指挥信息系统的健康状态评估和诊断的可行性进行了分析,基于多元状态估计技术以及改进的层次分析法进行系统的健康状态评估[23]。空军工程大学的焦晓璇团队为克服传统PHM开发平台的结构功能复杂的特点,改进了传统基于文本设计系统的思路,提出了基于模型的系统工程观点[24]。陆军工程大学鲁冬林团队针对装甲车辆PHM系统性能评估人为因素干扰较大的问题,运用“AHP-熵值”的组合赋权法确定指标权重系数,采用了模糊综合评判方法[25]。西安电子科技大学的吴冬寒等采用基于故障关联的统计模型和基于SOM神经网络的两种方法对某型雷达进行收发模块的健康状态评估[26]。西北机电工程研究所康总宽等针对某型舰炮PHM系统评价指标不够准确、客观等弊端,明确了评价主体和评价指标运用原则,通过分析操作人员、武器装备、环境对舰炮工作状态的影响,提出了基于MLP的舰炮PHM系统评价体系的构建方法,从而为数据驱动的舰炮PHM系统研究奠定了技术基础[27]。
虽然国内各种PHM系统已逐步开始得到应用,但还远没有达到工程实用化的程度。目前还仅在部分关键的系统和部件中应用,系统集成应用能力很弱;大部分系统的故障预测与健康管理脱节,没有充分发挥PHM系统的优势;并且对大多数系统尤其是电子产品的故障机理了解还不深入,有些还仅仅是故障的检测,还不具备故障预测的能力。此外,如何正确有效地评估系统的健康状态,并做出优化的维修决策等都需要大量的研究工作。
2 PHM系统一般体系结构
PHM系统的主要功能包括装备状态信息感知、获取与处理,故障告警和诊断,健康状态评估与预测,维修决策支持[28-29]。PHM系统的主要用户为使用操作人员(士兵)、设备管理人员(装备指挥员)和企业管理人员(作战指挥员)。PHM系统运行流程和功能层次-整体架构如图1所示。
1)数据获取层:该层主要是利用各种传感器(如:光敏传感器,声敏传感器,气敏传感器,化学传感器,压敏、温敏、流体传感器)来采集并获取数据,通过数据传输系统向上一层进行传输。
2)数据处理层:通过接收数据获取层的数据信息,运用相关预处理方法,经过特征提取,得到所需要的特征参数。
3)状态监测层:把获取的装备数据与预先设定好的失效模式下的故障数据进行比较分析,从而进行状态监测。通过设定的故障阈值及时进行预警、识别故障位置等。
4)健康评估层:把特征参数作为模型输入,分析状态退化趋势,对装备运行状态进行健康状态评估。健康状态等级包括正常状态、健康状态退化、健康状态预警(亚健康)、不健康。
5)寿命预测层:主要是对设备的剩余寿命预测。方法有基于大数据的预测方法和统计模型的方法,根据设备当前的健康状态,做出下一时刻的寿命预测。
6)决策支持层:根据任务需求使用和维修历史、维修资源等因素,以寿命预测层和健康评估层数据作为输入,为相关人员提供维修时机、维修类型、维修级别和维修技术等。
7)决策建议层:设备管理人员根据实时监控整个设备状态来进行设备故障诊断分析、设备剩余寿命预测、制定维修计划,便于企业管理人员实时掌握企业所有设备状态情况、设备停机时间、产品合格率生产成本、运营成本、维修成本、采购成本、财务费用等合理化建议。
3 国内外PHM发展经验和差距分析
3.1 国外PHM系统研发及应用中的经验
军事领域来看,PHM系统及其关键技术已经运用到了航空、航天、船舶和制导武器系统上,经济和军事效益显著[30]。根据美陆军航空与导弹司令部科研报告显示,列装了基于状态维修(Condition-based Maintenance,CBM)设备的航空飞行队,作战飞行的任务完成率能够提升5%,飞行的总时长增加1倍左右,该技术装备列装了大约20%的陆航部队[31]。欧美国家在PHM系统/技术领域的研究走在世界的前列。总结其在研发和应用PHM过程中经验:
1)研发预测能力十分困难且周期长。预测能力在多数情况下是可行的,但并非对所有故障情况都适用。因此要筛选出不能预测的条件,并用其他方法代替[32]。解决方案是把有限的资源集中到能够有效预测并且高效的系统或零部件上,例如:液压系统、动力系统、电子装备等(根据任务需求,可动态调整)。
2)有效地进行故障诊断是实现健康预测的关键。进行健康管理和预测之前,确保能进行良好的诊断。在装备效能衰减,发生故障之前进行诊断和识别,例如通过故障失效模式分析,查找到相关的故障模式和预兆,与此同时把最常发生的故障失效模式和引起停机故障的零件进行严酷度比较,进而筛选出需要预测的高价值的零部件,对于开发预测能力就有了好的基础。
3)PHM技术的实现需要经过装备的全寿命周期实验,技术的成熟和完善过程暴露出了实验时间、经验的不足。实践表明研发出客观、合理、精准的PHM能力,必须以大量的实验数据、经验、时间、人力、物力为支撑。以零部件失效的黑箱模型或是随机原因导致的故障原因为例,更需要上述条件来保障实验成功。从当前的研究来看,实验的软件和硬件条件都滞后于理论研究。
3.2 国内PHM技术差距分析
相较于欧美发达国家,我国发展PHM系统/技术相对较晚,特别是在复杂装备系统的应用方面。起初由人工经验诊断为主,逐渐过渡到状态监测与诊断。期间虽然取得了不少科研成果,但是在与国外有关工程实践、基础理论研究、集成方面有很大差距:
1)复杂系统PHM集成与技术应用方面。技术发达国家进行了很多相关研究和试验,国内目前是效仿国外的PHM技术或者应用,体系设计与理论研究明显落后,PHM系统集成与技术应用的研究相对较少,目前没有很好的工程案例,需要加大此方面的投入。
2)复杂系统健康管理方面。目前国外进行了很多PHM技术维修决策的研究与分析;国内机械设备大部分是以预防性维修为主,基于PHM的维修决策研究和健康管理较少。
3)复杂系统预测与智能维护方面,我国与国外发达国家不相上下,某些领域能达到同行业的先进水平。可是,在PHM技术成熟度与推广上,国外优于国内,特别是在先进传感器的研发和使用方面,我国还是相对落后的。
4 PHM系统的关键技术和方法
在分析国内外PHM发展经验和差距的基础上,从PHM系统的关键技术和方法这几个方面论述未来的发展方向,大致经历了从故障和设备异常状态的被动性维修到主动地预防性维修,再过渡到预测和智能维护管理[33-34]。
4.1 先进的传感器技术
微型化、智能化、无线低功耗的传感器及特种传感器(高加速度量程、特高温环境、在线油液检测等)是PHM技术实现的基础,因为只有正确地采集到设备的数据参数才能够提供维修决策,这就要求传感器能够适应不同的工作环境和强电磁干扰。
当前,研发传感器主要从两方面着手:一是提升和优化性能,主要涵盖了传感器的准确度、稳定性、耐久性等;二是研发微型和智能化传感器,从而便于系统集成。另外,PHM技术广泛运用了微型机电系统,能够在不影响传感器性能情况下,缩小传感器尺寸,从而大大降低功耗(通常情况下能够降到40~500 μW)和无线传输成本。
4.2 嵌入式测试技术
国际电机工程师协会对嵌入式系统的定义明确了嵌入式系统是包括软件和硬件两个模块。核心是应用,基础是先进的计算机技术,软硬件可删减,从而适用于不同种类的计算机。
嵌入式测试包括功能测试和性能测试。通常由嵌入式微处理器、硬件、嵌入式操作系统和应用程序四部分组成。可以对装备运行状态实时监测、管理,一旦发现故障,能够及时进行诊断、隔离。
4.3 数据传输技术
运用不同类型的传感器,数据获取层采集到设备的数据信息以有线和无线两种模式传输到PHM系统其他单元。
有线传输技术应用的比较成熟,通过有线数据总线和网络进行传输数据。国际上已经建立了通讯标准和网络协议,例如TCP/IP协议。蓝牙、WIFI和移动蜂窝等技术促进了无线传输方式在PHM系统中数据传输,无线传输系统由多个分布式的传感器组成,经无线调制解调器完成数据传输。
4.4 数据挖掘与信息融合技术
PHM系统采集到原始信号后,需要经过一定的数据处理。数据挖掘就是从原始的数据信息中获取到有用的信息过程。进行数据挖掘的信息来源是数据获取层中传感器采集的信息,处理过程中通过不同的算法和模型拆分原始信息,并能够被计算机所识别。数据挖掘算法包括决策树、聚类和朴素贝叶斯等。
信息融合是把多个信息来源采集到的数据综合分析研究,按照重要程度进行持续的评估和处理。信息融合技术作用是最大可能把有用的信息通过高效算法融合,在PHM系统中应用,进而得到准确的结果。融合算法主要有随机滤波融合、贝叶斯融合、人工智能网络等。
4.5 健康评估与寿命预测方法
健康评估和剩余寿命预测是PHM系统的关键环节,设备经过长时间工作后,性能状态逐步退化,从健康状态直到故障出现[35-36]。健康评估和剩余寿命预测通常会根据设备工作的实际情况,运用一种或多种方法来分析、判断故障点(阈值)。健康评估是指设备当前运行状态偏离正常工作状态的程度。在进行评估时需要参照状态参数、设备结构特点、历史维修记录,针对已发生或即将发生的故障进行诊断、研究,根据故障模式和失效机理,提供维修决策。所以越早获取监测数据,对健康评估越有利,早发现,早预防[37-38]。
剩余寿命(Remaining Useful Life,RUL)预测方法大体分为三类:一是基于物理模型的预测;二是基于数据驱动模型的预测;三是基于混合模型的预测方法。从设备寿命预测的实际出发,当前主流的方法是基于数据驱动模型的预测方法。
4.5.1 基于物理模型的预测方法
基于物理模型的预测方法,从故障机理分析研究故障的发展变化,结合机械设备故障失效模式、维修专业领域知识,构建能够反映出设备性能退化规律的数学模型,借助专业仪器设备,通过测量得到模型参数,进而预测未来退化趋势。该方法适用于零部件级的失效和剩余使用寿命预测。例如部件的裂纹、疲劳、磨损等与载荷、应力有关的函数。构建物理模型需要深入了解故障和失效机理,全面考虑部件受到的物理、化学过程,导致建模过程比较困难,不适用于系统级的设备。
4.5.2 基于数据驱动模型的预测方法
基于数据驱动模型的预测方法仅需要通过传感器获取数据,再把数据转换为设备性能退化模型。不需要关注物理失效故障模式,通用性好。数据驱动模型分为两种:一是基于统计数据的驱动方法;另一种是基于机器学习的方法。统计数据驱动方法包括随机滤波、相似性模型和随机过程模型。
4.5.3 基于混合模型的预测方法
机械设备结构越来越复杂化和精密化,目前单一的预测方法不能很好地预测结果,所以可以结合专业知识、成功案例经验,对各种预测方法进行融合研究,从而科学、准确、客观地预测结果,称之为基于混合模型的预测方法。基于数据驱动模型和物理模型融合,能够获得较好的预测精度。此外还可以把多种预测方法得到的结果进行融合。基于混合模型的剩余寿命预测方法能够利用不同预测方法的优势,有很好的发展前景[39]。由于涉及到多方法或者模型的融合,导致计算量过大或者建模困难,在实际应用中并不多。
4.6 智能推理与决策支持技术
智能推理与决策支持技术可以实现维修决策智能生成、维修资源优化配置和各维修要素的协同管理等。视情维修的发展,一方面可以最大限度发挥设备的使用寿命,另一方面能够预防偶发故障,节约成本,提高效率。视情维修的模型有时间延迟模型、冲击模型、比例危险模型和马尔可夫决策模型等。时间延迟模型主要把设备的运行寿命划分为故障产生时期和故障发生时期。冲击模型主要是针对因偶发情况而导致的设备随机损伤的状态。比例危险模型是根据故障的严酷程度,产生的故障严酷度占比的模型。马尔可夫决策模型是基于视情维修时间是离散的,状态信息与剩余寿命的关系分布可以考虑马尔可夫决策过程。智能推理与决策支持技术有专家系统、仿真技术、虚拟现实技术和分布式交互技术等[40]。
5 结束语
现有的PHM研究大都侧重于单一失效模式下的评估和预测,忽略了复杂设备的失效多是由于多种失效模型综合作用引起的情形。传统机器学习模型的健康管理和故障预测技术,需要依靠大量信号处理技术与专家经验手动提取出特征信息。大数据时代下,海量的复杂工程设备的监测数据无疑给这一工作带来了挑战。基于人工智能算法支撑的PHM成为主要发展方向。随着超级计算机的研发和5G网络快速发展,人工智能算法的不断优化,在鲁棒性、可解释性、准确度和速度上大幅提升,能实现在庞大的数据库中找到所需要的数据信息,让PHM实现真正的智能化。