脉冲电磁阀的集成分类器故障诊断方法
2024-04-12叶志勇
王 敏, 王 涛, 叶志勇
(1.北京理工大学 自动化学院, 北京 100081; 2.上海袋式除尘配件有限公司, 上海 200241)
引言
脉冲电磁阀作为气动系统和电液控制设备中的关键部件,被广泛应用于脉冲袋式除尘器清灰工作[1-2],其正常工作与否关系着系统的性能及效率。为了确保系统的正常高效工作,减少生产损失,开发一种脉冲电磁阀的智能检测和故障诊断技术急为迫切。随着计算机和人工智能技术的迅猛发展,基于信号和数据分析的非拆卸式电磁阀故障诊断方法已成为主流, 相关学者利用多特征融合的方法进行电磁阀故障模式识别[3],利用卷积神经网络对开关电磁阀进行故障诊断[4],利用遗传算法优化的MKSVM进行电磁阀故障诊断[5], 这些方法都取得了不错的诊断效果, 但是对故障诊断的类别有所限制,且参数的设置需要丰富的经验,限制了这些方法的推广与迁移。
为满足脉冲电磁阀智能故障诊断的需求,本研究以脉冲电磁阀作为故障诊断的研究对象,对脉冲电磁阀的常见故障进行分析与模拟后,利用接近开关检测作为脉冲阀关键部件的大膜片组件打开反应时间与打开状态保持时间作为其故障特征,分别建立单分类器模型和集成分类器模型对故障进行诊断,目的是为了快速检测并解决脉冲电磁阀的故障,解决人工诊断可信度及效率较低的问题,有效抑制停产事故的发生。
1 脉冲电磁阀及实验装置介绍
脉冲电磁阀是指由电磁或气动先导阀控制的隔膜阀,能瞬间开启或关闭高压气源,产生脉冲。主要构成部分为电磁线圈、接线盒、小气室、大气室、进气口,其实物结构图如图1所示。
图1 脉冲电磁阀实物结构图
为了提取正常和不同状态的脉冲电磁阀特征,模拟了不同喷吹条件,大膜片组件动作如表1所示。
表1 不同喷吹性能下大膜片组件动作Tab.1 Large diaphragm assembly action with different blowing performance
脉冲电磁阀的常见的故障类型有无大弹簧、无小弹簧、大膜片破损、小膜片破损、动铁芯长时间不复位造成漏气等,从表1中可知,这些故障引起的脉冲电磁阀的喷吹性能变化都与大膜片的动作紧紧相连,为了更好的监测大膜片组件运行状态,进而实现对不同故障的诊断,本研究选用电感式传感器进行监测。接近开关(电感式传感器)检测大膜片组件的原理是:当大膜片组件正常闭合时,大膜片组件到接近开关的距离会大于接近开关所检测到的范围,即大膜片组件的位置不在电气开关触点的检测范围内,此时接近开关无信号;反之则接近开关有信号。接近开关平齐式安装在脉冲电磁阀的大阀盖处,安装实物图如图2所示。
图2 接近开关在脉冲电磁阀上的安装图
通过设置不同的气包压力,在脉冲宽度为 100 ms,采样频率为1000 Hz的条件下检测控制信号和接近开关信号,接近开关检测的大膜片组件运动状态信号如图3所示,将接近开关信号滞后控制信号的时间作为大膜片打开的反应时间,即t1~t2的变化时间,将接近开关信号保持时间作为大膜片打开状态保持的时间,即t2~t3的变化时间。实验装置图如图4所示。
图3 大膜片组件运动状态信号图
图4 实验装置图
2 脉冲电磁阀故障及特征选取
为了测试不同故障情形下接近开关信号的大膜片组件打开反应时间及状态保持时间, 本研究通过撤去大小弹簧、大/小膜片上冲一定数量的小孔和增长脉冲宽度至200 ms等方式模拟大小弹簧失效、大/小膜片不同程度破损和动铁芯长时间不复位等故障,测试项目及模拟的故障类型如表2所示。
表2 测试项目及模拟的故障类型统计表Tab.2 Statistical table of test items and types of faults simulated
选取实验中某一组数据并将利用接近开关测得的不同气包压力p下大膜片组件的打开反应时间和状态保持时间的测试结果进行特征提取,如图5所示。
图5 脉冲电磁阀的正常状态与不同故障情况对比结果
为了进一步了解正常状态与不同故障特征分布,将滞后时间和保持时间归一化以散点形式展示在图6中。
图6 脉冲电磁阀的正常状态与不同故障情况特征散点图
从图5和图6中可以看出,无大膜片和无小膜片时,与正常状态相比,保持时间都有较大区别,较好区分。大/小膜片小范围破损时,反应时间比正常状态下相比稍长,保持时间比正常状态下较短。大/小膜片大范围破损时,反应时间明显长于正常状态下的反应时间,保持时间短于正常状态下的保持时间。正常状态与不同故障的滞后时间和保持时间在二维散点图中可以看出具有一定的差异性,其中膜片微破损和大破损差距较小,有部分重合,正常状态和无小弹簧较易区分。
3 Bagging-DT分类器模型
机器学习是现阶段人工智能领域发展最为迅猛的学科之一,利用机器学习的超强学习能力进行故障诊断,极大的丰富了故障诊断体系。机器学习处理分类故障问题主要分为两个步骤,第一步是进行“学习步”,即对训练集进行归纳分析,寻找合适的分类器,建立分类模型得到分类规则;第二步是“分类步”,即使用测试集检测分类规则的准确度,如果精度是可接受的,则用训练的模型预测带有未知类别标签待测集[6]。
本研究重点研究的分类器模型为Bagging-DT分类器,其是以决策树作为基分类器。决策树是一种倒置的树形结构,由根节点、内部节点和叶节点组成,决策树进行分类分为两个步骤,第一步是利用训练集从DT的顶部根节点开始,从上到下依次进行判断,生成一棵具有较强泛化能力,能够处理未知样本的树;第二步是利用形成的决策树对分类样本集进行分类[6-7]。
Bagging-DT模型在决策树为基分类器的基础上,采用套袋法(Bagging)进行集成[8-9]。套袋法的原理是通过自助法抽样有放回的从原始训练集中得到样本集,用这些样本集分别对多个基分类器进行训练,最后通过基分类器的组合策略得到最终的集成分类器。在分类问题中,Bagging通常使用投票法,按照少数服从多数或票数过半的原则来投票确定最终类别[10-11]。
Bagging-DT模型通过自助法抽样有放回的从原始训练集中得到样本集,然后用这些样本集分别对多个决策树分类器进行训练,最后通过决策树分类器的组合策略得到最终的集成分类器,所以具有很强的泛化能力。本次Bagging-DT集成方法流程图如图7所示。
图7 Bagging-DT集成方法流程图
网格搜索法[12-13]优化步骤如下:首先,需要选定并设置优化超参数的范围,然后实例化模型,遍历不同的超参数组合来训练。每个组合对应一个模型,并将平均得分最高的超参数组合作为最佳的选择, 返回模型对象。本研究模型的超参数如表3所示。
表3 Bagging集成分类器的参数及属性Tab.3 Parameters and properties of bagging integrated classifier
在选择基估计器为决策树的基础上,设置n_estimators的范围为[5,10,20,50],max_samples为[5,10,15,20],bootstrap 为[True, False],n_jobs=-1,进行网格搜索,最终选择的参数为base_estimator=dt,n_estimators=5,max_samples=10,bootstrap=True。
为了进一步验证所选分类器进行脉冲电磁阀故障诊断的有效性及准确性,分别测试了单分类模型包括决策树(DT)、K-近邻算法(KNN)和支持向量机(SVM),以及在此基础上利用集成策略中Bagging及Boosting方法的思想构建基于单分类器的集成模型。实验的流程图如图8所示。
图8 实验流程图
4 脉冲电磁阀智能故障诊断实验方法研究与分析
为了验证Bagging-DT分类器模型的优越性,选取实验压力为0.05~0.6 MPa,每间隔0.05 MPa测试一次的接近开关的测试数据,进行多次测量,共535组样本构成故障数据集。对脉冲电磁阀的2个故障特征值进行标准化处理后,随机抽取其中435组样本作为训练集,100组数据为测试集。将每种故障类型的特征值所构成的训练集输入到加权Bagging-DT分类器中,利用训练集对模型进行训练,同时运用网格搜索法自动寻找最佳参数,提升分类器的泛化能力,最后利用测试集样本对训练好的模型进行测试。
为了更好的评判该分类器的优劣程度,与决策树(DT)、K-近邻算法(KNN)和支持向量机(SVM)等3种单分类器以及Boosting-DT,Bagging-DT,Bagging-KNN和Bagging-SVM等3种集成分类器对脉冲电磁阀进行智能故障诊断的结果进行比较,采用分类模型的评估指标精确率、召回率、F1值进行综合性能评价[14]。
对于每个类别标签,分别计算精确率,再取算术平均值,即:
对于每个类别标签,分别计算召回率,再取算术平均值,即:
对于每个类别标签,分别计算 F1值,再取算术平均值,即:
上述7个分类器的综合性能评价指标对比如图9所示,时间指标对比如图10所示。
图9 各诊断模型综合性能对比
图10 各诊断模型运行时间对比
从图9和图10中可以看出,Bagging-DT分类器的精确率、召回率、F1值及整体性能均好于其他单分类器和集成分类器,从而验证Bagging-DT的分类器模型诊断脉冲电磁阀故障的优越性与适用性,在运行时间上,Bagging-DT分类器也优于其他集成分类器。
基于Bagging-DT的集成分类器的实际故障类型和预测故障类型分布如图11所示。
图11 Bagging-DT模型故障诊断结果
混淆矩阵[15],又称为可能性表格或是错误矩阵,是一种特定的矩阵用来呈现算法性能的可视化效果。
混淆矩阵中,行表示样本的真实值,列表示算法预测样本的预测值。Bagging-DT模型故障诊断混淆矩阵如图12所示,可以看出,正常和无大弹簧、无小弹簧诊断结果较为准确,膜片微破损和大破损诊断大部分准确,存在部分诊断错误情况。
图12 Bagging-DT模型故障诊断混淆矩阵
正常状态和故障时的预测准确度如表4所示,可以看出,Bagging-DT分类器对正常状况和无大膜片、无小膜片时的诊断精度较高,大/小膜片存在小范围破损和大范围破损两者的诊断精度相对较低,容易相互误判,这一问题的主要原因是大/小膜片存在破损的程度是较难界定的,粗化时没有具体考虑真实的界定情况,从图6中也能看出二者差异较小且有部分重叠。考虑到这一问题,可以考虑将诊断为这两种结果的故障再次分类,适当将模型参数进行修改以适应二分类问题,提升诊断精度。针对大/小膜片存在小范围破损和大范围破损两者的再分类诊断结果如图13所示。
表4 Bagging-DT模型诊断准确度表Tab.4 Accuracy table for Bagging-DT model diagnosis
图13 Bagging-DT模型针对低精度部分二次诊断结果
从图13能看出,二次诊断后,大/小膜片存在小范围破损和大范围的诊断精度有所提升。
5 实验结果分析
本研究对脉冲电磁阀的智能故障诊断方法进行研究。首先,根据电磁阀的故障特性,进行故障模拟并采用接近开关测试大膜片组件的运行状况,提取主阀芯的反应时间和保持时间两个特征进行故障诊断。其次,在研究模型选择方面,选择了基于决策树的Bagging-DT模型并进行了网格搜索以确定模型超参数,并将该模型与其他3种单分类器和4种集成分类器模型的分类结果进行精确率、召回率、F1值比较,实验结果验证表明,以DT作为基分类器的基于Bagging集成方法构建的Bagging-DT模型各项评价指标皆优于其他模型,且准确率达到86%,运行时间0.86 s,实现了对脉冲电磁阀5种及以上故障更加准确快速的预测与判断。
由于大/小膜片小范围和较大范围破损时,反应时间皆略高于正常情况下的反应时间,保持时间皆低于正常情况下的保持时间,且大或小范围破损的界定不是特别准确,导致了两者的相互误判,这也是本研究以后研究的重点。
6 结论
本研究的研究将机器学习与脉冲电磁阀的多种故障相结合,使用智能识别算法完成脉冲电磁阀工作情况下的故障原因的自动诊断,具有故障快速诊断的特点。由于本实验Bagging-DT参数设置较为简单,且添加了网格搜索算法,能根据数据的变化自动对模型进行调整,解决了模型自适应问题。故本研究提出的智能算法能对脉冲电磁阀的故障进行快速准确的诊断,具有重要的实际意义。