基于PCA-BP神经网络的设备润滑状态评价应用
2020-01-01崔策贺石中李秋秋康鑫硕
崔策,贺石中,李秋秋,康鑫硕
(广州机械科学研究院有限公司设备润滑与检测研究所, 广东 广州 510700)
0 引言
油液监测技术是通过润滑剂的性能变化、污染状况及油中携带的磨损颗粒等信息,并结合工程师对现场工况的了解,综合评价设备运行状态的监测技术[1]。该技术不仅对潜在故障、避免灾难性损坏导致的设备停机停产状况的预报具有及时性,同时减少了设备不必要的维修时间,增加隐性产值和效益[2]。神经网络在数据分类及回归等方面已有广泛应用,其特点主要包括;①充分逼近并求解复杂的非线性问题;②自适应特征提取及学习能力;③具有一定容错性和鲁棒性;④适用于处理多维数学问题。
本文首先通过主成分分析进行数据降维,后将降维后的数据集训练BP神经网络,在关联专家知识后,结合模糊综合评价理论,对数据集进行分类,建立PCA-BP神经网络分类模型。结果表明,基于PCA-BP神经网络的油液监测评价模型的准确率较高,相比人工识别分类,消除了数据模糊性,且效率明显提升。
1 主成分分析
素等共12个项目,其中黏度是表征润滑剂的油膜强度的主要指标;水分、元素Si及Al通常来源于外部污染;酸值主要表征润滑油的氧化程度及添加剂消耗程度;添加剂元素Ca、Zn及P是油中极压抗磨添加剂的主要成分,如烷基水杨酸钙、 二烷基二硫代磷酸锌(ZDDP)等;金属元素Fe、Cu、Cr、Sn主要来源于系统中的摩擦副材料,如齿轮、轴承材料及液压系统中的镀层等。
表1 测试样本集
润滑状态评价集合是检测数据集及专家知识的综合内容,其内容主要依据诊断人员的专家经验,监测数据的状态,部分项目的评价指标参考石化行业标准SH/T 0467,如40 ℃运动黏度值的变化率超出10%时,说明油质明显氧化变质,需要换油;水分超过0.1%则可能引起油品乳化等,表2列举了评价结论集U={u1、u2、u3、u4}及其特征矢量。
表2 评价集及特征矢量
图1是协方差矩阵的特征值累计曲线,为了消除指标之间的量纲影响,本文先对原数据进行归一化处理,不仅能加快梯度下降求最优解的速度,同时也降低了奇异样本对误差梯度无法收敛的影响[4]。由图1可知,前8个成分的累计特征值贡献率达到90%,因此本文选取8个特征作为原数据的主成分,图2列举了部分主成分特征向量。
图1 主成分特征值累计贡献率
图2 累计贡献率90%的主成分矩阵
2 BP神经网络识别分类结果
BP神经网络是一种多层前馈神经网络,其主要过程包括数据前向传播及误差反向传播,是目前应用最广泛的神经网络之一[5-6]。
图3 神经元模型
图4 最佳迭代次数及均方误差
由图4可知,在误差梯度迭代至316次时,训练误差已然达到目标误差,此时为防止过拟合,网络停止训练,模型已达到最优。ROC曲线是一种常见的分类器模型评估方法,其原理是将单一样本类别分类看成二分类问题,即对于类别yj,xm本属于该类别即为正样本,若不属于即为负样本。图5表示ROC曲线图中4个顶点分别表示的含义。
图5 ROC曲线中坐标顶点的含义
对于优质模型,单一类别的ROC曲线应尽量靠近(0,1)点,ROC曲线常用于解决由于样本不均衡导致训练模型对单一类别敏感的评价问题。
对比图4结果发现,采用PCA-BP的各类别ROC曲线ROC值较BP平均ROC值更高,说明模型对分类样本集合的识别率更高,表明模型更优,见图6。
图6 BP及PCA-BP模型ROC曲线
3 结论
本文采用BP神经网络建立油液监测评价模型,并首先对样本集合进行PCA降维,选取成分贡献率90%的8个维度训练神经网络,并通过ROC曲线分别评价了4分类的模型识别率,通过对比发现,相比未降维样本训练的BP神经网络,采用PCA-BP神经网络的识别结果较高,且能够在一定程度消除人为评估的模糊性及主观性。由于样本数据较少,且维数较多,因此采用主成分分析对数据集进行降维,减少了训练集中存在相关冗余的属性,提升了神经网络的计算效率。考虑数据集合的评价内容可扩展性,后期也可通过扩充样本数量或串联其他机器学习算法进一步增加模型的鲁棒性。