APP下载

基于张量Tucker分解的发动机故障诊断

2018-05-03许小伟严运兵

中国机械工程 2018年5期
关键词:三阶张量曲轴

许小伟 沈 琪 严运兵 吴 强 张 楠

1.武汉科技大学汽车与交通工程学院,武汉, 430081 2.纯电动汽车动力系统设计与测试湖北省重点实验室,襄阳,441053

0 引言

在传统的发动机故障诊断与预测中,监测的信号往往表现为时域或频域上的一维信号,影响因素只有时间或频率,而实际上发动机故障影响因素较多。复杂的高维数据在数据特征提取过程中,常利用波形分析法提取波动率变化最大值、波动率做功峰值、工倍频发火能量比等参数,或者采用小波包重构与分解提取信号的能量特征值,并作为特征参数,以向量的模式作为模型的输入[1]。这样处理解决了高维数据的模型输入问题,但会导致原始数据之间的自然结构信息丢失,多种模态特征之间的时序关联共生性遭到破坏,产生的误差也可能导致原始数据最有用的信息丢失,从而对后续的故障诊断造成影响[2]。

实际上发动机各个信号之间并不是相互独立的,众多信号相互干扰较大且带有强烈的非线性和复杂耦合的特征。众多信号源在数据分析中可以被表示成多维数组,即张量(tensor)。张量作为高维数据最自然的表示方式,不仅能够最大程度保持数据的内在结构特性,而且在实际问题中表示事物时更能接近事物的本质属性,这样得到的模型也能更加准确[3]。张量Tucker分解是高阶的主成分分析方法,能够挖掘出张量的潜在结构,分解得到的核心张量以低维子空间的形式存储原始张量,去除冗余信息后可以更为准确地表达原始张量。张量及张量分解理论目前被广泛应用于数据压缩、模式识别、图像处理等领域[4-6],而张量分解应用于发动机故障诊断还鲜见报道。

本文提出一种在张量空间构建发动机状态样本的方法,并基于张量Tucker分解和交替投影的思想,设计了一种高阶奇异值分解[7](high order singular value decomposition,HOSVD)和高阶正交迭代[8](high-order orthogonal iteration,HOOI)的联立分解算法,对构建的张量型样本进行低阶近似处理,得到发动机监测信号的数据特征;然后利用分类器进行训练和测试,对发动机单缸失火和轴系不对中进行故障诊断,证实了该张量构建方法和分解算法的有效性。

1 张量理论基础

1.1 张量基本概念及记号

定义1 张量与张量空间。对于向量空间V(1),V(2),…,V(N),定义外积(或称张量积,记作⊗)空间V(1)⊗V(2)⊗…⊗V(N)为包含所有v(1)⊗v(2)⊗…⊗v(N)的线性组合的向量空间∑kv(1)⊗v(2)⊗…⊗v(N),其中,v(1),v(2),…,v(N)分别为V(1),V(2),…,V(N)中的元素。其中外积⊗应满足多线性,即

(1)

(2)

……

(3)

因此定义此空间中的元素X∈V(1)⊗V(2)⊗…⊗V(N)为N阶张量。

定义2 张量的阶。张量的阶定义为形成所属张量空间的向量空间的个数。从代数角度看,张量是向量在高维空间的拓展,零阶张量为数量x,一阶张量为向量X=(xi),二阶张量为矩阵X=[xij],三阶张量即是由若干个同维矩阵叠放在一起,形成的一个立方体式的数组X=[xijk],更高阶的张量则无法可视化描述。张量的每一阶可以看作是一个影响因子,N阶张量的每一个元素都可以看成是N个影响因子相互作用的结果。

定义3 张量的纤维。张量的纤维定义为只保留张量的一个下标可变,而固定其他所有下标得到的一路阵列。一个三阶张量三个方向的纤维分别为模-1纤维(列纤维)X:jκ、模-2纤维(行纤维)Xi:κ、模-3纤维(管纤维)Xij:。

定义4 张量的切片。张量的切片定义为保留张量的两个下标可变而固定一个下标得到的一系列矩阵。一个三阶张量三个方向的切片分别为水平切片Xi::、侧身切片X:j:和正面切片X::k,正面切片又简记为Xk[3,9]。

1.2 张量运算

定义5 张量的范数。张量范数的定义与矩阵范数的定义相似,定义为把张量空间映射到实数域的一个函数,一个N阶张量X∈RI1×I2×…×IN的范数为

(4)

定义6 张量的矩阵化。张量的矩阵化是将张量中的元素重新排列,得到一个矩阵的过程。对于一个N阶张量X∈RI1×I2×…×IN,它的模-n矩阵化即重新组织张量的模-n纤维成为一个矩阵中的行或列,表示为X(n),张量中的元素xij…k被映射成为矩阵中的元素xij。

定义7 张量的Tucker分解。N阶张量X∈RI1×I2×…×IN可以近似表示成一个核心张量G∈Rg1×g2×…×gN沿每一阶乘上一个矩阵:

X≈G×1A×2A×…×NA=

(5)

其中,1Ak1∈RI1×n1,2Ak2∈RI2×n2,…,NAkN∈RIN×nN被称为因子矩阵,它们通常是正交的。在向量空间内,通常使用矩阵分解的方法来将复杂问题转换成更易处理的问题,例如矩阵的满秩分解、正交三角分解、奇异值分解等。在张量空间,同样可以利用张量Tucker分解的方法,将高维问题转换成低维问题[10-11]。

2 张量构建与分解算法

2.1 张量型发动机状态样本构建方法

在张量空间里构建发动机的状态样本,其中的每一阶可以看作是一个对发动机的状态进行影响的因子,张量里的每一个元素可以看作是各个影响因子相互作用的结果。

本文构建的发动机状态样本为三阶张量X∈RI×J×K,第一阶表示的影响因子为信号类别,例如各个部件受到的转矩大小、进气流量、进气压力、排气温度、冷却水温、喷油提前角等;第二阶表示的影响因子为曲轴转角,即样本信号随曲轴转角的变化;第三阶表示的影响因子为转速,即在不同的转速下样本信号的变化。即完成了一个“信号类别×曲轴转角×转速”的三阶张量型的发动机状态样本的构建,结构如图1所示。所构建的三阶张量型发动机状态样本中的每一个元素xijk(其中,i∈I,j∈J,k∈K)代表了在第k个转速下、第i度曲轴转角下的第j种信号参数值。

图1 三阶张量型发动机状态样本结构图Fig.1 Structure of the engine state sample of thethree order tensor

2.2 张量Tucker分解算法

基于张量模式的分解算法能够实现对高维张量数据的有效逼近,高阶张量的Tucker分解可以看作是矩阵的奇异值分解以及主成分分析在高阶上的推广。在张量Tucker分解中,其本质是用一个核张量和若干正交的投影矩阵的积去近似原始张量,核心张量保留了原张量最主要的信息,在每一阶上都比原张量小。以构建的三阶张量X∈RI×J×K为例,张量Tucker分解可通过求解‖X-G×U1×U2×U2‖的最小值得到最优解[12]。由张量Tucker分解公式和张量范数性质,可将该最小值问题等价为最大值问题:

(6)

将Tucker分解写成矩阵的形式,即

(7)

其中,因子矩阵U1、U2、U3分别为X(1)、X(2)、X(3)的前L、M、N个左奇异向量构成的矩阵。

如果分别对每个发动机状态样本进行张量Tucker分解,则各个样本分解后所得到的投影因子均不相同,即投影之后的核心张量属于不同的表征空间,这样导致后续的分类过程无法进行。因此,为了使投影后的核心张量属于同一表征空间,需要寻找一组相同的投影因子。HOSVD算法和HOOI算法是两种常用的张量Tucker分解算法,HOSVD的基本思想是利用矩阵分析中的奇异值分解算法对张量中的每一个切片进行一次分解,采用低阶近似处理,过滤掉某些较小的奇异值;HOOI的基本思想是使用交替投影的方法多次迭代求得最优结果。HOSVD的结果不能保证得到一个较好的近似值,但可以作为HOOI的一个很好的初始解[13],故可使用HOSVD张量Tucker分解算法对每个样本进行一次求解计算,其结果作为HOOI张量Tucker分解算法的输入,再使用HOOI算法完成分解。图2展示了张量分解算法流程。

2.3 发动机故障诊断流程

由于信号类别量纲的不同,需要先对每一个类别的信号数据进行归一化处理,然后构建张量型样本,接下来使用HOSVD-HOOI张量Tucker分解算法得到核心张量,核心张量在每一阶上的尺寸均小于原始张量的尺寸,最后对每个核心张量进行向量化,得到分类器的输入。随机选取部分样本作为训练集,分别采用网格参数优化法[14]、遗传算法[15]、粒子群算法[16]对分类模型中的参数进行优化。训练完毕后,将剩余样本作为测试集,对故障进行预测。基于张量Tucker分解的发动机数据特征提取及诊断流程如图3所示。

3 实验与分析

3.1 训练与测试样本

图4所示为康明斯4B3.9-G2型发动机在转速为1500 r/min时正常工作、单缸失火故障、轴系不对中故障三种状态下的实验样本数据,分别描述了曲轴端转矩、飞轮惯性力矩、曲柄销处的连杆力、连杆轴向力四种参数随曲轴转角的变化关系,故构建的三阶发动机状态样本第一阶大小为4维。实验中,将曲轴转角设置为一个周期内的 0°~720°,作为仿真时长,采样间隔为1°,故构建的三阶发动机状态样本第二阶大小为720维;转速设置为1500~3000 r/min,采样间隔为50 r/min,故第三阶大小为31维。即构建的张量样本X∈R4×720×31,每一个张量样本中有4×720×31个数据。总共仿真48×31次,得到48个样本。

图2 HOSVD-HOOI张量Tucker分解算法流程Fig.2 Algorithm flow of the HOSVD-HOOI tensor Tucker decomposition

图3 诊断流程图Fig.3 Flow chart of diagnosis

(a)正常工作时曲轴端转矩(b) 单缸失火时曲轴端转矩

(c)轴系不对中时曲轴端转矩(d)正常工作时飞轮惯性力矩

(e)单缸失火时飞轮惯性力矩(f)轴系不对中时飞轮惯性力矩

(g)正常工作时曲柄销连杆力(h)单缸失火时曲柄销连杆力

(i)轴系不对中时曲柄销连杆力(j)正常工作时连杆轴向力

(k)单缸失火时连杆轴向力(l)轴系不对中时连杆轴向力图4 实验样本数据Fig.4 Experimental sample data

将4×31×48个长度为720的向量形式的实验数据加载至MATLAB中,接下来取某一个转速下得到的四个信号数据,将曲轴端转矩、飞轮惯性力矩、曲柄销处的连杆力和连杆轴向力依次存储为第一至第四行,得到一个大小为4×720的矩阵。按照此方法,将每一个转速下得到的信号数据存储为矩阵,最终得到31个大小为4×720的矩阵。由定义4可知该矩阵即为张量的正面切片X::k。将正面切片矩阵归一化处理后,接下来创建大小为4×720×31的单位张量,并将31个大小为4×720的矩阵依次赋值给该单位张量的正面切片,从而完成一个三阶张量型发动机状态样本的构建。按照此方法完成48个张量型发动机状态样本的构建,随机选取24个样本作为训练集,剩余24个样本作为测试集,用于后续的算法验证。

3.2 实验结果分析

为验证张量型发动机状态样本构建方法和HOSVD-HOOI张量Tucker分解算法的有效性,实验首先使用张量Tucker分解算法进行数据特征提取,并分别采用网格参数优化法、遗传算法、粒子群算法对分类模型中的参数进行寻优,得到三种优化算法下的预测准确率和分类模型学习时间;接下来不使用Tucker分解算法,直接将向量型样本数据输入分类器,同时也采用上述三种参数寻优法对分类模型中的参数进行寻优,得到三种优化算法下的预测准确率和分类模型学习时间。

将发动机正常工作、单缸失火、轴系不对中三种状态分别用类别标签0、1、2表示,图5给出了采用张量Tucker分解进行特征提取,并使用遗传算法对分类模型中的参数进行寻优时得到的分类结果:正常工作状态8个样本全部正确分类;单缸失火故障有7个样本被正确分类,1个样本被误分为轴系不对中故障;轴系不对中故障有7个样本被正确分类,1个样本被误分为单缸失火故障。24个测试样本正确分类22个,预测准确率为91.67%。图6给出了未进行张量Tucker分解提取特征,使用遗传算法对分类模型中的参数进行寻优时得到分类结果:正常工作状态8个样本全部正确分类;单缸失火故障有7个样本被正确分类,1个样本被误分为轴系不对中故障;轴系不对中故障有6个样本被正确分类,2个样本被误分为单缸失火故障。24个测试样本正确分类21个,预测准确率为87.50%。

图5 张量Tucker分解后的分类结果Fig.5 Classification results after tensor Tucker decomposition

图6 未进行张量Tucker分解后的分类结果Fig.6 Classification resultswithout tensor Tucker decomposition

将6次实验结果绘制成表1,由表1可以看出,所有实验结果的预测准确率均达到了80%以上,满足工程应用的需求。对比三种参数优化算法,使用张量Tucker分解算法进行数据特征提取后,网格寻优法得到的分类准确率最高,粒子群算法次之,遗传算法最低;未进行特征提取、直接将向量型样本数据输入分类器后,网格寻优法得到的分类准确率最高,遗传算法次之,粒子群算法最低。无论是否进行特征提取,使用遗传算法的模型学习时间最短,粒子群算法次之,网格寻优法最长。且基于张量Tucker分解的数据特征提取方法的预测准确率均高于未进行特征提取得到的预测准确率,且前者学习时间均短于后者,实用性更强。

表1 实验结果

4 结论

(1)通过采集发动机曲轴端转矩,飞轮惯性力矩等信号参数,构建了“信号类别×曲轴转角×转速”的三阶张量形式的发动机状态样本,归一化处理后,基于交替投影的思想,使用HOSVD张量Tucker分解和HOOI张量Tucker分解的联立求解算法,将高维张量映射成尺寸更小的核心张量。

(2)分别采用网格参数优化法、遗传算法、粒子群算法对分类模型中的参数进行寻优,以预测准确率和学习时间作为评价指标。实验结果表明使用网格寻优法得到的预测准确率最高,使用遗传算法的模型学习时间最短。

(3)将使用张量Tucker分解后得到核心张量向量化后输入分类器进行训练,并与未进行特征提取、直接将向量型样本数据输入分类器训练作比较。实验结果证明基于张量Tucker分解的发动机数据特征提取方法进行故障诊断有着较高的预测准确率和较短的分类模型学习时间,具有较强的实用性。

参考文献:

[1] 张宇飞, 么子云, 唐松林,等. 一种基于主成分分析和支持向量机的发动机故障诊断方法[J]. 中国机械工程, 2016, 27(24): 3307-3311.

ZHANG Yufei,YAO Ziyun,TANG Songlin, et al. An Engine Fault Diagnosis Method Based on PCL and SVM[J]. China Mechanical Engineering, 2016,27(24): 3307-3311.

[2] HOU C, NIE F, ZHANG C, et al. Multiple Rank Multi-linear SVM for Matrix Data Classification[J]. Pattern Recognition, 2013, 47(1): 454-469.

[3] 杨兵. 基于张量数据的机器学习方法研究与应用[D]. 北京:中国农业大学, 2014.

YANG Bing. Research and Application of Machine Learning Algorithm Based Tensor Representation [D]. Beijing:China Agricultural University, 2014.

[4] KARAMI A, YAZDI M, MERCIER G. Compression of Hyperspectral Images Using Discerete Wavelet Transform and Tucker Decomposition[J]. IEEE Journal of Selected Topics in Applied Earth Observations & Remote Sensing, 2012, 5(2): 444-450.

[5] BENETOS E, KOTROPOULOS C. Non-negative Tensor Factorization Applied to Music Genre Classification[J]. IEEE Transactions on Audio Speech & Language Processing, 2010, 18(8): 1955-1967.

[6] ZHANG Q, WANG Y, LEVINE M D, et al. Multisensor Video Fusion Based on Higher Order Singular Value Decomposition[J]. Information Fusion, 2015, 24(C): 54-71.

[7] BARANYI P. Numerical Reconstruction of the HOSVD Based Canonical Form of Polytopic Dynamic Models[C]// International Symposium on Computational Intelligence & Intelligent Informatics. New York, 2007: 111-116.

[8] SHEEHAN B N, SAAD Y. Higher Order Orthogonal Iteration of Tensors (HOOI) and Its Relation to PCA and GLRAM[C]//SIAM International Conference on Data Mining. Minneapolis, Minnesota, USA, 2007:196-199.

[9] HACKBUSCH W. Tensor Spaces and Numerical Tensor Calculus[M].Heidelberg:Springer, 2012.

[10] KOLDA T G, BADER B W. Tensor Decompositions and Applications[J]. SIAM Review, 2009, 51(3): 455-500.

[11] CARROLL J D, CHANG J J. Analysis of Individual Differences in Multidimensional Scaling via ann-way Generalization of “Eckart-Young” Decomposition[J]. Psychometrika, 1970, 35(3): 283-319.

[12] 刘亚楠.基于图和低秩表示的张量分解方法及应用研究[D]. 合肥:安徽大学, 2014.

LIU Yanan. Tensor Decomposition and Its Applications Based on Graph and Low Rank Representation[D]. Hefei:Anhui University,2014.

[13] SUN J, TAO D, PAPADIMITRIOU S, et al. Incremental Tensor Analysis: Theory and Applications[J]. ACM Transactions on Knowledge Discovery from Data, 2008, 2(3): 651-678.

[14] 王健峰. 基于改进网格搜索法SVM参数优化的说话人识别研究[D]. 哈尔滨:哈尔滨工程大学, 2012.

WANG Jianfeng. Speaker Recognition Based on Improvedgrid Search Algorithm for SVM Parameter Optimization[D]. Harbin: Harbin Engineering University, 2012.

[15] 汪松泉. 遗传算法在组合优化中的应用研究[D]. 合肥:安徽大学, 2010.

WANG Songquan. Application of Genetic Algorithm in Combinatorial Optimization[D]. Hefei:Anhui University,2010.

[16] 张丽平. 粒子群优化算法的理论及实践[D]. 杭州:浙江大学, 2005.

ZHANG Liping. Theory and Practice of Particle Swarmoptimization Algorithm[D]. Hangzhou:Zhejiang University, 2005.

猜你喜欢

三阶张量曲轴
三阶非线性微分方程周期解的非退化和存在唯一性
定义在锥K上的张量互补问题解集的性质研究*
偶数阶张量core逆的性质和应用
四元数张量方程A*NX=B 的通解
一类结构张量方程解集的非空紧性
浅析曲轴磨床的可靠性改进
一种曲轴竖置热处理装置设计
基于支持向量机的曲轴动平衡控制方法
新型三阶TVD限制器性能分析
巧填三阶幻方