基于动态时间规整算法的复杂供输机构非平衡监测数据扩增方法
2022-01-25张梦琪梁伟阁
张梦琪,梁伟阁,张 钢
应用研究
基于动态时间规整算法的复杂供输机构非平衡监测数据扩增方法
张梦琪,梁伟阁,张 钢
(海军工程大学 兵器工程学院,武汉 430033)
针对复杂供输机构非平衡监测数据导致性能退化数据不足的问题,提出一种基于时间序列数据扩增的供输机构性能退化程度评估方法。在滤波算法处理实测数据基础上,利用动态时间规整算法(DTW)扩增性能退化阶段运动加速度参数,并将扩增数据与理论计算值作比较。实装试验结果表明:本文所提方法能够有效解决供输机构监测数据不平衡的问题。
时间序列数据 数据扩增 动态时间规整 性能退化评估
0 引言
随着机械设备自动化、集成化、综合化水平的不断提高,对机械产品运行可靠性要求不断提高。军工产品工作状况复杂,高盐高湿以及高强度磨损,试验室进行的加速寿命试验难以准确模拟出各类工况,机械产品由试验得出的寿命结论往往较为保守[1]。实际试验过程中,各类军工产品必须在保证安全的前提下运行,导致试验采集到的数据存在非平衡情况,即健康性能状态下数据量远远大于性能退化阶段的数据量。传统的健康状态评估算法对非平衡数据集[2]进行性能退化状态评估时,往往偏向多数样本数据集所在的非故障类,故障状态识别率较低,误判故障识别状态后代价昂贵,因此面向非平衡数据集的处理成为监测数据、性能退化研究的重要组成部分。
现有的非平衡数据处理方法主要集中在算法层面和数据层面。从算法层面来看,措施包括引入代价敏感机制、针对支持向量机的改进和采用集成算法等。代价敏感机制面对少数类样本判断时,对错分误判将赋予较高的代价权值,补充数据量较少带来的不平衡影响,缺点是错分误判的权重值难以确定,只能通过修改算法确定。改进支持向量机解决非平衡数据的方式使用广泛,Fan Q等[3]构建一以熵的模糊为基础的支持向量机,在模糊隶属度的权值上偏向分配了少数类样本,该算法取得了良好的效果,但缺乏通用性,较难应用于实际。集成方法实现方式为将数据集抽样划分为小平衡集[4],小平衡集都由多数类样本和少数类样本组成,各小平衡集参与对弱分类器的训练,再按一定规则组合输出分类结果。但该方法通常需要与采样技术和代价敏感机制结合才能有平衡数据集的效果。从数据层面来看,常用方法包括对多数类样本的欠采样、对少数类样本的过采样和混合采样方法[3]。其中欠采样技术得到平衡数据的方式为挑选多数类数据与少数类样本匹配,使数据分布达到相对平衡。但是这种挑选多数类样本方式具有随机性,可能导致没有挑选到有效信息或过拟合情况,影响分类效果。合成少数类过采样技术[3](SMOTE)也是一种常用的过采样方法,该方法通过在少数类与其K近邻之间随机线性插值生成样本。但仍然存在过采样技术中冗余样本或使分类效果过拟合以及欠采样过程中随机选取的问题。
以上非平衡数据处理方法均未增加非平衡数据的数据量,即未实现数据扩增的目的。针对上述问题,本文提出一种基于动态时间规整[5]的数据扩增方法,利用健康状态的试验实测数据扩增得到性能退化阶段的数据,最后与理论计算值进行对比,验证所提方法的有效性。
1 原理介绍
1.1 滤波理论
为应对本试验采得数据凌乱的情况,本文章采用一种使用MATLAB在频域进行带通滤波[6]的算法,主要使用了MATLAB中FliterDesigner工具箱,根据序列确定一最大值以及一最小值,在最大阈值和最小阈值之间确定一系列合适的阈值,然后将信号与此阈值比较,只有处在阈值范围内时保留值,从而达到对此数据集带通滤波操作,上下阈值之间的距离为带宽。
滤波器在电子技术中是由电阻、电感和电容组成的电路,针对要求的频率进行有效滤除。针对不同滤波的范围,分为四种滤波器,高通、低通、带阻、带通。滤波目的是获得允许范围内的频率分量,允许范围通常是滤波器设定的下截止频率和上截止频率之间的频率区间,在非允许范围内的频率分量将会被带通滤波器降到极底的水平。带通滤波技术的实践产生了多种带通滤波器,如RC串并联电路、串联谐振带通滤波器、SAW带通滤波器等。
滤波作用来源于电子元器件阻抗特性的结果,带通滤波器设置的谐振频率范围内的阻抗较小,谐振频率范围之外的阻抗较高,相对应频率通过的电流较小,以此达到带通滤波的效果,带通滤波器的频带(BW)范围为电流超过谐振频率点数值70.7%的频率范围,如图1所示:
图1 带通滤波器响应曲线
当滤波器输出电压值V(或电流值)为谐振值的70.7%时所对应的频率,在图1中,1和2分别是下截止频率和上截止频率,也叫临界频率,带频等。模拟电路的典型结构如图2:
图2 带通滤波器电路的结构
截止频率称为半功率频率,原因为若输出频率为截止频率时,输出的有效功率经计算为谐振的一半,频率为f时发生谐振,则频率对应的功率为:
频率为f和f时的功率为:
1.2 动态时间规整算法(DTW)
针对不等长序列样本关系间的非线性规划算法,首先由日本学者Itakura提出传统的动态时间规整算法(DTW),算法贯穿动态规划的原则,根据样本间点与点的距离,构造样本间点与点之间的距离矩阵,即假设有长度为n一维序列样本和长度为n的一维序列样本,且n≠n,则构造距离矩阵描述与中各样本点之间的距离,具体表达式(3)式:
为确定最佳路径,本文采用了迭代的方法。假设已知最佳路径的累计长度g,那么路径到达()这个点必然由临近点累计而来,即g、g、g中选择一点则迭代如公式4所示:
为了确保求解不等长序列S与C之间匹配的最短路径有解且解决实际意义上的匹配问题,在迭代过程中需满足约束条件如下列所示:
边界条件:最佳路径必须从1,1开始,ns,nc结束,以此确保不等长序列与内的每个点都处在匹配的范围内。
连续条件:每一次迭代必是从d的一个邻域内迭代,邻域范围设置为1,以此确保不等长序列与之间的每个点都匹配到对应的点,保证匹配的连续性,不漏点。
2 模型构建
图3 复杂供输机构性能退化评估模型
利用MEMS惯性传感器采集复杂供输机构工作过程加速度数据,通过滤波算法对原始数据进行预处理,提取反映复杂供输机构工作过程运动特性的加速度变化曲线。根据复杂供输机构工作过程机械传动特性,提取能够反映复杂供输机构工作过程健康状态的性能指标,本文采集的是健康状态下的供输机构运行数据,未获取到性能退化状态下的监测信息,因此在此类非平衡数据的基础上,需要将健康状态的运动数据进行数据扩增,得到性能退化阶段的供输运动数据。利用DTW算法测试数据集进行性能退化处理,扩增数据集获得性能退化后的数据集,对性能退化后的数据集与理论计算得数据集进行比较,计算预测精度,得到扩增后的数据集与理论退化数据集的相似性关系。
本论文使用最大绝对误差(maximum of absolute error,MaxAE)、均方根误差(root mean square error,RMSE),正交均方根误差(normal mean square error,NMSE)[8]评估扩增精度,计算公式如下:
3 试验验证
3.1 信号采集与处理
传感器采集得到的原始振动加速度信号中含有大量瞬态扰动与噪声,需要进行滤波处理,得到能够如实反映供输机构真实运动状态的加速度随时间变化曲线。传感器采集到的供输机构运行加速度随时间变化的原始信号如图4所示,滤波后的信号如图5所示。
图4 未进行滤波时传感器测得数据
图5 滤波处理之后的传感器测得数据
对比图4和图5可知,经过滤波处理后,有效消除了原始信号中独立、跃动较大和幅值较高的噪声干扰。在图5所示的物体运动的40余秒内,本文选取33.317 s~34.446 s的一次运动周期进行性能退化的研究。
3.2 试验结果分析
一次运动周期完全代表了复杂供输机构的运行过程,由于复杂供输机构驱动方式本质是由链条蜗杆组成的传输机构,传输机构最终功能将物品运输到特定位置等待下一步操作,在此过程中下一机构取用运输物品便形成了被运输物体整个链条上的周期性运动。由于链条或传送带的刚性假设,各个位置上的物品运动周期基本相同,因此选用某一周期的加速度变化过程足以代表整个运动过程。经原理分析,一个周期内复杂供输机构提供了两次力矩。因此从图像6上分析,加速度便有两次为正驱动供输机构工作。
图6 滤波后选取时间序列
供输机构作为火炮供弹系统重要机械部件,直接关系到火炮的安全运行,因此很难采集到性能退化或故障状态下的监测信号。本试验仅采集到供输机构正常运行状态下的监测数据,缺乏性能退化阶段的数据,因此数据非平衡数据,无法有效用于评估供输机构性能退化状态。
供输机构本质是由链条、蜗杆组成的复杂传输机构,因此可以通过传动原理计算传动加速度的理论计算值。当传动机构的机械部件发生磨损时,摩擦副之间的间隙增大,导致运动加速度发生变化,但是运动加速度随时间变化模式应保持不变。
因此针对性能退化后的理论计算值,进行了预测,性能退化后的理论计算值与使用DTW算法获得的性能退化数据集如图7所示:
图7 原数据、性能退化理论计算值与性能退化扩增数据
扩增后的数据能够反应供输机构性能退化的趋势,也能反应性能退化信息,通过图7可以看出性能退化后的机构运动加速度响应变缓慢,这是由于摩擦副之间的间隔变大引起的,性能退化后理论计算值与性能退化后扩增数据集之间的差别,一部分是由于理论计算的传动力矩是可以突变的,但反映在齿轮蜗杆传动上便有了惯性考量,导致加速度的变化出现理论计算与扩增数据集有差别的情况出现。本试验经扩增后的数据曲线与性能退化理论计算值比较发现,两者预测误差为Max=6.0081、RMSE=2.0650、NMSE=0.6170,因此扩增得到的数据曲线一定程度上可以代表理论计算过程,测量再进行扩增后的数据集能够反映理论运动过程。
图8 DTW算法路径匹配关系
根据DTW算法求解的最佳路径如图8所示。由图8可知,原数据集点与扩增数据集点呈线性变化关系,说明扩增后的运动参数随时间变化的关系与实测值相似。
4 结论
针对复杂供输机构性能退化数据缺乏导致监测数据非平衡的问题,本文提出了一种基于动态时间规整的时间序列数据扩增方法。利用动态时间规整算法对试验实测数据进行扩增,得到性能退化数据。扩增后的数据与理论计算值相比误差较小,表明扩增数据能够有效表征复杂供输机构性能退化阶段的运动参数随时间的变化过程,一定程度上解决了性能退化数据不足的问题。
[1] 朱凯强, 陆宁云, 姜斌. 基于性能退化的高铁牵引系统的剩余寿命预测[J]. 信息与控制, 2020, 49(3): 335-342.
[2] 余亚萍. 基于深度学习的非平衡小样本异物检测识别技术研究[D]. 西安: 西安电子科技大学, 2019.
[3] 夏爽. 基于维纳过程的机电装备性能退化建模与健康状态评估[D]. 武汉: 华中科技大学, 2016.
[4] 毕略, 雄伟丽. 基于数据分布的小样本扩充方法及应用[J]. 控制工程, 2019, 26(7): 431-1436.
[5] 何浩祥, 解鑫, 王文涛. 基于动态时间归整距的地震动特性分析及合成精度评价[J]. 振动与冲击, 2018, 37(12): 207-215.
[6] 顾明杰. 基于带通滤波的高精度时间间隔测量方法的研究[D]. 西安: 西安电子科技大学, 2019.
[7] 董绍江, 吴文亮, 贺坤, 等. 基于性能衰退评估的轴承寿命状态识别方法研究[J]. 振动与冲击, 2021, 40(5): 186-192.
[8] 邓超, 王远航, 吴军, 等. 机电装备性能退化建模与健康状态评估方法[J]. 计算机集成制造系统, 2018, 24(9): 2279-2287.
A method of data amplification for unbalanced monitoring of complex transmission mechanism based on dynamic time warping algorithm
Zhang Mengqi, Liang Weige, Zhang Gang
(Institute of weapon engineering, Naval University of Engineering, Wuhan 430033, China)
TN911.72
A
1003-4862(2022)01-0036-05
2021-06-21
张梦琪(1999-),男,主要从事物资管理工作。E-mail:1547481192@qq.com