APP下载

基于压缩感知的设备多源信息传输与分类算法

2020-03-05赵小虎王刚宋泊明于嘉成

通信学报 2020年2期
关键词:时域路由重构

赵小虎,王刚,宋泊明,于嘉成

(1.矿山互联网应用技术国家地方联合工程实验室,徐州 江苏 221000;2.中国矿业大学物联网(感知矿山)研究中心,徐州 江苏 221000;3.西澳大学电气电子与计算机工程系,珀斯 6009)

1 引言

由于选煤厂设备种类繁多,监测点分散,建立传统的有线监测系统存在较大的困难,基于自组和多跳路由的无线传感器网络为选煤厂设备状态监测提供了灵活的解决思路。设备振动信号由于包含丰富的设备运行信息,常用于设备故障诊断。然而,设备故障诊断中振动信号频带较宽,依据传统香农采样定理进行数据采集时,会得到大量振动数据,给实时设备监测中的存储、传输和处理带来很大困难。压缩感知(CS,compressed sensing)[1]由于利用了信号的稀疏性,能以远低于奈奎斯特采样速率对信号进行非自适应测量编码,突破了香农采样定理的瓶颈,使高分辨率信号的采集成为可能。因此,本文研究适用于选煤厂设备振动信号的压缩感知与分类算法。

Fazel 等[2]提出了一种用于大规模传感器网络中长期数据收集的随机压缩感知方案,该方案能够延长传感器网络的寿命。针对分布式压缩与重构问题,田子建等[3]研究了一种基于分布式压缩感知构造指纹数据库的方法,减少了数据采集工作量,提高了工作效率。Wang 等[4]结合压缩感知和多跳网络用于移动瓦斯测量,实现了瓦斯测量数据的重构。然而,利用压缩感知理论采集选煤厂设备振动数据时,由于监测点分散,监测点向无线接入点数据传输采用多跳通信方式,测量矩阵的构成依赖于多跳传输时所选择的路由技术。由于每次随机选择M条不同链路传输数据,而不同路由策略形成不同测量矩阵,从而影响不同重构效果,因此路由选择策略是选煤厂振动信号压缩感知实际使用时迫切需要解决的问题。

为了解决拥塞、时延、能耗等问题,Wang 等[5]提出了一种基于蚁群算法的服务质量(QoS,quality of service)路由协议。兰巨龙等[6]提出了基于深度强化学习的软件定义网络QoS 优化算法,将网络资源和状态信息统一到网络模型中,通过长短期记忆网络提升算法的流量感知能力,最后基于深度强化学习生成满足QoS 目标的动态流量调度策略。Gelenbe 等[7]将随机路由算法用于基于无线网络的事件监测,为监测事件提供更短的时延和更好的QoS。

结合选煤厂设备的监测需求,本文利用自组织特征映射(SOM,self-organizing map)神经网络将链路通信质量汇聚到路由构建中,保证了信息传输质量,同时,提出了一种基于服务质量的随机动态自组织路由技术,解决了压缩感知中测量矩阵存在较大相关性的问题,提高了信号重构精度。

对压缩重构的选煤厂设备运行信号进行状态分类时,传统故障诊断方法是构建设备振动信号混合域特征向量集,然而高维特征向量存在的冗余信息会对后续模式分析造成维数灾难,影响故障分类精度。Yang 等[8]提出将距离评估技术应用于特征降维和旋转机械设备故障分类。Lei 等[9]将距离评估技术改进为一种降维性能更优越的补偿距离评估技术(CDET,compensation distance evaluation technique)。王前等[10]将噪声信号梅尔倒谱与CDET 结合,用于滚动轴承故障诊断,取得了良好的聚类结果。以上研究成果表明,CDET 能够反映不同特征的敏感性特征权重。采用敏感特征组成的特征集能够提高故障模式识别的准确精度。

在分类模型选择上,基于数据驱动的机器学习算法取得了更好的诊断效果。人工神经网络(ANN,artificial neural network)[11-12]和支持向量机(SVM,support vector machine)[13]应用于旋转机械设备的故障诊断均可获得较高的故障分类精度。而SVM作为小样本的机器学习方法,分类模型训练时间远少于ANN,特别适用于工业应用场景,并且对旋转机械设备故障类型识别率更高[14]。

因此,为解决混合域特征集内特征维数较高、特征间相关性严重的问题,本文以压缩重构的多通道振动信号时域特征为基础,引入振动信号的全变分,将补偿距离评估算法与支持向量机结合,提出了一种基于全变分的滚动轴承数据驱动特征提取与故障分类算法,并从以下两方面验证了该算法的优越性:1)CDET 算法优于传统的降维算法,如主成分分析(PCA,principal component analysis)、线性判别式分析(LDA,linear discriminant analysis)、非线性主元分析(KPCA,kernel PCA)等,在特征筛选中能优先选出全变分特征,表明全变分具有描述轴承振动信号时域特征的优良特征;2)引入全变分后的特征集能够提高故障的识别精度。

2 多跳通信与压缩感知

压缩感知主要包括信号稀疏表示、测量矩阵设计与重构算法三部分。信号稀疏表示是压缩感知的先决条件。长度为N的K稀疏信号x,测量矩阵Φ∈RM×N(M<

振动监测信号从一个无线采集点传输到另一个无线采集点,为了延长生存时间,常采用多跳通信方式,如图1 所示。

图1 多跳无线网络

数据采集采用时间独立的M个具有不同起始节点的多跳通信链路,对于每一个多跳网络,测量节点随机选择一个初始节点,并计算振动测量值与自身产生的随机比例系数乘积,根据选定的路由将该乘积传送给下一个测量节点。而下一个测量节点将接收到的信号与本地产生的乘积信号相加,再传送给下一个测量节点,以此类推。这样,无线接入点接收到的第i路多跳信号的测量值为[15-16]

其中,Pi是在第i条多跳通信链路中经过的测量节点序号集合,Φi,j是第j个测量节点产生的随机系数,xj是第j个测量节点测量到的振动数据,则在无线接入点接收到的M路信号向量y=[y1,…,yM]可表示为

这样,数据多跳传输就转变为压缩感知问题。其中,Φ是M×N阶测量矩阵,当j∈Pi时,第(i,j)元素的值等于Φi,j;否则为0。显然测量矩阵Φ与监测信息传输的路由技术相关。

3 随机动态自组织路由

对于由N个测量节点构成的无线传感器网络,网络中每个测量节点有若干条通信链路同其他节点相连,网络可以用图的方式描述为G(V,E)。其中,V={v1,v2,…,vN}是网络测量节点集,它对应于图中每一个顶点;E={wij}是网络链路的集合,每条链路对应一条弧(vi,vj),wij为该弧的权值或距离。测量网络结构如图2 所示。在无线传感网络里,假设所有链路均是对称的,即wij=wji。

图2 测量网络结构

由于测量矩阵由网络中采用的路由算法确定,当采用最短路径树、贪婪路由算法测量数据流传输时,测量矩阵会存在较大的相干性,影响信号重构效果。因此,引入随机路由的思想。

考虑到选煤厂通信环境复杂,在构造最小路径树时,可将QoS 定义为通信链路的权值。影响服务质量的因素包括时延、数据传输率、误码率、带宽等,采用SOM 神经网络将以上因素映射为链路QoS,即链路距离。SOM 神经网络由两层神经元组成,第一层为输入层,作为传感器感知信息的输入端,这里是描述传感器邻居链路间QoS 优劣的指标;第二层为竞争层。运行过程分为训练和执行2个阶段。由于训练阶段需要较高的计算开销,因此需要在上位机上完成,称为离线处理;相反,执行阶段不需要高计算开销,可在每个传感器节点上在线运行,因此可以把SOM 神经网络应用到传感器网络节点。最后,利用最小路径树构造节点传输路径,称为动态自组织路由。随机动态自组织路由是在最小路径树基础上增加路由随机扩展。由于原有路由在构造路径时每次都选择节点到汇聚节点的最小距离,使节点路由唯一,出现测量节点只存在一个前向节点或后向节点的情况,不能满足压缩感知对测量矩阵的要求。因此,在最小路径树基础上,通过扩展路由增加前向节点,并对每一个前向节点赋予一定选择概率,使路由选择在保证QoS 的基础上又具有一定随机性,解决了测量矩阵存在较大相关性的问题。具体实现方法如下。

定义d(vi)为节点vi到汇聚节点的距离,Γ(vi)为节点vi单跳可到达的邻域节点集合,r为汇聚节点,wij为节点i与j的距离,其值由链路QoS 确定。假设所有节点链路间QoS 已通过SOM 神经网络汇聚计算得到。

1)节点距离初始化

当节点距离超过通信范围时,将距离d设为∞。令d(r)=0,。

2)最小路径树构建

在集合T中,寻找到汇聚节点距离最小的节点vj,更新T中元素,T=T-{vj}。对任意vi∈T∩Γ(vj),计算di=d(vj)+QoS。若di

3)如果|T|>0,重复步骤2);如果|T|=0,进入步骤4)。

4)路由扩展

对最小路径树中的每一节点vi,若只有一个前向节点,则在其Γ(vi)任意选择一个除已有前向节点vf和后向节点vh之外任一wij最小的节点vj,进行路由扩展,并令节点vi的下一跳选择节点vf和vj的概率分别为p1和p2,p1>p2,且p1+p2=1。若节点vi已有2 个或以上前向节点,则不再进行路径的前向扩展,并平均分配每条支路一个选择概率。

获得了信号传输采用的路由策略,即获得了多跳传输时压缩感知的测量矩阵,最后根据接收到的信息即可通过测量矩阵重构出原始测量信号。

4 信号重构与时域处理

4.1 信号重构

信号重构算法是指由长度为M的测量向量y重构长度为N的稀疏信号x的过程。信号的重构问题可表示为l0范数的最小优化问题,如式(3)所示。

4.2 振动信号特征提取

对重构的每一路测试信号进行时频分析,获取信号特征。传统的信号处理方法包括时域分析、频域分析、小波分组变换等。为了反映信号变化情况,本节参考文献[23-24]提取信号的均值、标准差、均方根值、歪度指标、峭度指标、波形指标、裕度指标、脉冲指标、峰值指标等传统时域特征,并构建了一种新的时域特征——振动信号的全变分。

设x为轴承的振动信号,由于正常运行下机器的振动或噪声一般是大量的、无规则的、大小接近的随机扰动的结果;而对于不正常运行状态下的振动信号,通常是在随机信号中出现有规则的周期性脉冲,即满足xi≈xi+1。因此,定义振动信号x∈RN的全变分如式(4)所示。

其中,D∈R(N-1)×N为双对角矩阵,Di为双对角矩阵D的第i行元素。

全变分反映了一个采样周期内信号时域相邻采样点的总体变化情况。在正常运行下,振动信号的全变分近似为微小量,而对于不正常运行状态下的振动信号,其全变分是一个较大的量,因此全变分函数对于快速变化的x给予大的值,更能反映有变化的故障信号的统计时域特征。这在信号的稀疏采样中也获得了验证[19]。

作为对比,本文选择了一般文献中常用的9 个信号时域特征,组成了本文轴承振动信号所选择的10个时域特征及其排列顺序,作为后续特征筛选的源特征,如表1 所示,其中μx为均值,σx为标准差。

4.3 补偿距离评估算法

设含有C个模式类ω1,ω2,…,ωC的特征集为{pc,m,k},c=1,2,…,C,m=1,2,…,Mc,k=1,2,…,K。其中,pc,m,k为状态c下第m个样本的第k个特征,Mc为状态c下样本总数,K为每个样本特征数目。因此总共可得个样本集,共计个特征。

表1 振动信号的10 个时域特征及其表达式

补偿距离评估算法实现特征降维的具体步骤如下。

1)计算ωc(c=1,2,…,C)类中所有特征向量的平均距离,如式(6)所示。

对dc,k(c=1,2,…,C)求平均后得到平均类内距离,如式(7)所示。

3)计算C个模式类的类间距离,如式(9)所示。

5)定义并计算补偿因子,如式(11)所示。

对αk进行归一化处理,得到归一化的距离评估指标为

7)设阈值φ(φ∈[0,1]),从特征集{pc,m,k}中选择距离评估指标特征为灵敏特征;或设目标维度为L,选取距离评估指标最高的L个特征为敏感特征,将K维降为L维。

5 算法流程

基于压缩感知的选煤厂设备多源监测信息传输与分类算法流程如图3 所示,具体步骤如下。

图3 算法流程

1)利用随机动态自组织路由部署选煤厂设备多元监测信息多跳传输网络,获取观测值y。

2)根据多跳传输网络获取压缩感知中的测量矩阵Φ。

3)信号重构,获取重构测量信号x。

4)根据重构获得的C个模式类型的P个通道振动信号,将每种故障类型振动信号分别按时间序列分帧处理组成Mc个样本。

5)引入全变分,提取不同故障类型样本的每个通道时域特征。其中每个通道提取10 个时域特征,10个特征排序按表1顺序排列。P个通道共提取K个特征,即K=10P。

6)样本特征按列排列,组成特征集{pc,m,k},表示为

其中,N为C个模式类的样本数总和,特征集元素aij表示第j个样本第p个通道的第k个特征值,i=(k-1)P+p,j=1,…,N,p=1,…,P,k=1,…,10。

7)采用CDET 算法,根据式(13)计算时域特征集补偿距离指标,并确定相应阈值φ,选取敏感特征。

8)确定敏感特征集,通过“一对一”的多分类SVM 对设备故障类型进行分类,确定其具体故障类型。

从信号重构开始,各步骤均在上位机中完成。

6 实验测试

6.1 随机动态自组织路由

轴承是机械设备易损件之一,因此在设备状态监测时,对选煤厂每台设备采用2 个三轴振动加速度传感器,分别测取X、Y、Z这3 个轴向的振动加速度信号,传感器的具体位置如图4 所示。其中,驱动端的3 个轴向分别用T1、T2和T3表示,非驱动端的3 个轴向分别用T4、T5和T6表示。

图5 描绘了根据图2 场景,采用不同路由协议时测量数据传输路径树的构造结果。图5(a)为根据SOM 神经网络计算出节点间链路质量的带QoS 的网络带权图,箭头上数字表示链路质量QoS;图5(b)为基于QoS 的多权值动态自组织路由技术,每条路由保证节点到汇聚节点累积QoS 最小,即链路质量最高;图5(c)为随机动态自组织路由,在图5(b)基础上进行了路由扩展,对只有一个前向节点的路由节点,在可能的情况下扩展了一个前向节点,并对多个前向节点进行了概率分配,从而使节点到汇聚节点的路径树不唯一,增加了路径选择的随机性。

图4 传感器的具体位置

图5 几种路由方式

为了测试路由效果,随机产生了12 路测试信号,每一路信号稀疏度为2,恢复算法采用BP 算法。图6 所示为分别采用多权值动态路由和随机动态自组织路由技术构建测量矩阵的重建效果。其中,横轴为采样点数;纵轴为加速度幅值,单位为g。由图6 可知,采用多权值动态路由时,由于测量矩阵的确定性,12 路信号中只有不到一半的路数信号可以精确重构;而采用随机动态自组织路由时,由于测量矩阵的随机性,数据重建效果变好。

图6 2 种路由技术构建测量矩阵的重建效果

6.2 重构的测量信号

具体工业实验时,采集1 800 r/min 转速下5 种轴承工作状态(正常、内圈故障、外圈故障、滚动体故障、组合故障)实验数据。不同设备轴承工作状态采样周期都为1 min,采集得到6 个轴向振动传感器的5 种运行状态数据集。图7 所示为轴T1方向5 种轴承运行状态,其中横轴为采样点数,纵轴为加速度幅值。

图7 轴1 方向5 种轴承运行状态

图8 显示了随机动态自组织路由下,采用不同重构算法压缩比与重构误差结果。由图8 可见,在相同压缩比时,OMP、gOMP 以及SAMP 算法整体性能相近。

图8 不同重构算法压缩比与重构误差关系

以正常状态信号为例,图9 为N=256 长轴承信号在压缩比为0.3 时利用随机动态自组织路由在OMP、gOMP、SAMP 和SP 重构算法下的时域波形对比。由于重构的测量信号主要应用于后续设备工作状态分类,因此不需要过于在意重构时域误差。

6.3 特征提取

利用随机动态自组织路由作为测量矩阵,采用OMP 算法对多源监测信号进行重构。重构信号的数据处理针对每个方向不同工作状态提取200 组数据为训练集,提取150 组数据为测试集,每组3 000个数据点。提取每组数据均值、标准差、均方根值、歪度指标、峭度指标、波形指标、裕度指标、脉冲指标、峰值指标、全变分共10 个特征构成测试特征集,6 轴向传感器共构成60 个特征集。

6.4 无全变分特征后特征筛选与分类情况

1)基于CDET 筛选出的时域特征

通过补偿距离评估算法得到没有振动信号全变分特征时的 54 个特征距离评估指标(k=1,2,…,54),为了使目标维数为3,本文将阈值φ设为0.6,即的指标被选为特征指标,用于下一步SVM 故障类型分类。图10 为特征补偿距离评估,选择的3 个特征分别为轴4 方向振动信号的均方根值,以及轴1 和轴3 方向的振动信号平均值。

2)不同降维算法分类情况比较

图9 正常状态信号在不同重构算法下重构效果

根据补偿距离评估算法得到的三维特征,与PCA、LDA、KPCA 降维得到的三维特征分别应用SVM 进行故障分类。图11 为各降维算法降维后的聚类效果。表2 为无全变分各降维算法对应的分类精度。

图10 特征补偿距离评估

表2 无全变分各降维算法对应的分类精度

由表2 可知,PCA 降维后的数据集分类精度约为96%;KPCA 降维方法处理非线性数据集降维效果较好[16],分类精度较高,但其故障分类结果要比补偿距离评估算法降维后分类精度低1.6%;LDA分类精度最低约为94%;而CDET 的分类准确度达到99.33%。由此可见,当目标维数为3 时,采用补偿距离评估算法得到的三维特征已可达到较高的分类精度,说明目标维数为三或阈值φ为0.6 满足实际应用需求。

6.5 考虑全变分特征后特征筛选与分类情况

1)基于CDET 筛选出的时域特征

当引入本文振动信号全变分特征后,对60维数据集进行降维,计算60 个特征距离评估指标(k=1,2,…,60),设阈值φ=0.6,即的指标被选为特征指标,图12 为引入全变分特征集补偿距离评估,选择的3 个特征分别为轴4 和轴5 方向的振动信号全变分,以及轴4 方向振动信号的均方根值。

根据表1 以及K个样本特征排列顺序,由图12可见,CDET 筛选出的3 个时域特征中2 个均为全变分特征,而且轴4 和轴5 方向的振动信号全变分补偿距离评估值均大于未引入全变分的所有特征的补偿距离评估值,表明全变分具有描述轴承振动信号时域特征的优良特征。

图11 各降维算法降维后的聚类效果

图12 引入全变分特征集补偿距离评估

2)不同降维算法分类情况比较

采用4 种降维算法得到低维特征集合,通过SVM 故障分类算法的识别精度验证全变分特征对分类效果的影响。图13 为引入振动信号全变分特征的聚类效果。与图11 对比可以看出,各种降维算法的聚类效果得到提高。表3 为4 种降维算法分类结果。

图13 引入振动信号全变分特征的聚类效果

表3 4 种降维算法分类结果

对比表2 和表3 可知,引入全变分指标后,PCA和LDA 故障分类精度分别提高了5.46%和3.46%;KPCA 分类精度为99.47%,相较于未引入全变分特征提高了1.74%;CDET 降维后分类精度最高约为99.87%。

图14 所示为引入振动信号全变分特征前后故障分类精度比较。由图14 可知,引入全变分特征后相较于未引入全变分特征4 种降维算法故障分类精度都得到明显提高。而且对本文2 个时域特征集降维,CDET 降维算法的分类结果都优于传统的降维算法。上述实验结果表明,引入全变分后的特征集能够提高故障的识别精度。

图14 引入全变分特征前后故障分类精度比较

7 结束语

针对选煤厂设备种类繁多和监测点分散的特点,本文提出了一种基于压缩感知的选煤厂设备多源信息无线传输与分类算法。通过构建一种多跳信息传输模型,将信息传输问题转换为多路测量信号的压缩传感问题,并将测量矩阵获取转化为多跳信息传输模型的路由问题。针对所获得的测量矩阵存在较大相干性,影响信号重构效果问题,将随机路由的思想引入路由构建当中,提出了一种随机动态自组织路由算法,该技术在最小路径树的基础上,通过扩展路由,增加前向节点,并对每一个前向节点赋予一定的选择概率,使路由的选择在保证QoS的基础上具有一定的随机性,解决了测量矩阵存在较大相关性的问题。为了解决重构后的信号时域特征难以对故障类型进行精确分类的问题,针对重构信号,提出了一种基于全变分与补偿距离评估相结合的支持向量机分类算法对轴承故障类型分类,并从两方面论述了该算法的优越性:1)补偿距离评估算法降维能够有效地得到特征主元,而且其降维后聚类结果优于传统的降维算法,CDET 算法在特征筛选中能优先选出全变分特征,表明全变分具有描述轴承振动信号时域特征的优良特征;2)当引入振动信号全变分特征后,4 种降维方法的故障类型识别精度都得到了提高,其中补偿距离评估算法降维后数据集相较于传统降维算法 PCA、LDA 与KPCA,分类精度最高,表明引入全变分后的特征集能够提高故障的识别精度。因此,基于全变分的滚动轴承数据驱动特征提取与故障分类算法,可以更有效地确定滚动轴承的故障类型。所提出的多源信息传输与分类算法在提高监测数据实时传输效率情况下,能够有效提高故障识别精度,特别适用于监测点分散、有线监测系统布置困难的应用场景。

猜你喜欢

时域路由重构
视频压缩感知采样率自适应的帧间片匹配重构
长城叙事的重构
改进的浮体运动响应间接时域计算方法
高盐肥胖心肌重构防治有新策略
数据通信网VRRP与MSTP联动引发的次优路由问题分析
路由选择技术对比
基于复杂网络理论的作战计划时域协同方法研究
网络分析仪时域测量技术综述
路由重分发时需要考虑的问题
北京的重构与再造