APP下载

基于海林格距离和相关系数的中低速悬浮系统异常检测方法

2022-11-30罗建辉王平

铁道科学与工程学报 2022年10期
关键词:站间线框间隙

罗建辉,王平

(1. 湖南机电职业技术学院 电气工程学院,湖南 长沙 410151;2. 中国空气动力研究与发展中心 设备设计与测试技术研究所,四川 绵阳 621000)

悬浮系统是中低速磁浮列车的关键系统之一,其异常检测技术作为一种提高系统运行安全的有效手段,受到了学术界和工业界的广泛关注和研究。根据工程技术标准,悬浮控制系统应能保证车辆在各种载荷下正常悬浮,额定悬浮间隙为8 mm,静态时悬浮间隙偏差±0.2 mm,列车运行时悬浮间隙偏差±4 mm。虽然在目前的实际工程应用中,悬浮系统已具备了一套基于该标准的自诊断系统,但额定的悬浮间隙以及间隙波动的情况比较复杂。主要有:1) 根据线路情况和列车的状况调整额定的悬浮间隙,如北京线设计为8 mm,长沙线为9 mm等,且悬浮控制器会根据速度的变化来调整额定的悬浮间隙。2) 由于每个传感器和结构安装的差异性,使得每个点的额定悬浮间隙不一定是8 mm。3) 列车运行时由于速度、轨道不平顺等多种因素综合作用,或者列车悬浮静止时由于车轨共振等因素作用,导致异常的间隙值低于经验阈值,从而导致漏报。因此,研究悬浮系统的异常检测技术具有十分重要的意义。国外对时间序列异常检测的研究已有不少成果。ZHOU等[1]提出了一种用于时间序列异常检测的粒度马尔可夫模型。HASHEM等[2]通过新的引导特征和适度的特征选择算法改进BGP,实现了时间序列数据的异常检测。KIM等[3]提出了一种实时置信区间估计方法来检测传感器数据的异常状态。LU等[4]提出了一种用于异常检测的半监督机器学习算法,解决了传统的基于关键质量指标的硬决策方法难以承担大数据环境下监控体验质量异常检测任务的问题。XIE等[5]针对在线和准确的异常检测问题,提出了一种基于双边PCA的异常检测方法,实现了快速准确的实时异常检测。PAN等[6]提出了一种用于传感器数据集成核PCA和关联规则挖掘的数据驱动异常检测方法,可实现卫星电力系统的异常检测。针对从异常环境中的训练集导出的主成分可能会被异常扭曲的问题,O’REILLY等[7]提出了一种最小体积椭圆PCA的分布式异常检测方法,能够得到更为稳健的训练集主成分。国内对时间序列异常检测的研究也有不少成果,其中数据相关性的成果不少。杨甲森等[8]提出一种基于遥测数据相关性的航天器异常检测方法。丁小欧等[9]提出一种基于序列相关性分析的多维时间序列异常检测方法。肖政宏等[10-11]结合相关系数,提出了一种基于流量预测和相关系数的异常入侵检测方法,以及一种基于卡尔曼滤波和相关系数相结合的异常入侵检测方法。韩秋凤[12]提出了一种基于混沌时间序列预测和相关系数相结合的异常入侵检测方法。孙宇豪等[13]提出了一种距离相关系数融合GPR模型的卫星异常检测方法。柴政等[14]提出了一种基于多源传感数据相关性分析的设备故障在线检测方法。孙宇豪等[15]采用了一种融合主成分分析的相关概率模型的检测方法。李晨等[16]利用数据的时间相关性,提出了针对无人机传感器数据的异常检测模型。综上所述,针对悬浮系统异常检测问题,利用悬浮系统的输入输出数据,提出一种基于海林格距离和相关系数的中低速悬浮系统异常检测方法。首先,考虑数据间的相关性,通过相关系数来检测该变化。然后,考虑数据前后的变化,通过海林格距离来检测该变化。最后,考虑在数据未发生异常时,部分变量之间的相关系数存在变化较大的情况。同时,在数据发生异常时,部分变量之间的相关系数也存在较大的变化,而部分变量之间的相关系数没有明显变化。因此,部分变量之间的相关系数不能作为最终的检测指标,同时本文将相关系数和海林格距离进行融合,实现异常检测。

1 悬浮系统的异常数据

1.1 数据分类

由于悬浮系统在不同的运行场景下所产生的数据之间存在较大的差异,故需要对数据进行划分,以便在不同的运行场景下进行异常检测,这样有利于提高检测的可靠性。悬浮系统在运行中会产生大量的数据,主要包括悬浮间隙、电磁铁电流、悬浮电磁铁的垂向加速度、悬浮控制器的输入电压和车辆运行速度。

图1为悬浮监控单元中某一个悬浮控制单元在某一天的间隙数据,由车库内、出库、正线运行和回库4部分数据组成。其中,一天的数据不到70万个样本点,而在正线运行过程中采集的悬浮数据有近50万个采样点。因此,正线运行过程的数据是本文的研究重点。由图1可知,在正线运行的数据中,站内悬浮静止的间隙数据与站间运行的间隙数据的幅值有明显的差异。

为了更为直观地反映二者之间的差异,从悬浮系统的历史数据中选择一段列车从始发站运行到终点站的悬浮系统历史数据,如图2所示。从图中可以看出,站内悬浮静止的间隙数据与站间运行的间隙数据之间的差异大且站间运行的间隙波动较为频繁。因此,本文将磁悬浮列车的数据分为站内悬浮静止和站间行驶2类。其中,第1个虚线框中的数据属于站内悬浮静止,第2个虚线框中的数据属于站间行驶。

1.2 典型的异常类型

站内悬浮静止是指磁浮列车在站台上悬停,属于乘客上下车的阶段。此时,车辆的速度为0,悬浮间隙在较小的范围内波动。站间行驶是指磁浮列车以0~100 km/h的速度在站与站之间行驶。此时,列车与轨道之间的间隙波动较大。

依据上述分析,可以通过列车速度是否为0来判断是站内悬浮静止还是站间行驶。如果速度为0,则当前为站内悬浮静止,否则为站间行驶。每当悬浮监控单元采集到一个样本,则根据速度判断系统当前的数据类别。同时,站间行驶的异常比站内悬浮静止的异常较难检测,因此重点从站间行驶中分别选择一些典型的异常。

从站间行驶的历史数据中选择含有3类异常的数据,且如果是线路特定位置或道岔特性引起悬浮系统表现出该特征,那么其他悬浮点在该位置也会出现异常,不属于本文考虑的异常。图3和图4分别为第1类异常和第2类异常的数据,其中虚线框中的数据属于异常数据,图3(a)和图4(a)中的2条实线分别为基于经验的上、下限阈值。当前数据来源于标准间隙为9 mm的悬浮系统,则基于经验的上、下限阈值分别为5 mm和13 mm。

图3中间隙有明显的波动,但没有超过经验阈值,此时加速度、电流和电压也对应有一定的波动。在实际工程中,当悬浮系统过三型接头或弯道时容易发生该类异常。对于这类异常,通过经验阈值不一定能检测出来。图4的这类异常表现为间隙有很大的波动,且超过经验阈值,此时加速度、电流和电压也对应有巨大的波动。在实际工程中,当悬浮系统多次与轨道发生碰撞时容易发生该类异常。对于这类异常,通过经验阈值很容易检测出来。图5的这类异常中,除了个别位置的间隙稍微大点外,其他位置的间隙没有明显的波动,且都没有超过经验阈值,此时电流和电压也没有明显的波动,但加速度波动很明显。在实际工程中,当加速度传感器有异常或加速度传感器的灵敏度比间隙传感器高或控制器内部接插件出现问题时容易发生该类异常。对于这类异常,根据经验阈值方法无法检测出来。

从站间行驶时的3类异常数据可知,当第1类异常发生时,虽然间隙波动较小,但电流和加速度也有较大的波动;当第2类异常发生时,除了间隙波动较大之外,电流和加速度也有很大的波动;当第3类异常发生时,虽然间隙和电流波动较小,但加速度有较大的波动。这说明,当异常发生时,电流和加速度包含系统的异常信息。因此,本文将利用悬浮系统的间隙、电流、加速度、电压和速度等多维数据进行异常检测。

2 提出的异常检测方法

2.1 海林格距离

在概率和统计学中,海林格距离是一种概率分布相似程度的度量,即衡量2个概率分布的不同,能够反映数据分布的相似程度[17]。它不会随着数据不平衡率的改变而发生质的改变。

假设P和Q是2个概率测度,二者之间的Hellinger distance 定义为:

其中:n表示P或Q中样本的总数量;Pj或Qj表示P或Q中第j个样本。

海林格距离具有以下特性:1)H(X,Y)的界限为[0,1];2)H(X,Y)是对称且非负的。

2.2 相关系数

相关系数是2个随机变量x和y之间相关程度的度量,广泛应用于信号处理和图像处理等领域。随机变量x和y之间的相关程度越大,则相关系数越大;反之,相关系数越小。相关系数定义为:

式中:Ex和Ey分别表示随机变量x和y的数学期望;Exy表示变量xy的数学期望;Dx和Dy表示随机变量x和y的方差;相关系数ρ(x,y)表示变量x和y间线性关系的相似度。

2.3 本文方法

根据对运行数据的分析可知,在未发生异常时,间隙、电流和加速度有一定的相关性。当系统发生异常时,间隙、电流和加速度都包含着系统的异常信息,三者的相关性会发生改变,此外三者自身的数值也存在一定的变化。由于系统的复杂性和三者的耦合关系,根据经验阈值法,只考虑间隙这一单维变量数据难以准确地对系统进行异常检测。同样,如果只考虑数据之间的相关性而不考虑数据的波动异常,那么可能检测不出不明显的异常,即漏检。因此,本文利用悬浮系统的间隙、电流和加速度等多维数据,同时考虑数据的变化和数据间的相关性,对悬浮系统进行异常检测。

首先,考虑数据间的相关性,2个信号序列x和y的相关系数公式为:

其中:x和y可以为对间隙、加速度、电流进行去均值后得到的数据序列(均值为0);m为序列的长度。

分别通过式(4)~式(6)计算间隙、加速度和电流两两之间的相关系数,得出间隙与加速度的相关系数ρga,间隙与电流的相关系数ρgc,加速度与电流的相关系数ρac。

其中:gi,ci和ai分别为当前间隙、电流和加速度去均值后的数据序列中第i个数据;N为序列的长度。

然后,在间隙、电流和加速度的历史数据中分别选择一段无异常的数据序列g0,c0和a0,并考虑数据的变化,根据式(7)~式(9)分别计算间隙、电流和加速度的海林格距离hg,hc和ha。

最后,考虑到在数据发生异常时,部分变量之间的相关系数存在较大的变化,而部分变量之间的相关系数没有明显变化。同时,在数据未发生异常时,部分变量之间的相关系数也存在变化较大段,这属于误报,也说明部分变量之间的相关系数不能作为最终的检测指标。因此,本文在文献[18]的加权相关系数的启发下,通过式(10)将ρga,ρgc,ρac,hg,hc和ha进行信息融合,获得基于加权相关系数的异常检测指标。

3 实验结果与分析

以第1类异常为例,图6为第1类异常中间隙、加速度和电流的测量数据,其中虚线框为异常数据段。

图7为各变量之间的互相关系数。由图7可知,当异常发生时,电流和间隙的相关系数基本没变化,但加速度和间隙的相关系数与加速度和电流的相关系数有较大的变化。图8为各变量之间的H距离。由图8可知,当异常发生时,间隙的H距离基本没大的变化,但电流的H距离和加速度的H距离变化较大。图9为加权相关系数及检测指标。由图9可知,当异常发生时,虽然hghc ρxy,hcha ρyz,hgha ρxz和检测指标H都发生了明显的变化,但在异常结束后,hghc ρxy并没有减小。此时,如果加权求和,可能会导致融合的指标在异常结束后仍然不会减少。而本文方法获得的检测指标H能在异常发生时能有效检测,在异常结束后能跟随减少。因此,本文方法能有效检测第1类异常。

为了验证本文方法的有效性,将对比方法[18]与本文方法分别应用于3类异常数据,并通过实验结果进行对比。

图10为本文方法和对比方法对站间行驶下第1类异常的检测结果,且异常的数据与对应的检测结果分别用虚线框圈出。由图10可知,本文提出的方法能有效检测出异常,且没有误报,而对比方法虽然能检测出异常,但在结果中从虚线框的右侧到第7 s存在一段较大值的检测指标,难以直接通过简单的阈值进行区分,这对阈值的划分有一定的挑战性,很容易导致误报。在本文方法的结果中,虽然虚线框两侧也存在一段较大值的检测指标,但虚线框中在第5~6 s之间有能明显区分于虚线框两侧的数值,可以直接通过简单的阈值进行区分。因此,对于第1类异常,本文提出的方法比对比方法更有优越性,误报率更低。

图11为本文方法和对比方法对站间行驶下第2类异常的检测结果,且异常的数据与对应的检测结果分别用虚线框圈出。由图11可知,虽然2种方法都能有效检测出异常,但都存在误报。这可能与选择的数据长度有关。本文选择的数据长度为15,在对比方法的结果中,误报数量也为15,而本文提出方法的结果中,误报数量为10。因此,对于第2类异常,本文提出的方法比对比方法更有优越性,误报率更低。

图12为本文方法和对比方法对站间行驶下第3类异常的检测结果,且异常的数据与对应的检测结果分别用虚线框圈出。由图12可知,2种方法都能有效检测出异常,但在对比方法的结果中,从第130 s到虚线框的左侧存在一段较大的检测指标,且虚线框以外的检测指标有较大的波动,这对阈值的划分有一定的挑战性,很容易导致较大的误报。而在本文方法的结果中,虚线框内外的检测指标有很大的区分性。因此,对于第3类异常,本文提出的方法比对比方法更有优越性,误报率更低。

4 结论

1) 虽然相关系数或海林格距离能有效检测部分变量之间的相关性或自身变化,但仍然不能有效检测所有异常引起的变化。因此,为有效检测系统的异常,将相关系数和海林格距离的结果融合来实现悬浮系统的异常检测。运营线数据验证了该方法能有效检测系统的异常。

2) 运营线数据验证表明,与相关方法相比,提出的方法能获得更高的检测率和更低的误报率,且受到额定悬浮间隙不唯一和外界扰动的影响较小。

猜你喜欢

站间线框间隙
电磁感应线框模型中最常考的三类题型剖析
间隙
飞行过载及安装间隙对主安装节推力测量的影响
紧流形上的SchrÖdinger算子的谱间隙估计
玩转方格
随位移均匀变化的磁场中电磁感应规律的初探
站间未设通过信号机的区间红灯转移问题探讨
浅谈保护间隙的利弊与应用
单线自动站间联系电路的改进
ZPW-2000A站间联系电路的改进