基于全卷积神经网络的机车信号降噪
2021-06-06邢玉龙赵会兵朱林富
邢玉龙 ,王 剑 ,赵会兵 ,朱林富
(1. 北京交通大学电子信息工程学院,北京 100044;2. 北京交通大学轨道交通控制与安全国家重点实验室,北京100044;3. 北京交大思诺科技股份有限公司,北京 102206;4. 中国铁道科学研究院集团有限公司标准计量研究所,北京 100081;5. 中铁检验认证中心,北京 100081)
随着铁路运输要求的提高和技术的发展,机车信号的译码性能要求随之提高. 机车信号提取轨道电路传送的行车信息,经译码处理后不仅在司机室内复示地面信号,同时将译码结果提供给后级监控设备,如列车运行监控装置、自动停车装置等,车载安全计算机监控列车运行速度,当列车超速时强制输出制动[1]. 而机车信号的误译或掉码,将有可能造成行车信号升级或停车,严重影响运输安全和效率.
由现场调研可知,除机车信号自身设备故障的原因外,轨道电路信号在传输过程中受到多种不同类型的干扰影响而导致传输质量下降,这是导致机车信号误译或掉码的一个主要原因. 存在的干扰主要包括不平衡牵引电流带来50 Hz及其谐波干扰、邻线干扰、邻区段干扰、单频干扰、白噪声等. 因此,研究适合轨道电路信号及干扰的特点并具有较强降噪能力的机车信号处理算法是非常必要的.
国内针对机车信号抗干扰问题已做过一些研究,文献[2]利用B样条离散二制进小波变换对机车信号所记录的感应电压幅度包络进行降噪,从减小噪声幅度和增大信号幅度两个方面来优化信噪比. 文献[3]基于经验模式分解(empirical mode decomposition,EMD)的轨道移频信号降噪算法,在一定程度上对几种噪音进行了去除,但是存在端点效应、模态混叠等问题. 文献[4]提出了基于稀疏分解的轨道移频信号降噪算法,取得了比小波阈值、EMD算法更好的降噪性能,但是仅验证了白噪声,对其他干扰的降噪效果未做验证.
国外学者提出了多种行之有效的降噪方法,应用于语音识别、语音增强领域,包括谱减法[5]、基于最小均方误差的短时频谱估计法[6]、维纳滤波[7]、非负矩阵分解[8]、基于深度神经网络的语音增强[9]等.以上研究以消除、掩蔽噪声信号频谱为目标,得到无噪信号,达到降噪目的. 但这对于需要从频域解析未知的载频、低频信息的机车信号是不适用的. 文献[10]提出直接以原始波形为输入的卷积神经网络(convolutional neural network,CNN),以解决音素分类问题,结果表明训练后的CNN更趋近带通滤波器的特点,且更适用于处理短时信号. 文献[11]利用空洞卷积逐点预测的方法构建了一个语音合成模型效果卓著,也为“端到端”的降噪方法提供了新思路[12].
本文引进CNN结合机车信号的特点,分析经典CNN中全连接层存在的问题,提出一种针对机车信号降噪的全卷积神经网络(fully convolutional networks, FCN),将机车信号时域波形作为输入/输出,实现“端到端”的处理方式,提高信噪比. 以主流的ZPW-2000型轨道电路移频信号为研究对象,对其仿真信号和现场实测信号进行测试.
1 ZPW-2000型轨道电路信号模型
ZPW-2000型无绝缘轨道电路是在法国UM71无绝缘轨道电路技术基础上,结合国情,提高安全性和系统传输性能的技术再开发,已在我国铁路既有线、客运专线和高速铁路上广泛使用[13].
ZPW-2000型无绝缘轨道电路采用相位连续式移频键控信号,用频率调制方法把低频信号搬移到高频段,形成振幅不变、频率随低频信号幅度的变化做周期性变化的调频信号. ZPW-2000型无绝缘轨道电路信号的时域表达如式(1).
式中:A为轨道电路信号幅值;fc为载频;τ为时间;g(τ)为相移,如式(2).
式中:s(τ) 为调制信号;n=1,2,···;Δf为信号频偏;k为移频器的灵敏度;T=1/fd,fd为调制低频.
ZPW-2000型轨道电路信号信息特征[14]如表1.
表 1 信息特征参数Tab. 1 Information characteristic parameters Hz
2 针对机车信号降噪的FCN
2.1 基于原始波形的降噪模型及特点
基于原始波形的降噪模型是一种端到端的处理方法,即模型以原始时序波形作为输入,以降噪后的时序波形作为输出,以深度神经网络、CNN等结构构建降噪模型. 在时域表示信号的特征与在频域表示有很大不同:以频域法分析信号,通常计算信号的频谱,一个频点的值代表了此信号中这个频率分量的幅度. 而以时域分析信号,一个时刻的点只能代表该时刻信号的幅度,想要表示频率信息,需要结合该时刻附近的值一同分析,即在相同采样率且满足香农采样定理的条件下,信号变化的快慢表征了信号频率的高低.
从这种表示信号特征的差异性来看,频域法似乎更方便解决降噪问题,因此诞生了诸多以消除、掩蔽噪声信号频谱为目标的算法[5-9]. 但从机车信号的译码特点来看,fc及fd是未知的,是机车信号主机需要解析的. 机车信号的频率范围为1 700~2 600 Hz,对于此范围外的噪声干扰信号可以轻松通过带通滤波器过滤掉,但是对于该频带内的干扰信号,因无法甄别是否为有用信号,所以难以用频域法消除.即便可以通过计算首先解析出fc,然后设计范围更小的带通滤波器,以过滤更多的噪声,但是对于[fc−fd,fc+fd]范围内的干扰无能为力. 而时域的降噪方法则可以避免这类问题,可以通过时域相邻几个点变化的快慢来表征频率上的高低. 按照二进制移频键控调制的特点,频偏一定时,机车信号上、下边频以低频频率不断交替. 在任一载频下,如果能精确地表征出上、下边频即可达到降噪的目的. CNN因带通滤波器的特性和避免了对输入的前期预处理的优势,而得到广泛应用. 文献[10]表明卷积操作可以高效地从未作处理的时域信号提取到有用信息.更重要的是,证明了以卷积为基础的结构达到与频域法相似或更好的效果是可能的. 因此很多研究利用CNN模型来进行原始波形建模[11-12]. 本文借助CNN直接表征轨道电路移频信号的上、下边频,构建机车信号降噪模型,将无噪信号从带噪信号中还原出来.
2.2 全连接层对于构建原始波形降噪模型的不足
在经典CNN的结构中,最后一层隐层与输出层之间为全连接的方式,因而被称为全连接层,如图1.在处理一维时域信号时,这种全连接的方式导致整个神经网络很难同时表征高频信号和低频信号. 输出层与最后一层隐层之间的关系可以表示为
那么对于节点t−1、t、t+1 有
当yt为高频信号时,信号变化迅速,即yt−1、yt、yt+1有较大差异,对于同一个隐层h,则wt−1、wt、wt+1也应有较大差异. 当yt为低频信号时,信号变化缓慢,即yt−1、yt、yt+1有较小差异,对于同一个隐层输出h′,则wt−1、wt、wt+1也应有较小差异. 而经过神经网络的训练过程,权值W是固定的,这与上述yt为高频的情景相矛盾. 所以全连接层的存在使得神经网络结构难以同时表征高频和低频的时序信号. 除此之外,由于其全相连的特性,一般全连接层的参数也是最多的,导致神经网络的训练、预测效率大大下降.
图1 全连接层结构Fig. 1 Fully connected layer structure
2.3 FCN的降噪模型
2.3.1 FCN的局部连接性
在2.2节中阐述了全连接层的缺点,全连接层的存在可能导致以CNN为主体的降噪模型对载频频率不断高低变化的机车信号表征不精确. 所以这里引入不包含全连接层的FCN. FCN与CNN相似,只是以卷积层代替了全连接层[15]. 移除全连接层带来的影响,除了减少了神经网络的参数规模,还使得网络具备局部连接性,即每个时刻的输出只取决于与该时刻相邻的一些时刻的输入数据. 相关时刻的数量取决于FCN的卷积层数和卷积核的大小. 如图2所示. 假设此网络有2个卷积层,卷积核为3,经过训练后W1、W2都是固定值,那么与yt直接相关的是隐层O的Ot−1、Ot、Ot+1,输入层x与yt相关的是xt−2、xt−1、xt、xt+1、xt+2. 即使卷积层的层数增加,局部相关性仍然存在,只是相关的输入值数量会增加. 这种局部相关性也契合了轨道电路移频信号上、下边频交替变化的特点. 当xt−2、xt−1、xt、xt+1、xt+2表征频率较高的上边频时,yt也为高频成分;当xt−2、xt−1、xt、xt+1、xt+2表征频率较低的下边频时,yt则为低频成分.
2.3.2 降噪模型的结构及分析
图3为FCN降噪模型的整体结构. 相较于频域降噪方法需要将时域信号转为频率谱或梅尔频率倒谱,降噪模型输入为所需降噪的N个点的时域信号,输出为相同长度的N个点的时域信号. 卷积核的长度反映了CNN中感受野的大小,卷积核选得太小会使神经网络无法学到数据的特征,但是太大的卷积核会导致计算量暴增,不利于模型深度的增加,计算性能也会降低. 卷积核长度的选取问题上,需要保证感受野至少大于1个周期信号. 机车信号采样率通常为固定值,以8 192点/s为例,机车信号的载频频率为1 700~2 600 Hz,即每周期信号包含3~5个采样点. 所以卷积核长度应大于5,而选取太大会带来过多计算负担,经过实验,最终卷积核长度选为13.机车系信号为一维信号,所以卷积核的宽为1. 图3中L为卷积层数,C为每层中卷积核的数量. 每个卷积核与前一层的输出都会通过卷积运算产生新的波形,并传到下一层. 所以这里每个卷积核实际上在通道方向上还有一个维度,即卷积核为三维的(长,宽,深). 卷积核的深度与前一层的输出个数相同. 在卷积层之后设置文献[16]提出的批规范化层(batch normalization)以加快神经网络的训练速度. 为使得神经网络可以更好地解决较为复杂的问题,通过加入激活函数来加入一些非线性因素是常用做法. 本文采用文献[17]提出的参数化整流线性单元(parametric rectified linear unit,PReLU)为激活函数.最后一层只设1个卷积核,形成端到端的模型结构.
图2 局部连接Fig. 2 Local connection
图3 FCN降噪模型整体结构Fig. 3 Overall structure of denoising model based on FCN
3 实验验证
3.1 实验配置
实验中,FCN的输入为2048个采样点的原始波形,用到的神经网络整体结构如图4所示. 采用7层卷积层,每个卷积层有15个长度为13的卷积核,然后利用批规范化层缓解训练中的梯度消失或梯度爆炸. 每层以PReLU为激活函数, 最后一层为1个卷积核,以双曲正切函数(tanh)为激活函数,进而得到与输入信号相同长度的输出信号.
图4 神经网络结构Fig. 4 Network structure
神经网络的训练样本由仿真产生,先仿真产生幅度为1 V的无噪信号,后叠加相应的噪声. 为保证训练样本的一般性,设定无噪信号幅度为1 V,仿真ZPW-2000轨道电路信号所需的信息特征参数参见表1,随机选取载频、低频参数. 样本的噪声特性如表2所示. 带外干扰防护较简单,所以这里重点考虑工作频带内的单频干扰. 谐波干扰的幅度定义为1 650~2 650 Hz内最大谐波分量的幅度.
表2 样本的噪声特性Tab. 2 Noise characteristics of samples
3.2 ZPW-2000轨道移频仿真信号降噪效果分析
为定量评估本文算法的降噪性能,选取了均方根误差(root mean square error,RMSE)、信噪比(signal-to-noise ratio,SNR)两个指标衡量降噪结果的有效性,分别如式(5)、(6).
式中:s(i)为无噪信号;x(i)为降噪前或降噪后信号.
为验证本文算法有效性,针对表2中所列的每种噪声和全体噪声样本分别训练FCN,随机生成1 000条带噪信号的测试集,计算降噪前、后1000条信号的均方根误差和信噪比的平均值,并与CNN、带通滤波、EMD[3]和稀疏分解[4]去噪方法做对比,如表3、表4所示. 其中CNN的网络参数均通过实验调整至最佳去噪效果.
表3 本文算法RMSE结果与其他算法对比Tab. 3 RMSE comparison with various algorithms V
从表3和表4可知:降噪后RMSE相较于降噪前均有不同程度降低,SNR提高8~14 dB,即本文算法对表中各噪声均有效果. 在与CNN滤波、数字带通滤波、EMD和稀疏分解去噪方法的比较中,FCN在各类噪声上均取得更好的效果. 尤其在带内干扰上,FCN明显优于现场使用的带通滤波方法. 在与CNN方法对比中,FCN除了去噪效果优于CNN之外,FCN中的网络参数仅为CNN的10%,这意味着FCN的计算量更小,计算速度更快,这对于工程应用有重大意义.
表 4 本文算法SNR结果与其他算法对比Tab. 4 SNR comparison with various algorithms dB
图5(a)为仿真产生的一条载频为1.7 kHz机车信号的频谱,该信号受到频率为2.0 kHz的单频干扰,且干扰幅度超过了正常信号幅度,直接译码会产生错译载频的问题. 图5(b)为经本文算法处理后的信号频谱,可以看到2.0 kHz的单频干扰成分幅度显著降低且低于1.7 kHz载频幅度.
图5 载频1.7 kHz机车信号降噪前、后频谱Fig. 5 Spectrum of cab signal with 1.7 kHz carrierfrequency befor and after denoising
3.3 ZPW-2000轨道电路实际信号降噪效果分析
图6为Z54次列车发生的一起信号误译现象,列车按绿黄灯行驶过程中,机车信号译码突然变为黄灯,3 s后恢复绿黄灯. 经波形频谱分析,如图7(a)所示,机车信号输出黄灯的原因是列车在接收载频2.0 kHz,低频13.6 Hz的LU码轨道电路信号的同时接收到一个载频为2.6 kHz,低频15.8 Hz的LU2码轨道电路信号且幅度超过了机车信号内部设定的译码阈值,考虑故障-安全原则,机车信号输出LU2码,显示为黄灯,即图6中 17:33:40 时刻的灯位输出错误. 经过本文算法处理后,如图7(b)所示,载频2.6 kHz的干扰信号幅度降至原来的55.5%,且低于机车信号译码阈值,使得误译现象消失.
图6 一起信号误译示例Fig. 6 Example of signal decoding error
图7 误译信号降噪前、后频谱Fig. 7 Spectrum of decoding-error signal befor and after denoising
4 结 论
本文针对机车信号处理过程中受噪声干扰影响的问题,在分析轨道电路信号的特点的基础上,得到基于原始波形的端到端的时域降噪模型适用于机车信号的结论,并分析了神经网络中全连接层对于构建降噪模型的不足,进而提出基于FCN的机车信号降噪方法. 最后通过均方根误差和信噪比两个指标对本文算法予以验证. 在随机生成带噪信号的实验条件下,采用本文方法机车信号的信噪比得以提升8~14 dB. 对实际机车信号中误译信号进行处理后误译现象消失. 本文提出的方法极大地改善机车信号处理性能,在带内干扰方面能够克服现有方法的不足. 有利于保证列控系统地车传输的可靠性和安全性,提高运行效率.