APP下载

基于CNN-LSTM混合模型的工频磁扰动信号预测

2021-11-25葛友铖文仕强

自动化与仪表 2021年11期
关键词:工频扰动卷积

田 斌,葛友铖,梁 冰,文仕强

(武汉工程大学 电气信息学院,武汉430205)

在过去探测铁磁性目标研究中,地磁探测[1]占据主角地位,然而随着各国军事力量的壮大,出现了一批低噪声、低热辐射的铁磁性目标,这些“新型”目标对地磁探测、声学探测[2]和光学探测[3]等传统探测手段提出了新挑战。工频探测相较于传统探测手段,具有实时探测、大范围遥感探测、动静目标探测等优良特性。世界各国高压输/变/用电网络可以产生一个强度稳定、分布广泛、可探测的工频磁场[4],当工频磁场和铁磁性目标相互作用时,铁磁性目标的存在会改变整个空间的磁场分布,造成磁场局部异常,从而产生一种工频磁扰动时序信号。

关于时序信号的处理问题,通常有3 类模型(统计模型、机器学习模型和深度学习模型)帮助解决。统计模型主要包括自回归滑动平均(ARMA)模型和卡尔曼滤波(KF)模型。例如文献[5]通过建立ARMA 模型对某地区用电量异常数据进行识别与预测,预测结果的误报率保持在6%以下。然而,统计模型预测的准确率一般;机器学习模型主要有支持向量机模型(SVM),BP 神经网络模型和随机森林(RF)等。例如文献[6]提出一种基于混沌类电磁学(CEM)优化支持向量机(SVM)的短期负荷预测方法,预测模型的最大误差在3.02%以内。但机器学习模型也存在特征提取能力较弱,泛化能力一般等缺点。

针对以上统计模型及机器学习模型的缺点,本文将引入深度学习模型,并提出了一种CNN-LSTM混合模型,该模型同时具备CNN 网络的特征提取能力和LSTM 网络的时序信息表达和预测能力。

1 CNN-LSTM 混合模型介绍

1.1 卷积神经网络(CNN)

卷积神经网络(CNN)是一种包含卷积计算和深层次结构的深度前馈神经网络[7],它被广泛运用在图像分类、目标识别、自然语言处理等领域。

一个典型的CNN 网络包含5 个部分: 输入层、卷积层、激活函数层、池化层和全连接层。其中卷积层作用是提取输入的特征信息;激活函数层是使样本输出的特征具有非线性特性;池化层作用是进一步对卷积操作得到的特征映射结果进行处理;全连接层是把前面几层所提取到的特征进行非线性组合。卷积运算的过程表示为

式中:S 为输出的特征序列;I 为输入数据;K 为卷积核。

1.2 长短期记忆网络(LSTM)

传统的RNN 网络在处理输入序列的长期依赖时[8],会产生梯度下降或梯度消失的问题,为了解决该问题,文献[9]在1997年提出了LSTM 网络。LSTM本身就是RNN 中一种特殊的循环体结构,其单个神经元结构如图1 所示。

图1 LSTM 单个神经元结构Fig.1 LSTM single neuron structure

LSTM 由3 个门控单元(输入门、遗忘门和输出门)、1 个细胞态、1 个候选态和记忆体组成。其中门控单元是使用Sigmoid 激活函数对输入的信息进行控制的结构,输入门是用来确定向记忆体状态中添加的新信息,输出门表示输出当前细胞状态的信息,遗忘门则将细胞状态中的没用的信息选择性遗忘,细胞态表示长期记忆,记忆体表示短期记忆。每个部分的计算过程如式(2)~式(7)所示:

式中:xt表示当前时刻的输入特征;W 和b 分别表示各单元结构的待训练参数矩阵和偏置项;σ 表示Sigmoid 函数。

1.3 CNN-LSTM 混合模型

在实际情况中,目标产生的微弱工频磁扰动信号,会受到恶劣天气、居民用电设备以及复杂观测环境等因素的影响,呈现出低信噪比、微弱难提取等特点。单一模型很难保证模型的训练效果,预测结果的准确率会大大降低,而混合模型能有效改进单一模型的缺点,它能充分提高磁扰动信号预测的准确性,增强工频磁场对铁磁性目标的探测能力。

2 工频磁扰动信号预测模型建模

模型总体设计的思路为:首先,利用低噪声、高灵敏度感应式磁力仪[10]采集外场试验数据(0~250 Hz),通过快速傅里叶变换(FFT)提取原始数据中50 Hz 的时间序列数据{fn},进而对{fn}进行分析和预处理;其次,将处理后的数据送入模型中的卷积层和全连接层,完成特征工程(特征提取和特征融合);最后,数据通过LSTM 层后输出,实现时序信息的表达与预测。

2.1 数据分析

目标在工频磁场下产生的扰动信号是连续时序信号f(t),将传感器采样率设置为500 后进行采样,得到离散时间信号f(n·Δt)=fn,(n=0,1,2,…,N-1),其中N 是信号长度,再通过FFT 转换成{fn},提取一组正常状态下(无目标)与扰动状态下(有目标)的信号数据,用Matlab 分别绘制出50 Hz 数据,如图2 和图3 所示。

图2 正常状态下50 Hz 数据Fig.2 Under normal condition 50 Hz data

图3 扰动状态下50 Hz 数据Fig.3 Under disturbance 50 Hz data

图中横坐标代表测量时间,单位s,纵坐标代表磁感应强度,单位nT。从图2 可以看出,无目标时,工频背景场可以近似看作一个较为稳定的正弦波,磁场强度在0.2~0.6 nT 之间波动; 从图3 可以看出,目标物(车辆)出现时,传感器测到了明显的工频磁扰动信号,且不同目标物引起的磁扰动信号强度有所不同。目标1 为电瓶车,体积小、含铁量少(磁导率较低)、速度慢,引起的磁扰动信号强度约为0.88 nT;目标2 为小轿车,体积大、含铁量多(磁导率较高),速度快,引起的磁扰动信号强度约1.28 nT,但目标物1 和目标2 引起的磁场强度均高于背景场平均值0.4 nT,可以初步推断铁磁性目标与工频磁场相互作用产生的电磁扰动信号与目标物本身的磁导率以及运动状态有关。

2.2 数据处理

数据处理分为2 个部分:缺失值填补和数据集归一化。

1)传感器、数采卡等探测设备故障时可能导致数据缺失,针对缺失数据,本文将采用线性插值法填补缺失值,即用t-1 与t+1 时刻的数据填补t 时刻的缺失值,具体计算公式为

2)为了加快训练时梯度下降的速度,避免由目标物产生过大的扰动信号对预测结果产生影响,数据集在送入到神经网络训练前要进行归一化处理。其计算公式为

式中:x 为转换前的值;xnorm为归一化的值;xmax为样本的最大值;xmin为样本的最小值。

2.3 模型各层参数及训练流程

通过数据分析和预处理后,将高质量的数据集按时间顺序划分为2 个子集(训练集和测试集)送入到混合模型。模型各层参数具体设置如下:卷积核个数为64,大小为1×1;激活层使用Relu 激活函数,目的是产生更多的稀疏性,避免梯度消失;LSTM 层设置为2 层,其神经元个数分别是80 和100,并增加2 层Dropout 层(rate=0.2)避免过拟合;优化器Optimizer 采用Adam 算法。CNN-LSTM 混合模型参数如表1 所示,神经网络训练流程如图4所示。

图4 CNN-LSTM 训练流程Fig.4 CNN-LSTM training flow chart

表1 模型各层参数Tab.1 Parameters for each layer of model

3 算例分析

3.1 实验数据

本文使用的测量系统由1 台单轴感应式磁力仪、1 块电池组和1 个数据采集器组成,其中磁力仪量程为±200 nT,工作电压为±5 V,即灵敏度为40 nT/V。实验数据来源:本课题组于2020年9月11日前往湖北省红安县金沙河地区,进行了工频探测目标(车辆)外场试验,共采集到21744 组磁信号数据。把这些数据集划分为80%的训练集和20%的测试集,训练集用于找出最佳的权重和偏置,测试集用来评估模型性能的好坏和预测效果。

3.2 实验结果

将训练样本送入到CNN-LSTM 网络中训练,得到损失函数,如图5 所示。可以看出,训练集和验证集损失曲线随着迭代次数的增加而降低,当达到一定次数后会趋于一个平稳值。

图5 CNN-LSTM 模型的损失函数Fig.5 Loss function diagram of CNN-LSTM model

训练完毕后,为了验证本文CNN-LSTM 混合模型的优越性,同时还采用了单一的LSTM 模型进行预测,CNN-LSTM 混合模型和单一LSTM 模型实验结果分别如图6 和图7 所示。

图6 CNN-LSTM 模型预测结果Fig.6 CNN-LSTM model prediction results

图7 LSTM 模型预测结果Fig.7 CNN-LSTM model prediction results

两个模型的预测评估指标对比如表2 所示。

表2 模型预测评估指标对比Tab.2 Model prediction evaluation index comparison

根据两个模型的预测结果和评估指标对比可以看出,CNN-LSTM 模型预测的整体趋势和真实趋势更吻合,特别是在峰值处的预测值和真实值十分贴近,更容易判定目标物的存在。此外,相对于单一的LSTM模型,本文提出的CNN-LSTM 混合模型使得磁信号数据在时间维度上的特征更容易提取,更有利于解决铁磁性目标存在的多特征维度和时序特征问题。

4 结语

为了充分发挥工频磁场在目标探测领域的推广应用,完善铁磁性目标探测机制,提高磁扰动信号预测准确性,本文引入了深度学习模型,深度学习模型的优点在于能够随着训练样本量的增加以及数据特征的多元化变化,可以有效提升模型对数据分布规律的总结与表达。

同时本文提出了一种CNN-LSTM 混合模型,通过CNN 提取到磁信号特征信息,减少了原始特征的损失,再利用LSTM 进行拟合和预测,可以更清楚表达信号中的关键信息。下一阶段目标是使用三轴磁力仪采集更多特征的信号,丰富磁信号数据集,进一步提升混合模型的预测性能。

猜你喜欢

工频扰动卷积
Bernoulli泛函上典则酉对合的扰动
基于3D-Winograd的快速卷积算法设计及FPGA实现
(h)性质及其扰动
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
浅析工频过电压故障研究
小噪声扰动的二维扩散的极大似然估计
浅议交流工频耐压试验
可穿戴式工频电场测量仪的研制
用于光伏MPPT中的模糊控制占空比扰动法