APP下载

基于Resnet的雷电电场波形识别与分类

2023-09-04张潇艺王彩霞田杨萌

计算机仿真 2023年7期
关键词:雷电电场波形

张潇艺,王彩霞,田杨萌,杨 辉

(1. 北京信息科技大学,北京100192;2. 南方海洋科学与工程广东省实验室(广州),广东 广州511458;3. 南方科技大学,广东 深圳518055)

1 引言

雷电是非常常见的一种气象灾害,一般在雨季比较频发,对人们的生活和生产都有很大的影响[1],被联合国有关部门列为最严重的十种自然灾害之一,其自身产生的高温、猛烈的冲击波以及强烈的电磁辐射等物理效应,能在瞬间产生巨大的破坏作用,对人身安全、基础设施、工业生产、建筑物、森林生态、国防事业等都具有非常大的危害,由此雷电的观测与监测将成为防雷减灾工作的重要组成部分[2]。由于雷暴发生时雷电探测网具有多个观测站且每个站观测到的电场数据量庞大,单靠人工去识别会很难分辨并且耗时较长,也很难做到实时定位。雷电进行识别分类后可以根据得到的不同类型闪电做出相应的防护措施,现有的利用模糊识别技术[3]对地闪信号和云闪信号进行识别,但是适当的隶属度函数往往难以建立, 故限制了它的应用;还有闵可夫斯基距离法[4],该方法需首先提取多个云闪信号和地闪信号, 将其平均值作为对应类型闪电的标准值,但该方法不允许样品有相当程度的干扰,否则会很大程度的影响识别结果;田茂教授设计了一种能够完成帧-帧背景去除算法的闪电识别系统[5],该系统能够实现2.88Gbps焦面数据的实时接收与处理, 主要完成高速数据流的接收, 背景信号评估、背景信号去除、阈值选择、闪电信号判断、闪电强度排序和闪电事件编码等工作[6]。闪电识别系统最重要的任务就是从高速的背景信号中检测出闪电事件[7], 并输出闪电事件的位置、强度、背景评估值[8]和阈值等信息。但是由于所需设备过于繁琐,步骤不够简洁,导致识别效率不高;李鹏君[9]采用多层BP网络来识别闪电类型的方法,BP网络得名于误差反向传播算法(Back Propagation Algorithm)[10],该方法从采集到的数据中获得到光电同步数据,总体识别效果基本能够达到要求, 但是由于云间放电过程比较复杂,采集到的电场信号数据少,这在一定程度上影响了识别结果。

平时看的书、车辆的车牌、股票的走势图等各种文字及线条图形,为了方便计算机的运算和编辑,需要把这些转为计算机中的字符格式[11],但是传统的人工识别方法已经远远不能满足对该图像的识别的需求,速度慢、人工成本高,这时能够对自动对图像进行识别的算法是迫切所要得到的。在人工智能技术不断发展的时代背景下,图像识别作为人工智能的一个重要方面,在各个领域得到了广泛应用[12]。卷积神经网络(Convolutional Neural Networks,CNN) 是一类包含卷积计算的具有深度结构的前馈神经网络,其核心为卷积层,层参数由内核和滤波器组成。神经网络CNN算法相对于传统图像识别算法和基于区域的目标检测算法在对于电场波形更为适用,但卷积神经网络具有多种算法模型,如 AlexNet、MobileNet、ResNet、VG-GNet和GoogleNet等均为CNN的主流算法,这些算法都可针对图像对象进行识别。相比其它算法,CNN算法比较简洁明了,并且模型训练时间快,该算法的时间开销很小,预测效果好,并且对异常值不敏感。基于以上分析,提出建立基于深度学习算法的图像识别模型,对于获取较多的电场波形数据,选用机器学习CNN算法[13]实现对雷电电场波形的快速识别和分类。

同时为提升模型识别效果,本论文在使用Lenet5模型的基础上进一步研究Resnet模型对雷电电场波形的识别效果。 其次在自然闪电探测方面,对雷电的类型进行分类记录是其中的一个重要内容,利用中科院大气物理研究所雷电探测网2008年夏季在北京清河、怀柔两个站点的大量原始观测数据,在时域波形上统计分析了闪电快电场信号的特点,选取5个特征值作为数据集分类的判定标准。另外数据集中的图片大小固定,利用数据增强也可以辅助性的提升一部分的图片性能以使得训练的时候更加稳定,更加容易收敛。这将有助于现场实时性数据的采集和记录,并对采集到的图像数据进行及时的判断反馈,以快速获取雷电定位信息达到实时定位目的,这对雷电、雷暴过程观测预报预警等具有非常重要的现实意义。

2 CNN网络架构

近年来,深度学习已成为学术研究热点,其中研究最多的是卷积神经网络模型,卷积神经网络是一种监督学习算法,广泛应用于模式识别领域。一般是将原始信号处理变换成时域图像、频域图像或时频图像,然后用卷积神经网络对这些图像进行分类识别。

卷积神经网络基本架构为Lenet5,模型包括输入层、隐藏层和输出层,其基本结构如图1所示:

图1 卷积神经网络基本结构示意图

1)输入层:在使用CNN网络进行图像识别时,需要将具有宽度、高度、深度的图片集输入。在这里深度为图像存储每个像素所用位数,输入图片大小可以根据需要进行设置。

2)卷积层:卷积层由若干卷积核组成。卷积核可以提取输入图片的不同特征,浅层卷积层只能提取一些低级的特征如角、线型和边缘等,深层的网络可以从低级特征中迭代提取更复杂的特征。

3)激活层:激活层可通过非线性环节来加强模型的拟合能力,突出图像的特征,有利于实现后续的特征识别,也有效解决了梯度消失而造成神经网络的收敛速度过慢的问题。依据不同的模型选择不同的激活函数,常见的激活函数有Sigmond,Tanh,Relu。本文使用Relu做为激活函数,因为Relu函数可以有效避免梯度消失并加速模型收敛。

4)池化层:在卷积后使用池化操作来降低图像矩阵的维度,并且保持大部分重要信息。池化有最大值池化(Max Pooling)和平均值池化(Average Pooling)。最大值池化是将图像平均分割,每个分割块取最大值;平均值池化则是取每个分割块的平均值。采用池化并不会影响识别结果,且可有效保留图像特征信息,极大提升训练效率。

5)全连接层:全连接层中每个神经元与前一层的所有神经元进行全连接,可以进行数据降维,并整合卷积层中具有类别区分性的局部信息起到分类器的作用。

6)目标函数及优化函数:本文使用交叉熵损失函数做为目标函数使用Adam做为优化函数,首先通过不同类型间的概率分布计算出损失值并通过反向传播求得各节点梯度。最后通过可动态调整学习率的Adam函数对各节点数值进行优化并往复执行此过程直至到达停止条件。

为提升模型识别效果,本论文在使用Lenet5模型的基础上进一步研究Resnet模型对雷电电场波形的识别效果。Resnet模型[14]它有效解决了堆叠更多网络层但不能提升网络性能的问题。其利用残差连接的方式在多层卷积中添加短接,使得网络层的整体表现不会因为层数增加而衰减变差。如图2所示,x为估计值(也就是上一层Resnet输出的特征映射),F(x)为残差映射函数,F(x)+x为观测值,图中weight layer代表着卷积操作,一般一个残差部分包含2-3个卷积操作,将卷积后的特征图与x相加得到新的特征图。

图2 Resnet残差卷积神经网络结构示意图

3 自定义数据集

在对自然闪电探测方面,对雷电的类型进行分类记录是其中的一个重要内容,目前多数探测网主要是使用闪电电场时域信号的一些特征进行分类[15]。本文利用中科院大气物理研究所雷电探测网2008年夏季在北京清河、怀柔两个站点的原始观测数据,在时域波形上统计分析了闪电快电场信号的特点(如图3中波形所示)选取5个特征值,即信号持续时间、到达峰值(90%极大值)时间、脉冲上升沿(10%~90%极大值)时间和脉冲宽度(半宽)时间,信号上升陡度[16],作为数据集分类的判定标准且保证数据量充足[17],将电场信号分类如图3所示,每一类由观测数据制作的样本如表1所示。在制作数据集的时候利用预处理层对原始数据进行规范化处理,数据集中的图片大小固定,图片尺寸为224×224。另外利用数据增强也可以辅助性的提升一部分的图片性能以使得训练的时候更加稳定,更加容易收敛。

表1 自定义数据集分类

图3 电场波形分类展示

另外,制作的数据集将其分成三部分:训练集、验证集和测试集,各个部分的样本划分分别如表1所示。

4 识别结果分析及模型优化

4.1 初步识别结果分析

基于最初构建的CNN网络模型基础上得到的电场波形识别准确率仅为40%左右,该准确率过低。通过对识别错误的图片特征进行分析,发现这可能由于下面的原因造成,其一所采集到的电场数据波形因为受到一些外界的干扰,如附近通信信号干扰、高压电力塔及变电站内的电力设施等干扰,会导致波形产生一定的畸变;另外当采集雷电电场波形数据的过程中,难以保证闪电的单一性,可能几个闪电过程会同时发生,产生叠加效果,这时测得的电场是叠加电场波形,也会造成波形与分类标准波形产生偏差,影响分类准确率。其二,最初搭建的CNN网络模型结构为Lenet5模型,其首先通过卷积层与池化层提取数据特征最终经过全连接神经网络进行数据分类,但由于模型结构过于简单在训练中容易出现过拟合从而无法达到训练目标。

4.2 模型优化

由于最初构建的CNN网络模型在电场波形识别研究中识别准确率过低,故这里考虑对网络模型进行优化以提高识别率,最终选用结构更为复杂的Resnet残差卷积神经网络作为网络模型。为提高模型识别准确率与模型泛化能力,分别从数据集优化与模型训练两个方面对模型识别结果进行提升。

数据集优化部分首先扩充雷电数据集,获取更多精准雷电电场波形数据,接着对已有数据进行标准化(Normalize)操作,然后对已有数据进行随机剪裁(RandomRotation)操作。其中扩充雷电数据集可以增加数据多样性,同时降低波形中的干扰噪声,提高模型识别准确率。数据标准化其作用是将数据按比例缩放使之标准化到一个小的特定区间,从而缩短训练所需时间并提升模型准确率。旋转图片数据,通过对数据的旋转操作有利于提升模型泛化能力。

模型训练优化首先通过优化批大小(BatchSize)、学习率(LearningRate)、添加BatchNorm2d函数层,添加正则化系数等操作逐步实现图像识别率的提升。首先,将训练集中全部样本训练次数(epoch)设置为30,调整批大小参数对模型识别结果进行优化,如图4(a)所示,当批大小选择64时模型识别准确率最高达到56.82%。其次,调整学习率参数对模型识别准确率进行优化,结果如图4(b)所示。当学习率选择0.001时模型识别准确率最高达到64.77%。再次,对模型添加BatchNorm2d函数层并对模型识别准确率进行优化结果如图4(c)所示。通过观察可以得出增加BatchNorm2d函数层可提升模型识别准确率到70.45%。随后,对模型添加正则化项,优化结果如图4(d)所示。通过图4(b)可以发现当epoch=30且加入正则化项后出现了欠拟合,通过实验发现当epoch提升至50时最高准确率出现在epoch为38时,即加入正则化项且当epoch=38时取得最好成绩,其识别准确率为72.16%。

图4 模型训练及逐步优化结果对比

最后,引入残差卷积神经网络(Resnet)预训练模型,将模型识别准确率达到90.17%,如图4(e)所示。

由图4可知随着模型的逐步调整及优化,模型训练的识别率在逐步提升,由最初的40%左右到90%以上,说明模型优化具有必要性且具有很好的提升识别率的效果,提升效果非常明显,基本能够达到专业方面的实际需求。

5 结论

本文针对雷电电场波形分类识别问题,搭建了基于机器学习的Resnet卷积神经网络训练检测模型,并对模型进行逐步优化使识别率不断提升,给出了一种识别率较高的卷积神经网络图像识别方法。得到的结论如下:

1)使用机器学习框架搭建Resnet卷积神经网络模型,通过3200 张来自现场采集的雷电电场波形图像构建数据集进行训练与测试,并通过多项优化,最终该模型识别分类的准确率可达到 90.70%,说明该方法可有效用于现场雷电分类识别,有助于实现快速获取雷电定位信息,达到实时的定位目的。这将对雷电、雷暴过程观测预报预警等具有非常重要的应用价值。

2)将深度学习卷积神经网络技术与雷电电场波形分类相结合,提出针对雷电、雷暴现场监测及预警的前期解决方案。未来此技术可应用于其它雷电现场不安全因素的识别,进一步实现雷电安全监管的自动化与智能化。

致谢:感谢中科院大气物理研究所2008年夏季在北京地区进行雷电探测网观测的所有参与人员及相关单位和老师。本课题由国家自然科学基金(41974122,41375012)、南方海洋科学与工程广东省实验室(广州)人才团队引进重大专项(GML2019ZD0203)、深圳市科技计划资助(项目编号:KQTD20170810111725321)共同资助。

猜你喜欢

雷电电场波形
巧用对称法 妙解电场题
雨天防雷电要选对雨伞
对《压力容器波形膨胀节》2018版新标准的理解及分析
雷电
基于LFM波形的灵巧干扰效能分析
电场强度单个表达的比较
计算机机房的雷电防护
电场中六个常见物理量的大小比较
基于ARM的任意波形电源设计
大连台使用CTS-1记录波形特点