基于BP神经网络和大气电场特征的地闪雷电预测方法
2018-12-14,,,,,,
, ,,, , ,
(1.国网电力科学研究院 南瑞集团公司,南京 211106; 2.国网电力科学研究院 武汉南瑞有限责任公司,武汉 430074; 3.电网雷击风险预防湖北省重点实验室,武汉 430074;4.武汉大学 计算机学院,武汉 430072)
0 引言
近年来,中国因为雷电灾害造成了巨大的经济损失与人员伤害[1-3],联合国已将雷电灾害列为最严重的自然灾害之一[4]。国内外已经利用卫星、雷达等设备采集雷电相关信息并在相应算法支持下展开了一系列雷电预警工作。郑东等利用大气中不稳定度参数对雷电进行潜势预报[5]。孟青等人分析了雷电检测系统和地面电场仪在雷电预警中的应用。吕伟涛利用卫星、雷达、闪电定位仪等观测资料,集成了决策树以及区域识别、跟踪和外推等方法,建立了雷电临近预报系统[6]。在众多雷电预警方法中,神经网络方法被广泛的使用。陈勇伟等人利用2008的资料基于探空数据所建立的BP神经网络模型,预报了2009年6—8月的南京地区的雷暴情况[7]。张强等人提出了一种基于改进遗传算法优化小波神经网络的雷暴预测方法(IGAWNN)[8],该方法利用聚类分析和牛顿迭代法对多种群遗传算法的收敛方向和精度进行了改进,避免了种群同质化与局部最优问题,采用改进的遗传算法对小波神经网络的初始权值阈值进行了优化。杨仲江等[9]人选取与雷暴发生相关性较好的探空因子作为预报因子,对其进行归一化处理,输出采用两级分类,构建双隐层的BP网络,并应用独立样本进行预报检验。
以上基于神经网络方法的雷电预测主要基于探空数据,包括特定气压下的温度、露点温度、风速、风向以及可降水量等。本文旨在针对保护地面物体如输电网络而进行云地间雷电预测,因此本文后续部分,雷电均指代为地闪,并且选择通过地面大气电场仪获得的地面附近的大气电场作为预测依据[10]。地面大气电场仪具有部署方便,可覆盖面积广,可实时连续监测的特点。 传统的基于大气电场的地闪雷电预警方法有阈值预警[11]、电场分级预警[12]和动态设定阈值方法[13]等。但是这些阈值需要人为设定,如何优化地选择这些阈值本身是一个难点,而且对于不同地区,阈值的取值范围也存在差异。
基于以上大气电场在对地闪预警的优势,本文提出以大气电场作为预测依据,利用BP神经网络模型构建地闪雷电预测方法。
1 方法
地面大气电场仪在监测时,利用电荷探头感应空气中的电荷变化,通过计算转换成相应的电场强度,连续采集可以形成雷电发生过程的大气电场时序数据[14]。一段时间内的电场时序波形包含了雷电发生的电场变化特征,可用于雷电预测。以往单一电场强度阈值的方法效果不佳说明雷电发生的电场预测特征远比单一电场强度复杂。因此需要更为有效的方法来描述预测特征与雷电发生的关系。
笔者选择使用神经网络模型预测雷电是基于3个原因: 1)神经网络学习能力强,可以从积累的电场历史数据学习到雷电发生的规律。 2)神经网络可以刻画大气电场特征和雷电之间的非线性关系。神经网络有很多种类型,本工作使用BP神经网络,多层前馈利用反向递推修正权值,使其具有很强的自学习和容错能力。3)如前所述,虽神经网络在基于探空数据的雷电预测方面取得了效果,但还未系统地应用到基于地面附近大气电场的情形,还需进一步研究与应用。
神经网络的构建需要考虑于网络的结构和特征编码。网络结构上,包括网络层数及每层的结点数,本方法通过实验讨论多种参数情况,帮助在具体问题中确定优化值。特征编码上,考虑采用直接式和特征式编码。
1.1 BP神经网络模型
从结构上,BP网络模型具有一层输入层、至少一个隐含层和一个输出层的层次结构。本文使用3层结构,见图1,输入数据从输入层通过隐含层的一系列映射最后从输出层输出,得到输出结果,并通过激发函数与训练信号相减得到误差,再通过神经网络反向修改各层之间的权重,从而达到学习的效果。
图1 BP神经网络结构Fig.1 structure of BP neural network
BP模型训练算法是一种有监督学习算法。通过设定一个误差函数,在其斜率下降的方向上不断计算该网络的权值和偏差从而达到不断逼近期望的目的。网络误差根据每次计算的权值和偏差传播反馈给每个层,其学习过程如下:
步骤一(确定参数):设置目标输出、预期平均误差、隐含层和输出层的神经元节点数、初始化阈值和初始化权值等。
步骤二(归一化样本数据):
(1)
步骤三(前向传输):计算各层输入和输出。
(2)
(3)
式中:h是隐含层;k是第k个样本;是第h个隐含层节点与第个输入层节点之间的连接权值;bh指的是神经元的阈值;who和则分别指的是第h个隐含层节点与第o个输出节点之间的连接权值和神经元的阈值;yio为经过神经网络计算后的输出值。
步骤四(逆向反馈):设激活函数为f(x),E为误差。计算完误差率后,利用误差率对权重和阈值进行更新,其中λ为学习速率
Δwij=λEj·yi0
(4)
wij=wij+Δwij
(5)
Δbj=λEj
(6)
bj=bj+Δbj
(7)
1.2 编码方式
提高地闪预测精确度除了优化BP神经网络模型的结构和参数外,还需要考虑不同的编码方式建立输入变量与输出变量之间不同的映射关系。本文输入变量编码主要关注使用多长时间观测大气电场值以及是直接使用电场值还是从电场值中抽取的特征作为预测特征;预测距离决定了预测的时间远近;预测目标考虑是直接预测指定未来某个时刻的电场值还是指定预测距离后的一段时间内是否会出现地闪的事件。下面具体讨论3种预测情形。
1.2.1 时间序列到电场值的映射
此种映射关系是最直接的预测,见图2。
图2 时间序列数据到电场值的映射Fig.2 Mapping from EF time series data to EF value
通过使用指定宽度窗口的电场值(虚线矩形框部分)直接预测未来(由预测距离参数决定)某时刻(点目标预测值,圆圈标识)的电场大小。如果能有效地得到电场目标值,便可利用其大小判断是否会出现雷电,从而达到预测雷电的目的。
1.2.2 时序特征到电场值的映射
大气电场仪采样频率为1Hz,即每秒一次,当窗口宽度比较大时,导致BP输入维数过多,而且相邻两秒之间的电场变化可能较小,造成信息冗余。所以,考虑从电场时序数据中提取特征作为模型的输入。见图3,对于一个窗口的电场时序过程(虚线矩形框部分),本文选用其最大值、最小值、平均值、方差、线性拟合的斜率和截距总计6个特征代表该过程,直接预测未来(由预测距离参数决定)某时刻(点目标预测值,圆圈标识)的电场大小。
图3 时序特征到电场值的映射Fig.3 Mapping from EF time series features to EF value
1.2.3 时域电场特征到雷电发生的映射
由于雷电过程中电场变化剧烈,而且最终目标是预测雷电的发生,所以将预测目标由未来某时刻点的电场值变为未来一段时间内雷电的发生情况。见图4,预测目标不再是未来某时刻的电场值,而是未来某时刻后一段时间内是否有雷电事件(图4中右侧的虚线矩形框部分)。即将模型从特征值到电场值的映射转化为特征值到事件的映射。
图4 时域电场特征到区间雷电发生的映射Fig.4 Mapping from EF time series features to occurrence of lighting in window
2 实验
2.1 数据准备
本实验包括大气电场数据和雷电数据。雷电数据由雷电定位网给出雷电发生的位置、时间和强度信息。预测使用的电场数据来自位于江苏利港(120.079 E,31.991 N)的大气电场仪从2016年2月至12月的雷电记录。电场仪型号为场磨式AMEO340,其敏感指标为20 km[15],所以在选择有效监测雷电范围时,以大气电场仪为中心,半径20 km内的雷电记录视为电场相关有效雷电记录。
在一个连续大气电场监测过程中,大部分情况下,天气处于平稳,电场时序数值呈现平滑稳定的形态。为此,首先需要从数据中提取出潜在与雷电相关的电场波动部分。本工作将单点场强绝对值超过0.3 kV,间隔5 min内的相邻数据相连,组成目标时间段。时间段内平均场强绝对值超过0.4 kV的选入实验样本。进一步通过雷电定位数据划分电场预测雷电的正负样本,即电场波动过程中有雷电发生划为正样本,无雷电发生则划为负样本。由于雷电发生有一个持续过程,每个样本的数据宽度取120 min。最后一共提取了符合标准的样本430个,其中包括389个负样本和41个正样本。
2.2 验证方法
对雷电进行预测实验时,采用交叉验证的方法。针对电场连续值预测采用均方误差法,针对雷电事件预测采用真假阳性率来衡量预测效果。
2.2.1 留一法交叉验证
每次将样本分为两部分,每次取一个样本作为测试用例,其余样本作为训练集。假设有K个样本,则轮流将其中一个样本作为测试集,剩余K-1个样本作为训练集,循环K次,直至每个样本均被测试过。留一法样本利用率最高,适合于小样本的情况。
2.2.2 均方误差
均方误差是指参数估计值与参数真值之差平方的期望值,记为MSE。MSE是衡量“平均误差”的一种较方便的方法,MSE的值越小,说明预测模型效果越好。
(8)
2.2.3 真阳性率和假阳性率
真阳性率(TPR)又称灵敏度,体现模型对正样本的识别能力。TPR越高则模型对雷电事件的检测效果越好。假阳性率(FPR)又称1-特异度或虚警率,体现模型误报的程度,FPR越低则模型为获得高预测率花费代价越低。
2.3 实验结果
本文模型和预测实验均在MATLAB 平台下实现完成。
2.3.1 电场时序值预测未来电场值
在41个正样本上采用留一法交叉验证。BP神经网络的隐含层节点数设为10,采用levenberg-marquardt backpropagation算法训练。时间窗口宽度设为5 min,预测距离为12 min,从开始时间点向后滑动窗口。依次比较预测的电场值与真实电场值,计算MSE指标评估结果
41样本的MSE结果见图5,ID为实验测试样本编号。
图5 留一法MSE结果 Fig.5 MSE of samples
MSE显示预测效果最好的对9号样本的0.19,最差的是对25号样本的13.15。图6给出了两种情况下的真实值与预测值对比,其中实线为真实值,虚线为预测值。
图6 MSE最大和最小值对应的预测结果Fig.6 The prediction results of samples with max and min MSE
可见该方法对于大气电场的变化趋势有一定的预测效果,但是电场值的绝对准确性欠佳,特别是高频、波动大的情况。
2.3.2 电场时序特征预测未来电场值
将输入数据改为时间窗口宽度为5 min内连续电场值提取出来的6个特征指标,预测距离依然为12 min,预测未来的大气电场值。预测结果的MSE见图7。
图7 各样本MSE Fig.7 MSEof samples
从图中可见,利用电场特征进行预测,并没有比直接利用时序电场值减小更多的MSE误差,甚至在某些样本上,MSE反而增加了。对比预测曲线和真实曲线,相比于前一种编码方法,基于特征编码的预测曲线更为平滑(图6和图8中,25号样本),失去了部分的高频信息,但趋势更为相近。在电场温和变化情况下,基于特征编码的效果更好,在9号样本上,电场的预测更接近真实情况(图6和图8中,9号样本)。而且从输入量上,特征编码由原来的300维降低为6维,依然可以达到类似的结果,说明这6个指标可以概括这一段时间的电场特征。
图8 MSE最大和最小值对应的预测结果Fig.8 The prediction results of samples with max and min MSE
分析直接预测电场值效果欠佳的主要原因:1)电场存在剧烈突变。2)收集到的训练数据有限。但是介于BP神经网络已经能预测大气电场变化趋势的事实,当训练样本量增加时,电场预测精度会有进一步提高的空间。
2.3.3 时序电场特征预测未来雷电发生
直接预测电场值的效果欠佳和6维特征在预测效果上已经能等同于300维电场输入的事实,第3种方法保留采用特征编码方式,并扩大训练窗口宽度。时间窗口宽度扩大到30 min,从中提取电场值的6个特征,预测距离设为15 min,预测目标变为预测距离的15 min后再过15 min的这段时间内雷电事件(即图4中右侧的虚线框内的雷电事件)。
在默认参数值下:隐含层节点数为10,最大验证次数为6,模型的测试结果为TPR=0.984 615,FPR=0.098 901。考虑到BP神经网络的隐含层节点数对BP神经网络预测精度有较大影响:节点数太少,网络不能较好地学习,需要增加训练的次数,训练精度也受影响;节点数如果太多,训练时间将会增加,网络容易出现 “过拟合”现象。固定最大验证次数为6,考查隐含层节点数对结果的影响,图9显示不同隐含层结点数对预测结果的影响。
图9 隐含层节点数对预测性能的影响Fig.9 The influence of cell number in hidden layer on the prediction performance
当神经元节点数大于38时,训练模型的TPR稳定保持在较高的水平上。当节点数大于42时,FPR随着节点数的增加逐步下降,节点数到50时降至0.09。因此,认为结点为50时是最优隐含结点参数。
在训练过程中,每一次训练都会使用验证集测试模型的性能。当误差下降到连续n次训练均不改变时,便停止训练,这里的n即为最大验证次数。最大验证次数的作用在于确保模型拟合程度合适,该属性过大会导致过拟合从而使模型泛化能力下降,反之会导致模型还未学习完便被停止。
在隐含层神经元节点数为50并且其他参数为默认的情况下,图10显示随着最大验证次数的不断增加,TPR和FPR不断减小。TPR最大为0.991 2,FPR最大为0.114 3。当最大验证次数达到13次的时候,TPR滑坡式下降。经分析,这是因为模型过度拟合,导致泛化能力下降。
图10 最大验证次数对性能的影响Fig.10 Impact of maximum number of validations on performance
3 结论
讨论了基于大气电场数据,在BP神经网络模型上3种编码方式的雷电预测效果。尽管直接预测大气电场值是最为直接的方法,但由于大气电场变化迅速,导致对于电场的直接预测达效果欠佳。这与雷电过程中电场模式复杂有直接联系。在实际应用过程中,必须收集足够多的训练样本,以提高雷电预测效果。而对雷电事件的预测相比于对大气电场的预测,此方法预测时间跨度更远(15 min),预测范围适中(15 min),在实际应用中更为有用。实验证明了雷电发生前,大气电场特征具有可识别与预警性。同时,本文讨论了BP神经网络参数对预测效果的影响,为具体实施时,提供参数设置指导,可根据需要做出调整以应对不同使用目标。