APP下载

BP神经网络滑动窗口算法在活跃火时空预测模型研究与实现

2023-09-25谢非凡张世涛黄威

计算机时代 2023年9期
关键词:中南半岛机器学习神经网络

谢非凡 张世涛 黄威

摘  要: 通过C#编程语言与ArcEngine开发引擎编写一种BP神经网络的滑动窗口算法,实现活跃火频次预测。对中南半岛五国活跃火进行建模,预测2020年活跃火频次并与实际对比。经过多次迭代实验,结果表明,模型程序在误差小于0.8或学习训练次数大于8000作为单次结束条件时具有优良的预测效果。

关键词: 神经网络; 活跃火; 机器学习; 中南半岛

中图分类号:TP399.4          文献标识码:A     文章编号:1006-8228(2023)09-124-05

Research and implementation of BP neural network sliding window algorithm

in active fire spatiotemporal prediction model

Xie Feifan, Zhang Shitao, Huang Wei

(Faculty of Land and Resources, Kunming University of Science and Technology, Kunming, Yunnan 650000, China)

Abstract: A sliding window algorithm for BP neural networks is developed using C# programming language and ArcEngine development engine to predict active fire frequency. Active fires in five countries on Indochina Peninsula are modeled to predict the frequency of active fires in 2020 and compare with the actual situation. The results of several iterations show that the model program has a good prediction effect when the error is less than 0.8 or the number of learning training is more than 8000 as a single end condition.

Key words: neural network; active fire; machine learning; Indochina Peninsula

0 引言

活跃火(Active fire)是全球生态系统碳循环的重要因素,亦是影响大气污染、公共安全、生物多样性等重要因素之一。活跃火在地球表面的大部分地区均产生重要的生态作用,是全球气候变化与森林生态系统反馈的关键因子[1-2]。热带活跃火在全球的发生频率日益加剧,已对全球陆生、水生和大气系统造成重大影响[3]。 在微观尺度上,活跃火通过植被燃烧、温度升高改变土壤的理化性质,直接影响植被生长[4-5],从而改变植被和土壤的结构和组成[6]。全球每年由火灾引起的碳排放量可达2~4Pa,是每年化石燃料的50%。因此,预估和预测活跃火,对大气环境治理及检测评估等具有重要的参考价值[7]。中南半岛山区历来有刀耕火种的农业耕作传统,且山地移民的增加又进一步提高了刀耕火种的利用强度,从而加剧了植被焚烧与森林野火的发生概率[8-9]。美国火灾信息资源管理系统(FIRMS)提供了近乎实时的活跃火位置矢量产品数据,已被各个领域研究者广泛应用[10]。其数据质量得到了广泛的认可,但在挖掘此矢量数据信息时,研究人员更多的是在统计分析层面来解析数据,缺乏更为深层次的数据挖掘方法与技术手段[11-15]。因此从时间和空间上建模进而预测是非常有意义和有必要的。

目前BP神经网络已经在许多领域得到应用,理论上BP神经网络可以逼近任何复杂的函数[16-17]。技术人员和研究人员设计的神经网络算法模型对火灾的预测需要大量的火灾影响因子数据进行训练学习[18-19],小区域研究范围内的研究取得了不错的预测效果,但针对大区域面积的研究时,获取各种相关因素数据存在许多困难。因此本文提出一种次优的基于BP神经网络的滑动窗口算法对东南亚活跃火频次进行预测。本文相关研究成果可以对大尺度空间范围活跃火进行预测评估,希望能为同行提供参考,为活跃火相关因子评估分析提供科学的启发与思考。

1 源数据整理

从NASA FIRMS分别下载了中南半岛五国(柬埔寨,老挝、缅甸、泰国、越南)2000年至2020年的MODIS与VIIRS活跃火矢量数据。MODIS的历史数据更加充足,更加的有利于下文的神经网络训练学习建模,剔除MODIS数据缺失的时间段,最终选用MODIS产品2010年至2020年的数据作为我们的研究源数據,通过GIS软件强大的空间数据统计分析能力做了初步的统计处理,统计表如表1所示。

据统计,2010年至2020年间柬埔寨活跃火频次总数达3.80591×105次,老挝达4.42116×105次,缅甸达6.97154×105次,泰国达3.04636×105次,越南达2.09489×105次。缅甸活跃火每年频次总数均大于其他四国,且走势较为陡峭,在2010年达到峰值,其他四国数据波动较为平缓,越南每年活跃火频次均低于其他四国。在2010至2011年中南半岛各国活跃火频次均在降低,在2018年至2019年均在上升,我们认为可能是某种大环境因素导致其同步变化(图1)。11年间柬埔寨活跃火总频次密度约为1.4074次/km²,老挝约为1.3527次/km²,缅甸约为0.8469次/km²,泰国约为0.4364次/km²,越南约为0.4198次/km²。在密度分布上柬埔寨、老挝、缅甸走势较为陡峭,越南与泰国较为平缓,其数据的平滑性更有利于下文神经网络在时间序列的函数拟合(图2)。

通过整理发现柬埔寨活跃火频次密集时间段在每年的1月、2月、3月、12月,老挝活跃火频次密集时间段在3月和4月,缅甸集中在2月、3月、4月,泰国集中在1月、2月、3月、4月、12月较为平滑,泰国集中在2月、3月、4月。根据这一数据特征,可以将每个国家的数据按此特征分为两组作为滑动窗口神经网络算法的处理数据集,目的是为了训练的数据集在数据上更加的平滑,为BP算法计算各参数值时减轻负担。

2 数据构型

火灾的发生有人为因素和自然因素,火灾是一个复杂的物理过程,选用具有处理复杂非线性问题的BP神经网络模型建立其预测模型是非常必要的。传统的神经网络学习需要大量数据进行训练学习,在小尺度空间范围时,据有关实验表明,其在诸多领域具有良好的预测效果,但面对大尺度空间范围时,往往会因为数据的收集困难导致实验难以继续,或因数据不足导致训练效果较差,实验误差大。因此我们采用本文提出的次优的基于滑动窗口神经网络算法,分别对中南半岛的柬埔寨,老挝、缅甸、泰国、越南五个国家数据进行了总量的预测和分网格的预测,采用局部和整体混合验证模型,以保其精確度。

2.1 BP神经网络

神经网络是对人脑神经工作过程进行抽取模拟出的,类似于大脑神经突触联接的结构进行信息处理的数学模型。BP神经网络模型拓扑结构包括输入层、输出层和多个隐层,BP算法的学习过程,由信息的正向传播和误差的反向传播两个过程组成。理论上隐层只要足够多就可以逼近任意复杂的非线性函数。三层神经网络结构如图3所示。

神经网络中的训练或者学习,旨在求解所要解决问题的网络模型中的参数,这些参数包括神经元之间的连接权重(w1,w2..wxm)以及偏置等,偏置的存在可以更好的拟合数据。根据不同的实际问题,设计者所构造出来的网络模型是不同的,为了求出这些参数,往往需要算法进行学习和训练来迭代找出最优的参数,BP算法就是现在应用最为广泛的和成功的算法之一[20]。

2.2 数据设计

本实验首先对柬埔寨,老挝、缅甸、泰国五个国家活跃火数据按月进行统计标记,统计完成后按时间序列进行滑动窗口数据设计,以此形成一种次优的基于滑动窗口神经网络结构进行训练学习。训练数据组织排列方式如下:

[x1x2x3x4x5x2x3x4x5x6……………xn-4xn-3xn-2xn-1xn] ⑴

X1至Xn为每个国家按月统计的活跃火频次数据,按照以上数据排列方式进行训练,值得注意的是此处的滑动窗口设计的数据列数可以根据实际需求调整,未来输出的个数来决定。研究区按(10km×10km)划分格网,每个格网里以月为单位统计活跃火频次,以每个格网为单位进行训练学习,预测出每个格网的结果,对每个国家的结果进行累加,与整体的预测结果进行对比验证小于阈值时输出结果。

3 模型

3.1 模型设计

本预测模型需要通过GIS软件进行初步的数据统计与整理,筛选出时间与空间数据序列,其次将统计后的数据作为预测模型的输入数据,预测模型核心利用.NET Framework框架通过c#(sharp)编程语言与ArcEngine开发引擎编写而成,神经网络搭配使用AForge.NET库。AForge.NET主要用于计算机视觉、人工智能、机器学习、图像处理、机器人等领域。一种次优的基于滑动窗口神经网络算法对东南亚活跃火频次进行预测,极大的降低了对多元数据的要求,扩大了其应用场景与广度。通过以上数据的整理构建东南亚活跃火频次预测模型,通过交叉验证的方法对网络训练进行进一步的控制以提高预测精度。中南半岛活跃火频次预测模型包含对原始数据整体的时间序列整理,对划分网格后的各网格内活跃火频次按时间序列整理,对神经网络模型的建立,对两次预测模型的阈值设置与评判。BP神经网络的建立包括对原始数据的归一化处理、初始化权重、激活函数的选择、网络模型的构建、网络训练。中南半岛活跃火频次预测模型构架图如图4所示。

3.2 模型实验与结果

本文通过中南半岛活跃火频次预测模型在时间上以时间序列月为单位组织数据结构,在空间上通过格网10km*10km进行划分,在统计数据的基础上应用模型对2020年实际数据与模型的输出数据进行了实验对比。数据每个格网的时间尺度序列数据为输入,将结果和实际值及误差数据通过GIS软件可视化出图。统计每个格网的实际值,根据2020年活跃火频次数量填充格网颜色得到活跃火频次图(图5),通过模型预测的频次数量统计得2020年活跃火预测频次图、误差图(图6、图7),实验表明该模型有较好的稳定性、准确性。可为大尺度的活跃火预测评估提供科学的数据支撑。

4 结束语

本文对中南半岛五国2020年活跃火进行建模预测并与实际对比,单格网内误差绝对最大为8。经过多次迭代实验测试结果表明,单个格网模型程序在误差小于0.8或者学习训练次数大于8000作为单次结束条件具有优良的预测效果。值得注意的是,在做参数优化时误差不能设定的太小,作者在参考其他学者的研究时发现,有学者将其设置为很小,这可能会导致程序假死陷入无线循环导致无法结束。一种次优的基于滑动窗口神经网络算法设计目的是在没有相关因子情况下,科学的对数据未来趋势进行预测评估,是一种适用于空间大尺度区域的预测算法,是一种适应于实际生产需求的次优的算法。本文通过编程语言合理的设计模型并对中南半岛2020年活跃火频次进行了预测,实验效果良好。此模型虽然减少了数据的输入量,但是与多因子模型相比精度会低一些。

参考文献(References):

[1] 李鹏,李文君,封志明,等.基于FIRMS MODIS与VIIRS的东南亚活跃火频次时空动态分析[J].资源科学,2019,41(8):1526-1540.

[2] 刘颖,李鹏,肖池伟,等.中南半岛旱季VIIRS活跃火的空间特征与国别差异[J].地理科学进展,2021,40(8):1406-1418.

[3] Leigh B. Lentile,Zachary A. Holden,Alistair M. S. Smith,el al.Remote sensing techniques to assess active fire characteristics and post-fire effects[J]. International Journal of Wildland Fire,2006,15(3).

[4] U. Choromanska,T.H. DeLuca. Microbial activity andnitrogen mineralization in forest mineral soils following heating: evaluation of post-fire effects[J]. Soil Biology and Biochemistry,2002,34(2).

[5] He Han,ChangYu,LiuZhihua,et al. Evaluations on theConsequences of Fire Suppression and the Ecological Effects of Fuel Treatment Scenarios in a Boreal Forest of the Great Xing'an Mountains, China[J]. Forests,2023,14(1).

[6] Charles W. McHugh,Thomas E. Kolb. Ponderosa pinemortality following fire in northern Arizona[J]. International Journal of Wildland Fire,2003,12(1).

[7] 劉怡媛,李鹏,肖池伟,等.老挝VIIRS活跃火的主要自然地理要素特征[J].地理研究,2020,39(3):749-760.

[8] 廖谌婳,封志明,李鹏,等.缅老泰交界地区刀耕火种农业的时空变化格局[J].地理研究,2014,33(8):1529-1541.

[9] 李文君,肖池伟,封志明,等.2015年厄尔尼诺年东南亚主要国家活跃火发生类型与影响分析[J].自然资源学报,2020,35(10):2539-2552.

[10] 薛乃婷,张震,杜志恒,等.北极地区活跃火的时空分布格局分析[J].极地研究,2020,32(4):555-564.

[11] 李军,张志东,乔元健,等.基于自适应集成神经网络的火灾预测方法[J].消防科学与技术,2020,39(12):1727-1731.

[12] 薛乃婷,张震,杜志恒,等.北极地区活跃火的时空分布格局分析[J].极地研究,2020,32(4):555-564.

[13] 杨伟,姜晓丽.森林火灾火烧迹地遥感信息提取及应用[J].林业科学,2018,54(5):135-142.

[14] 丁青,冯险峰.欧亚北方森林MODIS14数据的林火变化分析——以俄罗斯欧洲地区为例[J].地球信息科学学报,2013,15(3):476-482.

[15] 胡超.基于BP人工神经网络的区域森林火灾预测研究[D].浙江:浙江海洋学院,2015.

[16] 史一通.基于BP神经网络的城市区域火灾风险评估模型研究[D].四川:西南交通大学,2018.

[17] 汪文野,刘静,贾南.基于神经网络的森林火灾预测分析[J].武警学院学报,2020,36(6):15-20.

[18] 李晓明,顾钰培,张俊涛.一种滑动窗口的GPS轨迹点地图匹配算法[J].西安工业大学学报,2017,37(6):459-462.

[19] 南虎,路璐,麻晓晶,等.基于卷积神经网络的滑动窗口算法在高分辨电镜图像中的应用[J].电子显微学报,2021,40(3):242-250.

[20] 王亚琴,王耀力,郭学斌,等.基于直连BP神经网络模型的森林火险预测[J].森林防火,2018(2):41-45,54.

猜你喜欢

中南半岛机器学习神经网络
神经网络抑制无线通信干扰探究
中南半岛经济走廊基础设施公私合营风险分担研究
以云南园区跨境合作带动中国
中国—印度洋第二条物流大通道构想
基于网络搜索数据的平遥旅游客流量预测分析
前缀字母为特征在维吾尔语文本情感分类中的研究
基于支持向量机的金融数据分析研究
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定