APP下载

基于遗传算法优化BP神经网络模型估测高山松叶面积指数

2020-11-27谭德宏舒清态赵洪莹王柯人袁梓健

林业资源管理 2020年5期
关键词:植被指数香格里拉高山

谭德宏,舒清态,赵洪莹,王柯人,袁梓健

(西南林业大学 林学院,昆明 650224)

叶面积指数(Leaf area index,LAI)是重要的森林冠层物理参数,其定义为单位地面面积上植被叶面积总和[1]。它不仅能推断植物的群体光合作用、初级生产力、生物量和蒸腾作用,还可以作为植被生长监测和病害评价的重要指标[2]。传统地面叶面积指数测量需要消耗大量的人力、物力、财力,因此快速、准确、可靠地获取植被LAI具有重要的研究意义。遥感为植被大面积无损监测LAI提供了技术支持。国内外反演LAI所采用的遥感影像主要为可见光与近红外波段的多光谱数据,Sentinel-2多光谱影像的优势就在于具有多个红边波段。研究表明Sentinel-2红边波段及构建植被指数与叶面积指数之间表现出较好的相关性[3-4],当前却鲜有利用Sentinel-2多光谱影像反演森林LAI的研究。

统计模型和机理模型是反演植被LAI的主要模型。统计模型是通过建立地面样地植被冠层LAI与遥感像元光谱及其相关变换信息之间的对应关系,机理模型是通过求解光在植被中的辐射传输过程得到植被物理和生化参数。统计模型应用于LAI反演中主要是参数模型和非参数模型[5]。参数模型有具体表达式,比如多元线性回归、逐步回归、指数函数、幂函数、最小二乘法回归等模型。参数模型被广泛运用于定量反演LAI,具有大量的研究成果。非参数模型无具体数学表达式,因其较好的非线性拟合能力大量使用于LAI定量反演中,其中包括支持向量机(Support Vector Machine,SVM)、随机森林(Random Forest,RF)、k-最近邻法(k-Nearest Neighbor,k-NN)和人工神经网络(Artificial Neural Networks,ANN)等模型[6-9]。在非参数模型中,BP神经网络(Back Propagation)具有高效学习和适应能力、良好的容错能力和非线性拟合能力,因此被国内外研究者广泛运用于LAI遥感估测研究,并取得了较好的结果[10-17]。大量研究发现,BP神经网络存在局部极值和网络算法收敛速度慢等不足[18]。BP神经网络优化有多种算法,如粒子群算法(Particle Swarm Optimization,PSO)、遗传算法(Genetic Algorithm,GA)和模拟退火法(Simulated Annealing,SA)等[19]。在基于算法优化BP神经网络进行LAI估测的研究中,王枭轩等[20]运用粒子群算法优化BP神经网络模型,结果表明,优化后的BP神经网络能够有效提高模型非线性拟合精度。粒子群算法是通过不断迭代寻优,没有对个体进行交换和变异。本研究采用遗传算法优化BP神经网络模型来进行研究,以提高BP神经网络对LAI的估测精度。

本文以Sentinel-2遥感影像结合高山松地面样点实测LAI数据,通过相关性分析筛选出相关性显著的植被指数,利用BP神经网络和遗传算法优化后GA-BP神经网络构建LAI估测模型。通过像元尺度实现研究区高山松LAI估测,该研究可为低纬度高海拔地区森林LAI的研究提供参考。

1 材料与方法

1.1 研究区概况

香格里拉市是迪庆藏族自治州下辖市之一,位于云南省西北部和云贵高原与青藏高原交界处,是“三江并流”风景区腹地,其地理坐标为26°52′~28°50′N,99°23′~100°18′E。香格里拉市属于山地寒温带季风气候区,年均降雨量为618.4mm,年均气温为5℃,全市面积为11 613km2,地形复杂,海拔落差大。区域植被类型为亚热带常绿阔叶林向高寒植被过渡类型,植被垂直化明显。森林资源丰富,森林覆盖面广,覆盖率高达83.3%,以天然林为主。常见的树种为云南松(Pinusyunnanensis)、高山松(Pinusdensata)、云杉 (Piceaasperata)、 冷杉(Abiesfabri)、高山栎(Quercussemicarpifolia)等。高山松为香格里拉地区的先锋树种,其主要分布在海拔3 300~3 800m的地方,具有较强的耐寒性和耐贫瘠性。

1.2 数据采集及处理

1.2.1遥感数据及预处理

Sentinel-2A卫星于2015年6月23日发射,搭载的有效载荷为多光谱成像(multispectral instrument,MSI)。MSI传感器有13个波段,分为可见光、近红外和短波红外3部分,中心波长范围为490~2 190nm。Sentinel-2A卫星的优势在于更短的访问周期和3条红边波段,能够更精确地检测植被健康状态。本研究获取2018年12月香格里拉市的Sentinel-2A卫星数据中的L1C影像数据。Sentinel-2A卫星传感器的光谱相关参数如表1所示。

表1 Sentinel-2A光谱波段信息Tab.1 Sentinel-2A spectral band information

遥感数据预处理是为了消除大气、地形对传感器获取植被真实的地标反射率的影响。从欧洲航空局的数据共享网站获取的Sentinel-2遥感影像是经过正射校正和几何精校正的大气表观反射率产品,需要对影像数据进行大气校正与地形校正。利用SNAP插件工具(Sen2Cor-02.08.00)完成Sentinel-2的大气校正过程,将影像像元大小重采样到30m空间分辨率。研究区地形复杂,因此,地形校正模型使用SCS+C校正模型,通过对Sentinel-2数据影像读取传感器太阳高度角与观测方位角,使用香格里拉30m分辨率DEM数据对每一幅遥感影像进行地形校正。

1.2.2样地数据

样本实测数据采集时间为2018年11月。选择样地是以林业调查结果为参考,在云南省香格里拉市高山松分布范围内选取32块样地(样地为半径15m的圆形样地),样地设置于高山松纯林或接近纯林的林分中央,以保证样地与影像图之间的叠加尽可能完全重合。利用LAI-2200叶面积指数仪器测量高山松LAI,为避免光线直射的影响,时间选取为上午9点以前和下午5点后采集样地的叶面积指数。记录样地中心点的差分GPS坐标数据,用差分GPS能够控制坐标数据误差精度,以减小误差。在每块样地测量5个点的LAI数据值,并求其平均值作为样地LAI的实测值,32块样地高山松LAI实测值分布范围为1.04~3.15。样地实测的LAI数据统计情况如表2所示。

表2 32块高山松样地的LAI实测值统计Tab.2 Statistics of LAI of Pinus densata measured data in sample 34 plots

1.2.3高山松信息提取

研究区的高山松主要为纯林,高山松空间分布范围根据2016年香格里拉市森林资源规划设计调查结果(1)香格里拉市林业局.2016年香格里拉市森林资源规划设计调查报告.2016.得到。以遥感影像单波段构建的植被指数为自变量。通过参考红边波段构建植被指数与LAI的相关研究[21-26],选取相关性较好的植被指数进行LAI估测研究。本文选取的植被指数公式如表3所示,本文选取的波段为B4,B5,B6,B7,B8和B8a。

表3 植被指数公式Tab.3 Vegetation index formula

1.3 研究方法

1.3.1BP神经网络模型

BP(Back Propagation)神经网络是一种运用误差逆向传播算法训练的多层前馈网络。BP神经可以逼近输入神经元与输出神经元之间的非线性关系。网络结构分为3部分,即输入层、隐含层和输出层。其原理是通过误差反传,不断调整整个网络的权值和阀值,使得网络输出值与已知的训练样本输出值之间误差平方和达到预期值。如图1所示,网络主要分为两个过程:其一,前向传播。输入样本通过隐藏层作用于输出节点,以生成输出结果。每层中的神经元状态只对下一层中的神经元状态产生影响。其二,误差反转。如果实际输出值与预期输出值不匹配,则误差将被反转,将输出误差通过隐藏层传递到输入层,并通过修改神经元每一层的权重将误差最小化[18]。

图1 BP神经神经网络结构图Fig.1 BP neural network structure diagram

1.3.2遗传算法

遗传算法(Genetic Algorithm,GA)是模拟达尔文生物进化过程中遗传选择和自然淘汰机制的计算模型,是通过模拟自然,寻找达到全局最优的方法。遗传算法把生物进化论原理引入算法中,根据适应度函数对个体进行选择、交叉和变异筛选,通过反复循环、层层优化,使得结果达到最优[27-28]。

遗传算法实现过程:1)对研究的变量进行编码,随机建立一个初始群体。2)计算群体中个体的适应度,操作产生新群体。3)寻优过程。选择:将适应度高的个体选择到新的群体中,淘汰适度低的个体。杂交:随机选出个体进行片段交叉换位,产生新个体。变异:随机改变某个体的字符,得到新个体。4)根据某种条件判断计算过程是否结束,不满足结束条件,则从个体适应度计算重新开始操作,直到满足条件,才能结束优化过程。

1.3.3精度评价

本研究评价参数采用决定系数(R2)与均方根误差(RMSE)对估测模型进行精度检验。计算公式为:

(1)

(2)

2 结果与分析

2.1 相关性分析

相关性分析是寻找最优变量的过程,进而有效提高模型估测研究的效率和可行性。以通过相关性分析筛选出显著相关的植被指数作为建模自变量。基于相关性分析得到植被指数与LAI的相关性呈正相关(表4),相关性大小为S2REP>NDVI>PVI>SAVI>NDSI,其中,S2REP与LAI相关性系数最高,达到0.508;NDSI相关系数最低,为0.454。

表4 植被指数与森林LAI的相关性分析Tab.4 Correlation analysis of vegetation index and LAI of forest

2.2 模型建立及精度分析

模型在MATLAB软件下调试和运行,以相关性分析筛选出的S2REP,NDVI,PVI,SAVI,NDSI等5个植被指数作为自变量,以高山松样地实测LAI为因变量,在剔除异常点后采用留一法交叉验证(Leave Out Cross Validation,LOOCV)对高山松叶面积指数估测模型进行精度检验。留一法交叉验证,即为对于建模样本,使用其中一个样本为测试样本,其他样本为训练样本的循环验证方法。分别利用BP神经网络和GA-BP神经网络模型建立估测模型,利用精度评价来分析模型效果。模型参数设置:通过参考前人研究经验[27-28]和不断调试参数大小以确定模型参数。BP神经网络输入层、隐藏层和输出层节点分别是5个,5个,1个 ;训练精度为0.001,迭代次数为1 000次,学习率为0.1。遗传优化算法的初始化种群迭代次数为300次,种群规模为10,变异和交换概率分别为0.1和0.3。BP神经网络所设置的参数与GA-BP神经网络中BP网络模型部分的一致,其目的是与GA-BP神经网络建模进行对照。

建模结果如表5所示,其中:BP神经网络的R2为0.289,RSME为0.340;GA-BP神经网络建模的R2为0.508,RSME为0.314 。通过建模分析得出,GA-BP神经网络估测精度的R2和RMSE优于BP神经网络模型,经过遗传算法优化后的BP神经网络能够有效提高模型精度。从图2可看出,使用遗传算法优化BP神经网络模型,LAI的预测值与样本实测值比较接近,但存在高值低估现象;从图3可看出,未优化BP神经网络模型估测LAI与样本实测值之间误差较大,存在低值高估现象。对比图2和图3可知:遗传算法优化后,BP神经网络模型降低了LAI的预测值与实测值之间的误差;GA-BP神经网络对实测LAI变化趋势预测更加准确。

表5 高山松LAI估测模型精度检验Tab.5 The accuracy test for estimation model of LAI of Pinus densata

图2 GA-BP神经网络LAI预测结果Fig.2 LAI prediction results of GA-BP neural network

图3 BP神经网络LAI预测结果Fig.3 LAI prediction results of BP neural network

2.3 高山松LAI估测

使用遥感数据对研究区进行植被物理和生物化学参数估测时,通常基于样地尺度或像元尺度两种方法进行研究区植被参数的估测。研究区高山松LAI的估测基于像元尺度进行。由于研究区域数据量大,为减少单次计算量,估测时,将研究区分割为若干个区域,具体情况如图4所示。

利用GA-BP神经网络估测模型对香格里拉市各区域高山松的LAI进行估测,根据高山松样地实测数据统计情况,将估测的高山松LAI分为3个等级,得到香格里拉市高山松LAI的空间分布图(图5)。由表6可知:LAI在0~2之间的像元占总数的18.38%,LAI在2~3之间的像元占总数的80.93%,LAI在3~4之间的像元占总数的0.69%。

表6 香格里拉高山松LAI估测分布情况Tab.6 LAI of Pinus densata estimation and distribution in Shangri La

注:该图基于云南省测绘地理信息局标准地图服务网站下载的审图号为云S(2019)206号的标准地图制作,底图无修改。图4 研究区分区编号Fig.4 Study area partition number

从估测结果可知香格里拉市高山松LAI值主要集中在2~3之间。影像目视解译分析可知,LAI值为0~2区域是植被稀疏区域,LAI值为2~3和3~4的区域是植被相对密集区域。结合研究区高山松森林资源规划设计调查实际情况的分析,高山松为纯林且林分结构单一,树龄分布较为集中。研究区高山松LAI的估测结果与实际情况比较一致,图5能够较好地反映高山松LAI值的分布情况。

注:该图基于云南省测绘地理信息局标准地图服务网站下载的审图号为云S(2019)206号的标准地图制作,底图无修改。图5 高山松LAI分布Fig.5 Distribution for LAI of Pinus densata

3 结论与讨论

3.1 结论

本研究通过实测高山松LAI数据与植被指数的相关分析,基于遗传算法优化BP神经网络建立高山松LAI估测模型,以估算香格里拉高山松LAI值。研究结果表明,Sentinel-2影像红边波段构建植被指数对LAI的预测表现出较好的性能。BP神经网络的R2为0.289,RSME为0.340;GA-BP神经网络建模的R2为0.508,RSME为0.314。使用遗传算法优化BP神经网络模型不仅提高估测值与实测值的R2还降低了RMSE。遗传算法通过自然寻优过程,不断更新样本适应度函数,能够避免BP神经网络陷入局部极值,进而有效提高BP神经网络模型估测精度。遗传算法优化后,BP神经网络模型对实测LAI的变化趋势预测更加准确,说明遗传算法可以提高BP神经网络模型的预测精度。

3.2 讨论

本研究仅采用遗传算法对BP神经网络进行优化,未涉及其他算法,其他算法优化结果是否优于遗传算法有待进一步验证。关于模型参数设置,目前还没有统一的标准,需要通过综合考虑与反复试验得到。如何使用普适性参数设置,有待进一步研究。

本研究所采用的模型为统计模型,虽然能够较好地预测LAI值,但是统计模型没有明确的物理基础,且容易受到土壤因子、光照条件、遥感传感器、像元大小、观察位置等的影响,对非植被因素比较敏感,经验模型的鲁棒性比较弱。引入机理模型进行估测反演研究是下一步要做的工作。

猜你喜欢

植被指数香格里拉高山
香格里拉行
基于植被指数选择算法和决策树的生态系统识别
高山从何而来?
寻找香格里拉
AMSR_2微波植被指数在黄河流域的适用性对比与分析
河南省冬小麦产量遥感监测精度比较研究
高山生态扶贫搬迁
高山台防雷实践
主要植被指数在生态环评中的作用
迷行香格里拉