玉米叶片叶绿素含量的高光谱反演模型探究
2015-07-31杨可明孙阳阳王林伟史钢强魏华锋刘飞
杨可明 孙阳阳 王林伟 史钢强 魏华锋 刘飞
摘要:叶绿素含量是绿色植物生长状态的一个重要指标。首先在实验室采集玉米叶片高光谱数据和测定叶绿素含量,并对光谱数据进行对数一阶微分变换,对比选取建模反演因子。根据选定的反演因子采用线性回归、模糊识别和BP神经网络方法建立了玉米叶片叶绿素含量高光谱反演模型,并计算出模型的精度。结果表明,有较好非线性映射能力的BP神经网络反演模型能够高精度地反演出玉米叶片中的叶绿素含量。BP神经网络模型叶绿素含量预测和实测叶绿素含量的平均绝对误差(e)为1.126,决定系数(R2)为0.902,均方根误差(RMSE)为1.375。玉米叶片叶绿素含量与高光谱数据并非线性关系,BP神经网络反演模型能够较好地运用到叶片叶绿素含量反演中。
关键词:玉米叶片;叶绿素含量;高光谱遥感;反演模型
中图分类号:P237;S513 文献标识码:A 文章编号:0439-8114(2015)11-2744-05
DOI:10.14088/j.cnki.issn0439-8114.2015.11.049
Researches on Hyperspectral Inversion Model of Corn Leaf Chlorophyll Content
YANG Ke-ming, SUN Yang-yang,WANG Lin-wei, SHI Gang-qiang, WEI Hua-feng, LIU Fei
(College of Geosciences and Survey Engineering, China University of Mining & Technology (Beijing), Beijing 100083, China)
Abstract:Chlorophyll content is an important indicator of green plant growth status. Firstly the hyperspectral data and chlorophyll content of corn leaf were measured in the laboratory, and the inversion factors were selected by comparing the data which was transferred by the hyperspectral data of corn leaf through the first order differential of logarithmic. Then hyperspectral inversion models of corn leaf chlorophyll content were established by method of liner regression, BP neural network and fuzzy recognition based on the selected inversion factors and the accuracy of each model was calculated. Results showed that the BP neural network inversion model with good nonlinear mapping capability could accurately predict the chlorophyll content of corn leaf high. The mean absolute error was 1.126,R2 was 0.902 and RMSE was 1.375 in BP neural network inversion model. The chlorophyll content and hyperspectral data of corn leaf was not a linear relationship and the BP neural network inversion model could be applied in leaf chlorophyll inversion.
Key words:corn leaf; chlorophyll content; hyperspectral remote sensing; inversion model
高光谱遥感技术是21世纪遥感技术重大、影响深远的突破,在国民经济发展中发挥了重要作用[1]。高光谱波谱分辨率高,光谱连续性强,蕴含着丰富的地物信息,为遥感从对地定性观测到定量观测提供了强有力的技术支撑[2]。
绿色植物为地球生命提供养料和能量,是社会生存和发展的根本,对植物的生长监测有着十分重要的意义。叶绿素是绿色植物中存在的最广泛。最主要的色素,在植物的光合作用中扮演着非常重要的角色[3]。叶绿素含量反映植被的生长状态,是植物理化分析的一个重要指标。传统的叶绿素含量测定方法费时费力,因此结合新技术实现对叶绿素含量的反演有着重要意义。为此,以玉米叶片高光谱波谱数据为基础,结合线性回归、模糊识别和BP神经网络建模算法,对玉米叶片的高光谱波谱数据与叶绿素含量关系进行了探究,以期为精细化农业和生态环境监测提供新的技术手段。
1 BP神经网络理论及其应用
BP(Back Propagation)神经网络[4]由Rumelhart和McCelland为首的科学家小组于1986年提出,是一种按误差逆传播算法训练的多层前馈网络。BP神经网络的拓扑结构包括输入层(Input layer)、隐含层(Hidden layer)和输出层(Output layer),具体见图1。隐含层是位于输入层和输出层之间的一种内部结构,可以有多层多个节点,是输入模式在神经网络中的一种内部表示[5]。隐含层的作用是将输入模式的特征进行抽取,并将抽取的特征传递至下层,直至输出层,然后由输出层进行判断其与其他输入模式的不同。隐含层产生作用的过程其实是神经元之间连接权值的调节过程,是一个自组织化的过程。因此,BP神经网络模型的建立过程就是确定隐含层以及节点数并根据训练样本不断调整神经元之间的权值,使误差函数达到极小值的过程。
BP神经网络的信息循环包括输入信息的正向传播和输出误差的反向传播。正向传播符合神经最基本的三个特征:加权、求和与转移[6],节点的特征见图2。图2中,x1,x2,…,xn-1,xn分别代表来自前一层的神经元1,2,…,n-1,n的输入;w1j,w2j,…,w(n-1)j,wnj分别表示前一层神经元1,2,…,n-1,n与神经元j的连接权值;bj为阈值;F(y)为激励函数;Yj为第j个神经元的输出。BP神经网络在j个神经元的输出Yj见式(1)。
Yj=F(y)=F(■wijxi+bj)=F(WjX+bj) (1)
式中,Wj=[w1j,w2j,…,w(n-1)j,wnj],X=[x1,x2,…,xn-1,xn]T。
BP神经网络每正向传播一次就会获得一个实际输出Yj(j=1,2,…,n),实际输出与期望输出Tj(j=1,2,…,n)的误差函数见式(2)。当误差没有达到设定的容许误差或者取得极小值,则神经网络进行输出误差反向传播,不断调整神经元之间的连接权值,使误差达到允许范围之内。
E=■■(Tj-Yj)2 (2)
BP神经网络以及其改进模型已经在各行各业中得到了广泛的应用。周建春等[7]对隧道围岩力学参数进行BP神经网络的反演,证明了该方法的有效性;吐尔逊·艾山[8]等利用BP神经网络进行盐碱土盐分反演建模,模型精度达到88.77%;张娟娟等[9]利用BP神经网络对不同类型土壤的有机质进行预测,达到了较高的精度;李雪等[10]利用BP神经网络优化的粒子群算法对粮食产量进行预测,弥补了粒子群算法的缺点,取得了较好的效果。
2 数据获取与处理
2.1 数据获取
测量的对象为实验室培养玉米的叶片,对玉米植株的不同部位分别取样,测量取样的高光谱数据和叶绿素含量。
光谱测量仪器是美国SVC公司生产的型号为SVC HR-1024I的高性能地物光谱仪,该光谱仪光谱范围为350~2 500 nm,其中在350~1 000 nm范围内光谱采样带宽为1.5 nm,光谱分辨率为3.5 nm;在1 000~1 850 nm范围内光谱采样带宽为3.6 nm,光谱分辨率为9.5 nm;在1 850~2 500 nm范围内光谱采样带宽为2.5 nm,光谱分辨率为6.5 nm。光谱数据在暗室内进行测量,使用光谱仪配套的功率为50 W的卤素灯光源和4°视场角的探头,探头垂直于叶片表面40 cm;输出的光谱为3条原始扫描光谱自动平均所得,光谱反射系数经专用平面白板标准化。
叶片中的叶绿素主要分为叶绿素a和叶绿素b,传统的叶绿素含量测量主要采用化学实验法。研究表明[11],绿色植物绿色度值(SPAD)与叶绿素含量相关性显著,应用叶绿素计测量叶绿素含量是可行的。故采用SPAD-502测定玉米叶片中的叶绿素含量,在每个叶片不同位置随机测量5个值,求取平均值代替叶片的叶绿素含量值。
2.2 光谱数据的处理
2.2.1 光谱数据的去噪和变换 在光谱的测量过程中由于人为和仪器的原因,光谱曲线总存在一些包含在信号中的少量噪声。实践表明,如果噪声的频率较高,其量值也不大,用平滑方法可在一定程度上降低噪声[12]。采用五点加权平均值的方法对原始光谱进行平滑,计算方法见式(3)。设原始光谱曲线测点的反射率和五点光滑后曲线测点的反射率分别为Ri和ri(i=3,4,…,N),则:
ri=0.1Ri-2+0.2Ri-1+0.4Ri+0.2Ri+1+0.1Ri+2 (3)
光谱数据的变换方法有很多种,采用式(4)对数的一阶微分变换。对数变换不但能够减少光照条件变化引起的乘性因素的影响,而且能够增加光谱值偏低区域的光谱差异;微分变换有助于降低低频噪声对目标光谱的影响。
Ai=■ (4)
式中,Ai、ri和?姿i分别为测点i的光谱变换值、光谱反射率值和中心波长。一阶微分变换后其数据值很小,为了方便数据的使用,将数据统一乘以100。
2.2.2 反演因子的选择 叶绿素含量的高光谱反演是根据叶片的高光谱数据通过数据计算处理,建立叶片高光谱数据与叶绿素含量的内在关系。光谱数据相邻波段不可避免的存在冗余,若把350~2 500 nm的光谱数据作为模型的反演因子没有必要,也不利于建模。因此,选择最佳波段的光谱值作为建模的因子十分必要。
计算各个波段光谱数据变换值与与叶绿素含量相关系数并生成折线图,相关系数见图3。在折线图上选取拐点处且相关系数较大的点作为模型的反演因子,选取的反演因子及其相关系数见表1,最终得到的建模数据见表2。
3 反演模型的建立
为了探究玉米叶片高光谱数据与叶绿素含量的关系,分别建立了线性回归模型、模糊识别和BP神经网络模型3种反演模型并计算出模型的精度。评价反演模型精度的指标主要有均方根误差(RMSE)、叶绿素预测值与实测值的决定系数(R2)和平均相对误差(e)。
3.1 线性回归模型及其精度
线性回归是研究因变量与自变量之间线性相关关系的一种基本建模方法,根据因变量的多少可以分为一元线性回归和多元线性回归。
3.1.1 一元线性回归建模及精度 一元线性回归分别建立各个反演因子以及反演因子加权均值与因变量的线性方程,回归方程及精度见表3。
对不同的一元线性估测模型进行加权综合,建立一元线性综合反演模型,具体见式(5)。
Y=■ (5)
式中,i表示反演因子数,Pi表示反演因子i的权重(由各个反演因子与叶绿素含量的相关系数求得),yi表示模型估测值。一元线性综合反演模型的RMSE、R2和■分别为3.180、0.657和2.754,图4为叶绿素实测值与一元线性综合反演模型反演值。
3.1.2 多元线性回归建模及精度 多元线性回归模型的建模数据为全部的45个数据,最后得出的多元线性回归方程:
y=24.78-1.3 x1-1.27 x2+12.34 x3+0.68 x4+22.41 x5
(6)
式中,x1、x2、x3、x4、x5分别代表反演因子1~5。
多元线性回归模型的RMSE、R2和■分别为2.938、0.698和2.489。通过比较可以看出,相对于单因子一元线性估测模型,加权综合估测模型和多元线性回归模型精度并没有得到显著提高。当选反演因子5(波长为743 nm)时的单因子线性回归模型精度最高,RMSE为1.906,R2为0.693,■为2.499。
3.2 模糊识别反演模型及其精度
首先将建模数据归一化,选取45个样本数据的35个作为建模数据建立反演模型,剩余10个作为检验样本检验模型精度,模型的精度见表4,模型反演值见图5。
3.3 BP神经网络模型及其精度
在建立BP神经网络进行反演建模时,选取45个数据中的35个作为建模数据,其余10个作为检验样本,设置最小训练速率为0.1,允许误差为0.000 1,迭代次数为20 000。由建模数据可知,BP神经网络的输入层与输出层分别为5和1,根据所设置不同的隐含层分别建立了6个BP神经网络模型,各个模型的隐含层数及节点数见表5。
BP神经网络建模后,得到建模数据的拟合值以及检验样本的预测值,分别计算每个模型建模数据拟合值和检验样本预测值的RMSE、R2和e,具体见表6。
由表6可以看出,当隐含层为3层,第一隐含层节点数为5,第二隐含层节点数为4,第三隐含层节点数为2时,模型的精度最高。该模型的RMSE为1.375,R2为0.902,■为1.126,相对于最优的线性回归模型,精度有了大幅度提高,图6为叶绿素实测值与BP反演模型模Ⅴ反演值。
4 小结
通过对玉米叶片光谱反射率与叶绿素含量模型的反演研究可以得出以下结论。
1)适合对玉米叶片中叶绿素含量进行反演的波段位于可见光波段。叶绿素主要作用于光合作用,而光合作用的波段主要是可见光,这与已知知识相一致。同时说明了SPAD-502测定的绿度值在一些应用中可以替代叶绿素含量的化学实验测定值。
2)高光谱叶绿素的线性反演模型的精度与反演因子的选择有很大的关系。反演因子多的线性回归模型的精度不一定比单一因子的选择精度高,但是多因子的模型能够降低反演因子选择带来的模型精度风险。
3)叶绿素含量与光谱反演因子并非线性关系。BP神经网络反演模型的精度高于线性反演模型,说明其建立的反演模型更能够表达光谱数据与叶绿素含量的的映射关系,而BP神经网络对非线性相关关系表达比线性回归模型更有优势。
4)BP神经网络模型的的鲁棒性比模糊识别模型的强。通过表4和表6的对比可以发现,对于模型的建模精度和检验精度BP神经网络模型的几乎没有什么区别,而模糊识别模型相差较大。因此,在一定的样本条件下,BP神经网络模型的稳定性比模糊识别模型高。
本文虽然是以玉米叶片作为试验对象,但是对其他的农作物也起到了借鉴作用。在高光谱叶绿素反演模型中引入了模糊识别和BP神经网络等技术,在叶绿素的反演取得了良好的效果。反演模型的输入数据是光谱数据的变换值,在以后的研究中可以将反演因子多样化。
参考文献:
[1] 童庆禧,张 兵,郑兰芬.高光谱遥感——原理、技术与应用[M]. 北京:高等教育出版社,2006.
[2] 王润生,甘甫平,闫柏琨,等.高光谱矿物填图技术与应用研究[J].国土资源遥感,2010,22(1):1-13.
[3] 张怀斌.叶绿素的光学性质及其应用[D].济南:山东师范大学, 2008.
[4] RUMELHART D E, MCCLELLAND J L, THE PDP Research Group. Parallel Distributed Processing——Explorations in the Microstructure of Cognition(Volume 1): Foundation[M]. The Cambridge, Massachusetts,USA:The MIT Press, 1987.
[5] 黄继红.基于改进PSO的BP网络的研究及应用[D].长沙:长沙理工大学,2008.
[6] 孙娓娓,刘琼荪.一种基于放大误差信号的自适应BP算法[J]. 计算机应用,2008,28(8):2081-2083.
[7] 周建春,魏 琴,刘光栋.采用BP神经网络反演隧道围岩力学参数[J].岩石力学与工程学报,2004,23(6):941-945.
[8] 吐尔逊·艾山,塔西甫拉提·特依拜,买买提沙吾提.基于BP神经网络的盐碱土盐分反演模型研究[J].环境污染与防治,2011, 33(2):23-28.
[9] 张娟娟,田永超,朱 艳,等.不同类型土壤的光谱特征及其有机质含量预测[J].中国农业科学,2009,42(9):3154-3163.
[10] 李 雪,顾沈明,年 浩.改进粒子群算法优化BP神经网络的粮食产量预测[J].闽南师范大学学报(自然科学版),2014(1):56-61.
[11] 姜丽芬,石福臣,王化田,等.叶绿素计SPAD-502在林业上应用[J].生态学杂志,2005,24(12):1543-1548.
[12] 徐永明,蔺启忠,王 璐,等.基于高分辨率反射光谱的土壤营养元素估算模型[J].土壤学报,2006,43(5):709-716.