基于冠层光谱和BP神经网络的水稻叶片氮素浓度估算模型*
2019-04-10孙小香王芳东赵小敏
孙小香,王芳东,赵小敏,谢 文,郭 熙
(江西农业大学江西省鄱阳湖流域农业资源与生态重点实验室/南方粮油作物协同创新中心,南昌 330045)
0 引言
限制植物生长的17种必需营养元素中,氮素排首位。氮是作物体内多种重要有机化合物的组分,例如氨基酸、蛋白质、核酸、叶绿素和酶等都含有氮素[1]。缺氮直接影响作物的氨基酸、蛋白质、叶绿素等的生物合成,使作物的光合作用能力降低,从而导致产量与品质的降低[2]。由于氨的挥发及硝酸盐的淋洗、径流作用,作物施氮过多不仅造成氮肥利用率过低[3]而且容易加剧酸雨的形成、温室气体的排放[4]以及地下水、地表水污染[5],因此,对作物氮肥的精准管理是提高生产及减少环境污染的重要措施。准确、快速、实时监测作物氮素状况和长势动态,是确定适宜追肥量的前提[6]。
随着高光谱分析技术的发展,利用遥感可以快速监测水稻生长及生理状态[7]。我国近十几年来,学术界在利用高光谱反射率估算水稻氮素含量领域已经得出了较多成果,普遍认为[8-12]绿色植被的反射光谱在可见光范围主要受各种色素的吸收影响,反射率较低,在近红外区域主要受叶片内部结构的影响,经过细胞壁的多次反射而呈现出高的反射平台,所以在红谷到近红外的过渡波段出现“红边”特征[13]。通过提取与叶片氮素浓度相关性高的光谱信息,可以建立以光谱参数为自变量,氮素浓度为因变量的预测模型。王人潮等[14]研究表明,诊断水稻叶片氮素营养的冠层敏感光谱波段为530~560nm、630~660nm和760~900nm。谭昌伟[15]以796.7nm处的光谱反射率和738.4nm处的一阶微分光谱反射率构建的预测氮素模型精度较高(R2>0.79),但认为最适合诊断氮素含量的光谱参数是归一化变量(SDr-SDb)/(SDr+SDb)。薛利红等[16]研究得出近红外与绿光波段的比值(R810/R560)与叶片氮积累量(LNA)呈显著线性关系,不受氮肥水平和生育时期的影响。Tian等[17]研究表明指数SR(R553,R537)可以较好地估测水稻叶片氮素含量。目前BP神经网络在构建土壤养分含量领域的研究成果较多[18-20],例如张娟娟等[21]利用BP神经网络构建了估测土壤全氮的高光谱模型,证明了BP神经网络模型的预测效果较好,在植被养分估算方面,李媛媛等[22]通过BP神经网络模型估算玉米叶片叶绿素相对含量(soil and plant analyzer development,SPAD)值。Chen等[23]利用几个光谱参数为输入参数,构建BP神经网络模型反演水稻色素含量,发现其精度高于多元逐步回归。Kira等[24]基于神经网络建立了估算3种树木叶绿素和类胡萝卜素含量的模型。前人对构建水稻氮素反演模型时缺乏对多种参数和多种方法的比较,尤其是BP神经网络与传统模型的对比。建立基于单个特征参数指标的传统水稻叶片氮素浓度预测模型、不同指标数量的多元回归模型与BP神经网络模型,对比分析各模型精度,探讨BP神经网络模型在该试验条件下的可行性,及其适合的指标及数量。
1 材料与方法
1.1 试验设计
观测资料来自于江西省农科院的长期试验田。供试土壤为莲塘县层中潴黄泥田试验田0~20cm耕层,土壤基本性状为:pH值为6.50,有机质含量25.6g/kg,全氮含量1.36g/kg,全磷含量0.49g/kg,缓效钾含量240mg/kg,碱解氮含量81.6g/kg,有效磷含量20.8mg/kg,速效磷含量20.8mg/kg,速效钾含量35.0mg/kg,阳离子交换量7.54cmol/kg。
该试验共设8个处理:(1)不施肥(CK);(2)缺氮(PK);(3)缺钾(NP);(4)缺磷(NK);(5)正常施肥(NPK);(6)正常施肥:有机肥为1: 1(即处理(5)等养分化肥50%+有机肥50%); (7)正常施肥:有机肥为3: 7(即处理(5)等养分化肥30%+有机肥70%); (8)正常施肥:有机肥为7: 3(即处理(5)等养分化肥70%+有机肥30%),其中每个处理设置3个重复,共24个试验小区,每个小区33.3m2,并修筑了深70cm、宽50cm的水泥田埂。早稻施纯氮(N)150kg/hm2,纯磷(P2O5)60kg/hm2,纯钾(K2O)150kg/hm2,晚稻施纯氮(N)160kg/hm2,纯磷(P2O5)60kg/hm2,纯钾(K2O)150kg/hm2。氮肥施用尿素,磷肥施用过磷酸钙,钾肥施用氯化钾,有机肥早稻用紫云英,其鲜草养分含量按含N 0.303%、P2O50.08%、K2O 0.23%计算,晚稻用鲜猪粪,其养分含量按含N 0.45%、P2O50.19%、K2O 0.60%计算。磷肥和有机肥全作基肥,氮肥50%作基肥、25%作分蘖肥、25%作幼穗分化肥,K肥全作追肥, 50%作分蘖肥, 50%作幼穗分化肥。
1.2 高光谱信息获取
于2016年进行光谱数据的采集,高光谱测定采用SVC HR-768地物波谱仪,其波长范围为350~2 500nm,采样间隔为1.5nm(350~1 000nm)、7.5nm(1 000~1 850nm)和5nm(1 850~2 500nm)。水稻冠层测量时,天空无云或云分布均匀,时间一般为10: 00-14: 00(太阳高度角大于45°),光谱仪探头垂直置于冠层上方100cm处测量光谱,每个小区重复3次取平均值作为该小区的光谱测量值,而且每次测量前进行白板校正。光谱测定的日期为:分蘖盛期(8月25日)、孕穗期(9月18日)、抽穗期(9月27日)、成熟期(11月6日)。
1.3 叶片全氮浓度测定
与光谱测量同步,每小区选取2穴水稻植株带回实验室,立即将水稻叶片分离,测定叶片面积及鲜重,在105℃杀青30min后,再将温度调回80℃烘至恒重,称取叶片干重。将同一时期同一小区的所有绿色叶片进行粉碎、过筛,采用凯氏定氮法测定叶片全氮浓度。
1.4 数据处理
利用SVC HR-768光谱仪自带的光谱数据处理软件对原始光谱数据进行重采样,间隔为1nm,将输出结果作为该曲线的光谱数据,对每小区重复测量曲线进行均值处理作为该小区的光谱数据。表1为文中会使用的光谱参数,通过分析下表中各光谱参数与水稻叶片全氮含量的关系,寻找最佳预测效果的光谱参数。
表1 采用的光谱参数
光谱参数缩写含义原始反射率Rλ1nm重采样后的反射率值一阶导数R′λ[R(λi+1)-R(λi-1)]/2Δλ三边”参数红边振幅Dr680~760 nm内最大一阶微分值红边位置PDrDr对应的波长值红边面积SDr红边内一阶微分值总和黄边振幅Dy560~640 nm内最大一阶微分值黄边位置PDyDy对应的波长值黄边面积SDy黄边内一阶微分值总和蓝边振幅PDb510~560 nm内最大一阶微分值蓝边位置DbDb对应的波长值蓝边面积SDb蓝边内一阶微分值总和植被指数差值植被指数SD(Rλ1,Rλ2)Rλ2-Rλ1比值植被指数SR(Rλ1,Rλ2)Rλ2/Rλ1归一化植被指数ND(Rλ1,Rλ2)(Rλ1-Rλ2)/(Rλ1+Rλ2)
以表1中的参数为自变量,采用指数、线性、对数、多项式和幂函数构建传统的回归模型及BP神经网络模型,利用Excel及Matlab R2014a软件进行处理。由于氮素营养对冠层光谱的响应波段主要位于可见光和近红外波段,且在短波红外容易受水分的干扰,因此该文主要选择350~1 350nm波段进行分析。该文利用决定系数(R2)、均方根误差(RMSE)及相对分析误差(RPD)对模型精度进行检验。
将所有样本按氮素浓度进行由高到低排序,每隔3个样本选择1个样本为验证样本(共23份),其余为建模样本(共71份)。
表2 水稻叶片全氮含量统计特征
样本集样本数最大值(%)最小值(%)平均值(%)标准差整体样本944.8761.2462.9930.845建模集714.8761.2462.9880.860验证集234.3151.4883.0110.814
由表2看出建模、验证样本的各项指标与总样本相差不大,说明该方法筛选的建模、验证样本有代表性,可以代替总样本对模型进行建模验证。
2 结果与分析
2.1 水稻冠层叶片氮素浓度
图1 水稻LNC随生育期的变化
图2 不同LNC水平水稻冠层光谱反射率曲线
图3 水稻叶片全氮含量与冠层光谱反射率及一阶导数光谱的相关性
采用凯氏定氮法对水稻冠层叶片进行氮素浓度的检测,图1是8个处理的水稻LNC随生育期的变化而变化的曲线。从图1可知8个不同施肥处理的LNC随生育期的增长趋势一致,均表现为从分蘖盛期到成熟期呈下降趋势; 而同一生育期不同处理差异较为明显,尤其是处理1(不施肥)和处理2(缺N),且各生育期的全氮含量均显著低于其它处理,原因可能是处理1和处理2缺施氮肥,从而导致水稻长势较差; 而相对全氮含量较高的为处理6(NPK: 有机肥=1: 1)、处理7(NPK: 有机肥=3: 7)及处理8(NPK:有机肥=7: 3),这3个处理进行了有机—无机肥不同比例的结合施用,水稻长势较好,叶片含氮量较高; 5是NPK均施的处理,从理论上推测其各生育期的LNC均高于处理3(缺P),但是图1处理5的曲线始终处于处理3曲线下方,所以可以看出水稻的营养状况并不能只依靠施肥状况进行推测。
2.2 不同LNC等级下水稻冠层反射率特征
不同施肥处理可能导致水稻LNC的差异,但是依据施肥情况无法准确地确定水稻的氮素营养状况,于是该文根据事后检测的叶片氮含量情况进行分组,从而分析氮素对光谱的响应特征。将94组水稻冠层光谱按LNC由低到高分为1%~2%、2%~3%、3%~4%、4%~5%共4组,并将对应的每组光谱曲线进行平均,从而得到代表不同N含量的冠层光谱反射曲线图(图2)。结果显示,随着LNC的增加,可见光波段光谱反射率逐渐降低,而近红外波段的反射率显著增加(从40%左右上升为80%左右),主要是因为随全氮含量的增加,作物群体长势较好,色素含量增加,叶面积指数也增加,所以在可见光波段反射率下降,而在近红外反射率增加; 每条光谱曲线的走势基本一致,在550nm附近光谱曲线形成一个小的反射峰,红光波段形成一个吸收谷,主要是由于叶绿素对红光及蓝紫光的强烈吸收,而对绿光的吸收强度较弱导致的; 在680~760nm波段反射率急剧上升,形成“红边”现象,也是植物曲线区别于其它地物光谱曲线的最为明显的特征; 光谱曲线进入近红外波段之后,形成一个较高且较稳的反射平台,主要是由于叶内水化细胞壁及海绵状叶肉组织胞间界面的多次内部反射作用引起的,另一个原因是因为冠层光谱测定的是多层叶片,透过顶层叶片的能量将被下层的叶片反射回去,相比单片叶子会形成更高的反射能量; 其中在1 000nm波段处光谱曲线出现骤降骤升的现象,SVC HR-768在可见光和近红外波段使用的是两块不同的传感器,传感器在交叠处数据存在不一致的现象。
2.3 水稻LNC与原始光谱及一阶光谱的相关性分析
表3 “三边”参数与水稻LNC的相关系数
“三边”参数相关系数Dr0.608∗∗PDr0.612∗∗SDr0.687∗∗Dy-0.506∗∗PDy0.267∗∗SDy0.560∗∗PDb-0.444∗∗Db0.418∗∗SDb-0.419∗∗ 注:∗表示在0.05水平上显著; ∗∗表示在0.01水平上显著
将每个小区水稻所有生育期的LNC与对应的冠层光谱反射率及其一阶微分光谱反射率进行相关性分析(如图3)。结果显示,就原始光谱相关性曲线看来,在414~706nm波段相关系数均小于0,而527~691nm范围为显著负相关; 在350~414nm、708~1 350nm波段相关系数均大于0,在722~1 350nm间相关系数变化不大,存在一个正相关的平台,且相关性较高(0.6左右),相关性最好的波段是806nm(r=0.623)。相对于原始光谱,叶片全氮含量与一阶微分光谱间的相关系数在部分波段得到了较大程度的提高,在402~463nm、503~624nm波段达到显著性负相关,均高于原始光谱与叶片氮素的相关性; 在637~673nm 及698~804nm区域,其正相关达到较高水平,以751nm处的相关性最高(r=0.822); 而804~1 350nm近红外波段与叶片全氮的相关性较弱(r<0.242)。通过对这几个相关性高的波段光谱信息进行分析,有可能找到适于预测水稻LNC的光谱变量。
2.4 LNC与“三边”参数的相关性分析
通过Excel软件提取光谱曲线的“三边”参数,并与LNC进行相关性分析(表3)。
由表3可知,水稻LNC与“红边”参数的相关性均高于“黄边”及“蓝边”参数,但都达到极显著相关; 其中与Dr、PDr、SDr、PDy、SDy、Db呈正相关,与Dy、PDb、SDb呈负相关,相关性最高的为SDr(r=0.687),相关性最低的为PDy(0.267)。
2.5 水稻叶片全氮含量的敏感植被指数
由于冠层反射光谱反映的是植被群体的光谱信息,是叶片、穗、茎秆及土壤等背景光谱特征的综合体[25],单一波段的反射率变异性较大,易受外在因素的干扰,而以两波段的组合形成的植被指数可以扩展植被间的光谱差异。为了寻找估算叶片全氮含量的最佳光谱植被指数,该文进一步系统分析了350~1 350nm范围内两波段组合的差值(SD)、比值(SR)及归一化(ND)光谱指数与水稻叶片全氮含量的定量关系。图4-A、4-B和4-C分别为350~1 350nm范围内不同波段组合后的光谱指数与叶片全氮量的决定系数等势图。图4-A结果显示差值植被指数形成的等势图是两个对称的三角形,在750nm附近的红边波段与近红外波段的差值组合与叶片全氮含量相关性均较高,其中SD(R752,R751)与叶片全氮量相关系数最高,为0.827,决定系数为0.683; 图4-B结果显示550nm附近的绿光波段与近红外波段的比值相关系数较高,其中SR(R534,R1 350)相关系数最高,为-0.790,R2为0.624; 图4-C与图4-A一样均为两个相同的三角形组合而成, 500~600nm的绿光波段与近红外波段组合的归一化差值植被指数与叶片全氮含量相关性较高,其中ND(R534,R1 349)相关系数最高,为0.788,决定系数为0.621。
图4 两波段组合的差值(A)、比值(B)及归一化差值(C)光谱指数估算LNC的决定系数(R2)等势图
图5 多指标线性回归与BP神经网络回归实测值与预测值拟合结果
2.6 基于高光谱特征参数的单指标传统全氮估算模型
表4 水稻叶片全氮含量(y)与不同光谱参数(x)的定量关系及模型检验效果
光谱参数模型回归方程建模RC2验证RV2RMSEV%RPDR′751指数y=1.713 1e1.652 1x0.6280.6970.4511.807线性y=4.534 6x+1.589 90.6610.7280.4191.945对数y=1.085ln(x)+4.438 90.6380.6920.4531.798多项式y=-3.847 3x2+7.081 1x+1.260 70.6780.7310.4171.951幂y=4.97x0.415 60.6700.7230.4221.931SDr指数y=1.677 1e0.013x0.4320.4510.6221.308线性y=0.036 3x+1.502 40.4740.4800.5841.395对数y=1.646 8ln(x)-3.003 10.5240.5030.5691.432多项式y=-0.000 8x2+0.114 6x-0.113 50.5290.4960.5681.434幂y=0.318 7x0.602 30.5020.4940.5941.370SD(R752,R751)指数y=1.717 2e1.658x0.6270.7260.4221.930线性y=4.567 6x+1.591 30.6650.7500.4002.034对数y=1.150 1ln(x)+4.528 80.6580.6950.4421.841多项式y=-3.970 9x2+7.177 3x+1.256 90.6800.7470.4032.020幂y=5.113 8x0.436 10.6760.7380.4081.997SR(R534,R1 350)指数y=5.432 7e-3.676x0.6960.6400.5211.562线性y=-9.373 4x+4.6320.6330.6410.5211.565对数y=-1.635ln(x)+0.010.5840.6140.5531.471多项式y=2.861 9x2-10.581x+4.740 70.6340.6430.5211.563幂y=0.91x-0.6270.6140.5550.6321.289ND(R534,R1 349)指数y=0.442 5e2.632 3x0.6820.6280.5441.498线性y=6.770 9x-1.803 90.6310.6440.5241.555对数y=4.440 5ln(x)+4.572 10.6310.6380.5211.564多项式y=-4.401 3x2+12.694x-3.7470.6350.6410.5201.567幂y=5.316 2x1.746 50.6980.6420.5171.576
2.7 多指标的线性回归与BP神经网络的全氮估算模型
为了确定最佳的输入参数个数,该文进行了不同参数个数的验证。首先利用2.6节中的5个特征光谱参数作为输入变量,LNC作为输出变量,构建多元线性回归和BP神经网络模型。多元线性回归模型在SPSS软件中进行,
y=5.072-0.398×x1+0.011×x2+1.828×x3-8.54×x4-2.101×x5,R2=0.742
由于2.6节中筛选出来的5个特征参数存在一定的相关性,所以为了使模型更简便,该文将5个指标进行逐步回归,入选的参数为SD(R752,R751)和SR(R534,R1 350),公式为:
y=2.971+2.8x3-4.779x4,R2=0.731,验证结果如图5。另外将逐步回归筛选出的2个参数作为输入变量,叶片全氮含量作为输出变量进行BP神经网络训练,验证结果如图5。对比图5的4种模型发现,多指标模型精度均高于单指标线性模型; 另外,当5个指标全部作为自变量时,多元线性回归模型验证精度优于BP神经网络模型; 而通过逐步回归再次筛选指标后,建立的BP神经网络模型优于多元线性模型; 其中多元线性模型稍微优于逐步回归模型,而2指标BP神经网络模型较5指标BP神经网络模型有较大程度提高,说明指标较多时采用传统的线性模型精度较好,而采用指标较少时BP神经网络更有优势。
3 讨论
光谱反射率对氮素含量变化的响应为光谱反演氮素提供了理论基础,本系统分析了光谱反射率、一阶微分光谱、“三边”参数及3种植被指数与水稻LNC的相关性,目的是筛选出敏感参数。其中氮素与原始光谱在527~691nm波段呈显著负相关、708~1 350nm波段呈显著正相关,与一阶微分在402~463nm、503~624nm波段达到显著性负相关, 637~673nm 及698~804nm区域显著正相关,其中751nm处的一阶微分光谱反射率与叶片全氮含量相关系数最高(0.822),这与谭昌伟[15]的研究稍有出入,其原因可能是该研究是基于冠层层面,而谭昌伟的研究只是针对叶片,又或者是水稻品种、施肥情况及传感器等因素造成的,真正原因还有待进一步考究。
“三边”参数能较好的反映出绿色植被的光谱特征,史冰全等[26]通过对“三边”参数与叶绿素的相关性进行分析,建立了基于红边面积的健康松树针叶叶片叶绿素估算模型和基于蓝边位置的发黄松树针叶叶片叶绿素估算模型。秦占飞等[27]发现在拔节期利用红边面积预测水稻SPAD、在抽穗期及乳熟期利用红边位置预测水稻SPAD效果较好。该文研究也得出“三边”参数与叶片氮素相关性密切,尤其是“红边”参数中的红边面积,通过红边面积构建的预测叶片氮素的幂函数效果较好(R2=0.674 8),但是效果不如一阶微分及植被指数构建的模型。
相对比单波段参数,两波段构成的光谱指数可以放大植被的有效信息,削弱外部因素的影响,构建适宜的敏感光谱指数已成为遥感提取植被生化组分信息的重要方法。由两波段构建的差值、比值及归一化差值植被指数对叶片氮素含量的变化更敏感,以植被指数为自变量构建的线性及非线性模型精度均高于单波段模型,这与田永超等[28]的结论一致。该文筛选的最佳的植被指数为751nm与752nm波段反射率的差值,由于两波段相差太近,在目前分辨率低的仪器中可能得不到该波段数据,但是随着科技的发展, 1nm以下分辨率的光谱仪应该会出现。
寻找适宜的敏感参数是建模的前提,确定建模方法是建模的关键。该文研究结果表明,不同建模方法对估算水稻叶片全氮含量的影响较大。基于多变量构建回归模型精度均高于该文出现的所有单变量回归模型,另外,李媛媛[22]构建的BP神经网络模型只是与单变量的传统模型进行对比,缺乏与多变量的对比,而该文为了使BP神经网络的优势表现的更有说服力,进行了不同指标数量前提下的多元线性回归与BP神经网络模型的构建,发现利用该文的5个指标构建的BP神经网络与多元线性回归相比没有优势,而经逐步回归筛选出的2个指标构建的BP神经网络模型精度较多元回归模型有大幅度提高,说明BP神经网络构建水稻叶片全氮含量模型有优势,但需要选取合适的变量指标。