基于无人机可见光谱的城市植被含水量反演
2022-07-04李雪鹏邓红霞李海芳
李雪鹏,许 增,杨 昱,邓红霞,李海芳
(1. 太原理工大学信息与计算机学院,山西 太原 030600)
植被生长态势的监测是城市绿化持续健康发展的基础[1]。过去相关研究[2-11]尽管能够映射出植被叶片含水量和高光谱波段之间的联系,但由于高光谱相机的价格十分高昂,对于大范围监测城市植被的生长态势可行性很小。随着无人机技术的普及[12],大范围监测成为可能。基于此,利用无人机在4个月时间内对6种植被进行叶片含水量监测,并尝试在植被的多维光谱信息和含水量之间利用回归方程建立映射关系,分析不同回归方程对植被含水量的相关性,并对模型精度进行测评。
1 数据集
1.1 数据采集
本文的数据来源于山西省晋中市榆次区,使用深圳市大疆创新科技有限公司生产的Mavic Air2型多旋翼无人机,搭载一颗全新的1/2英寸CMOS传感器,支持拍摄4 800万像素的照片(角度84°,等效角度24 mm,光圈f/2.8)。在2020-04~2020-08共5个月时间内,选取了草地、白蜡、冬青、美人榆、白杨、枣树6种植被。根据不同的植被种植面积采用不同的飞行高度,经多次试飞后选定为4~30 m,拍摄角度为50~84°,拍摄时间选为上午9:00、10:00、11:00和下午14:00、15:00,拍摄场景选取风力柔和的晴天,每次拍摄前先操控无人机飞至植被区域上空5~10 s待机身稳定后进行拍摄,保证获取图像的质量。图1为拍摄的6种植被的可见光图像。
图1 航拍植被的可见光图像
为了建立植被冠层含水量和可见光图像之间的映射关系,还需要采集实验地面植被的冠层水分信息。对于每一种植被,随机挑选10~20处长势正常的分枝,用电子天平(单位:g,精度0.01:g)测量出这些分枝的重量,即植被的鲜重FW(fresh weight,单位:g);接下来将这些分枝置于70℃的恒温烘干箱中烘烤12 h,直至其质量不再发生变化,得到植被的干重DW(单位:g),通过式(1)计算可得植被冠层的相对含水量[13]:
1.2 图像预处理
在1.1 中航拍到的图像中,尽管有所需要的植被部分,但是同时也存在大量的非植被区域。由于非植被部分的存在,会对接下来的提取造成多余的信息干扰,因此要预处理去除图像中的非植被部分,只保留植被部分的信息。
本文采用过绿植被指数NExG[14]和归一化处理来提取图像中的植被部分:
式中,R、G、B分别代表像素点的红、绿、蓝亮度值。
利用直方图阈值法确定NExG的阈值大小,然后根据阈值点对对原图像进行Mask 掩膜处理,结果如图2所示。
图2 图像预处理前后对比
2 方 法
2.1 技术路线
本文使用的技术路线如图3 所示,按照一部分中的方法采集足量的数据集,其中每张图像与其拍摄时的冠层含水量之间做记录并一一对应。将采集到的图像做预处理后,利用HSCNN 将普通可见光RGB 图像重构为400~700 nm 的多光谱图像,然后利用PCA 从多维光谱信息中提取出主成分,最终从这些主成分和冠层含水量之间建立一个映射关系,达到反演目的。
图3 技术路线
2.2 HSCNN
HSCNN是Xiong[12]等在2017年ICCV上提出的统一的深度学习框架。具体流程是首先通过简单插值在光谱维度上对RGB图像进行升采样,然后所提出的方法从大量的升采样/地面高光谱图像对中学习端到端映射。映射表示为深度卷积神经网络,以频谱上采样的图像为输入,并预测丢失的图像细节,从中恢复最终的高光谱图像。
HSCNN网络结构如图4所示,网络共有d层,第一层负责从输入图像中提取补丁。由于高光谱图像是三维图像,因此第一层具有64 个大小为3×3×Ω(Ω为索引光谱坐标)的过滤器,并在Ω个光谱带的3×3空间区域上运行,产生了64个特征映射。除第一个和最后一个图层外的其他图层均为64 个大小为3×3×64的过滤器。最后一层由大小为3×3×64 的Ω个过滤器组成,可从64 个特征映射中重建具有Ω个光谱带的高光谱图像。
图4 HSCNN网络框架
2.3 植被冠层含水量与光谱特征分析
可见光图像(w×h×3,w和d为图片宽度和高度,3 代表三维颜色通道RGB)经过HSCNN 重构为w×h×31的图像矩阵,由三维通道扩充到了31维,可见光光谱波长范围为400~700 nm,波长间隔为10 nm。
图像的颜色矩,即一阶矩(均值)、二阶矩(方差)和三阶矩(斜度)被证明可以很有效地表示图像中的颜色分布[15],3个颜色矩的数学定义如式(3):
式中,ρi,j为图像第i个颜色通道分量中灰度为j的像素出现的概率;N为图像中的像素个数。
图像的31维通道组成的直方图向量,即图像的特征向量表示如式(4):在可见光波长范围内,每一种植被都有其各自的光谱反射特性,因此要建立植被冠层含水量和可见光图像之间的映射关系,就是建立从植被图像中提取的多维光谱特征信息和该植被实际冠层含水量间的联系[16]。
2.4 PCA提取光谱主成分
多元回归分析方法是处理多变量间相依关系的统计方法[17]。但在实际的应用中,有的多元自变量与因变量相关性不大,有的自变量之间还可能存在近似线性关系则会引起回归方程的不稳定,由于2.3 中图像的特征向量维数较多,需要用较少的几个综合变量来代替原来较多的变量,使得这几个综合变量彼此之间互不相关,尽可能反映原变量的信息。表1 显示出当相关性大于99.9%时所需要的主成分数。
表1 光谱波段主成分分析表
2.5 回归方程
实验得出的6 种植被的光谱波段的主成分在4~6之间,要建立这些主成分与其对应的相对含水量之间的联系,可采用最小二乘法拟合多元变量来建立回归模型[18]。考虑到模型中使用的样本数量较少,可能出现过拟合的现象,为了避免这种情况,可以通过在最小二乘法回归方程后加上正则化参数来调节。在这里选择添加L1正则和L2正则2个参数,即使用ElasticNet,既能减少模型的方差,又能使得回归系数尽可能取较小的值,防止出现过拟合。ElasticNet公式如下所示(5):
3 结果与分析
3.1 实验结果
以04-01~08-01 采集数据中的4/5 样本进行回归建模,1/5 样本用来验证模型的精度,其中6种植被的无人机航拍图像和对应的植被冠层相对含水量数据均为160个样本建模,40个样本验证,验证方法采用五折交叉验证,6 种植被的冠层相对含水量统计特征如表2所示。
表2 植被冠层相对含水量统计特征
3.2 模型验证分析
采用模型决定系数(R2)和均方根误差(RMSE),2 种验证方式[19]和五折交叉验证对回归模型进行验证。验证结果见表3。
根据表3 对2 种模型下植被冠层相对含水量的预测值与实测值比较,2 种回归模型方法均有较好的预测性。其中最小二乘法的预测误差率普遍要略大于ElasticNet。白蜡在2种模型的决定系数R2均表现出偏低(0.322 和0.371),而其他5 种植被均表现正常,2 种回归模型均可作为反演植被含水量的模型。同时也发现,接触地面的草地植被(草) 和灌木植被(白杨、枣树)的误差率相比较林地植被(白蜡、冬青、美人榆)的更高,因此可以推测这2 种模型对林地植被的反演精度更高。对比文献[11]中基于无人机可见光波段反演冬小麦植株含水量,其光谱反射率模型的相对误差率为10%,光谱植被指数模型的相对误差率为13%,两者结合下的优选模型相对误差率约为7%,而本文提出基于HSCNN可见光植被含水量反演模型平均相对误差率为4%左右,相较于其模型准确率提高了3%~9%。
表3 不同模型下植被冠层相对含水量的预测值与实测值比较
4 结 语
本研究从无人机拍摄的可见光图像着手,采集了草地、白蜡、冬青、美人榆、白杨、枣树6 种植被各200组数据和与图像一一对应的植被冠层相对含水量数据。首先对采集到的图像进行预处理,通过Mask掩膜覆盖图像的非植被部分,然后通过HSCNN 映射并恢复出航拍图像可见光400~700 nm范围内的多光谱数据;利用PCA 主成分提取法对多维光谱波段提取主成分,然后通过最小二乘法和ElasticNet 2 种回归模型对通过PCA 提取出来的主成分和植被冠层相对含水量数据之间建立映射关系。
实验结果表明,植被的可见光多维光谱信息和植被冠层相对含水量之间存在较好的相关性,其预测结果和实际测量结果的误差率在2%~5%左右,对可见光反演植被冠层含水量提供了一定理论支持。同时,通过2 种回归模型对6 种植被的冠层含水量反演的结果分析,其对冬青的反演结果最好(模型决定系数在0.7以上,误差率在2.5%左右)。因此可以认为通过普通的RGB可见光图像能够对植被冠层含水量进行预测和反演,为大面积监测城市植被的生长态势提供了理论依据。尽管在可见光植被图像和植被冠层含水量之间建立了映射关系,但模型有以下两点限制:①由于不同植被之间的外观、颜色、长势、含水量之间的差异性,每种映射关系的建立是在同一种植被上,因此如果想要建立除本研究中外6 种植被的反演模型,需要建立新的映射关系;②本研究中所实验的植被均为绿色植被,因此非绿色植被能否应用本文的方法仍需进一步研究。