基于Lab颜色空间的棉花覆盖度提取方法研究
2018-10-20牛亚晓张立元韩文霆
牛亚晓 张立元 韩文霆
(1.西北农林科技大学机械与电子工程学院, 陕西杨凌 712100; 2.农业部农业物联网重点实验室, 陕西杨凌 712100; 3.西北农林科技大学水土保持研究所, 陕西杨凌 712100)
0 引言
植被覆盖度(Fractional vegetation cover,FVC)是描述地表植被分布的重要参数,通常定义为统计范围内植被(包括叶茎)垂直投影面积所占的百分比[1-2],是区域生态系统研究的重要指标,在分析植被分布影响因素、评价区域生态环境等方面具有重要意义[3-11]。随着遥感技术应用越来越广泛[12-14],植被覆盖度的遥感监测已经成为精准农业的重要内容和研究热点。根据ZHOU等[15]的建议,理想的植被覆盖度获取方法应具备以下几个特征:采用低成本、易于操作的设备,提取结果准确、客观,对采集时间要求较低,以及需要较少的人机交互。
目前,植被覆盖度的获取方法主要分为目估法、采样法、仪器法以及照相法[16-17]。目估法是指通过专业人员目视估计植被覆盖度,具有容易操作的优点,但是其测量结果较为主观。采样法通过统计样地内植被出现的频率进行植被覆盖度估计,该方法只能针对固定的植被类型或在固定的时间内进行测量,具有操作复杂、测量时间长等缺陷。仪器法则是利用专门的空间定量计等进行植被覆盖度估计,由于需要专业仪器,增加了推广难度。显然,上述3种方法并不具备理想植被覆盖度获取方法的特征。而照相法则是利用低成本、易于操作的数码相机,在作物上方采集数字图像,进而通过在图像中区分植被与非植被提取植被覆盖度。与上述其他方法相比,照相法具有操作简便、效率高等优点,是较为理想的植被覆盖度提取方法,目前得到广泛应用。
基于照相法获取植被覆盖度的关键是区分数字图像中的植被像元与非植被像元。目前,常见的区分方法主要有目视解译、监督分类和利用专业遥感软件等,分类过程需要人机交互,效率较低。如汪小钦等[18]采用目视解译的方式将数字图像中的像元逐个区分为植被与非植被,并以此作为植被覆盖度的地面参考值,用于评价各个植被指数对植被像元的提取效果。任世龙等[19]以商业软件WinCAM获取的植被覆盖度为地面测量值,对比分析了其开发的DPPS系统与基于Lab颜色空间方法的估算结果精确度,认为高寒草地生态系统DPPS比Lab颜色空间方法更适于提取植被覆盖度。常慧[17]以通过CAN_EYE软件获取的草地植被覆盖度作为地面测量值,选取了青海湖流域植被覆盖度反演的最佳遥感模型。VALÉRIE等[20]使用专业遥感软件CAN_EYE处理多种作物的数字图像,从土壤背景中正确识别植被像元。
随着图像处理技术的发展,越来越多的研究人员开始利用不同颜色空间中植被像元与非植被像元特异性进行植被覆盖度提取[16,21-25]。上述研究虽然在基于不同颜色空间提取植被覆盖度方面取得了一定的成果,但是大多没有分析所提出的提取方法对不同光照条件的适用性,或分类阈值在不同的光照条件下具有波动性,限制了上述方法在田间的进一步应用[26]。
随着传感器等相关技术的发展,无人机遥感系统凭借其运载便利、灵活性高、作业周期短、影像数据分辨率高等优势得到迅猛发展,越来越多地应用到各领域遥感监测中[18,27-31]。无人机可见光遥感技术与照相法的结合使得大范围田间植被覆盖度的高效、快速提取成为可能。本文以苗期和蕾期的棉花为研究对象,对不同光照条件下手持高清数码相机获取的可见光图像进行处理和分析,寻求一种受光照条件影响小且分类阈值相对稳定的田间条件下快速提取棉花覆盖度的方法,并通过与无人机可见光遥感技术的结合,提高该方法的效率和适用性,降低数据采集成本和劳动强度。
1 材料与方法
1.1 试验地概况及数据采集
研究区域位于陕西省杨凌示范区西北农林科技大学中国旱区节水农业研究院(34°17′50.94″N,108° 4′4.17″E)。杨凌位于关中平原中部,属于暖温带半干旱或半湿润气候,年平均气温11~13℃,年降水量500~700 mm。分别于2017年6月18日15:00(苗期,多云)、2017年6月30日10:00(蕾期,多云)以及2017年7月2日12:00(蕾期,晴天),在棉花试验田采集了不同天气状况及不同时间段的29幅具有不同覆盖度的数字图像,图像按照采集时间进行依次编号。图像采集设备为数码相机SONY ILCE-QX1,采集高度2 m,镜头垂直向下,图像分辨率5 456像素×3 632像素,地面分辨率0.4 mm,视场2 m×1.3 m。由于采集高度较低、相机视场角较小(镜头焦距为16 mm),因此在本研究中忽略了地面遥感图像边缘畸变。根据图像捕获时不同的天气状况可将29幅数字图像分为两类:16幅由棉花、土壤2部分构成的图像;13幅由棉花、阴影、土壤3部分组成的图像。
在2017年7月2日(蕾期、晴天)和2017年7月6日(蕾期、多云)的14:30分别利用DJI精灵3标准版进行了无人机可见光遥感数据采集,数据采集高度10 m,图像分辨率4 000像素×3 000像素,地面分辨率4 mm,视场21.4 m×12.9 m,快门时间设置为1/1 600 s,ISO分别设置为200和400,白平衡分别设置为晴天和阴天,共采集280幅图像。无人机可见光遥感图像采集完成后,对2017年7月6日采集的数据利用Pix4DMapper软件进行图像拼接处理,获取棉花试验田全景图。基于无人机可见光遥感技术获取试验地全景图(图1a)和地面可见光图像采集示意图(图1b)。对单幅无人机可见光遥感图像进行处理时,为了避免图像边缘畸变的影响,对图像进行了修剪,仅保留图像中心部分的2 000×2 000个像元。
图1 试验地概况Fig.1 Experimental site overviews
1.2 基于颜色空间的棉花植被覆盖度提取方法
图2 植被覆盖度提取流程图Fig.2 Flow chart of FVC extraction
彩色数字图像具有适应丰富场景的优势,尤其是户外场景[27]。对于植被覆盖度提取来说,彩色图像可以满足多种维度的图像分割要求。在实际应用中,可以通过在某种颜色空间下的某个维度中选取阈值的方式,进行植被覆盖度提取[22]。本文将基于Lab(a)颜色空间、RGB(2G-R-B)颜色空间和HIS(H)颜色空间分别采用高斯分布拟合求解动态阈值和固定阈值两种方式进行棉花覆盖度提取。以Lab颜色空间为例,本文植被覆盖度提取流程(利用Matlab软件实现)如图2所示。
1.2.1颜色空间选取
基于HIS、Lab以及RGB等颜色空间的特定通道或指数都可以提取绿色植被覆盖度。具体来说,在HIS颜色空间中色调H用于描述纯色的属性(如绿色、黄色);在Lab颜色空间中a用于描述从红色到绿色的范围;RGB颜色空间的2G-R-B为过绿指数,常用于提取绿色植被。因此,可以分别利用数字图像中植被与非植被像元在H、a、2G-R-B指数上分布的差异性进行棉花覆盖度提取。
精确提取植被覆盖度的关键在于精确区分数字图像中的植被与非植被像元,因此在进行颜色空间选取时需要尽可能扩大植被像元与非植被像元的分布差异性。为了对植被像元与非植被像元在上述颜色空间特定通道上的分布(高斯分布)差异性进行量化,将其定义为
(1)
式中S——两类高斯分布的可分离性
μ1——第1类高斯分布均值
μ2——第2类高斯分布均值
σ1——第1类高斯分布标准差
σ2——第2类高斯分布标准差
由图3可知,S值越大则表示两类高斯分布重叠部分越小,即两类像元分布相距越远。
图3 两类高斯分布交点示意图Fig.3 Diagrams of two Gaussian distribution
1.2.2高斯分布拟合
为了研究棉花与土壤像元在上述颜色空间某个通道上的分布情况,分别截取了仅包含棉花和仅包含土壤的图像,如图4a和图4b所示。以其在Lab颜色空间a通道上的分布为例进行分析,直方图绘制间距为0.2。如图4所示,棉花像元、土壤背景在a通道上近似服从高斯分布,且均值具有一定的差异。图4a中的分布可以通过非线性最小二乘算法拟合成(通过软件编程实现)均值为-27.31、标准差为4.46的高斯分布(R2=0.99)。可以认为在既包含棉花又包含背景像元的数字图像中,像元在a通道上的分布为两个或多个高斯分布的综合(图4c、图4d),同样可以通过非线性最小二乘算法拟合成多个高斯分布,如图4c和图4d所示。在过绿指数2G-R-B以及H通道中具有相同的现象。综上所述,可以利用软件通过非线性最小二乘算法将数字图像中的植被像元和非植被像元在a通道、2G-R-B指数以及H通道分布自动拟合成分别对应于植被和背景的多个高斯分布曲线。
1.3 精度评价
目前,植被覆盖度的真实值难以获取,在评价植被覆盖度提取方法的有效性时,一般将目视解译结果[18]或监督分类结果[16]作为真实值。其中监督分类方法需要在待处理图像中人工选取N类典型训练样本,训练样本的选取在很大程度上影响该方法对图像的分类结果。由于训练样本的精确度与图像分辨率呈正相关,且可以通过对训练样本的评价与检验避免出现严重错误,因此图像分辨率越高,分类误差越小。文中所用遥感图像分辨率分别为0.4 mm和4 mm,可以精确地选取土壤和植被两种训练样本,进而保证分类结果的准确性。因此,本文将通过监督分类提取的植被覆盖度作为真实值,对基于颜色空间与高斯分布拟合方法的提取效果进行评价,并将植被覆盖度提取误差定义为
EF=|Fsup-Fcolor|
(2)
式中EF——植被覆盖度提取误差
Fsup——通过监督分类方法获取的植被覆盖度
Fcolor——基于颜色空间获取的植被覆盖度
2 结果与分析
2.1 植被与非植被在不同颜色空间的可分离性
以16幅仅包含棉花、土壤的数字图像为例,根据式(1)计算了两类高斯分布的可分离性S,如表1所示。数字图像在a通道、2G-R-B指数以及H通道的分布直方图中采样数量一致,均为80。由表1可知,在上述3种通道上棉花像元与土壤像元分布的可分离性S都大于3,意味着两类高斯分布的重叠部分都小于0.1%。因此,基于a通道、2G-R-B指数和H通道3种灰度值的高斯分布特性对棉花覆盖度进行提取均是可行的,而影响植被覆盖度提取精度的主要因素则为各个颜色空间对绿色植被的识别能力。
表1 植被像元与非植被像元分布的可分离性STab.1 Separability of vegetation pixel and non-vegetation pixel distribution
2.2 植被与非植被动态分类阈值的分布
表2为通过高斯分布拟合得到植被像元与非植被像元在29幅图像中的动态分类阈值。
表2 植被像元与非植被像元的分类阈值Tab.2 Classification threshold of vegetation and non-vegetation pixels
对具有不同量纲或特性的数据进行统计分析时,为了使不同的数据具有可比性,一般需要进行标准化处理[32]。为了对比分析棉花图像在a通道、2G-R-B指数以及H通道中动态分类阈值的离散程度,消除动态阈值在3种通道上数据量级的差异性,对动态阈值进行了标准化处理,即得到均值为0、标准差为1的服从标准正态分布的动态阈值数据。上述3种通道动态阈值经过标准化处理之后的分布情况如图5所示,其中黑线为分类阈值单位标准差的中分位数,绿色矩形表示上、下四分位数之间的数据分布。由图5可知,标准化后的动态阈值集中分布在(-0.58,0.72)之间,分布较为集中,即上述3种颜色空间相应通道上的动态分类阈值离散性较小。
图5 阈值分布Fig.5 Distribution of threshold
以a通道为例,标准化之后的动态阈值分布范围(-0.58,0.72)对应的动态阈值范围为(-4.74,-2.59)。由表1可知,在上述3种通道中植被像元与非植被像元分布的可分离性S都大于3,即意味着两类高斯分布的重叠部分小于0.1%。由图4可知,a通道上植被像元与非植被像元高斯分布的重叠范围约在(-10,-2)之间,由于重叠部分小于0.1%,分类阈值在上述范围波动并不会对提取结果造成较大影响。为了验证固定分类阈值在a通道、2G-R-B指数和H通道中进行植被覆盖度提取的可行性,本文以反映动态阈值分布情况的平均值-3.78、0.06、0.13作为固定分类阈值进行棉花植被覆盖度提取。
2.3 基于地面遥感的棉花植被覆盖度提取
图6为基于颜色空间的植被覆盖度提取方法得到的3种不同覆盖度梯度棉花植被覆盖的提取效果。
图6 3种不同梯度的棉花植被覆盖度提取效果图Fig.6 Cotton FVC extraction results of three different gradients
图7 植被覆盖度提取误差分布Fig.7 Distributions of FVC extraction error
按上述精度分析方法,分别对在Lab颜色空间(a)、RGB颜色空间(2G-R-B)、HIS颜色空间(H)中基于动态分类阈值和固定阈值-3.78、0.06、0.13的棉花植被覆盖度提取结果进行了误差计算,并绘制总体提取误差分布图,如图7所示。由图7可知,相比于RGB(2G-R-B)颜色空间和HIS(H)颜色空间,基于Lab(a)颜色空间的棉花覆盖度提取精度最好,通过高斯分布拟合求解动态阈值和以-3.78为固定阈值的平均提取误差分别为0.011 1和0.009 4,固定分类阈值的提取效果更好,误差降低了0.001 7。相比于动态阈值,固定阈值的提取误差分布更接近0,且较大的误差出现的概率较低。
图8 不同天气的植被覆盖度提取误差Fig.8 FVC extraction error under different weathers
图8和图9分别为在Lab(a)颜色空间上应用非线性最小二乘算法进行高斯分布拟合的棉花覆盖度提取误差,按照图像采集时天气状况和采集时刻进行分类的对比分析图。由图8和图9可知,在不同天气状况(晴天和多云)与不同采集时刻(10:00、12:00和15:00)等不同光照条件下,基于Lab(a)颜色空间应用动态阈值时棉花覆盖度平均提取误差分别为0.007 3、0.014 2、0.020 2、0.007 3和0.004 1,应用固定阈值-3.78时棉花覆盖度平均提取误差分别为0.005 6、0.012 5、0.018、0.005 6和0.003 5,具有较小的平均提取误差,不超过0.0202%,且相比于动态分类阈值,应用固定分类阈值时提取精度更好。
图9 不同时刻的植被覆盖度提取误差Fig.9 FVC extraction error at different times
图11 基于UAV图像的棉花植被覆盖度提取结果Fig.11 FVC extraction results of cotton based on UAV images
由前文可知与晴天相比,在多云天气下采集的棉花可见光图像中只包含棉花和土壤两部分,地物类型分布更为简单,其应具有较小的提取误差,而由图8可知,多云天气下提取误差较大。多云天气下采集的数据包括2017年6月18日15:00和2017年6月30日10:00,由图9可知,与晴天(2017年7月2日12:00)相比,2017年6月18日15:00采集数据的提取误差较小,而2017年6月30日10:00采集数据提取误差的异常增大,进而造成多云天气下的提取误差较大。经过分析发现,2017年6月30日10:00采集棉花可见光图像中存在大量枯萎的叶片(图10),与深色阴影相比,尚未完全干枯的落叶呈浅绿色与棉花叶片更为相似,即与晴天相比多云天气下采集的图像中地物类型更为复杂,从而造成提取误差偏大。
图10 包含枯叶的棉花图像Fig.10 Cotton image containing dead leaves
综上所述,相比于2G-R-B指数和H通道,a通道对绿色植被的识别能力最好,受不同天气状况(晴天和多云)与不同采集时刻(10:00、12:00和15:00)等不同光照条件的影响较小,且植被像元与非植被像元存在固定分类阈值-3.78,平均提取误差为0.009 4,更适合提取棉花覆盖度。
2.4 基于无人机可见光遥感的棉花植被覆盖度提取
图11为基于单幅无人机可见光遥感影像在a通道应用固定阈值的方法得到的两种天气、两种土壤湿度和两种不同棉花覆盖度的提取效果。图11a、图11b、图11c分别为晴天及干燥土壤条件下的原始图像、覆盖度提取结果和监督分类结果;图11d、图11e、图11f分别为阴天及湿润土壤条件下的原始图像、覆盖度提取结果和监督分类结果。
为了更好地评价该方法结合无人机可见光遥感技术进行棉花覆盖度提取的效果,在两次采集的280幅无人机可见光遥感影像中各随机选取12幅,共24幅进行支持向量机的监督分类,并按上述精度分析方法进行误差计算,提取误差分布图如图12所示。由图11和图12可知,棉花覆盖度的总体平均提取误差为0.012,晴天和干燥土壤条件下的平均提取误差为0.011 4,多云和湿润土壤条件下的平均提取误差为0.012 6,提取误差较小。因此,可以认为基于两种天气和土壤干湿情况下采集的棉花蕾期无人机可见光遥感影像在a通道的分布情况,结合固定阈值的方法可以较好的提取棉花覆盖度。
图12 基于UAV图像的棉花植被覆盖度提取误差分布Fig.12 FVC extraction error distributions of cotton based on UAV images
采用a通道与固定阈值相结合的方法,对2017年7月6日采集的无人机可见光遥感图像进行处理得到的试验地棉花总体植被覆盖度情况如图13所示。由图可知,结合无人机可见光遥感技术和棉花在Lab颜色空间a通道上的提取阈值,可以精确地在低空无人机遥感尺度上提取棉花覆盖度。
图13 棉花植被覆盖总体分布图Fig.13 Overall distribution diagram of FVC of cotton based on UAV orthophoto image
3 结论
以苗期和蕾期的棉花为对象,提出了一种基于Lab颜色空间a通道的受不同光照条件影响小且分类阈值波动小的棉花覆盖度提取方法,并成功将该方法与无人机可见光遥感技术相结合,提高了方法适用性及作业效率,降低了数据采集成本及劳动强度。研究结果表明:
(1)苗期和蕾期的棉花可见光图像中,植被与非植被像元在Lab(a)颜色空间、RGB(2G-R-B)颜色空间和HIS(H)颜色空间呈现高斯分布,可以通过非线性最小二乘算法进行高斯分布拟合。
(2)通过分析地面可见光遥感图像在3个通道的动态分类阈值分布情况,发现植被像元与非植被像元的分类阈值分布范围较为集中,利用动态阈值的平均值-3.78、0.06、0.13可以较好地提取棉花植被覆盖度,相比于RGB(2G-R-B)颜色空间和HIS(H)颜色空间,Lab(a)颜色空间对绿色植被的识别能力最好,更适合提取棉花植被覆盖度。
(3)所提出的棉花覆盖度提取方法受天气状况(晴天和多云)与采集时刻(10:00、12:00和15:00)等不同光照条件的影响较小,可以通过a通道中固定阈值-3.78提取棉花覆盖度,平均提取误差为0.009 4。
(4)将该方法应用到无人机尺度时,同样可以较好地提取不同天气状况(晴天和多云)和不同土壤干湿类型的棉花覆盖度,且总体平均提取误差为0.012。