多共性特征联合的Landsat 8 OLI遥感影像光伏电站提取
2018-11-30王胜利张连蓬朱寿红
王胜利,张连蓬,朱寿红,吉 莉,柴 琪,沈 扬,张 蕊
(1. 江苏师范大学地理测绘与城乡规划学院,江苏 徐州 221116;2. 江苏省兰德土地工程技术有限公司,江苏 南京 210019)
随着能源短缺和环境污染问题的日益加剧,太阳能光伏电站因其无污染、可再生等优势受到人类的重视,且在世界范围内大量建设。根据我国《可再生能源中长期发展规划》,预计到2020年光伏电站累计装机容量将达1亿千瓦,稳居世界第一[1]。如何及时、准确地获取全国光伏电站的分布情况及变化信息,对于政府管理部门实现科学决策具有重要意义[2]。人工解译因其成本高、效率低等缺点,已经很难满足实际需求,而观测范围广、时效性强的遥感技术提供了一个重要的监测手段[3-4]。
遥感图像监督学习是地物提取常用的手段,然而监督学习算法的性能具有高度的样本依赖性,即依赖于所选训练样本的数量、纯度、分布位置、统计分布特性,以及对数据特征的可区分性表述能力等[5]。在地物提取领域往往需要多时相遥感影像进行时序分析,在土地覆被变化监测中常需要由多幅图像拼接起来的大尺度遥感图像来制图。然而,不同时期图像和上述的大尺度遥感图像在大气、辐射、光照和成像几何条件上的差异会带来数据统计分布特性的改变(像元亮度值的改变),进而造成利用某幅遥感图像获取的训练样本训练的模型在另一幅遥感图像上分类性能降低,甚至模型失效。上述现象被称为数据偏移,这给地物提取带来极大的困扰[6-7]。鉴于此,若能够避开运用像元亮度特征而选择相对不变的共性特征进行地物提取将能够有效提高精度。此外,地物在影像上表现为一定的光谱、纹理和几何形状信息的综合体,地物光谱不确定的广泛存在使得仅利用单一特征进行信息提取具有较大的局限性[8]。近年来,多特征综合应用已经成为当前研究的热点,但研究的重点大多在于辅助空间特征改善分类结果中的椒盐现象,缺乏对本文论述问题的关注[9-12]。
光谱角制图算法[13](spectral angle mapper,SAM)因具备对照度变化不敏感的特性而得到广泛的应用,然而SAM不具备对波形细节变异捕捉的能力;色度、饱和度具有区分地物材料的特性[14],从而具有一定的特征可区分性表述能力;纹理是刻画物体表面形态的工具,大量研究表明辅助纹理进行地物提取能够显著改善效果[9,15];波段比值作为刻画波形局部细节特征的手段,同样对照度变化不敏感,且能够与SAM起到互补作用[16]。利用上述不受亮度值统计分布特性改变的地物共性特征提取光伏电站理论上能够取得更好的效果。基于以上分析,本文提出一种多共性特征联合的光伏电站提取方法。首先,选取对照度变化不敏感的波形特征(如光谱夹角、波段比值)和色彩空间变换后的光谱特征(色度和饱和度)作为复合光谱特征;然后,利用亮度维计算傅里叶纹理特征,并与复合光谱特征融合输入一类支持向量机[3](one-class support vector machine,OCSVM)进行光伏电站提取。利用Landsat 8 OLI影像作为数据源,通过在宁夏地区选取电站样本训练OCSVM模型提取甘肃地区的光伏电站,并利用人工解译的结果进行精度评定。本文将设计不同的提取方案,并对各方案进行对比分析。
1 研究区概况及数据源
1.1 研究区概况
研究区(39°41′N—39°45′N,98°05′E—98°39′E)位于甘肃省中部,两个光伏电站分别位于酒泉市西部和东南部。华电嘉峪关航天机电10兆瓦沙漠电站示范项目位于酒泉市城区以西,于2010年5月并网发电,占地面积0.4 km2,未来总规划面积162 km2,装机容量500兆瓦以上;酒泉东洞滩100兆瓦沙漠电站于2014年1月正式并网发电,该项目位于酒泉市城区东南12 km处,占地面积约5 km2;研究区内的地物类型主要包括沙漠、山脉、建筑区、光伏电站、植被和道路。研究区波段(4、3、2)合成假彩色影像及光伏电站的局部放大如图1所示(上图为假彩色影像图,下图左侧为华电嘉峪关光伏电站、右侧为酒泉东洞滩光伏电站)。
1.2 数据源
试验数据为从美国地质调查局(USGS)网站上免费获取的Landsat 8 OLI影像,训练数据采用2015年10月10号宁夏地区的影像,条带号为130、34;测试数据采用2016年10月15号甘肃酒泉的影像,条带号为135、32,覆盖范围包括酒泉市和嘉峪关市及周围的部分区域。数据影像共包含11个波段,除8波段(全色波段)的空间分辨率为15 m和10、11波段(热红外波段)的空间分辨率为100 m外,其他波段空间分辨率均为30 m。由于试验选取的两幅影像云覆盖率在1.5%左右,因此无需采用9波段(卷云波段)作去云处理;考虑数据的用途为地物提取,因此选择1~7波段进行试验分析。
2 多共性特征联合分析
考虑辐射强度偏差给传统基于像元亮度值统计分布特性进行提取的算法带来的巨大挑战,本文选取多种对地物照度变化不敏感的共性特征进行联合分析,然后输入OCSVM进行光伏电站提取。
2.1 色彩空间变换特征(HLS)
HLS是色度H(hue)、亮度L(luminance)和饱和度S(saturation)的简称,因其和人眼观察事物的方式类似,利于图像处理,因此在遥感图像处理领域也得到了运用[14]。H实质上是色彩的基本颜色,表示该颜色最接近何种光谱波长;L即图像原色的明暗度,反映的是物体表面的起伏特性;S是描述颜色与标准颜色之间相近程度的物理量,即彩色的纯度。色度和饱和度通常由地物材料的反射和吸收特性决定,因此利用这两个光谱维度作为辅助特征,能够提高不同地物间的特征可分性。
图1 研究区
2.2 波形特征
成像辐射偏差会使同种地物的像元亮度值产生较大波动,对于不同空间位置和不同时相的遥感影像更甚,造成基于统计特性的传统算法泛化性能不足。根据地物光谱形状线性尺度变化或接近线性尺度变化的特性,一些学者从波形相似性度量的角度出发提取地物,大大改善了提取效果。考虑两个光谱向量的方向相对于长度不易改变的特性,本文利用SAM影像替代原始影像进行目标地物提取。SAM是通过计算影像上每一个像元与端元像元之间的夹角来度量像元之间的相似性程度,根据阈值来判断该像元是否为目标地物的一种方法[17]。
2.3 纹理-光谱特征
纹理是描述地物内部属性的特征,部分学者将纹理描述为像素亮度在局部空间以一定形式变化而产生的模式[18]。研究表明纹理和光谱特征联合能够显著提高地物提取精度[10-11,19-20]。傅里叶变换[16,21]将图像从空间域转换到频率域,具有旋转不变的特性。由于影像上不同地物的形状不同,进而对应的频率域产生的能量谱亦不相同,因此依据能量谱的统计信息就够区分不同地物[22]。
对于一个长度为N的一维序列f(x),其离散傅里叶变换为
(1)
式中,F(u)为频域谱;x为图像(空间)域变量;u为频率域变量;j为复数的虚部部分。
因此,傅里叶变换的功率谱表示为
(2)
局部傅里叶变换(local Fourier transform,LFT)通过选择合适的窗口大小来突出对地物特定纹理细节的描述,弥补了传统傅里叶变换只能分析信号全局频域内容的缺陷[18]。傅里叶谱纹理含有大量的信息和冗余,如何高效、恰当地利用傅里叶谱的统计量去准确描述地物形状特征依然是当前的研究难点。目前常用的方法有多种,如周烽等[23]利用LFT功率谱的幅度和相位直方图作为纹理特征辅助分类,取得了比灰度共生矩阵更好的分类精度,但存在直方图等级难以量化的缺点;Chun等[22]直接利用LFT功率谱的方差和均值作为纹理特征用于图像检索,也取得了较好的效果;王焕萍等[18]在利用高分影像进行图像分割时,对比了功率谱的4个统计量(方差、均值、最大值和平方和)作为纹理时的地物分割效果,得到的方差能更好地描述纹理这一结论,同时指出对于不同特征的地物,应选择与之匹配的窗口大小和统计量;佃袁勇等[15]将频率变量从笛卡尔坐标系转到极坐标系中,并以窗口内的径向谱向量的平均值作为纹理特征,取得了较高的精度;张志龙等[24]对LFT功率谱各阶矩的纹理鉴别性能进行对比分析,得到偶数阶矩刻画的纹理特征优于奇数阶矩的结论。
从以上分析可看出,目前如何利用LFT功率谱刻画纹理还没有形成共识,还需要根据地物特征进行具体分析。由于光伏电站在空间的分布呈现出显著的块状特征,而沙漠的表面更为平滑,裸露山体的表面起伏明显,其在频域上也势必会表现出不同。对于本文的Landsat影像,受分辨率限制3种地物均表现出低频特性。基于此,本文根据光伏电站在影像上分布的几何特征,采取文献[24]的方法,选择15×15的窗口进行试验,通过将其展开为225的一维序列计算一维离散傅里叶功率谱来提取纹理特征。计算结果表明,几种地物的功率谱均在第一个分量处形成峰值,除裸露山体第二分量较大外,其余分量均较小,表现出类似噪声的扰动。因此,本文将功率谱的方差和前两维作为纹理特征辅助地物提取。
光谱响应曲线随着地物材料光谱反射率的不同而变化。光伏电站与部分地物如水体、建筑和植被,在光谱形状上有较大差异,易于区分;但是光伏电站与相似材料构成的地物(如沙漠、裸露山体)光谱形状差异较小(如图2所示),SAM从整体波形出发已经无法区分此类地物。但是这些易混淆地物的光谱形状在局部却存在微小差异,如光伏电站的波段6~7间的下降趋势明显快于其余地物,捕捉并利用此特征将会是提高提取精度的关键。因此,本文引入局部波段比值(local band ratio,LBR)特征参与光伏电站提取[16]。LBR特征计算步骤如下:
(1) 计算训练影像每个像元的NIR、SWIR1、SWIR2波段的比值。其定义如下
(3)
(4)
(5)
式中,NIR、SWIR1、SWIR2代表这3个波段的像元亮度值;NIRRatio、SWIR1Ratio、SWIR2Ratio分别为NIR、SWIR1、SWIR2波段比值。
(2) LBR的定义为
LBR={NIRRatio,SWIR1Ratio,SWIR2Ratio}
(6)
图2 易混淆地物的光谱曲线
3 研究方法与试验分析
3.1 研究方法
首先,对影像进行几何校正、大气校正和裁剪等预处理。然后,计算SAM、LBR特征,将原图像的RGB波段转换为HLS格式后,H和S作为变换特征,而L用来计算LFT纹理,将以上提取的特征影像联合输入OCSVM提取光伏电站,并利用人工标定地面参考对提取结果进行精度评定。技术流程如图3所示。为了最大程度提高训练样本的正确度,本文辅助Google Earth来进行样本采集,并结合多波段假彩色影像进一步验证。
图3 技术流程
3.2 试验分析
为了验证多特征联合提取策略的有效性和优越性,本文设计了不同输入特征用于电站提取。具体试验方案如下:
方案1 OCSVM,将原始影像输入OCSVM。
方案2 SAM-OCSVM,将SAM特征影像输入OCSVM。
方案3 SAM-HS-OCSVM,将SAM特征影像和变换后的光谱HS特征影像联合输入OCSVM。
方案4 SAM-HS-FT-OCSVM,将SAM特征影像、变换后的光谱HS特征影像和纹理FT特征影像联合输入OCSVM。
方案5 SAM-HS-FT-LBR-OCSVM,将SAM特征影像、变换后的光谱特征HS、纹理FT特征影像和波段比值LBR影像联合输入OCSVM。
根据前面介绍的提取方案进行试验,提取嘉峪关和酒泉东洞滩光伏电站的结果分别如图4和图5所示。表1为不同方法的提取精度对比,可以看出,利用多个特征的提取结果(方案3—方案5)优于单一特征的提取结果(方案2),本文采用的多共性特征联合算法(方案5)的提取精度最高,误分像元个数最少,显著优于未加入纹理特征的提取结果(方案3),略优于未考虑波形局部细节特征的提取结果(方案4)。
图4 嘉峪关光伏电站提取结果
由于辐射强度偏差造成宁夏和甘肃两地的光伏电站像元亮度值存在较大差异,OCSVM算法基于像元亮度值统计分布特性的特点,使得在宁夏训练好的OCSVM模型未能有效识别到甘肃地区的光伏电站,而是将其余像元值接近的地物误识别为光伏电站,如图4(b)所示。SAM-OCSVM算法从地物光谱形状的角度出发,具备对像元亮度值不敏感的特性,能够识别到大部分的光伏电站,但是由于裸露山体、沙漠和光伏电站的整体波形较为接近,因此仅靠波形无法有效地将噪声与目标地物区分开。SAM-HS-OCSVM由于引入了色度、饱和度两种能够区分地物材料的光谱特征,因此提取的光伏电站更加完整,但由于光伏电站、裸露的山体和沙漠的材料中均存在“硅”元素,因此将大量的裸露山体和沙漠误识别为光伏电站,且光伏电站周边区域噪声现象严重。相反的,裸露山体和沙漠与光伏电站的纹理特征存在一定的差异,方案4和方案5由于考虑了地物的纹理特征,因此两种地物噪声能够有效地被过滤掉,其光伏电站提取结果更加紧凑,且斑点噪声明显减少。尤其是本文方法在纹理特征的基础上引入局部波段比值LBR,使其效果优于方案3和方案4,提取结果具有较好的空间一致性和平滑性,易混淆地物的干扰噪声大量减少,原因在于LBR能够捕捉到光谱曲线局部的细节变异,而这些细节特征恰恰是提高地物提取精度的关键;此外,多共性特征联合能够提高地物的识别精度和模型自身的泛化性能,每种特征在OCSVM模型中均起到了自己独特的作用,最终将目标地物从周围地物中很好地凸显出来。
图5 酒泉东洞滩光伏电站提取结果
表1列出了各种方法的总体提取精度和落在背景区的误分像元个数。其中,本文方法精度最高且误分像元数明显减少,嘉峪关和酒泉东洞滩2个地区的光伏电站识别精度分别为91.39%和86.33%,且误分像元个数较次优的方案4分别从2777和4665减少到142和1204;此外,本文方法提取的光伏电站能够保证较好的空间一致性,面向对象特征显著,且能够将绝大部分的裸露山体和沙漠同光伏电站分开,进一步表明了该方法的有效性和优越性,且对后续研究有一定借鉴意义。
表1 不同方法的提取精度对比
4 结 语
本文提出一种多共性特征联合的Landsat 8 OLI影像光伏电站提取方法。通过分析传统地物提取算法泛化性能不足的成因,提出了利用波形特征提取地物的思路,之后联合通过色彩空间变换和特征深度挖掘得到的色度、饱和度、纹理和局部波形细节特征得到对电站多角度的描述。通过在宁夏地区训练模型,迁移到甘肃酒泉2处光伏电站进行提取试验,结果表明:
(1) 不同时相和不同空间位置的同类地物易受辐射强度偏差的影响造成像元亮度值差异,传统基于样本数值统计分布特性的提取模型难以克服数据偏移带来的挑战。
(2) 由于SAM从波形角度出发,具备对像元亮度值不敏感的特性,其与OCSVM相结合时能够有效克服光谱不确定性的影响,提高算法的泛化性能,但带有大量波形相似地物的干扰。
(3) 本文方法采用对光谱不确定性不敏感的多共性特征相联合的思路去识别光伏电站,共性特征较强的泛化性在很大程度上弥补了学习算法对样本高度依赖性的不足;从多个角度拉大目标地物与背景地物的可分性,保证了较好的识别效果,且算法的泛化和稳健性能得到显著提升;尤其是LBR能够刻画光谱形状的细节特征,与SAM之间形成互补效应。试验结果表明,本文提取的光伏电站提取算法具备较高的识别精度和较低的误识别率。
但是,试验结果仍存在部分噪声未能被有效排除的现象,该现象一方面是由于部分地物的特征确实和光伏电站异常类似,另一方面与提取过程中缺乏面向对象分析有关。因此,下一步工作的重点是挖掘更深层次的隐含特征或引入多视图集成学习策略,更好地区分光伏电站和背景,同时利用影像分割获得的拓展知识提取光伏电站,以获得更加完整的提取效果。