多源遥感精确提取光伏电站研究
2022-01-21蔡俊兴田广增孔德庸
王 卫 蔡俊兴 田广增 成 量 孔德庸
(1.韶关学院英东生物与农业学院, 广东 韶关 512005; 2.韶关学院粤北土壤土地研究中心, 广东 韶关 512005;3.华南农业大学资源环境学院, 广东 广州 510642; 4.韶关学院旅游与地理学院, 广东 韶关 512005;5.江西财经大学旅游与城市管理学院, 江西 南昌 330013)
0 引言
太阳能光伏发电是一种清洁无污染、可再生、地域限制小的能源利用方式,在全球大规模建设。根据国家能源局统计信息,至2019年我国光伏累计装机容量2.043×108kW,占全球的35%,2013—2019年均增长33%。对光伏电站建设的有效监测是管理部门制定调控政策的重要途径,相对于低效滞后和高成本的调查统计方法,遥感技术具有及时高效、大范围同步监测和低成本的优势,是获取光伏电站建设进度、区域分布和动态变化的重要手段[1]。遥感影像地物精准识别是近年来遥感应用领域的热点问题[2-6]。准确地识别光伏电站是实现监测光伏电站分布和变化的关键问题。
遥感识别的数据源从中低分辨率到高分辨率,识别方法向集成学习和机器学习发展,使得地物识别的准确度和精度不断提高。在遥感成像过程中,遥感影像地物光谱包含了地物环境光谱和地物本底光谱,如土壤的光谱信息、水分光谱信息及异物同谱信息[7-8]。遥感的地物识别,必须去除环境、本底的影响以及区分异物同谱,这是提高遥感识别和遥感分类的精度的难点和热点之一。中低空间分辨率遥感影像,具有多谱段数据,光谱信息丰富,适合大面积种植的作物,如小麦、水稻、玉米等,广泛应用到农作物分类和农业估产领域[9-14]。通过提取多指数特征参与地物的识别和分类,利用支持向量机、决策树分类等方法,消除异物同谱和降低地物误分的概率,提高作物的识别和分类精度[15-17]。但受制于数据源的低分辨率,物的识别和分类精度不高。随着对地观测技术的进步,高分辨率遥感的应用越来越广泛,在城市监测、作物精细分类、小面积种植作物、特殊地物识别和提取领域的优势尤为明显[18-21]。在利用高分遥感的多光谱特征的同时,更多地利用纹理特征,利用集成学习和机器学习的方法训练分类模型,增强遥感影像的可识别度和识别精度[22-24]。但是高分辨率影像分类时会出现“椒盐现象”,导致地物呈现散点式误分和地物边界不清晰的现象,需要大量样本以修正分类结果[25-27]。深度学习方法是一种机器学习方法,能够很好地处理多特征数据,训练速度快,有效利用图形处理单元、校正线性单元和多训练示例的特性[23]。本文通过融合光谱和纹理多特征图像,并联合多尺度分割图像,构建多尺度多特征图像,利用深度学习方法,对粤北地区不同本底环境的光伏电站进行识别,验证方法可行性,并利用空间关联法提高光伏电站识别精度。本文为光伏电站的高精度监测提供可参考的案例,利用开源的遥感影像和我国自主高分遥感,降低监测的成本,并丰富我国高分系列卫星的应用领域。
1 研究区与数据源
1.1 研究区概况
本文选取广东粤北地区仁化县董塘镇、始兴县马市镇和南雄市全安镇的光伏电站为研究区,该区域光热资源丰富,太阳能资源丰富程度属III类区[3 780~5 040 MJ/(m2·a)]。研究区内利用重金属污染土地、荒地荒山等土地建设光伏电站,并发展农光互补、土壤修复和热电联产,具备一定的地域优势。
1.2 数据源
本文利用的卫星遥感影像有广东省高分中心提供的高分2号(GF-2)影像、欧洲空间局和美国地质调查局(USGS)提供的哨兵2号(Sentinel 2)影像。GF-2卫星是我国自主研制的首颗空间分辨率优于1 m的民用光学遥感卫星,搭载有两台高分辨率1 m全色、4 m多光谱相机,幅宽45 km,波谱范围为0.45~0.90 μm。GF-2卫星具有米级空间分辨率、高辐射精度、高定位精度和快速姿态机动能力。Sentinel 2卫星搭载一台多光谱成像仪,可覆盖13个光谱波段,波谱范围0.44~22 μm,幅宽达290 km,地面分辨率分别为10、20和60 m。GF-2卫星影像获取时间为2019年10月4日,2019年11月17日和2019年12月12日,Sentinel 2卫星影像获取时间为2019年11月11日。
2 研究方法
2.1 深度学习方法
深度学习属于机器学习方法的分支,在图像处理过程中可以根据样本提取图像中的高级特征[2]。卷积神经网络是最广泛的深度学习模型之一,用于处理多个数组形式的数据,适合处理像素排列规则的多波段多特征的遥感数据[3]。
卷积神经网络(Convolutional Neural Networks, CNN)由卷积层、池化层、全连接层组成。在图像分类训练过程中经过调参,最终确定各网络层输入参数。经过4个卷积层和池化层组合后,连接多个全连接层,将输入向量转化为相关类别输出。本文利用ENVI5.6平台中的Deep learning软件进行光伏电站的提取,该软件是基于TensorFlow框架,利用U-Net网络构建深度学习模型,U-Net是卷积神经网络的变形,它基于全卷积神经网络进行改进,利用数据增强可以减少对训练样本的需要[3]。U-Net模型包含编码器与解码器2部分,在编码器中进行2次卷积与1次池化过程,用于降低特征图维度;在解码器中经过上采样层恢复特征图原始分辨率,通过跳跃式连接将特征图传递给解码器。
2.2 多特征图像构建
哨兵2号遥感影像多光谱特征较为丰富,可利用模型对波段进行运算,构建多指数特征图形。而高分2号卫星影像具备高空间分辨率,地物的纹理特征丰富,通过滤波分析提取纹理信息。
2.2.1样本特征分析
为验证地物类型的区分度,结合研究区的物候、季节和地形情况,将研究区地物类型分为9个,留茬耕地、绿植耕地、林地、居民点用地、道路、裸地、水体、光伏电站、阴影区。对建立的9个训练样本进行分割,70%的样本参与分类,30%的样本作为精度验证。
2.2.2环境特征
多光谱影像中存在大量异物同谱特征,在研究区内光伏电站面板的光谱与水体和建筑的阴影相似,容易在多光谱图像上造成误分(图1)。根据光伏电站在Sentinel 2上的波谱曲线,在短波红外和蓝光波段为反射峰,而在红光波段和红外波段为吸收谷。
图1 光伏电站在Sentinel 2影像上的取值范围和波谱曲线
2.2.3光谱特征
通过计算归一化植被指数(Normalized Difference Vegetation Index,NDVI),强化区分植被信息,用于消除环境植被的干扰,其表达式如式(1)所示:
(1)
式中,V为NDVI;ρNIR为红外波段;ρR为红光波段。
通过计算归一化水体指数(Normalized Difference Water Index,NDWI),区分光伏电站与水体、阴影地类,其表达式如式(2)所示:
(2)
式中,W为NDWI;ρNIR为红外波段;ρG为绿光波段。
根据光伏电站在短波红外、蓝光波段、红光波段和红外波段的反射特征,如图1(b)所示,构建简单光伏-建筑指数(Photovoltaic Building index, PBI),用于区分建筑物及阴影与光伏电站,其表达式如式(3)所示:
P=ρswir+ρB-ρR-ρNIR
(3)
式中,P为PBI;ρswir为短波红外波段;ρNIR为红外波段;ρG为绿光波段。
2.2.4纹理特征
为了更大面积地接受太阳光,光伏电站布局的方向性很强,表现在问题图像上的纹理特征明显。对高分2号影像1 m融合图像主成分分析后,对第一主成分滤波计算灰度共生矩阵,采用5×5窗口获取8个纹理特征量,分别为均值、对比度、均匀性、相关性、方差、相异性、角二阶矩和熵。
2.3 多尺度影像分割
高分2号影像的高空间分辨率特性,使得直接对1 m融合多光谱图像分类时,会出现大量的散点式分布的“椒盐现象”。影像多尺度的分割,以像元为单位,对同质性像元进行合并,对异质性像元进行分割,达到同一幅图像中不同尺度的像元聚类。通过影像的多尺度分割,使得光谱和纹理相似的地物进行归并,消除“椒盐现象”。本文以ENVI5.3软件的图像分割功能,对研究区1 m合图像进行分割,形成4个多尺度分割的特征量。
将3个指数特征量、8个纹理特征量、第一主成分量、4个多尺度分割量,构建成16个特征量的光伏识别的多特征图像,并对比多光谱影像进行可分离性分析。9个类型的样本,在多光谱影像中可分离性有较大的差别,光伏电站与裸地、道路、阴影区和居民点用地的可分离度在1.9以下,与留茬耕地、绿植耕地、林地和水体的可分离度在1.9以上;而在多特征图像上样本的可分离性较好,所有样本的可分离度均在1.9以上。
2.4 空间关联方法
高分2号卫星影像的多尺度分割图像可以提供清晰的地类边界,而Sentinel图像可以快速准确地识别判断光伏电站的位置,利用光伏电站的相同位置将类型属性多为尺度分割图像上的图像块赋值(图2)。
图2 空间关联法赋值示意图
利用ENVI5.3软件,经过正射校正、图像融合、辐射定标和大气校正,形成研究区多源遥感图像,进而提取多特征指数,并建立训练样本,最后对光伏电站的提取效果进行评估。本文研究的技术路线如图3所示。
图3 光伏电站识别技术路线图
3 结果与分析
3.1 多特征图像分类结果
利用1 m融合多光谱4波段图像和1 m多特征12波段图像,分别运用波谱角方法、随机森林方法和深度学习方法进行分类,然后评估3种方法的分类精度(如表1所示)。
表1 不同方法下两类图像分类精度
总体来讲,多特征图像比多光谱图像提高了分类精度和面积精度,就方法来讲,波谱角分类方法精度最低,但分类时间最短(0.5 h,DELL Precision 3 530,CPU:I7-8 750H,内存:16 G,硬盘:256 G固态,显卡:P600,4 G,下同),随机森林方法精度较高,但分类时间长(2 h),深度学习方法分类精度最高,分类时间适中(1 h)。深度学习方法分类精度最高,但所有方法中均出现散点式误分(椒盐现象)情况。
3.2 多特征多尺度融合图像分类结果
联合多尺度分割影像的多特征图像,分别运用波谱角方法、随机森林方法和深度学习方法进行分类,并利用空间关联方法对图像中的光伏电站重新赋值,然后利用验证样本进行精度验证,如表2和图4所示。
图4 光伏电站假彩色合成遥感图像和分类结果图
表2 多尺度多特征图像不同方法分类精度
利用深度学习方法的分类结果,结合空间关联方法,光伏电站的分类精度达到95%,分别比随机森林方法和波谱角方法提高了近4个百分点和9个百分点;提取光伏电站的面积精度达到97%,分别比随机森林方法和波谱角方法提高了6个百分点和11个百分点。而分类耗时适中。深度学习方法方法的面积精度最高,同时消除分类结果中的“椒盐现象”。
从不同环境背景的地区提取光伏电站,会受到背景地物和光伏板反射的影响,增加精确分类的难度。本文通过构建光伏指数、植被指数和水体指数消除环境背景的影响,通过提取纹理特征减少光伏板的反射角度的影响,提取面积精度在90%以上。利用空间关联方法将识别的光伏电站重新赋值于高分辨率分割图像上,提高了光伏电站提取的面积精度6个百分点。
4 结束语
4.1 讨论
光伏发电规模逐年增长,其发电量跟装机的占地面积成正比关系,在结构用地矛盾突出的地区部署面积不大,在光照条件较好,荒地荒山较多的地区比较适合部署,如我国西北地区、西南丘陵区和南方山区。部署光伏电站的同时,探索农光互补、土壤修复和热电联产模式,可使经济效益和生态效益叠加,不仅支持地区经济发展,也可优化能源结构,减少碳排放,应对全球变暖。光伏电站建设过程中也面临一些问题,如工程进度较慢、分批次建设、建设规模与规划有差异、对环境产生不同的影响。通过遥感手段可以实时、快速、准确地监控光伏电站的建设进度和部署规模,及时评价其对生态环境的影响,为调节新能源发展政策,提供可靠数据支撑。
光伏电站的空间特征较为明显,表现在几个方面:第一,单个电站空间分布具有独立性,地域限制性较低,与周边环境的关联性不强,这导致光伏电站所处的本底环境差别很大,给光伏电站的遥感精准识别带来的困难,必须对遥感影像进行指数特征的提取,增加遥感识别的精准性;第二,光伏电站有序排列,方向性强,表现在遥感影像上纹理信息丰富且明显,通过提取纹理信息,将规律的纹理特征作为遥感识别的特征量,提高遥感识别的准确度;第三,光伏电站晶硅材料的光谱相应信息与研究区内的道路、居民点和阴影区相近,导致误分和“椒盐现象”,这是本文解决的重点难题之一,通过多尺度影像分割,利用多特征图像,在随机森林算法的支持下,构建光伏电站识别的模型。通过对比实验,多特征图像相对于多光谱图像主要是提高识别的精度,而加入多尺度分割图像,主要是消除“椒盐现象”,提高提取面积的精确度,而深度学习方法,则能在多特征维度图像中,有较强的特征提取能力。本文验证了多尺度多特征图像在不同环境背景的影像上,精准识别光伏电站的可行性,识别精度和面积精度均在95%以上。但是本文构建了16个特征量参与识别和分类,使得数据量较大,受制于单机运算能力,故选取特征样区进行研究。如需大面积同步监测光伏电站,可利用开源的多源遥感数据,如Sentinel卫星影像和我国自主高分卫星影像,部署在云计算平台上,利用光伏电站单样本,降低监测应用的成本并提高遥感监测的适用性。
4.2 结束语
在高分辨率遥感影像的支持下,可实现对光伏电站实时、高效和高精度的遥感监测。通过对光谱信息和纹理信息的特征提取,消除背景和本底环境的影响。常用的植被指数、水体指数能够清晰区分出地物的边界,而本文基于Sentinel 2卫星遥感影像构建的简单光伏指数则较好地区分光伏电站与建筑。本文通过对影像的多尺度分割,并融合多特征图像,构建多尺度多特征图像进而准确地识别出光伏电站,并提高了单个光伏电站的面积精度,为监测光伏电站的建设进度、建设规模和评估发电量提供可靠的数据支持。多尺度多特征图像具有多波段高维特征,数据量较大,而深度学习能够较好地处理高维多特征数据,具有较强的特征提取能力,训练速度快,分类结果精度高。相同方法下,多尺度多特征图像分别比多光谱图像和多特征图像提高了11.8%和6.5%,深度学习方法的处理速度快且精度较高,结合空间关联方法识别精度分别比随机森林和波谱角方法提高7个百分点和11个百分点。GF-2卫星遥感影像在精准识别光伏电站具有可行性,利用深度学习方法实现光伏电站大规模监测具有可操作性。