基于GF-2 卫星数据的日光温室智能识别应用实践
2022-07-09冰卢闯罗玉柱彭秀媛
白 冰卢 闯罗玉柱彭秀媛
(辽宁省农业科学院信息研究所,辽宁 沈阳 110161)
设施产业作为辽宁省农业的主要产业和优势产业,目前仍存在日光温室数量和面积数据不精准问题,利用遥感技术快速、准确地获取辽宁省日光温室数量、面积、位置等信息,监测辽宁省温室的空间分布和动态变化情况,可为政府、合作社、农户等进行设施生产管理及规划、设施生产决策制定等提供数据支撑。 目前,温室数量、面积等数据的获取多采用抽样调查和统计上报等方法,由于其工作流程复杂、人工干预过多等问题,导致数据获取的准确性和时效性较低。 相比于传统统计方法,遥感技术可以在大范围、大尺度上快速获取相关信息,且遥感图像数据已用于温室信息获取应用[1]。 其中,主要采用的目视解译法虽精度较高,但费时费力,难以完成长时间序列、大空间尺度的温室识别和监测工作[2]。 随着机器学习、云计算等前沿技术的发展,使得长时间、大范围、高精度的温室信息自动提取成为可能,并逐渐成为解决此类问题的重要手段[3]。
1 数据来源与研究方法
1.1 数据来源
采用2019年GF-2 卫星数据作为数据源(图1 所示),数据主要以夏季遥感数据为主,秋季遥感数据作为补充。 包括高分2 号数据869 景,其中2019年度758 景,空间分辨率0.8 m,平原区平面位置精度5 m,高山区平面位置精度25 m,正射校正采用的DEM 分辨率为30 m。
图1 高分遥感数据
1.2 研究方法
1.2.1 最优切片尺寸确定
待分析高分图像数据量2.69T,而图形处理器(Graphic Processing Unit,GPU)显存一般为24 G 大,因此不能一次性将图像导入GPU 中进行分析,需将数据切片分析,因此本研究拟选取不同的尺寸标准将图像数据分割成碎片,分析截断率进而确定最优切片尺寸,解决数据量过大而不能分析的问题,也便于图像数据标注和分析。
1.2.2 进行高分图像数据增强和颜色校准
由于待分析高分数据存在涉及区域大、数据采集时间不一致等问题,使得图像数据颜色不遵循同一基准,造成图像数据在多维空间中可能存在同一特征但Mahalanobis 距离不相等的问题[4]。 且由于不同地域不同用途的日光温室形态特征相差很大,而日光温室边界与周围环境颜色相近。 因此本研究将不同区域图像数据进行数据增强和颜色校准。
1.2.3 日光温室识别模型构建
本研究选用Segnet、Deeplab v3+、Unet3个语义分割模型进行识别模型构建研究[5~7]。 根据公式(1)可知,在训练误差相同的情况下,模型的复杂度越低,模型的泛化能力就越强。
式中R(ω)为权重函数,称为置信范围,与样本数N成反比,与算法相关的VC维参数成h正比。
由于选用的3 种模型的复杂度及架构不同,本研究拟对3 种模型进行实验并改良,将3个模型通过冻结层分析模型中的每一层后进行改进,之后通过模型融合综合判定每个像素点的归属类别,进一步提高识别的准确率。最后将识别后的所有切片图像数据采用闭操作完成识别结果的拼接,同时统计出温室的数量、面积、位置等信息。
2 分析结果
2.1 最优切片尺寸确定
选取320×320、384×384、512×512 3 种像素尺寸将图像数据分割成切片,通过分析截断率确定最优切片尺寸为384×384。
2.2 高分图像数据增强和颜色校准
将不同区域图像数据进行数据增强,并进行颜色校准,降低图像数据及温室特征的复杂度,尽可能的使相同特征的样本在同一超球体内(图2)。
图2 高分图像数据增强和颜色校准
2.3 日光温室识别模型构建
根据辽宁省不同地域温室的特征挑选了1 000 余张样本,包括不同形态、大小的日光温室,对选定图像数据进行人工标注后应用Segnet、Deeplab v3+、Unet 3个语义分割型卷积神经网络模型进行建模,结果如表1 所示。
表1 不同模型指标评价
通过对比3个模型的性能指标可知:Unet 模型准确率最高,Deeplab v3+模型准确度(Intersection over Union,IoU)最高。 结果表明试验中无某一模型在各方面指标上都表现最好,为进一步提高识别的准确率,结合3 种模型各自的优势,采用模型融合的方式对温室样本进行分类研究。
2.4 日光温室识别融合模型效果
选用GF-2 影像400 张进行模型融合效果测试,结果表明融合模型识别日光温室效果较单一模型效果好,通过目视解译可知与实际情况吻合程度较高,评价指标为:召回率为97.8,准确率为96.4,IOU 为92.2(图3)。
图3 日光温室识别融合模型效果
3 结论
本研究选择空间分辨率高、纹理信息丰富的GF-2 影像数据为研究数据源,采用了图像校准、数据增强、卷积神经网络模型、模型融合、闭操作等方法构建了日光温室识别模型,能够识别辽宁省日光温室,同时统计出温室的数量、面积、位置等信息。 经初步分析模型识别效果较好,能够科学量化辽宁省日光温室情况,从而为相关工作提供数据支撑。 下一步将尝试采用多点目视解译法进一步确定现有模型的准确定和存在的问题,同时试验其他数据源和图像处理方法,以及进一步优化现有日光温室识别方法,不断提高模型的准确性。