农村乱占耕地建房疑似违法图斑自动提取研究
2020-02-03吴家杰黄霞刘锟铭
吴家杰 黄霞 刘锟铭
(江西省煤田地质局测绘大队 江西南昌 330001)
1 引言
为认真贯彻落实习近平总书记关于农村乱占耕地建房问题的重要批示精神,牢牢守住耕地保护红线,扎实做好农村宅基地管理各项工作,落实国务院农村乱占耕地建房问题专项整治工作电视电话会议要求,各级政府积极响应中央要求,组织大量人力物力全面查清农村乱占耕地建房底数。
目前,查清乱占耕地建房底数,主要从影像中提取疑似违法图斑,将第三次国土调查初始调查成果和2009 年第二次土地调查成果进行叠加,提取农村建房占用耕地的地块范围,将地块范围叠加影像去实地调查,从而获取乱占耕地建房底数及相关信息。主要做法是通过高分辨率遥感影像判读,以宗为单位,人工提取疑似占用耕地的农村建房宗地图斑,并编制外业调查地图。
面对海量数据,人工判读存在效率低、漏提取等问题。为了快速准确地提取疑似违法图斑,本文采用迁移学习法快速自动提取疑似违法图斑,具体流程如图1 所示,影像通过几何校正、影像配准、畸变差校正、匀光匀色和影像拼接处理后,通过特征学习,训练影像,制作建筑物样本库,通过ImageNet 样本库,利用迁移学习法构建建筑物解译模型,最后进行建筑物检测、标记位置信息,输出疑似违法图斑。
图1 农村乱占耕地建房疑似违法图斑自动提取流程
2 理论方法
迁移学习(Transfer Learning)指的是将一个场景学到的内容应用到另外一个场景中。在迁移学习中,学习器必须执行两个或两个以上不同任务。迁移学习模型具有较强的表达能力,是深度学习的一种,它可以采用迁移已有知识来解决目标领域中仅有少量甚至没有标签样本数据的问题,随着深度学习的发展,迁移学习也逐渐受到了关注[1]。
传统机器学习需要足够多的样本数据进行训练,学习结果会更优,且在新的领域,样本数据的学习也十分昂贵。例如在图像识别中,如果要对图像进行分类识别,就需要标注与训练大量的图像数据,并将标注与训练结果输入机器学习算法中实现图像分类,期间耗费大量的人力物力。如果样本不足,训练的特征子集或分类器就很难实现准确分类。迁移学习的目标是将一个现有环境中学到的知识帮助未知新环境中的任务学习,该方式不需要训练数据与测试数据具有严格假设的同分布[2-3]。通过在已有分类数据集中预训练模型,通过移除预训练模型顶层神经网络,再用目标任务数据集重新训练一个输出层,获得新类别的权重,就可以获得一个适用于目标任务的分类模型,该方法可以缩短模型训练时间,提高工作效率[4]。
目前图像识别领域最大的标注图像库是由斯坦福大学制作完成的ImageNet 库,包含了1500 多万张带标签的高分辨率图像和百万级别的标注图像,划分了两万多个类别,是目前使用频率最高的标注图像库之一。本文的迁移学习法就是在ImageNet 库上学习图像特征提取方法,通过迁移学习机制,生成建筑物训练模型。
迁移学习支持下的农村乱占耕地建房疑似违法图斑提取方法需要构建建筑物解译模型框架,如图2 所示。其中源任务是传统的深度学习场景分类,通过源任务的网络参数转移到目标任务中,从而实现建筑物分类模型的构建。
图2 迁移学习建筑物信息提取框架
在特征学习阶段,采用的是加州大学伯克利分校计算机视觉研究小组预训练好的ImageNet 分类模型[5],包含了五层卷积层(卷积层和下采样层)和三层全连接层。在特征迁移阶段,利用建筑物特征样本库对特征学习阶段的五层卷积层(卷积层和下采样层)和三层全连接层的参数进行调优处理,通过网络参数转移,输出代表建筑物特征的FC6 层,最后将调优得到的特征作为机器学习的训练输入,构建建筑物解译模型。
这里对建筑物解译模型FC6 层输出进行了可视化,采用t-SNE (t-Distributed Stochastic Neighbor Embedding)数据降维方法[6]将高维数据在二维空间上进行了展示。如图3 所示为t-SNE 可视化结果。
图3 t-SNE 可视化
3 实验与分析
3.1 数据获取
以江西省某县为例,采用0.2 米最新遥感影像,将影像套合本县耕地范围后,选取30 平方公里大小区域作为试验区,利用本文方法提取农村乱占耕地建房疑似违法图斑。图4 是提取出的疑似违法图斑,试验区域共提取132 个图斑。
图4 图斑提取结果
将疑似图斑以行政村为单位进行外业测量调查,将疑似图斑矢量图导入作业平板,使用平板设备对内业提取的疑似农村占用耕地建房宗地,进行逐宗地外业核实,根据房屋类型,填写农村乱占耕地建房问题摸排信息采集表,调查每宗地的使用人、户籍情况、实际用途、占地面积、占用耕地面积、建房时间、建筑层数、不动产登记发证情况、用地审批情况、符合规划情况、“一户一宅”情况、“一户多宅”等信息,同时使用调查软件拍摄带位置坐标的实地照片。在外业核实情况的基础上,对农村占用耕地建房的情况进行分门别类,形成“一宗一台账”的台账记录,并建立集图形、属性、电子档案为一体的乱占耕地调查数据库和管理系统,为落实耕地保护责任目标,下一步做好农村宅基地管理工作奠定基础。
3.2 精度评定
为了评定本文方法的准确性,将提取结果与人工提取结果进行对比,从表1 可以看出,迁移学习法自动提取图斑准确率达到94.69%,可以较准确地提取出疑似违法图斑,提取出的非建筑物主要是水工建筑、晒谷场、破损房屋等。在精度可以保证的情况下,迁移学习法能够快速自动地提取出疑似图斑,节省了大量人力物力,具有较高的推广性。
表1 迁移学习法与人工提取法对比分析
4 结束语
通过实验证明,迁移学习支持下的农村乱占耕地建房疑似违法图斑提取方法具有快速、准确等优点,可节省大量的人力物力,能实现较大范围的房屋自动化提取,快速准确地提取出疑似违法图斑,为政府决策提供依据。同时,该方法具有较强的可移植性,可应用于汽车违章违法统计、水土流失自然灾害动态监测和矿区生态恢复监测等。