基于词袋特征的空心村高分影像建筑物解译模型
2017-06-27李何超李永树谢嘉丽
李 政 李何超 吴 玺 李永树 谢嘉丽 鲁 恒
(1.西南交通大学地球科学与环境工程学院, 成都 611756; 2.四川省土地统征整理事物中心, 成都 610041;3.四川大学水力学与山区河流开发保护国家重点实验室, 成都 610065; 4.四川大学水利水电学院, 成都 610065)
基于词袋特征的空心村高分影像建筑物解译模型
李 政1李何超2吴 玺2李永树1谢嘉丽1鲁 恒3,4
(1.西南交通大学地球科学与环境工程学院, 成都 611756; 2.四川省土地统征整理事物中心, 成都 610041;3.四川大学水力学与山区河流开发保护国家重点实验室, 成都 610065; 4.四川大学水利水电学院, 成都 610065)
如何利用高分影像构建自动解译模型是快速高效获取空心村建筑物的关键,对空心村调查研究具有重要意义。针对传统目视解译需要专业知识,效率低、工作量大的问题,提出一种基于词袋特征的空心村高分影像建筑物解译模型。首先,对比了多种影像特征提取方法;然后,选取词袋特征(BoW)和支持向量机(SVM)构建建筑物自动解译模型;最后,为检验方法的有效性,选取空心村高分影像构建了建筑物样本库,并基于该样本库进行实验研究。结果表明本文方法的分类准确度可以达到0.86,所提方法可用于空心村内建筑物自动解译,具有较高的实用价值。
空心村; 词袋模型; 高分影像; 机器学习; 建筑物解译
引言
随着中国城镇化进程的不断深入,农村人地关系发生巨大变化,空心村问题日益突出[1]。空心村形成始于20世纪90年代中期,随着近郊农村就业结构的转型和经济条件的改善,空心村规模发展较为迅速,尤其是进入21世纪以来,土地保护、乡村城镇化发展与空心村的矛盾逐渐凸显[2-4]。有学者认为,乡村土地使用管理制度不完善,原有居住设施条件差,土地边际生产力低下,拆旧建新和新地建新的成本存在明显差异以及乡村传统观念(挣钱建房、拆老屋破风水等)等众多原因导致了空心村的形成[5-7]。在自然条件和经济发展影响下,沿公路形成新居住集中区,造成传统沿河分布的村落逐渐衰败、废弃,也是造成部分空心村的原因之一[8-9]。国务院批复国土资源部发布的《全国土地整治规划(2011—2015)》提出以空心村整治和乡(镇)企业用地整治为重点,加强闲置和低效利用的农村建设用地整治[10]。因此,如何利用高分影像自动、高效、准确地获取建筑物信息、统筹城乡土地利用配置、促进乡村空间重构、开展空心村土地整治,对于空心村的调查研究具有重要意义,也是中国城乡转型期推进新农村建设和全面建设小康社会的关键问题。
遥感作为一种有效的对地检测手段,已经广泛应用于土地利用调查、灾害信息获取、测绘以及地理国(省)情监测等领域,特别是无人机高分遥感以其高空间分辨率、视场范围广等特点,得到了广泛的应用,其应用于空心村建筑物快速检测、空心化评估及整治等方面具有得天独厚的优势[11-13]。传统空心村建筑物的面积、数量、分布情况等数据的获取主要依靠外业大比例尺测图和利用遥感影像人工矢量化两种方式获取。外业大比例尺测图会受到天气等环境因素制约,耗费大量的人力、物力,具有制图周期长、容易漏测等缺点。在遥感影像上获取高精度的建筑物信息一般采取人工目视解译的方法,该方法效率低、工作量大[14]。因此,研究行之有效的高分影像建筑物解译模型对空心村研究及整治具有较高的实用价值。
本文选取空心村高分影像建筑物作为研究对象,基于实验区域构建建筑物样本库,比较多种影像建筑物特征提取方法的优劣,最终采用词袋特征(Bag-of-words,BoW)[15]结合支持向量机(Support vector machines,SVM)[16]分类方法对建筑物影像进行自动解译,提出一种基于词袋特征的空心村高分影像建筑物解译模型,并基于构建的样本库进行训练研究。
1 高分影像建筑物自动解译模型构建
高分影像建筑物解译模型构建的方法流程如图1所示,主要由4部分组成:①高分影像的获取,本文实验数据为无人机高分影像。②图像预处理,本文对获取的高分影像进行畸变纠正、影像平滑及增强等预处理。③将预处理的影像进行拼接,得到研究区域的全景图。④解译模型的构建,首先通过采集大量的建筑物样本(正样本)及背景样本(负样本)构建了样本库,用于解译模型的训练;其次设计建筑物特征提取方法,如原始光谱特征、词袋特征BoW、梯度方向直方图特征HoG[17]、SIFT[18]、Surf[19]等;最后选取支持向量机SVM作为分类模型,并基于交叉验证法进行模型训练。
图1 高分影像建筑物解译模型构建流程Fig.1 Construction flow chart of building interpretation model with high resolution image
其中特征提取是自动解译的关键,选取特征决定了最终的解译结果。特征提取是对高分影像信息进行抽象,得到一组可以描述解译目标的特征向量,一般通过人工目视解译可以获得较好的解译结果,但工作量大,效率低,具有主观性强和非定量等缺陷。本文基于高分影像采集样本数据,分析发现样本中建筑物空间形状复杂,空间光谱变化大,因此需要大量的样本支持特征训练。本文选取多个空心村的高分影像构建了建筑物样本库,然后通过引入词袋特征(BoW)结合支持向量机(SVM)方法,构建了一种基于词袋特征的建筑物解译模型。本文选取被广泛应用的HoG特征与BoW特征进行对比实验。
1.1 HoG特征
HoG特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子,由DALAL等[17]在2005年的CVPR上提出。首先是通过统计将图像划分为区块,然后分别统计其边缘强度直方图分布,最后将各个区块直方图组装在一起,形成图像的特征描述符。
由于HoG是在图像的局部方格单元上操作,空间领域小,所以它对图像几何和光学形变都能保持很好的不变性。HoG特征结合SVM分类器已经被广泛应用于图像识别中,尤其在行人检测中获得了极大的成功。考虑到影像中建筑物与周边环境形成鲜明梯度变化,本文利用HoG特征加以区分。HoG特征提取流程如图2所示。
图2 HoG特征提取流程图Fig.2 Flow chart of HoG feature extraction
实验中HoG参数如下:梯度直方图投影时采用8个直方图的bin,单个Cell的尺寸为32像素×32像素,每一个Block由2×2个Cell组成,样本尺寸统一为256像素×256像素,最终合并得到特征向量长度为1 568。建筑物样本的HoG特征可视化结果如图3所示。
1.2 词袋特征
用词袋做图像表示模型被称之为视觉词袋模型,能够将二维的图像信息映射成视觉关键词集合,这样既保存了图像的局部特征又有效地压缩了图像的描述。为了使用视觉词袋模型,首先要在学习阶段建立视觉关键词集合并且提取出所有局部特征,然后对这些特征进行聚类,得到的结果是训练集中的普遍特征。称这些原型特征为“字典”。
视觉词袋模型从训练图像集图片中提取低级特征,结合K-means的无监督算法对这些低级别特征进行给定聚类中心数目k的聚类,给定一组观察值序列(x1,x2,…,xn),每一个观察值都是一个d维实值向量,K-means的目标是划分这n个观察值到k个序列S=(S1,S2,…,Sk)(k 图3 建筑物样本及HoG特征Fig.3 Building samples and HoG feature (1) 式中μi——Si的均值 视觉关键词(“字典:图4中用w1,w2,…,wp,wr,…,wm表示”)是通过聚类中心获得的,把每一个从图像中提取的特征映射到它最接近的视觉词典上,图像可以表示为一个视觉词典上的直方图特征描述符。 本文实验中局部特征提取128维Surf特征,字典学习过程中,基于K-means构建“字典”,设置字典数量为400。最后将Surf特征对应到字典中统计其直方图分布作为图像的BoW特征。具体采用的BoW特征提取流程如图4所示。 图4 BoW特征提取流程Fig.4 Flow chart of BoW feature extraction 2.1 实验数据 实验区域位于四川省成都市,总面积约为46.48 km2,实验数据包含多个空心村无人机高分影像,影像空间分辨率为0.2 m。采用的无人机是固定翼机型,搭载了SONY Cyber shot DSC RX1数码相机,飞行时预设的航向重叠度为70%,旁向重叠度为40%。通过观察发现研究区域内建筑物建设多为农民的自发行为,缺乏统一规划,分布散乱,房屋多为砖瓦结构,建筑物高度普遍较低(一般为平房或层数较少的楼房),基本没有建筑阴影的影响。鉴于篇幅,图5仅给出试验区域关帝村的高分影像图作为示例。 2.2 建筑物样本库 样本是建筑物目标解译模型构建的基础,通过收集研究区域内高分影像,利用目视解译的方法,为不同建筑物类型采集样本,并按照标准规范格式进行存储。本文根据研究区建立了样本库,其中包括建筑物正样本2 500个,建筑物负样本5 000个,所有样本尺寸均缩放到256像素×256像素。从采集到的样本可以看出,建筑物空间形状复杂,空间光谱变化较大,这增加了自动解译难度。图6为样本示例数据。 图5 局部研究区域Fig.5 Local study area 图6 样本库示例数据Fig.6 Samples of building sample library 2.3 精度分析 在机器学习中,普遍使用混淆矩阵(Confusion matrix)[20]来更好地了解分类中的错误。针对本文建筑物识别的二分类问题,实验采用表1所示评价指标体系。 其中TP表示真正例,即将一个正例判为正例;TN表示真反例,即对一个反例判为正例。相应地,另外2种情况分别称为伪反例(FN)和伪正例(FP)。 同时定义真正类率Tpr用于刻画分类器所识别出的正实例占所有正实例的比例;负正类率Fpr用于计算分类器错认为正类的负实例占所有负实例的比例;以及分类的准确度Acc用于刻画分类器正确分类占整体的比例。计算公式为 (2) 实验采用支持向量机(SVM)分类模型,采用线性核函数,通过L2正则化实现对模型空间的限制,在一定程度上避免过拟合。选取平方损失函数作为损失函数,用来估量模型预测值与真实值的不一致程度,损失函数越小,模型的鲁棒性就越好。在训练过程中留10%的样本(750个)用于测试,其中SVM分类器的关键参数C采用6-fold(6文件夹)交叉验证确定,训练结果如下:HoG特征和BoW特征交叉验证最佳参数分别为{‘C’:8 000}和{‘C’: 6 000},混淆矩阵如表2所示。 表2 混淆矩阵 由于高分影像建筑物识别模型产生连续概率输出,通过划定不同阈值可以得到一系列Tpr和Fpr对,上述2个参数作为坐标轴可以绘制接受者操作特性曲线ROC[21],并定义ROC曲线下面积AUC指标,AUC取值在0.5~1.0,AUC越接近1,说明分类效果越好。AUC在0.5~0.7时分类准确性较低,AUC在0.7~0.9时准确性较高。由上述训练结果以及图7的ROC曲线可以看出,BoW(Acc:0.861,AUC:0.85)与HoG(Acc:0.797,AUC:0.73)特征相比,在分类精度方面具有一定优势,因此可以选取词袋特征构建建筑物解译模型。 在获取了建筑物解译模型后,可以用于大面积高分影像中建筑物快速定位及检测,为空心村的整治及研究提供必要的理论依据及数据支持。 图7 ROC曲线Fig.7 ROC curves 大量空心村的涌现,成为我国当前农村发展暴露的诸多问题中最普遍、最直接的表象,农村空心化已成为我国推进新农村建设和统筹城乡协调发展面临的最大障碍之一。面对空心村高分影像形状光谱差异大、规模各不相同的建筑物,研究行之有效的特征提取方法构建建筑物解译模型,是实现建筑物自动解译的关键。本文基于无人机高分影像构建了建筑物样本库,以空心村为研究对象,通过对比多种影像特征提取方法,最终选取词袋特征进行建筑物解译模型构建,提出了一种基于词袋特征的空心村高分影像建筑物解译模型。实验结果表明,BoW(Acc:0.861,AUC:0.85)相比于HoG(Acc:0.797,AUC:0.73)及传统目视解译有一定的优势,因此本文所提模型可以准确高效地自动解译空心村内建筑物,对于空心村调查和研究具有较高的实用价值。 1 陈玉福,孙虎,刘彦随. 中国典型农区空心村综合整治模式[J]. 地理学报,2010,65(6):727-735. CHEN Yufu, SUN Hu, LIU Yansui. Reconstruction models of hollowed villages in key agricultural regions of China[J]. Acta Geographica Sinica, 2010, 65(6):727-735. (in Chinese) 2 SUN H, LIU Y, XU K. Hollow villages and rural restructuring in major rural regions of China: a case study of Yucheng City, Shandong Province[J]. Chinese Geographical Science, 2011, 21(3): 354-363. 3 欧定华,夏建国. 城市近郊区景观格局变化特征、潜力与模拟——以成都市龙泉驿区为例[J]. 地理研究,2016,35(3):534-550. OU Dinghua, XIA Jianguo. Characteristics, potential and simulation of landscape pattern change in peri-urban areas: a case of Longquanyi district, Chengdu city[J]. Geographical Research, 2016, 35(3):534-550. (in Chinese) 4 刘彦随,刘玉,翟荣新. 中国农村空心化的地理学研究与整治实践[J]. 地理学报,2009,64(10):1193-1202. LIU Yansui, LIU Yu, ZHAI Rongxin. Geographical research and optimizing practice of rural hollowing in China[J]. Acta Geographica Sinica, 2009, 64(10):1193-1202. (in Chinese) 5 XU S, ZHAO Q, YIN K, et al. Research on remote sensing identification of rural abandoned homesteads using multi parameter characteristics method[C]∥Proceedings of SPIE 10005, Earth Resources and Environmental Remote Sensing/GIS Applications VII, 2016: 100050K-100050K-15. 6 刘彦随,刘玉. 中国农村空心化问题研究的进展与展望[J]. 地理研究,2010,29(1):35-42. LIU Yansui, LIU Yu. Progress and prospect on the study of rural hollowing in China[J]. Geographical Research, 2010, 29(1):35-42. (in Chinese) 7 HAN S. “Hollow village” evolution and policy control from the perspective of rural urbanization: a case study of Jiangsu province[J]. Asian Agricultural Research, 2016, 8(3):22-26. (in Chinese) 8 朱晓华,丁晶晶,刘彦随,等. 村域尺度土地利用现状分类体系的构建与应用——以山东禹城牌子村为例[J]. 地理研究,2010,29(5):883-890. ZHU Xiaohua, DING Jingjing, LIU Yansui, et al. Construction and application of land use classification system on village scale: a case study of Paizi village, Lun zhen, Yucheng city, Shandong province[J]. Geographical Research, 2010, 29(5):883-890. (in Chinese) 9 史舟,梁宗正,杨媛媛,等.农业遥感研究现状与展望[J/OL]. 农业机械学报,2015,46(2):247-260. https:∥www.j-csam.org/ch/reader/view_abstract.aspx?file_no=20150237&flag=1.DOI:10.6041/j.issn.1000-1298.2015.02.037. SHI Zhou, LIANG Zongzheng, YANG Yuanyuan, et al. Status and prospect of agricultural remote sensing[J/OL]. Transactions of the Chinese Society for Agricultural Machinery, 2015, 46(2):247-260. (in Chinese) 10 龙花楼. 论土地整治与乡村空间重构[J]. 地理学报,2013,68(8):1019-1028. LONG Hualou. Land consolidation and rural spatial restructuring[J]. Acta Geographica Sinica, 2013, 68(8):1019-1028. (in Chinese) 11 李政,李永树,郭加伟,等.词袋特征支持下的无人机影像滑坡解译模型[J].遥感信息,2016, 31(5):24-29. LI Zheng, LI Yongshu, GUO Jiawei, et al. An automatic landslide interpretation model of UAV imagery based on BoW[J]. Remote Sensing Information, 2016, 31(5):24-29. (in Chinese) 12 张明媚. 面向对象的高分辨率遥感影像建筑物特征提取方法研究[D].太原:太原理工大学,2012. ZHANG Mingmei. The method of object-oriented building features extraction from high resolution remote sensing images[D]. Taiyuan: Taiyuan University of Technology, 2012. (in Chinese) 13 鲁恒, 付萧, 贺一楠, 等. 基于迁移学习的无人机影像耕地信息提取方法[J/OL]. 农业机械学报, 2015, 46(12): 274-279. https:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?file_no=20151237&flag=1. DOI:10.6041/j.issn.1000-1298.2015.12.037. LU Heng,FU Xiao, HE Yi’nan, et al. Cultivated land information extraction from high resolution UAV images based on transfer learning [J/OL]. Transactions of the Chinese Society for Agricultural Machinery, 2015,46(12):274-279. (in Chinese) 14 邓曾,李丹,柯樱海,等. 基于改进SVM算法的高分辨率遥感影像分类[J]. 国土资源遥感,2016,28(3):12-18. DENG Zeng, LI Dan, KE Yinghai, et al. An improved algorithm for high spatial resolution remote sensing image classification[J]. Remote Sensing for Land and Resources, 2016, 28(3):12-18. (in Chinese) 15 FEI-FEI L, PERONA P. A bayesian hierarchical model for learning natural scene categories[C]∥2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR’05), 2005, 2: 524-531. 16 CORTES C, VAPNIK V. Support-vector networks[J]. Machine Learning, 1995, 20(3): 273-297. 17 DALAL N, TRIGGS B. Histograms of oriented gradients for human detection[C]∥2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR 2005), 2005, 1: 886-893. 18 LOWE D G. Object recognition from local scale-invariant features[C]∥Proceedings of the Seventh IEEE International Conference on Computer Vision, 1999, 2: 1150-1157. 19 BAY H, TUYTELAARS T, VAN GOOL L. Surf: speeded up robust features[C]∥European Conference on Computer Vision, 2006: 404-417. 20 HARRINGTON P. Machine learning in action[M]. Cherry Hill, NJ: Manning Publications, 2012:116-133. 21 FAWCETT T. An introduction to ROC analysis [J]. Pattern Recognition Letters, 2006, 27(8): 861-874. Building Interpretation Model of Hollow Village High Resolution Images Based on Bag-of-words LI Zheng1LI Hechao2WU Xi2LI Yongshu1XIE Jiali1LU Heng3,4 (1.FacultyofGeosciencesandEnvironmentalEngineering,SouthwestJiaotongUniversity,Chengdu611756,China2.CenterofLandAcquisitionandConsolidationinSichuanProvince,Chengdu610041,China3.StateKeyLaboratoryofHydraulicsandMountainRiverEngineering,SichuanUniversity,Chengdu610065,China4.CollegeofHydraulicandHydroelectricEngineering,SichuanUniversity,Chengdu610065,China) With the rapid development of remote sensing technology, remote sensing image resolution has been greatly improved and the ground targets can be obtained from high resolution remote sensing image. But the traditional visual interpretation has low work efficiency and needs for professional knowledge. Thus using high resolution remote sensing image to construct automatic interpreting model is the key to quickly and efficiently obtain the building of hollow village. Meanwhile, it is important for the hollow village renovation and research. Based on this, a novel automatic building interpretation model of hollow village high resolution images based on bag-of-words (BoW) was proposed. Firstly, several existing feature extraction methods were compared, and then based on the BoW and support vector machines (SVM) the automatic interpretation model for the building was constructed. In order to verify the validity of this method, the high resolution remote sensing image of typical hollow village was selected to construct the building sample library. Finally, the model for building interpretation was experimentally studied based on the sample library. The results showed that the classification accuracy (ACC) of this method can reach 0.86. Therefore, the proposed method can be used for the building automatic interpretation, and it had high practical value to hollow village research and renovation. hollow village; bag-of-words model; high resolution images; machine learning; building interpretation 10.6041/j.issn.1000-1298.2017.06.017 2016-11-09 2016-11-29 “十二五”国家科技支撑计划项目(2014BAL01B04) 李政(1989—),男,博士生,主要从事遥感影像处理和图像理解研究,E-mail: lizswjtu@163.com P231.5; TP75 A 1000-1298(2017)06-0132-062 实验分析
3 结束语