高分辨率遥感数据和POI数据支持下的城市土地利用分类<br/>——以宁波市某广场为例

高分辨率遥感数据和POI数据支持下的城市土地利用分类
——以宁波市某广场为例

2021-07-30高子为程朋根赵亚男

东华理工大学学报(自然科学版) 2021年3期

高子为，程朋根，赵亚男

(东华理工大学测绘工程学院,江西南昌 330013)

科学规划国土空间，需要对土地利用现状和城市功能区空间分布情况进行深入分析，如何准确有效地识别城市土地利用类型成为关键问题。遥感作为一种可以快速获取地表覆盖信息的技术，具有快速、宏观、综合、准确、周期性、低成本等优势，已经成为城市用地信息提取与监测的重要手段(杨朝斌等，2016；方正等，2020)。传统的基于像元特性信息的影像分类为大面积获取城市土地利用现状和土地覆盖分类提供了便捷的手段，为城市定量分析应用提供了重要技术支撑。有学者结合遥感技术(RS)和地理信息系统(GIS)技术构建了城市生态监测与评价系统，并对某城市综合生态指数进行提取与分级(程朋根等，2015；徐看等，2021)，也有学者利用Landsat遥感影像对珠江三角洲区域进行土地利用变化检测(樊风雷等，2007)。单一利用遥感影像分类仅仅使用了地物的物理特征，但不同的地物可能具有相同的物理特征。所以，仅使用低层语义特征进行分类结果往往不够准确。对此，有学者研究证明通过引入高层语义特征，利用遥感影像物理特征构建虚拟单词，并通过词袋模型(BOW)将光谱、纹理和尺度不变特征转换(SIFT)等多特征信息融合到一起，可以缩小场景分类中的“语义差距”，提高土地利用的分类精度(Zhong et al.，2015)。

遥感影像中提取的特征仅仅描述了地物的自然属性，无法完全对接社会经济属性明显的城市土地利用类型。随着互联网的快速发展，大量基于位置服务的社交媒体数据为城市土地利用分类和城市空间结构分析研究提供了丰富的数据源。社交媒体数据能够反映人类经济社会活动的内在特征，补充了高分辨率遥感影像数据无法描述的地物内部经济社会属性，有助于城市土地利用分类。例如，POI数据为城市土地利用分类研究提供了大量的语义信息，包括名称、地址、功能、经纬度等，可以描述地理空间中各类商业性设施和社会服务性设施，蕴含着丰富的人文经济特征，补充了遥感影像所缺乏的语义信息，是城市空间分析中的重要基础地理数据之一。已有研究表明，POI的分布特征可以有效地说明地块的功能(Jiang et al.，2015)。因此，研究遥感影像数据与POI数据支持下的城市土地利用分类，可以有效挖掘社交媒体数据中的有效信息，有效提高识别城市土地利用类型的精度。

以宁波市某广场作为研究区域，利用词袋模型和潜在狄利克雷分布 (LDA)主题模型，将高分辨率遥感影像数据特征信息与POI数据特征信息融合来实现城市土地利用类型分类。

1 研究方法

研究技术路线如图1所示。首先，对高分辨率遥感影像和POI数据进行格网划分，提取每一块影像的多源特征信息作为具有一定表达能力的视觉单词，建立影像的高层次语义表达；其次，利用主题模型提取上述多源数据的潜在语义特征；最后，选择迭代最优价值的样本用于训练支持向量机(SVM)来进行城市土地利用分类。

图1 技术流程图Fig.1 Technical flow chart

1.1 高分辨率影像和POI数据的多特征提取

高分辨率图像具有丰富的光谱信息和空间信息。本次研究选取影像的光谱、纹理、几何以及POI特征来充分刻画影像的视觉单词，从多个角度对地物特征进行描述。

1.1.1 光谱特征

遥感影像的光谱特征能够反映物体表面的物理属性以及色调变化(胡勇等，2015)。笔者分别采用公式(1)与(2)计算每个波段的均值与标准差。

(1)

(2)

1.1.2 纹理特征

纹理特征能够反映地物表面周期性变化的表面结构排列属性(张伐伐等，2012)。局部二值模式(LBP)是一种描述图像纹理特征的描述符，它含有灰度不变性和旋转不变性的特点(Bay et al.,2008)。

描述符LBP定义在一个3像素×3像素的窗口内，比较该窗口中心像素(x,y)与相邻8个像素的灰度值，若周围像素的灰度值大于中心像素的灰度值，则将该中心像素标记为1；反之，标记为0。通过公式(3)，每个窗口可以得到一个二进制数值，将该数值作为窗口中心像素点的LBP特征值，用于反映这个区域的纹理特征。

(3)

式中，LBP为局部二值模式，p为每个窗口中除了中心点以外的第p个像素点，I(p)为相邻像素点的灰度值，I(c)为窗口中心像素的灰度值，利用公式(4)计算符号函数s(x)。

(4)

1.1.3 几何特征

加速稳健特征(SURF)能够克服仿射变换、光照变化、三维视点变化等问题，可用于侦测与描述影像中的几何特征(Zhang et al.，2010)。SURF算法通过Hessian矩阵行列式获取近似值图像，每个像素(x,y)都可以用公式(5)计算其Hessian矩阵。

(5)

若Hessian矩阵的判别式在某一点取到局部极大值，则说明该点比周围区域内其他像素点的灰度值更高或更低，由此寻找特征点的位置，公式(6)为其判别式。

(6)

对上述图像进行盒子滤波计算，并构建尺度空间，在该尺度空间中使用非最大值抑制检测极值点，并记录该点的位置作为特征点。以特征点作为圆心的扇形区域对图像进行Haar小波响应运算，计算邻域内特征点在水平和垂直两个方向的小波响应，并将更靠近圆心的特征点赋予更高的权重，再将扇形区域转动一定角度，计算小波响应值。通过公式(7)和(8)对图像Haar小波响应值进行求和。

mω=∑dx+∑dy

(7)

θω=arctan(∑dx∕∑dy)

(8)

式中，m为小波响应值之和，ω为扇形转动角度，θ为最大Haar响应累加值所对应的主方向，SURF描述子具有良好的尺度、旋转和光照不变性。

1.1.4 POI特征

POI特征反映了人文经济信息，可以作为反映社会经济属性的视觉词汇。有学者利用格网单元分割遥感影像进行城市土地利用分类并取得了较高的精度(高晨，2017)。基于格网单元分割思路，采用与分割遥感影像大小一致的格网单元分割研究区域，根据OpenStreetMap路网划分区块，计算每个区块中POI类型的比例，并将该比例值赋予区块内的每一个格网，使得每个格网都包含POI特征值。

1.2 多特征融合的BOW字典构建

词袋模型(BOW)最初应用于自然语言处理和文档分类领域,因其简单而有效的优点得到了广泛应用,有学者将该模型的思想移植到遥感影像信息提取(Csurka et al.，2004)。其基本思路是通过对影像进行特征提取和描述，获取大量的特征信息，以此用一些关键词来描述影像，在此基础上构建视觉词典，挖掘遥感影像的高层语义特征。

将分割后的城市区域看作文档集，将区域的土地利用类型看作主题，将区域中的各类特征信息作为单词。基于以上假设，一个格网可以用类型的分布表示，一个主题可以用特征的分布表示。分别对多个特征进行K-means聚类，每个聚类中心为一个关键词，所有的聚类中心组成一个单词表，并计算每个格网的特征值与各关键词之间的距离，将每个特征值与单词表中与之距离最近的关键词相匹配，统计各特征在各个关键词中出现的词频，生成一个特征向量，再将多个特征向量以堆栈方式拼接在一起。这样每个格网的多特征信息就可以用一个多维向量fi来表示：

fi={spei,lbpi,suri,poii}

(9)

式中，spe为光谱特征的特征向量，lbp为纹理的特征向量，sur为几何的特征向量，poi为兴趣点的特征向量，i表示第i个格网。

1.3 潜在语义特征挖掘

主题模型是发现文档集合中隐藏语义结构的统计工具，近年来主题模型广泛运用于自然语言处理领域，并在许多交叉学科中得以运用。许多研究者利用词袋模型和概率主题模型来解决自然图像理解中的相关问题，如图像自动标注、场景分类等，一定程度上能够在图像底层视觉特征与高层语义之间建立桥梁(Chu et al.,2014；Tokarczyk et al. ,2015)。在上述构建的BOW字典的基础上，利用主题模型来挖掘遥感影像数据和POI数据的潜在语义特征。

LDA是一种无监督的贝叶斯模型(Blei et al., 2003)，该模型被广泛应用于主题建模和文档主题分类中。它通过挖掘文档所包含的潜在语义特征，通过公式(10)计算文档属于某一种主题的概率。

P(w|d)=P(w|t)×P(t|d)

(10)

式中，w为词，d为文档，t为主题。以主题为中间层，通过两个向量(θd,φt)实现主题分类和文档生成，θd表示对每个文档集中的文档d对应到不同主题的概率向量，φt表示对每个主题集中的主题t生成不同单词的概率向量。

每个视觉单词即为各类特征的描述，每篇文档即为每个格网所包含的融合后特征向量，通过单词的分布特征来推断每个格网所属的城市土地利用类型，以此达到识别城市土地利用类型的目的。

2 研究区域和数据源

2.1 研究区概况

宁波市位于浙江省东部，是长江三角洲南翼经济中心，社会经济发展水平较高，第三产业发达，城市土地利用类型复杂多样。为便于实验，选取宁波市某广场及周边区域作为研究区(图2)，其大小为5 200 m×5 900 m，面积约为30.7 km2。该区域作为宁波市的经济中心，高度集中了城市的商业、工业、居住和公共服务设施用地，区域内建筑分布密度高且建筑物外观相似，POI数据丰富，适合作为城市土地利用分类研究的实验区域。

图2 研究区范围Fig.2 The study areaa.宁波市遥感影像;b.研究区遥感影像

2.2 数据源

采用高分二号卫星1 m全色分辨率和4 m多光谱分辨率传感器影像作为高分辨率影像数据源。影像获取时间为2019年6月16日，数据来源于地理空间数据云平台(http://www.gscloud.cn)。在提取遥感影像特征前，对高分二号影像数据进行辐射定标、大气校正、正射校正、图像融合等预处理，并根据研究区域范围对预处理后影像进行裁剪，得到研究区域1 m分辨率的遥感影像。

选取与研究区域范围一致，且与影像为同一时间的POI数据，共12 377个点(数据来源于百度地图)。每个POI点都包含POI的名称、功能、地址、经纬度等属性。根据《城市用地分类与规划建设用地标准》(中华人民共和国住房和城乡建设部，2011)，同时考虑到数据类别的普遍性和显著性，将POI数据分为公共管理与公共服务用地、商业服务业设施用地、绿地与广场用地、工业用地和居住用地等5个较具代表性的类别，统计结果见表1。

表1 研究区各类型POI统计

考虑到研究区大小以及POI分布密度，本次采用100 m×100 m 大小的格网单元对影像进行分块，共得到3 068个格网，并通过目视解译与实地考察结合的方式确定每个格网的真实土地利用类型。

3 结果与分析

为了验证每种特征对城市土地利用分类是否有正向作用，使用不同的特征组合方式分别进行实验。表2为使用不同的特征组合方法的精度，从表2可以看出，使用遥感影像特征时，几何特征的加入能够提高分类的准确性，且相对于使用光谱+纹理+几何特征，在融合加工特征后，研究区域的总体分类精度提高了13.98%。这表明融合多源数据的多特征信息可以大幅提高城市土地利用分类的精度。

表2 研究区选取不同特征的分类结果

为探究每种土地利用类型的分类结果，对研究区中的3 068个格网进行结果检验，其中2 583个格网类型符合真实地物情况，研究区域的分类结果总体精度为84.19%。城市土地利用分类图如图3所示，每块格网的功能类型分类混淆矩阵如表3所示。

图3 不同特征组合的分类结果图Fig.3 The classification result diagram of different feature combinationsa.光谱+纹理特征；b.光谱+纹理+几何特征；c.POI特征；d.光谱+纹理+几何+POI特征；e.真实土地利用类型分布

由表3生产者精度可以看出，和绿地与广场用地、工业用地、水域相比，公共管理与公共服务用地、商业服务业设施用地、居住用地和道路的分类精度较低。由于公共管理与公共服务用地中服务类设施POI数量较少，且其在遥感物理特征上与商业服务业设施用地和居住用地较为相似，导致分类精度相对不高；在商业服务业设施用地周围往往包含着大量服务类设施POI点，一定程度上降低了其分类结果；居住用地中往往包含一些商业类型POI导致住宅类型POI所占比例较低，使居住用地被误分为商业设施用地；道路因其与建筑物顶层有相似的光谱特征，得到的分类结果较差。绿地与广场用地因为植被的物理特征，所以能保持较高的分类精度；工业用地因为其带有鲜明的物理特征如蓝色屋顶和高大的烟囱在城市土地利用类型分类时也能保持较高的精度；水域因为物理特征上的连续性以及光谱特征上的独特性也能得到较高的分类精度。

表3 每块格网的功能类型分类混淆矩阵

单独使用遥感影像物理特征的城市土地利用分类结果，每块格网的类型分布都较为零散，没有明显的边界，分类精度较低。而结合遥感影像物理特征和POI特征的分类结果图中格网的类型分布紧凑，不同土地利用类型之间分割界限明显，分类精度相对较高(图3)。

4 结论

本研究结果证明了相对于利用遥感影像数据分类，加入POI数据以后可以明显提高城市土地利用类型分类精度，多源数据融合对土地利用分类有正向作用，为城市土地利用分类提供了新的思路。但本次研究所使用的社交媒体数据仅为POI数据，其不能完全表达建筑物的内部属性；实际上，许多城市建筑物可能同时拥有多种类型混合属性，但本次实验没有考虑，这是下一步将要研究考虑的问题，以期待得到更准确的分类结果。