针对分层分类和多描述符空间的城镇植被群分类
2015-03-10蒋轩周坚华
蒋轩,周坚华
(1.华东师范大学地理系,上海200062;2.华东师范大学地理信息科学教育部重点实验室,上海200062)
针对分层分类和多描述符空间的城镇植被群分类
蒋轩1,周坚华2
(1.华东师范大学地理系,上海200062;2.华东师范大学地理信息科学教育部重点实验室,上海200062)
针对城镇绿化植被受可用土地限制,具有分布零散、结构复杂、植被群类型繁多等特点,以及建筑物和其他设施的阴影遮挡等加剧了植被群分类的困难,经典分类方法常常难以适应需求的困境,该文提出了以分层分割/分类和多描述符空间分类对城镇绿化植被群分类的方法,即采用一次采样,多层分类,利用分类要素间的层次关系,从粗到精依次分类,以降低分类难度和提高精度。通过对这些图斑做层之间关系的逻辑分析,以精度较高的边界取代较低者,可以得到精度较好的目标类图斑。此种方法可用于改善草地、乔灌木、阔叶植被、针叶植被、落叶植被、常绿植被等植被群之间的可分性。仿真测试表明,该算法对于高分辨遥感图像城镇绿化植被群分类具有一定的普适性,划分植被群的总体精度高于85%,比经典单层分类方法提高了5%~10%。
城镇植被群;分层分类;多描述符空间;植被分类
1 引 言
城镇绿地是城市生态系统的重要组成部分,具有显著的环境、休闲和审美功能[1-4]。由于生物量、生产力和生态效益随植被群类型不同有较大差别[57],对于许多与城镇环境相关的建模分析(如碳储量估算[8]、生态效益评价[9]、园林规划[10]、可持续发展能力评估[11]等),除了要求提供城镇植被的分布和数量,还要求提供植被(群)种类的详细数据。
在我国,遥感技术从20世纪80年代起已经日益广泛地用于城镇植被调查。与野外实地调查相比,遥感方法在节省人力物力、实现数据空间分布的连续性和改善同步性等方面具有显著的优势[12-14]。遥感图像分辨率的提高又为城镇绿化植被覆盖细节制图和细分植被类别提供了可能[15-18]。
此外,城镇绿地由于土地资源的限制和人工美学等需要,常常表现出植被群类型繁多、分布不规则、空间结构多样和局部地块高密度栽种等特点。同时,与绿化植被相伴的城镇建筑等也表现出高度破碎和异质性,以及对植被形成分隔、遮暗和遮蔽[19],使得城镇植被群分类成为一个极具挑战的任务,当使用常规“单层”监督分类(Single-layer classification,SC)方法分类时,分类精度常常不高。
多尺度分割、多描述符空间分类、面向对象分类等新技术为解决上述困难提供了可能性。一些文献提出了多尺度系统的理论框架[20]和实用模型[19-22]。此外,基于对象的技术允许在对象层面分析图像特征差异,而减少图像噪声的影响[22-23]。
本文研究基于分层分类(Hierarchical Classification,HC)和多描述符空间的城镇植被群类型分类方法。该方法采纳了上述多尺度分割的思想,利用分类要素间的分层关系,从粗到精依次分类。这样做,一方面可以通过设计针对层的多特征/多描述符空间,降低分类难度和提高精度;另一方面,某个类别的图斑有可能出现在多个层的分类结果中,只是图斑边界精度不同。通常较粗层的图斑具有较高的边界精度,通过对这些图斑做层之间关系的逻辑分析,并以精度较高的边界取代较低者,可以得到精度较好的目标类图斑,而进一步改善最终分类精度。为了证明本文算法的鲁棒性和普适性,对多组实验图像以MATLAB做仿真测试,并评估了分类精度。
在下述内容中,首先介绍研究区和测试数据集,然后将介绍分层分类和多描述符空间构建等主要算法,随后讨论本文主算法与现行相应算法的主要区别、对本文核心算法的精度和普适性评价等内容,最后,给出一些重要结论。
2 数据来源与研究区域
本期实验均采用高分辨率彩红外航摄像片,图像比例尺为1∶8000~1∶15000,空间分辨率高于2m。图像色彩中的红、绿、蓝色分别代表近红外(NIR,760nm~900nm)、红色(R,630nm~690nm)、绿色(G,520nm~600nm)波段。对于多雨南方城市,很难获得低云量覆盖的卫星图像,所以这些城市常采用航空摄影来获取用于城市测绘的图像。近年来随着数码摄影技术的发展和空中摄影成本下降,城镇航空摄影周期已经大幅缩短,研究以彩红外航片作为信息源的城镇植被分类方法,符合我国多数城市的应用需求。
实验区为上海市建成区,具体包括:上海烈士陵园、曹杨地区和敦化路区域等。
3 方 法
3.1 概 述
使用HC方法时,先根据以下4个层面逐层分类,再根据分层继承关系以逻辑运算整理分类结果。这4个层面的类别组合情况为:①亮区植被(vegeL)-亮背景(backL)-暗背景(backS,包括阴影和水体)-暗区植被(vegeS,包括treeS和grasS);②乔灌木(treeG)-草地(grasG)-背景(backG);③常绿植被(treeE)-落叶植被(treeD)-草地(grasG)-暗区植被(treeS)-背景(backG);④针叶植被(treeC)-阔叶植被(treeB)-草地(grasG)-暗区植被(treeS)-背景(backG)。目前可以划分的目标类为:grasG、treeB、treeC、vegeE、vegeD、backG 5类。尾缀L、S分别表示亮区和阴影区;G、E、D、B、C分别表示普通(或混合)、常绿、落叶、阔叶、针叶。成员(members,包括像素和图斑)整理时考虑各层的分类复杂度,当出现重叠、矛盾等情况时,以复杂度较低的(通常对应于较高的分类精度)成员取代较高者。图1为该算法的流程图。
3.2 采 样
分层分类采用的主要学习机模型为决策树。训练样本由图像点采样(图2)获得,并一次性采集图像上出现的植被群和背景类型,每类样本数不少于40个。采样类别包括:grasL、grasS、backL、backS、treeB、treeC、treeD、treeE、treeS 9类,一幅实验图像通常不会包括所有类别,故只对出现的类采样。在分层分类中,需要根据当前层的划分类别,对样本做合并整理。比如层一的划分类别为:vegeL-vegeS-backL-backS,则将grasL、treeB、treeC、treeD、treeE合并为vegeL,而将grasS、treeS合并为vegeS。
图1 主算法流程图(图中只表示常用和有效的描述符,括号内为用于替换的数学描述符。只列举主要、与其他层不重复的中间成果,如在层三的中间成果中未列出草地边界等。)
图2 图像点采样示意图(上海烈士陵园)
3.3 各层的描述符组合
由于单个波谱分量对遥感图像的类型和获取时环境条件的变化比较敏感,分割阈值通常不确定。而使用一些具有组合、归一化、相对值以及平滑化性质的描述符,如归一化植被数(Normalized Difference Vegtation Index,NDVI)等,情况通常会有较大改善。因此本文研究中采用NDVI、NDSV、土壤调整植被指数(Soil Adjusted Vegetation Index,SAVI)等波谱描述符以及边缘密度、细节密度等纹理描述符(表1),并将它们组合构成多描述符空间。以层一为例,其描述符组合为NDVI-V。对于一些难以辨识的植被群类型,通常以具有较鲜明图像特征的代表性植物种表征,如以水杉(粉红色光滑树冠)、雪松(暗粉红色粗糙树冠)、龙柏(紫红色粗糙树冠)等代表针叶植被群(treeC),可以通过S和细节密度等区分treeC和treeB等。
表1 城镇植被群分类常用描述符
3.4 分层分类和重新归类
多层分类的关键技术包括:①确定分层;②描述符设计和测试;③确定各层面特征描述符组合方案;④对中间成果做逻辑判断和重新归类;⑤精度分析和类别替代。
重新归类是利用层面成员之间的继承关系对分层分类结果做整理。由于各层之间相互独立,重新归类可以用多重中间成果互相补偿。如草地类,当空秃较多时经常导致提取不足,可以将HC结果中不同层的草地类互相补偿,获得草地“总和”grasGsum。但grasGsum并非简单地对所有层中的草地类做逻辑或;而是针对重叠成员,以较粗类别层(分类精度较高)取代较细类别层数据。此外,由于亮暗区相同植被群类型通常相邻,可以通过图斑的邻近关系分析做图斑修复/补偿(图3(d))。
重新归类还可以综合修正各尺度层的分类中间成果。层间逻辑分析过程中,类别归属出现多选或歧义时,以精度较高者替代较低者。图3(e)、图3(f)是分别使用不同替换方法所得出的结果。通常,第一层backG提取精度较高,可以用它替代其他层的背景类。图4(c)给出这种替代的实例。
3.5 分类成员整理
通过数学形态学的一些基本运算,可以将离散破碎的类别成员整理为类别图斑。比如可以通过闭合“粘合”距离小于阈值的同类成员,通过开启去除图斑之间的搭接和图斑边界上的毛刺等。在该实验中,使用了多种尺寸不同的结构元素SE,以适应不同图像分辨率和不同破碎程度成员的整理。SE的尺寸可以根据树冠尺寸自适应决定。通常SE尺寸越大,整理后的图斑边界越光滑也越粗略,图3(e)是使用3×3的SE将图3(d)进行开启闭合操作转化所得,而SE的形状对整理结果影响不大。与使用不同尺寸的SE整理类似,在使用滑动窗口统计值类的描述符时,采用不同尺寸的滑窗,分类结果有时会有较大差别。
若图像对角线长为Sa,s为SE尺寸,则s=a× Sa,a为经验系数,常用默认值为0.01。增大a,对在冬季图像上提取落叶植被树冠和提取空秃草地轮廓有利,但也可能提取过多的阴影或背景。而减小a,有助于分离粘连的树冠等。上述多尺寸SE形态学整理和多尺寸滑窗描述符计算也体现了多分割思想,是与分层分类原理相似的另一种多分割。
4 分 析
4.1 HC与SC
HC分层分类方法源于多尺度分割思想。“尺度”在本文通常指图像特征/描述符值域的粗略程度。比如划分vegeG与backG,可以用常量0.11(一个经验值)将NDVI分为左、右两个粗尺度区间,NDVI>0.11为vegeG类,另一侧为backG类。但如果要区分treeC和treeB类,则需用两个细得多的NDVI尺度区间。根据实验0.11>NDVI>0.15和NDVI≥0.15分别对应这两个类别。纹理和形状特征使用时也存在尺度选择问题。
HC方法允许在各层面使用各自的描述符组合方案(图1),各层面只针对尺度相同的地物分类,分类数相对较少,分类难度下降。以图3(a)为例,第一层划分类别中,各类别成员的均质度较高,提示分类精度较高。可以解释为在较粗尺度层,由于图像特征/描述符的分割阈值容限通常较大,即阈值可以在一个较大的范围里波动而不产生分类错误;同时较粗尺度层的分类数也相对较小,这两个原因使得较粗尺度层具有较高的分类精度。而在第二层中,由于尺度变细,类别增多,背景类划分错误增多,结果中出现了较多噪点,如图3(b)所示。使用HC时,可以将较粗尺度层的类别成员替换其他层的相关成员,而改善最终分类精度。
如图3所示,图3(a)为层一划分类别:backL-vegeL-backS-vegeS;图3(b)为层二划分类别:treeC-treeB-backL-backS-vegeS;图3(c)为以层一backL、backS、vegeS替换层二的对应成员,该操作减少了层二的噪点;图3(d)为对图3(c)的缺损图斑做补偿,分别膨胀treeC和treeB的图斑,再和vegeS求逻辑与,以补偿前两类由阴影引起的图斑缺损。由图3可见,补偿后树冠图斑的完整性大为改善。图3(e)为以3×3菱形SE做形态学开启和闭合获得的树冠图斑。图3(f)对图3(e)的结果做类别置换,即以层二的较粗类别替代具有继承关系的成员。由图3可见,置换后树冠图斑的完整性进一步改善。
下面比较HC与传统SC方法的分类精度。表2为5幅实验图像SC和HC分类全局精度(Overall accuracy,OA)对照表。由表可见,HC的OA平均值为90.74,最高为94.07%;相比SC的值分别为82.59%和85.24%。HC比SC平均高约5%~10%。分析还表明,由于HC各层面只针对尺度相同的地物分类,分类难度降低;且各层之间相关的类别成员可以相互修正补偿,因此最终分类精度较SC分类方法有明显提高。图4(e)和图4(f)给出了一个使用HC和SC的对比实例。
图3 分层分类和重新归类实例(敦化路区域)
表2 单层和多层分类精度对比
图4 重新归类实例及单层分类实例
其中,图4(a)为图4(b)、图4(c)的原图像;图4(b)为初始分类图;图4(c)为对图4(b)做HC修正后图,修正包括:用canny算子检测边缘提取grasG,与图4b中grasG成员做逻辑与,以精度较高的backG替换图4(b)中的backG,采用图3(d)的方法补偿缺损图斑;图4(d)为图4(e)、图4(f)的原图像;图4(e)为传统SC分类;图4(f)为HC分类。对比图4(e)和图4(f)可见,后者类别成员的均质度改善,提示精度有较大提高。
4.2 主算法分类精度评估
为检测本文多(层)分类方法的分类精度,将样本分为训练集和测试集,两个集的样本完全不重叠。训练集每类样本不少于40个,测试集每类不少于30个。分类步骤与上文所述方法一样,并以混淆矩阵评估分类精度(表3、表4)。由表3、表4可见,使用多(层)分类的生产者精度平均高于90%,最低不小于85%,各类别的误差分布比较均衡。两个实例的平均全局精度为92.32%,平均Kappa系数为0.8982。初步证明HC算法的分类精度较高且比较稳定。
另外,对于HC,采用不同的窗口和SE尺度、不同的补偿和置换方法、不同的描述符组合,以及不同的逻辑整理方法,得到的目标类别可能不同。为了减少人工干预,增加算法的科学性和普适性,上述部分尺度参数采用自适应方法调整。
表3 图4(a)分类混淆矩阵
表4 图4(d)分类混淆矩阵
5 结束语
本文以城镇植被分类为例提出和实践了多(层)分类。它分为“分层多描述符空间的多(层)分类”以及“逻辑分析和重新归类”两个主要部分。分层多(层)分类通过将植被和背景类别分层分类,降低各层的分类数,以及在各层面只针对尺度相同的地物分类,而使分类难度大幅下降。通过在各层面使用各自的描述符组合方案,适应当前层面分类对象的特点,来改善各层分类的不确定性,以及通过提高粗尺度层的分类精度,并以这种高精度的中间成果修正和补偿其他尺度层的中间成果,而最终提高目标类别精度。与传统单层分类相比,多层分类的精度约可以提高5%~10%。精度评估结果显示,多(层)分类的总体精度在85%以上。
[1] MORANCHO A B.A hedonic valuation of urban green areas[J].Landscape and Urban Planning,2003,66(1):35-41.
[2] AWAL M A,OHTA T,KAZUHO M,et al.Comparing the carbon sequestration capacity of temperate deciduous forests between urban and rural landscapes in central Japan[J].Urban Forestry &Urban Greening,2010,9(3):261-270.
[3] 王庆日.城市绿地的价值及其评估研究[D].浙江:浙江大学博士学位论文,2003.
[4] 陈春末.GIS技术支持下的城市绿地效益评价研究——以上海市为例[D].上海:华东师范大学硕士学位论文,2006.
[5] 李娜.川西亚高山森林植被生物量及碳储量遥感估算研究[D].四川:四川农业大学硕士学位论文,2008.
[6] 肖兴威.中国森林生物量与生产力的研究[D].黑龙江:东北林业大学博士学位论文,2005.
[7] 周敏.大山村林农复合系统生态学基础及综合效益评价[D].安徽:安徽农业大学硕士学位论文,2009.
[8] 邢艳秋.基于RS和GIS东北天然林区域森林生物量及碳贮量估测研究[D].黑龙江:东北林业大学博士学位论文,2005.
[9] 冯莉莉.昆明植物园东园绿地部分生态效益研究[D].云南:西南林学院硕士研究生学位论文,2009.
[10] 高峰.竹类植物在风景园林建设中的综合利用研究——以云南禄丰“恐龙湖生态竹园”规划为例[D].云南:西南林学院硕士研究生学位论文,2006.
[11] 曹长军.乐山市城市生态环境可持续发展能力评价分析[D].重庆:西南大学硕士学位论文,2007.
[12] 程之牧,孙建中,姜志祥.上海城市遥感应用研究[J].国土资源遥感,1996,27(1):1-8.
[13] 刘建贵,张兵,郑兰芬,等.成像光谱数据在城市遥感中的应用研究[J].遥感学报,2008,4(3):224-227.
[14] ZHANG J X,HUANG G M,LIU J P.SAR remote sensing monitoring of the Yushu earthquake disaster situation and the information service system[J].Journal of Remote Sensing,2010,14(5):1038-1050.
[15] ARDILA J P,TOLPEKIN V A,BIJKER W,et al.Context-sensitive extraction of tree crown objects in urban areas using VHR satellite images[J].International Journal of Applied Earth Observation and Geoinformation,2012,15(10):57-69.
[16] 张友静,高云霄,黄浩,等.基于SVM决策支持树的城市植被类型遥感分类研究[J].遥感学报,2006,10(2):191-196.
[17] WULDER M A,HALL R J,COOPS N C,et al.High spatial resolution remotely sensed data for ecosystem characterization[J].Biocience,2004(54):511-521.
[18] WHITE J C,HAY G J,CASTILLA G.Towards automated classification of forest inventory polygons on high spatial resolution satellite imagery[J].Forestry Chronicle,2008,84(2):221-230.
[19] 周坚华,周一凡,穆望舒.城镇绿地树种识别的数学描述符[J].遥感学报,2011,15(3):524-538.
[20] BENVENISTE A,NIKOUKHAH R,WILLSKY A S.Multi scale system theory[C].Proc.29thIEEE.Conf.on Decision and Control,IEEE:Honolulu,1990:2484-2487.
[21] BENVENISTE A,NIKOUKHAH R,WILLSKY A S.Multi scale system theory[J].IEEE Trans.Fundamental Theory and Applications,1994,14(l):2-14.
[22] WILLSKY A S.Multiresolution markov models for signal and image processing[C].Proc.of the IEEE,2002,90(8):1396-1458.
[23] 黄慧萍.面向对象影像分析中的尺度问题研究[D].北京:中国科学院遥感应用研究所博士学位论文,2003.
Classification of Urban Vegetation Population Through Hierarchical Classification in Multi-descriptor Space
JIANG Xuan1,ZHOU Jian-hua2
(1.Department of Geography,East China Normal University,Shanghai 200062;2.Key Lab of Geographical Information Science,Ministry of Education,East China Normal University,Shanghai 200062)
Constrained by limited urban land resources and the needs in artificial aesthetics,urban landscape vegetation is often characterized by scattered distribution,complex structure,various species and the shaded scene resulting in the severe challenges to the classification of vegetation population from remotely sensed imagery.To solve this problem,this paper presents an algorithm to classify vegetation populations such as the lawn,trees,broadleaf,conifers,deciduous and evergreen plants by using hierarchical classification(HC)in multi-descriptor space,that is,conducting multi-layer classifications in accordance with the hierarchical relationship of the classes and using different combinations of mathematical descriptors for the classifications.For example,the two classes of with and with no vegetation cover will firstly be separated.This will be followed by the classification between grass and trees(and/or shrubs)from the previous vegetation-covered class.After this the separation between broadleaf and conifers plants or between deciduous and evergreen plants from the above tree/shrub classes can be reached.By using the inheritance relationship between these classes in different layers,the accuracy of classification can further be improved because the boundary of a patch of a class in a certain layer can be replaced with a more accurate one of the same class in another layer.The whole algorithm was tested by MATLAB simulation.It is revealed that the overall accuracy(OA)is about 85%by using HC and has 5%to 10%better than that by using conventional single-layer classification.
city vegetation population;hierarchical classification;multi-descriptor space;vegetation classification
10.3969/j.issn.1000-3177.2015.02.007
TP391.6
A
1000-3177(2015)138-0043-07
2014-03-06
2014-04-21
国家理科基地科研训练及科研能力提高项目(J1310028);国家自然科学基金项目(41071275)。
蒋轩(1992~),女,本科生,研究方向为地理信息系统。
E-mail:1543494718@qq.com
周坚华(1956~),男,副教授,研究方向为遥感图像分析和城市遥感。
E-mail:jhzhou@geo.ecnu.edu.cn