整体特征和局部特征结合的机场检测方法
2015-12-23张永梅
张永梅,顾 琳,李 强
(北方工业大学 信息工程学院,北京100144)
0 引 言
判定图像中是否存在机场目标区域是机场目标检测的主要任务,是遥感图像处理的一个重要应用,也是计算机视觉领域与模式识别领域的重要研究方向[1,2]。
由于单一特征无法完整描述目标,可能造成某些具有平行长直线特性 (如道路)或与机场具有相似纹理特征的非机场图像被检测为存在机场区域,给后续的识别与变化检测带来困难。利用单一特征进行机场目标识别的局限性较大。本文提出一种基于整体特征和局部特征互补的多光谱图像的机场检测方法。提取图像的整体轮廓特征,在整体特征的指导下提取局部特征,建立感兴趣机场目标区域的完整特征描述,实现机场目标检测。
1 基于整体特征和局部特征的多光谱图像的机场检测方法
根据目前的研究成果,机场检测方法大致分为3 类:边缘提取检测、区域分割检测和模板特征点匹配检测。边缘提取检测是根据机场跑道的平行长直线特性,区域分割检测则是基于机场与周围地物纹理的差异性,模板特征点匹配检测是建立机场模型,在原始图像和待测图像上相对应的位置提取局部不变特征点并匹配来检测是否存在机场。一些研究,如张立平和张红等利用二叉树辨识通过自适应阈值分割得到的机场感兴趣区域,在大场景高分辨率图像的机场识别中取得了较好的效果[3];周延延和吴晓燕的基于句法的机场检测方法[4]机场目标检测率较高。
众所周知,跑道的直线特性是机场最明显的特征之一。传统的机场检测中,大多数方法也都提取了机场跑道的直线特征[5,6]。此类方法首先对输入图像进行去噪操作以减少相关噪声的干扰;然后利用如Sobel、Canny、Robert等边缘算子提取图像的边缘,对得到的边缘图像进行有方向约束的边缘跟踪,找出所有可能的直线段,并对这些直线段进行连接,将满足一定条件的直线段合并成为一条连接线,作为最终的直线提取结果;最后,提取平行直线对 (一般为最长的平行直线对),根据机场的相关先验知识,进一步验证是否为机场目标。这类方法的原理比较简单,软件实现起来也并不困难,但是在实际情况中机场具有多样性、复杂性,使得机场的直线特征可能并不是特别明显,而且在机场周围也很有可能出现具有直线特征的目标物,基于跑道检测的机场识别方法具有一定的局限性[7]。
本文方法不同于传统的机场检测方法,不依据跑道的直线特征来判定机场区域。本文所提出的机场检测方法的整体流程如图1所示。
图1 本文方法机场检测的整体流程
首先,对多光谱图像进行锐化、滤波、分割、形态学处理;然后进行特征提取,提取轮廓特征、纹理特征、颜色特征;最后用SVM 进行分类识别。
2 特征提取
图像能够直观、形象地传递人们所需要的信息。但是在实际应用中,若对所有的信息都进行加工处理,这将是一个巨大的工程。有选择性的提取图像特征,能够很好地解决这一问题。依据整体和局部的关系,可以将特征分为整体和局部特征[8]。
在提取特征时,整体特征能够从全局的角度来衡量静态图像的特征,常用的整体特征有矩特征、轮廓特征等[9]。局部特征是反映目标区域的特征,常用的局部目标特征有纹理特征、颜色特征、边缘特征、不变矩特征等[10]。本文选取轮廓特征作为整体特征进行粗分类,进一步提取纹理特征和颜色特征这两个局部特征进行细分类,从而检测出感兴趣机场区域。
2.1 预处理
从传感器获取的遥感图像,由于设备的误差或环境的干扰,会产生一系列的噪声,使得地物边缘轮廓部分往往不突出。为了更加充分地利用图像的轮廓信息,更好地获取轮廓特征,需要对图像进行增强处理。增强的目的是为了消除噪声,显现那些被模糊了的细节或突出图像中我们感兴趣的特征。图像增强技术有空间域增强和频率域增强这两大类,在实际应用中可根据不同的需要选择不同的方法。
本文采用的图像增强处理方法包含的具体实现步骤为:首先,使用拉普拉斯算子对图像进行锐化操作使其细节变得更加清晰、轮廓得到补偿、边缘及灰度跳变的部分得到增强,从而达到图像的整体锐化效果;然后,针对拉普拉斯算子锐化增强细节信息而引入的某些高频噪声问题,使用3×3的方形滑动窗口中值滤波方法对图像进行降噪处理,在有效降低噪声的同时能够较好地保留图像的细节。通过这两个步骤的处理,可以明显改善图像的清晰度[11]。选取其中的2组多光谱图像,效果如图2所示。
2.2 整体轮廓特征提取
人类视觉在检测目标的时候,到底是由整体到局部,还是局部到整体呢?特征分析理论认为,视觉从局部开始,逐步形成对整体的描述。拓扑知觉理论认为,局部图形之间的视觉排列决定了整体要优先于局部。格式塔心理学认为整体大于部分之和,并且决定了部分的感知。Navon认为整体要比局部知觉发生在更早阶段。整体特征的提取方法包括图像分割和特征描述两部分。特征描述中,轮廓特征具有直观、简单,符合人眼观察目标的机制,所以本文选用轮廓作为描述整体特征的方式。
在遥感图像中,不同的地物辐射能量值不同。地物的轮廓是辐射能量值发生突变的地方,它标志着一类地物的开始和另一类地物的终结。通过轮廓提取,即可区分不同的地物,得到许多个感兴趣目标区域。绝大多数机场都是建立在城市的郊区,而郊区有许多的绿色植被。这是很明显的不同类地物目标。再者,就机场目标本身而言,它的相对面积比较大。因此,本文首先从整体上提取多光谱图像的轮廓特征,得到若干个轮廓。用面积值来量化轮廓特征,并假定面积值大于一定像素值的被确定为潜在的机场区域。对图像进行分割和形态学处理后,提取图像的轮廓。
图2 图像增强效果
分别遍历筛选出来的符合条件的轮廓图像pi,并记录每一个点的坐标pij(xij,yij),其中,xij、yij分别表示图像pi的第j 个点的横坐标和纵坐标。找出4 个点对pij(xij,yij),分别为轮廓图像的最左、最右、最上、最下角的点的坐标。以原图像的坐标轴为参考标准,以这4个点分别画出4条直线,形成一个矩形并对应到原图中,从而得到各个潜在机场区域。原图像1和原图像2的各潜在区域如图3所示。
通过整体的轮廓特征得到机场潜在区域后,并不能非常明确地给出原图像是否存在机场目标,还需要更进一步地处理。本文在整体特征的指导下,提取局部纹理特征和局部颜色特征。
2.3 局部特征提取
局部特征是能够有效区分目标类别,反映目标区域特性的目标特征。常用的局部目标特征包括纹理、边缘、颜色、不变矩等特征,和整体特征相比,局部特征对目标的描述更加灵活、丰富、高效。
图3 各个潜在区域
2.3.1 局部纹理特征提取
由于机场目标的特殊性质,在图像上表现出明显的纹理特征,纹理特征能从细节上对图像进行描述。本文采用基于统计分析的纹理特征提取算法灰度共生矩阵,来提取各个潜在机场区域的纹理特征,并采用相关性小的角二阶矩、惯性矩、熵、相关性这4个特征值来描述纹理特征。G(i,j)表示灰度共生矩阵,4个特征值的具体定义如下所示
其中,角二阶矩 (angular second moment,ASM),又称为能量 (energy),反映了图像纹理的粗细度和图像灰度分布的均匀度。如果共生矩阵中有的值很大,有的值很小,则ASM 值大。惯性矩也称为对比度 (contrast,CON),表示纹理的清晰度,其计算结果大时,表明图像的纹理裂沟比较深,图像看起来就越清晰。熵 (entropy,ENT)表示图像复杂程度,如果图像上含有很多细腻复杂的纹理,则表明图像信息量大,对应的熵也就最大。相关性 (correlation,COR)反映的是图像中邻域灰度的相关性[12]。原图像1的4个潜在区域的纹理特征的特征值见表1。
表1 潜在区域的纹理特征值
从表1的各纹理特征值可以看出,包含真实机场区域的潜在区域4相对于其它3个非机场区域来说,其纹理变化缓慢,灰度分布较均匀,纹理清晰度较高,纹理复杂度低,邻域灰度的相关性较差。
2.3.2 局部颜色特征提取
HSV 颜色空间中的3个互相独立的颜色信道,即饱和度、色调和亮度与人眼系统对颜色的感知有着密切联系,是比较符合人眼对彩色感知的颜色空间之一。人眼系统对色调H 最为敏感,其次是饱和度S,最后是亮度V。利用颜色矩来表示图像的颜色特征是一种常用而且有效的方法,图像的颜色分布主要集中在低阶矩中。因此,本文分别选取HSV 颜色空间中的色调和饱和度的一阶矩和二阶矩来表示图像的颜色特征。
RGB颜色空间到HSV 颜色空间的映射
其中,MAX 是RGB颜色空间中R、G、B三通道分量的最大值和最小值[13]。转换到HSV 颜色空间后,分离出饱和度和色调两个通道进行单独处理,分别提取颜色一阶矩和二阶矩。颜色一阶矩和二阶矩的计算公式分别为式(8)和式(9)。
其中,N 表示图像像素的数目,pij表示图像的第j 个像素的第i个颜色分量。原图像1的4个潜在区域的颜色特征的特征值见表2。
表2 潜在区域的颜色特征值
3 目标机场区域检测
本文使用SVM 分类器对潜在区域进行进一步分析,从而确定是否为感兴趣机场目标区域。在经常使用的5 种SVM 核函数中,使用最多的是径向基 (RBF)核函数,这种核函数广泛适用于低、高维、小样本、大样本的情况,而且它参数少,适用性强。所以本文采用核函数为径RBF的SVM 分类器判断该区域是否真的是机场目标区域。关于SVM 的具体介绍请参见文献 [14]。
4 实验结果与分析
将上文提到的轮廓特征、纹理特征和颜色特征组成特征向量来描述这些区域,并输入到SVM 分类器。对图3中的各个潜在区域进行识别,识别结果见表3和表4。
表3 原图像1的检测结果
表4 原图像2的检测结果
其中,表3是对原图像1的识别结果的统计,表4 是对原图像2的识别结果统计。从结果可以看出,本文方法能够有效地对潜在区域进行检测,明确地给出包含目标机场的区域。
为检验本文方法的有效性,选取了100 幅不同区域的多光谱机场图像进行实验,并将实验结果与其它方法对比,对比结果见表5。
表5 机场检测对比结果
由表5的对比结果可知,本文方法具有较高的机场检测准确率和较低的误检率。
5 结束语
不同于传统的机场直线特征检测方法,本文提出一种基于整体特征和局部特征互补的多光谱图像的机场检测方法。在整体轮廓特征的指导下提取机场潜在区域的局部特征,能够有效地检测出机场区域。而对于机场的准确定位,本文的方法存在不足,有待进一步优化。另外,机场检测中其它的特征也值得考虑和研究,如具有旋转不变性和平移不变性的形状特征。后续工作中,将深入研究这些问题和因素。
[1]KONG Xiangwei,ZHAO Quanshun.The research of airport recognition technology in remote sensing image [D].Dalian:Dalian University of Technology,2011 (in Chinese). [孔祥维,赵全顺.遥感图像中机场识别技术研究 [D].大连:大连理工大学,2011.]
[2]WANG Bin,WANG Xin.The airport detection in remote sensing image based on selective visual attention mechanism[D].Shanghai:Fudan University,2012 (in Chinese). [王斌,王鑫.基于选择性视觉注意机制的遥感图像机场检测[D].上海:复旦大学,2012.]
[3]ZHANG Liping,ZHANG Hong,WANG Chao,et al.The rapid detection method of airport in large and high-resolution SAR images[J].China Image and Graphics,2010,15 (7):1110-1122 (in Chinese).[张立平,张红,王超,等.大场景高分辨率SAR 图像中机场快速检测方法 [J].中国图象图形学报,2010,15 (7):1110-1122.]
[4]ZHOU Yanyan,WU Xiaoyan.The authentication methods of target recognition model based on neural network [J].Computer Engineering and Applications,2010,46 (7):145-147(in Chinese).[周延延,吴晓燕.基于神经网络的目标识别模型验证方法研究 [J].计算机工程与应用,2010,46 (7):145-147.]
[5]DONG Yinwen,YUAN Bingcheng,SHI Zhaoming,et al.The automatic recognition algorithm of airport runway in aerial imagery based line feature[J].Systems Engineering and Electronics,2013,35 (4):876-879 (in Chinese). [董银文,苑秉成,石钊铭,等.基于直线特征的航拍图像机场跑道自动识别算法[J].系统工程与电子技术,2013,35 (4):876-879.]
[6]CHEN Xuguang,LIN Hui.The airport recognition method in remote sensing image[J].Computer Engineering and Applications,2012,48 (25):194-197 (in Chinese). [陈旭光,林卉.遥感图像中机场目标的识别方法 [J].计算机工程与应用,2012,48 (25):194-197.]
[7]CHEN Ren,ZHAO Guangzhou.The airport target recognition research status at home[J].Micro Computer and Application,2013,32 (11):1-6 (in Chinese). [陈仁,赵广州.国内机场目标识别研究现状 [J].微型机与应用,2013,32 (11):1-6.]
[8]Wang X,Lv Q,Wang B,et al.Airport detection in remote sensing images:A method based on saliency map [J].Cognitive Neurodynamics,2013,7 (2):143-154.
[9]SUN Xinghua,LIU Kun.Recognition based on the overall characteristics of human action [D].Nanjing:Nanjing University of Science and Technology,2009 (in Chinese). [孙兴华,刘堃.基于整体特征的人体动作的识别 [D].南京:南京理工大学,2009.]
[10]Gonzalez,Alvaro,Bergasa.Text detection and recognition on traffic panels from street-level imagery using visual appearance[J].IEEE Transactions on Intelligent Transportation Systems,2014,15 (1):228-238.
[11]MA Huadong,ZHANG He.The method of text extraction from video based on color clustering and connectivity analysis[D].Beijing:Beijing University of Posts and Telecommunications,2011 (in Chinese).[马华东,张赫.基于颜色聚类和连通域分析的视频文本提取方法 [D].北京:北京邮电大学,2011.]
[12]ZHANG Honggang,LIU Lixia.The comparation and study about image texture features[D].Beijing:Beijing University of Posts and Telecommunications,2011 (in Chinese).[张洪刚,刘丽霞.图像纹理特征研究和比较 [D].北京:北京邮电大学,2011.]
[13]Rafael C Gonzalez,Richard E Woods.Digital image processing [M].3rd ed.Electronic Industry Press,2010.
[14]YANG Hai,SHEN Haibin.The research and application of SVM kernel parameter optimization [D].Zhejiang:Zhejiang University,2014 (in Chinese).[杨海,沈海斌.SVM 核参数优化研究与应用 [D].浙江:浙江大学,2014.]