APP下载

结合SVM和分形维数的多特征红外人造目标提取*

2013-10-25张长江赵翠芳杨丽丽

关键词:维数分形人造

张长江, 陈 源, 赵翠芳, 杨丽丽

(浙江师范大学 数理与信息工程学院,浙江 金华 321004)

结合SVM和分形维数的多特征红外人造目标提取*

张长江, 陈 源, 赵翠芳, 杨丽丽

(浙江师范大学 数理与信息工程学院,浙江 金华 321004)

研究了红外图像中人造目标的提取.首先,通过计算红外图像目标的分形维数确定红外目标和背景的大致区域;然后,分别提取目标图像和背景图像的灰度级特征(邻域中心像素亮度、邻域中值亮度和邻域平均亮度),再利用支持向量机(SVM)进行训练,并尝试用不同的核函数及其参数建立最适当的区分目标和背景像素点的模型,进而把红外图像像素点分成目标和背景2类;最后,利用构建的模型实现红外图像中人造目标的提取.实验结果表明,用该方法建立的分类模型可以有效地提取红外图像中的人造目标.

SVM;分形维数;红外图像;人造目标

0 引 言

红外图像由于其具有隐蔽性强和能够在恶劣天气下全天候工作等特点,目前已被广泛应用于军事和工业等领域[1].在红外目标检测和识别中,我们往往仅对红外图像中某些特定的、具有独特性质的目标感兴趣.红外图像中的人造目标提取属于图像分割范畴[2],将人造目标从复杂的背景中提取出来,能够为后续的红外目标自动分类和识别提供依据,是自动目标识别系统中非常关键的一个步骤.

图1 红外图像中人造目标提取的总体流程图

目前,红外人造目标提取的方法都是基于特征提取的方法实现,主要分为5大类:1)基于几何特征的人造目标提取:主要基于形状上的几何特征差异区分人造目标和自然背景.该类方法目标漏检率低,但对图像质量要求较高,算法鲁棒性较差.2)基于概率模型的人造目标的提取:主要包括Logistic模型、马尔可夫随机场模型(Markov Random Fields, MRF)和DRF(Discriminative Random Fields)模型[3-4].其中,MRF应用最为广泛,具有参数少、分割效果好、方法稳定性高等优点.但是,当该方法用于小样本数据建模时较为困难.3)基于水平集的人造目标的提取[5]:该类方法具有较低的检测误差和漏测率、算法鲁棒性好,但运算量比较大.4)基于聚类的人造目标的提取:运用聚类算法(K-means[6]、期望最大化(Expectation Maximization, EM)[7])将图像聚成不同的类,将人造目标从背景中提取出来.该类方法能提取任意形状和大小的人造目标,但需用户事先定义类别,从而导致一定的主观性,聚类效果对算法的依赖性较大.5)基于分形特征的人造目标的提取:利用人造目标和自然背景具有不同的分形维数来提取人造目标[8].但对于复杂的背景,仅用单一的分形维数误检率较高.总之,红外图像中人造目标提取是一项极具挑战性的工作,此外,由于红外图像中存在目标模糊、纹理较少、对比度差等特点,许多传统的检测方法并不适用.纵观其发展的历史,红外图像中人造目标提取应从以下几个方面进行研究:一是完善现有的算法;二是根据红外图像特点提出新的算法;三是综合红外图像的多特征提取人造目标,如基于Bezier直方图的红外图像分割方法[9]可有效用于提取红外人造目标.本文通过提取红外目标的纹理特征确定目标和背景的大致区域,然后分别提取目标图像和背景图像的灰度级特征(邻域中心像素亮度、邻域中值亮度和邻域平均亮度),再利用支持向量机(Support Vector Machine,SVM)进行训练,并尝试用不同的核函数及其参数建立适当的模型区分目标和背景的像素点,进而把红外图像像素分成目标和背景2类,利用构建的模型最终实现红外图像中人造目标的有效提取.对红外图像中人造目标提取的总体流程如图1所示.

1 红外图像中值滤波法去噪

中值滤波是一种非线性滤波,能有效消除红外图像中的噪声.在使用中值滤波时,可先用小尺寸的窗口,然后逐渐加大窗口的尺寸.或是当某个像素的灰度值超过了窗口中像素灰度值排序中间的那个值,且达到一定的水平时,即判断该点为噪声,并用灰度值排序在中间的那个值来代替,否则保持原来的灰度值.一般红外图像在成像和传输的过程中不可完全避免噪声信号的影响,因此,在提取图像特征前,有必要对红外图像进行去噪处理,以使后续的图像分析和理解避免噪声的干扰.本文根据试样图像的实际情况,选取前述的第1种方法对红外图像进行滤波.图2表示利用3×3大小的窗口对一幅红外船只图像(尺寸为259×257像素)进行去噪的结果.

(a)原始红外图像 (b)中值滤波后的图像图2 用中值滤波法去噪前后的图像

2 红外人造目标的特征提取

在对红外图像的研究应用中,往往只对图像中的某些部分感兴趣,这些部分就成为目标或者前景,它往往是图像中某些特定的、具有独特性质的区域.独特性可以是灰度值、物体的轮廓曲线、纹理特征等等,在图像中用来表示某一物体的区域,其特征都是相近或是相同的,但是不同的物体区域之间的特征会急剧变化,利用红外图像中人造目标的灰度级特征,结合纹理特征不同于周围的自然景物,就可以将红外图像中的人造目标提取出来,有利于后续的图像分析和理解.

2.1分形维数区分目标和背景区域

依次计算覆盖每一个格子所需要的最少盒子数,则得到尺度为r的盒子覆盖图像所需要最少的盒子数为

在计算时,子图像窗口和分形数维尺度是2个关键参数.窗口子图像尺寸太小会丢失一些重要的纹理信息;反之,则会导致边缘像素和其他像素混合,从而影响纹理特征的选取.因此,为了选取适当大小的窗口子图,本文取3组子图窗口,即令M=16,32,64,分别研究子图窗口大小与纹理特征的关系,最终确定当取M=32时效果最佳.此时,尺度r从3 取到15(步长为2),以确保直线拟合的精度.

由于目标存在的子图像的分形维数相对于其他背景子图像的分形维数存在着较大的差值,利用这个原理可以大致区分出图像中目标和背景区域.将图2所示的红外船只图像分割成8×8大小的子块并计算其分形维数,得具有同一分形特征图像的不同区域一般具有相同的维数,如果某些图像的分形维数低于相应的拓扑维数,说明分形模型在此处并不合适,此处一般为多类物质的分界处.因此,根据图像的分形维数特征,可以大致区分出图像中目标和背景,在8×8的图像块中,目标大致集中在18,22,24,33,35,43,44,45,52,53,54等小图块区域,对应图3中的各个方框所在区域.

.

图3 分形维数确定目标大致区域

2.2像素灰度特征的提取

根据前面分形维数大致确定的目标和背景分布区域,分别取背景图像和目标图像各10幅样本图,分别如图4和图5所示.

对上面的20幅样图进行图像的灰度特征提取,主要通过5×5的窗口提取出每个像素点的邻域像素中心像素亮度、邻域中值像素亮度和邻域平均像素亮度,作为该窗口中心图像的像素灰度特征集.设图像f(i,j)表示点(i,j)的实际像素灰度值,以它为中心取一个5×5的窗口,窗口内的像素组成点集,对其像素点灰度值排序,构建图像灰度特征子集H=[中心像素亮度(A),中值像素亮度(B),平均像素亮度(C)].此外,由于图像灰度特征集H采集的各个数据单位不一致,因而需要对数据进行[0,1]的归一化处理.

图4 背景样图

图5 目标样图

3 基于SVM的红外人造目标提取

SVM是源于统计学习理论的一种先进的模式识别方法.理论上比传统的神经网络提供更好的推广性能.SVM的核心思想是分割超平面使得它们中的空余最大化.图6是SVM思想的原理图.L是最佳的分割平面,L1和L2分别是穿过每个样本空间最近的和平行的直线.称L1和L2之间的距离为分类边缘d.

图6 SVM思想的图示

通常,SVM是针对两类识别问题的机器学习方法.在提取红外图像人造目标时,实际上就是分类目标和背景这两类像素点.因此,设训练样本为

式(4)中:xi为N维实数向量;yi∈{-1,1};RN表示N维实数集.标准的SVM 形式通常表述为

式(5)中:ξi≥0;i=1,2,…,c,c通常称为惩罚系数;ω为权重向量.若φ(xi)=xi,则称式(5)为线性可分情况下的线性核SVM.对于非线性可分问题,通常利用φ将xi映射到一个高维空间,从而变成非线性核SVM.求解约束条件下的目标函数,需要求解下面的对偶问题:

式(8)和式(9)中:d为多项式系数;γ为该核函数参数[12].提取出红外图像的灰度特征后,采用SVM进行训练,SVM通过对已知训练样本进行训练,构造判别函数,将各种模式最大限度地正确分类,即寻找最优分类平面,使分类间隔最大化,从而实现红外图像中人造目标的提取.

4 实验结果及分析

使用前面实验提取的红外图像的目标和背景的灰度特征值数据,建立一个样本数据库,作为建立模型的属性矩阵.测试的标签就是用来区分目标和背景的,在建立模型时,测试的标签应该是已知的,在这里,人为定义目标像素的标签为1,背景像素的标签为0.那么,可以先选用少量的样本数据进行实验性测试.理论上,测试样本数量的多少对建立的模型的分类效果具有十分重要的影响.样本数量过少,会缺失一些重要的图像灰度特征,致使建立的模型不能准确地分类图像目标和背景;样本数量过多,会增加运行时间.因此,对于采集来的图像灰度特征数据样本,选取背景和目标信息比较齐全的8组数据,作为训练的数据样本,余下2组分别作为测试的目标和背景样本.SVM训练建立的模型往往都需要测试,因为建立模型的目的是为了通过属性矩阵来预测其标签,这才是预测分类的真正目的.但在实验研究测试时,测试集合的标签一般都要已知的,因为需要知道建立的分类器模型的分类效果.效果的评价指标之一就是分类预测的准确率,只有准确度达到了一定的程度,建立的分类模型才是有效的,才能有效地分类不同的属性矩阵.因此,需要用测试集本来的真实标签进行分类预测准确率的计算,即测试的目标和背景样本.为了建立最适当的模型,本文按照上面的SVM训练和测试的方法尝试建立基于不同核函数的分类模型,并探索相应参数选取的最佳值.通过对实验结果的分析,选取建立分类效果最好的核函数及其参数,建立相应的分类模型,用以提取红外图像中的人造目标.

试验中选取3种核函数(线性、多项式和RBF)建立分类模型,试验中惩罚因子均为1.2.运行不同的核函数,测试不同的样本,其中b9,b10分别是背景图块9,10的灰度特征集,m9,m10分别是目标图块9,10的灰度特征集.输入已知的标签,得到的实验结果如表1所示.通过比对实验结果,选取RBF核函数建立最适合的分类模型.

表1 不同核函数模型的训练结果 %

为了验证本文提出的红外人造目标提取方法的有效性,将本文方法与传统的全局阈值法[13]进行对比分析.利用图7第1排所示的3幅红外船只图像进行实验,其中第2排表示本文方法提取的效果图,第3排表示使用传统的全局阈值法提取的效果图.由图7可见,本文提取的方法能较准确地将红外人造目标从背景中提取出来,而传统的全局阈值法虽然也能将目标从背景中分离出来,但提取后的图像里包含了较多的背景信息,还需要采用其他方法将目标与背景进一步分离.当然,在目标所在区域的边界方面,全局阈值法效果比本文方法要好,这主要因为本文采用分块的提取策略会在边界区域产生一定的方块效应.但是从提取人造目标的角度来看,本文提出的方法综合性能优于传统的全局阈值法.

5 结 语

本文提出的基于红外图像中自然景物与人造目标的灰度值特征、训练SVM、建立适当模型自动提取出红外图像中人造目标的方法,与传统的基于阈值分割等提取方法相比,可以很好地避免灰度值接近目标灰度值的自然景物被误当作人造目标提取出来,从而使得红外图像人造目标的提取更加准确.同时,由于本文方法是根据图像邻域的灰度值特征、自然景物背景与人造目标图像在灰度值上具有不同的连续性等来区分人造目标和自然背景的,所以对于提取人造目标的形状细节不够精确.因此,本文方法的后续研究应改进对于人造目标形状边缘细节信息的提取方法.

第1排表示原始测试红外图像;第2排表示本文方法提取的效果图;第3排表示传统的全局阈值提取的效果图图7 本文方法和传统的全局阈值法的红外人造目标提取效果图

[1]郭海涛,周军.舰船红外图像处理技术及应用[J].海洋技术,2009,28(3):91-92.

[2]Hinz S,Baumgartner A.Automatic extraction of urban road networks from multi-view aerial imagery[J].ISPRS Jon of Photogram & Remote Sensing,2003,58(3):83-98.

[3]Cheng Hui,Bouma C A.Multiscale bayesian segmentation using a trainable context model[J].IEEE Trans on Image Processing,2001,10(4):511-525.

[4]Andrey R,Tarox P.Segmentation of mark model texture image in selection relaxation[J].IEEE Trans on Patten Analysis and Machine Intelligence,1998,20(3):252-262.

[5]Cao Guo,Yang Xin,Mao Zhihong.A two-stage level set evolution scheme for man-made objects detection in serial images[C]//IEEE Computer Society Conference on Computer Vision and Pattern Recognition.California:IEEE,2005:474-476.

[6]Kanongo T,Mount D M,Nethan S,et al.A local search approximation algorithm forK-means clustering[J].Computational Geometry,2004,28(2/3):89-112.

[7]Denpster A D,Laird N M,Rsin D B.Maximum likelihood from incomplete data via the EM algorithm[J].Journal of the Royal Statistical Society,1977,39(1):1-38.

[8]Mandelbrot B B.The fractal geometry of nature[M].New York:W H Freeman and Company,1982:102-113.

[9]金梅,张长江.一种有效的红外图像中人造目标分割方法[J].光电工程,2005,32(4):82-85.

[10]赵健,雷蕾,蒲小勤.分形理论及其在信号处理中的应用[M].北京:清华大学出版社,2008:169-190.

[11]Chaudhuri B B,Sarkar N.Texture segmentation using fractal dimension[J].IEEE Trans on Pattern Analysis and Machine Intelligence,1995,17(1):72-77.

[12]杜峰,施文康,邓勇,等.红外序列图像的支持向量机分割方法[J].光电工程,2005,32(3):62-65.

[13]章毓晋.图像处理和分析教程[M].北京:人民邮电出版社,2009:346-348.

(责任编辑 陶立方)

Extractionofinfraredman-madetargetbasedonmulti-featuresbycombiningSVMwithfractaldimension

ZHANG Changjiang, CHEN Yuan, ZHAO Cuifang, YANG Lili

(CollegeofMathematics,PhysicsandInformationEngineering,ZhejiangNormalUniversity,JinhuaZhejiang321004,China)

It was studied the extraction of man-made target in infrared image, it was first determined by computing the image fractal dimension of the approximate area of the infrared target, and the background were extracted from the grayscale characteristics of the target image and the background image (the pixel brightness of the center of the neighborhood, neighborhood values brightness and neighborhood average luminance). The support vector machine (SVM) for training, a different kernel functions and function parameters were used to establish the most appropriate model to distinguish between target and background pixels, and then divided into two of the target and background pixelsclass. The built model was the most final extraction of man-made target in infrared image. Experiment results showed that the classification model established by this method could effectively extract the man-made target in infrared image.

SVM; fractal dimension; infrared image; man-made target

TP391

A

1001-5051(2013)02-0133-07

2013-03-12

浙江省科技厅公益性应用研究计划项目(2012C23027;2012C31005);计算机软件与理论浙江省重中之重学科开放基金资助项目(ZC323011014)

张长江(1974-),男,黑龙江齐齐哈尔人,教授.研究方向:图像处理;模式识别;机器学习;多尺度几何分析及应用.

猜你喜欢

维数分形人造
修正的中间测度和维数
无中生有人造木
人造太原
感受分形
那些令人捧腹的雷人造句
分形之美
一种等比半群作用下的分形集的Hausdorff维数
分形——2018芳草地艺术节
疯狂编辑部之人造惊魂夜
分形空间上广义凸函数的新Simpson型不等式及应用