APP下载

遗传算法在SAR 图像目标鉴别特征选择上的应用

2014-03-13王卫红唐晓斌

电子科技 2014年5期
关键词:特征选择适应度遗传算法

刘 轩,王卫红,唐晓斌,李 鹏

(电子科学研究院 综合电子信息研究所,北京 100041)

在SAR-ATR 研究中,目标鉴别是一个重要阶段,其主要目的是对目标检测后获得的感兴趣区域(ROI)进行进一步处理,去除只含有杂波的ROI 切片,保留目标ROI 切片,从而减小目标分类和识别的代价[1-2]。目标鉴别工作主要分为:首先提取一些对目标、杂波有一定区分度的特征,组成初始特征集;然后针对不同的鉴别需求,对初始特征集进行选择,选择出最优的特征序列;最后利用相应的鉴别器和适应度函数对选择出的特征序列进行决策[3]。其中,特征选择是影响目标鉴别性能的关键步骤[4]。

早期的特征选择主要依靠专家的经验知识。后来随着问题的深入和目标鉴别技术的发展,越来越多的特征选择方法涌现出来。文献[5]中提到一种基于特征相关性的特征选择方法,文献[6]中提出一种量子进化理论的特征选择方法。遗传算法(GA)由于其本身属于一种全局优化随机搜索算法[7],在鉴别特征选择上也得到了实际应用。最早将遗传算法应用到鉴别特征选择上的是Bhanu[8]研究小组,国防科技大学高贵博士在Bhanu 小组的工作基础上,对Bhanu 小组设定的适应度函数进行了改进,提出了一种对特征优劣评价更全面的特征选择算法[9-10],但在适应度函数权值设定方面仍存在一定的不足。基于此,本文对文献[9]提出的适应度函数,在权值设定方面进行了改进,提出一种新的适应度函数。对比研究结果表明,采用本文提出的特征选择算法评价更准确,且目标鉴别率也得到提高。

1 鉴别特征提取

特征提取是解决目标鉴别问题的一种有效方法。这是由于在SAR 图像中,目标和杂波虚警在散射特征和外形特征上,呈现出明显的差异性。文中一共提到了19 个特征,其中有8 个特征是林肯实验室在解决目标鉴别问题中所使用过的,其余11 个也是目标鉴别常用特征[9-11]。

(1)标准差特征(Standard Deviation Feature)。该特征是对SAR 图像像素点长度的统计测量,其反映了图像切片中目标区域像素值的起伏程度。

(2)分形维特征(Fractal Dimension Feature)。该特征反映了经过二值化处理后图像中强像素点的紧密程度。

(3)聚集特征(Mass Feature)。该特征反映了图像中像素点的数量。

(4)对角线特征(Diameter Feature)。该特征反映了图像出目标的尺寸信息。

(5)~(6)对比差异特征,包括最大恒虚警特征和均值恒虚警特征。

(7)CFAR 最亮百分比特征(Percent Bright CFAR Feature)。该特征反映了经CFAR 处理后像素点的强度特征。

(8)计数特征(Count Feature)。该特征反映了图像中像素点的强度特征。

(9)~(14)相邻特征。该特征描述是图像中不同区域(阴影,背景,目标)中点的分布情况。

(15)最大距离特征。该特征体现了强像素点分布的离散程度。

(16)~(19)空间边界属性特征,其中包括:像素质量平均值特征、像素空间离散度特征、拐点特征和加速度特征。

2 特征选择算法设计

2.1 基于遗传算法的特征选择

遗传算法是模拟生物在自然选择中的遗传进化过程而形成的一种全局优化随机搜索算法[6],算法的实现主要包括以下几个步骤[8-10]:

(1)定义染色体。

图1 特征序列染色体编码

遗传算法采用二进制编码,如图1 所示,其中的一个0 或1 可称为一个基因,对应由0 ~1 组成的二进制编码可称其为染色体。其中若染色体中第i 位的基因为1,则代表对应的第i 个特征被选中参加鉴别,反之若第i 位的基因为0,则代表对应位置的特征在选择中被剔除。因此,染色体代表的是特征的选择情况。

(2)生成初始种群。初始种群是随即生成的长度为l 的染色体集合,其中l 是总特征数。种群大小N表示集合中元素的个数,由于本文使用的特征数较多,为保证种群中个体的多样性,故取N=200。

(3)设计适应度函数。特征选择的目的是为了在保证鉴别精度的前提下,选择一个特征维数最小的特征序列用于鉴别。适应度函数的设定正是用来评估所选特征序列的鉴别效果,一般而言,鉴别效果的评价主要考虑以下因素:特征总数l 为候选特征的总数;描述长度k 为经过特征选择后,被选中用于鉴别的特征个数。总样本数n 为实验样本中目标和杂波的总数;总错误数ne为经特征鉴别后,目标误判为虚警的个数与虚警误判为目标的个数之和;目标的样本数m 为实验样本中目标数据的数量;漏报数me为目标误判为虚警的个数;目标鉴别率pr=1-me×m-1;总鉴别率pz=1-ne×n-1;基于上述因素考虑,Bhanu 研究小组设计的适应度函数为

该适应度函数在评价特征子序列的鉴别性能时,只考虑了总错误数和描述长度这两个因素,是不全面的。基于此,国防科技大学的高贵博士在设计适应度函数上不仅考虑了前两个因素,还着重加入了漏报数一项,如式(2)所示,该适应度函数对鉴别特征选择结果的评价更全面,并取得了更好的效果[10]

但对于候选特征数较多的情况,该适应度函数缺乏准确性,这是由于:1)随着候选特征数量的增加,被选中特征数k 对适应度函数值的影响越大。2)随着新特征的加入,总鉴别率和目标鉴别率明显提高,即总错误数ne和漏报数me在逐渐减小,但优选出的特征序列维数k 并未明显减小,反之在一定的特征维数区间内,k 值还有上升的趋势。基于此,本文对文献[10]提出的适应度函数做了局部修正,如下式

式中,将高贵提出的适应度函数的第一项权值k 适当减小,变为k/l,大幅减小了所选特征数对适应度函数值的影响,保证了优选特征序列的鉴别性能,加快了遗传算法的收敛速度。

(4)确定遗传算子。设置初始的交叉算子为0.8,变异算子为0.01。为降低程序的运算时间并防止发生种群早熟现象,在整个搜索过程中,若最优个体的适应度函数值超过3 代未增加,则以0.02 的幅度按代增加变异率。待重新出现最优个体时,初始化变异率为0.01。

(5)设定终止条件。当适应度函数满足预设定目标值或迭代次数达到最终代数时,终止算法,并输出结果。本文由于候选特征数较多,设定遗传代数为200 代。

2.2 遗传算法流程

根据上述的5 个步骤,设计算法流程如图2 所示。

图2 基于遗传算法的特征选择流程图

3 实验结果与对比分析

为验证本文所提算法的可行性和有效性,这里进行了两类实验:(1)单特征可分性实验。(2)特征选取算法对比实验。

实验数据使用RADARSAT-2 数据库内的目标和杂波图像,图像分辨率为3 m×3 m,极化方式为HH;工作波段为C 波段;入射角30°~40°;图像尺寸为128×128。训练样本和测试样本的数量如表1 所示,实验采用二次距离鉴别器。

表1 实验图像数据

3.1 单特征可分性实验

对所有训练样本进行特征提取,根据样本中特征值的变化对单一特征的可分性进行分析,如图3 所示,为了构图,其中横坐标为155 个自动生成的随机数,代表每幅图像在坐标内的位置。纵坐标为该图像对应的特征值。由于特征数量较多,在此只展示前4 个特征。由此可看出,对于不同的特征、目标和杂波其所对应的特征值有明显的差异性。

图3 前4 个特征的可分性

根据上图所示。尽管单个特征对杂波、目标有一定的区分能力,但难以得到满意的鉴别结果。这是由于单个特征只能表现出目标的一部分特性,但对目标整体的特征缺乏概括性。

3.2 特征选择算法对比实验

采用高贵提出的适应度函数和本文改进的适应度函数进行对比研究,实验分为3 步。

第1 步 采用高贵提出的适应度函数对上述19个特征进行选择,实验次数为10 次,特征选择后的结果如表2 所示。

表2 高贵提出的适应度函数对19 个特征的选择结果

由表2 的结果可见:

(1)适应度函数最大值为-7.204 9,与此对应的特征序列有2 组,分别为[f3、f8、f9、f17]和[f3、f8、f9、f18],其总鉴别率均为0.991 87。但根据表2,维数为4的特征序列鉴别效果明显劣于维数为6 的特征序列。这样的结果在一定程度上说明,当候选特征数目较多时,文献[10]中提到的适应度函数存在一定的局限。

(2)特征选择后选择出的特征序列是多样的,这主要是由于参选的特征数目较多,满足鉴别要求的特征序列不唯一。且出于对算法计算时间的考虑,选择的种群规模和遗传代数有限,可能不足以保证每一次实验均达到全局收敛。

第2 步 采用本文提出的适应度函数对19 个特征进行特征选择,实验次数为10 次,特征选择后的结果如表3 所示。

表3 本文提出的适应度函数对19 个特征的选择结果

由表3 的结果可见:

(1)适应度函数的最大值为-0.336 51,与此对应的第2、7、8 次实验均找到了维数为5 的特征序列,同时鉴别率均为1。优于利用文献[10]中适应度函数得到的实验结果。

(2)依靠高贵提出的适应度函数理论上也能找出维数为5 的最优特征序列,但由于其评价函数设计缺乏准确性,在每一代的选择中有可能将错误的个体误判为最优个体保留。错误地引导种群的进化,导致遗传算法的全局收敛速度变慢。

第3 步 采用前两步得出的特征序列对测试样本进行实验研究。由于最优序列不唯一,从每组实验结果中随机抽取一组序列进行验证,如表4 所示。

表4 两个特征序列在测试样本中的实验结果

测试样本验证的结果表明,采用本文所提适应度函数后总鉴别率达到0.991 76、目标鉴别率达到1。均优于采用文献[10]适应度函数时获得的结果。

综上所述,本文提出的适应度函数更适用于候选特征数目较多的情况。优选出的特征数目更少且鉴别率更高。同时评价效果更全面,算法的收敛速度也更快。

4 结束语

本文针对SAR 图像鉴别特征选择的应用,在已有算法的基础上提出了一种基于遗传算法的鉴别特征选择算法。该方法通过对原有算法中适应度函数权值的修改,使得算法对实际问题适用性更为广泛。理论分析与实际验证均表明,该算法比文献[10]所提方法具有更高的准确性,收敛速度更快。

[1] DUDGEON D E,LACOSS R T.An overview of automatic target recognition[J].The Lincoln Laboratory Journal,1993,6(1):2-10.

[2] DUDGEON D E,ZELNIO E G.Discriminating targets from clutter[J].The Lincoln Laboratory Journal,1993,6(1):25-51.

[3] BURL M C,BURL,G J.OWIRKA L M.Texture discrimination in synthetic aperture radar imagery[C].Proceeding of Twenty-Third Asilomar Conference on Signals,Systems and Computers,1989:399-404.

[4] NOVAK L M,OWIRKA G J,BROWER W S,et al.The automatic target-recognition system in SAIP[J].The Lincoln Laboratory Journal,1997,10(2):187-202.

[5] 李禹.SAR 图像机动目标检测与鉴别技术研究[D].长沙:国防科学技术大学,2007.

[6] 王培伟.基于量子进化特征选择的SAR 图像分割[D].西安:西安电子科技大学,2010.

[7] 李敏强.遗传算法的基本理论与应用[M].北京:科学出版社,2002.

[8] BHANU B,LIN Y.Genetic algorithm based feature selection for target detection in SAR images[J].Image and Vision Computing,2003,21(7):591-608.

[9] 高贵.SAR 图像目标ROI 自动获取技术研究[D].长沙:国防科学技术大学,2007.

[10]高贵,周蝶飞,张军,等.基于遗传算法的SAR 图像目标鉴别特征选择[J].电子学报,2008,36(6):1041-1046.

猜你喜欢

特征选择适应度遗传算法
改进的自适应复制、交叉和突变遗传算法
一种基于改进适应度的多机器人协作策略
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
基于遗传算法和LS-SVM的财务危机预测
Kmeans 应用与特征选择
基于空调导风板成型工艺的Kriging模型适应度研究
软件发布规划的遗传算法实现与解释
联合互信息水下目标特征选择算法
基于改进的遗传算法的模糊聚类算法
基于特征选择聚类方法的稀疏TSK模糊系统