基于入侵性杂草优化算法的图像识别的研究
2014-07-07于蕾周忠良郑丽颖
于蕾,周忠良,郑丽颖
1.哈尔滨工程大学信息与通信工程学院,哈尔滨 150000
2.哈尔滨工程大学计算机科学与技术学院,哈尔滨 150000
基于入侵性杂草优化算法的图像识别的研究
于蕾1,周忠良1,郑丽颖2
1.哈尔滨工程大学信息与通信工程学院,哈尔滨 150000
2.哈尔滨工程大学计算机科学与技术学院,哈尔滨 150000
针对小波不变矩提取的特征向量维数过大的问题,提出一种以类间、类内散布矩阵作为可分离判据的离散入侵性杂草优化算法实现特征向量的选择,利用BP神经网络作为分类器进行图像识别。实验仿真结果表明,与现有特征选择算法相比,改进的离散入侵性杂草优化算法对于图像特征向量的选择时间更短,识别正确率更高,能有效提高分类器的性能。
图像识别;特征选择;小波矩;入侵性杂草优化算法
1 引言
图像识别在最近几年里得到广泛研究,在工农业生产和国防军事上都有着重要的应用价值。由于同一个目标,从不同角度和高度观测时,目标必然会发生平移、旋转和尺度的变化,这使得图像中包含的信息、数据量大,为识别带来困难。因此本文采用小波不变矩进行图像特征的提取,但是通常从图像中提取的特征可能有上百维,而实际上只有能够表征相似图差异的特征值对识别才具有价值。适当减少特征向量的维数,既可以消除冗余,提高分类器的运算速度;也可降低分类器的复杂性,得到较低的分类错误率。为了有效减少特征向量维数,文献[1]和文献[2]提出了一种利用遗传优化算法进行特征值的选择,但是利用遗传算法进行特征向量选择的速度慢。针对以上缺点,本文提出了一种改进的离散入侵性杂草优化算法(Discrete Invasive Weeds Optimization,DIWO),该算法结合类间、类内散布矩阵进行特征值的选择,有效提高了特征向量选择的时间,并用BP神经网络作为分类器进行最终识别[3],以达到最优的目标识别性能。该系统主要由不变矩的特征提取、特征向量选择和分类识别三个主要部分组成。
2 图像不变矩特征提取
图像特征提取对图像的识别尤为重要,它决定了识别性能的优劣,故本文选择具有旋转、平移、尺度变换不变性的小波不变矩作为图像识别的特征提取方法。
一幅二维图像可以用函数f(x,y)表示,采用极坐标表示为f(r,θ),其中x=rcos(θ),y=rsin(θ),因此,图像f(x,y)的小波不变矩定义如下:
式中,φmnq(r)为径向小波基函数,表示为:
式中,m,n分别为尺度因子和位移因子,m=0,1…,n=0,1,…,2m+1。本文母小波φ(r)选择B样条函数,它的高斯表达式如下:
选择不同的m和n,||Wmnq||就可以得到图像的不同尺度水平上的特征[4]。
3 特征选择
在利用小波不变矩提取的大量特征值中,有些是交叠的、不易判断的,这些特征值含有的信息量很少,会降低分类器的识别效率。因此,要对这些特征向量进行进一步的选择,这个选择出含信息量较大、对有效识别起重要作用的过程就称为特征选择。特征选择是模式识别中一个非常关键的问题,选择出具有良好分类性能的特征向量能有效改善分类器的性能,提高识别正确率。现有的特征选择算法仍存在选择时间长的问题,为了解决这个问题,本文提出一种利用类间、类内散布矩阵作为可分离判据的离散入侵性杂草优化搜索方式的特征向量选择算法,该算法的具体步骤介绍如下。
3.1 类别可分离性判据
特征值选择的任务是从D个特征中选出分类效果最优的d个特征(d<D),共有种选择组合方式。这时就需要一个标准来衡量到底哪种特征组合方式的分类效果最好。各类样本可以分开是由于它们位于特征空间中的不同区域,这些区域之间的距离越大,则类别可分性就越好,因此可以用类别间的距离作为衡量分类效果的标准。
式中,c为类别数,ni、nj分别为wi、wj类的样本个数,pi、pj是相应类别所占概率。多维空间中的两个向量之间有很多种距离度量方式,这里选择通用的欧氏距离方式,距离表示如下:
若用mi表示第i类样本集的均值向量:
m表示所有各类样本集总平均向量:
则各类特征向量之间的平均距离可表示为:
其中,Sb为类间散布矩阵:
由于类内散布矩阵的行列式越小、类间散布矩阵的行列式越大,可分离性就越好,因此,还可以提出下面几种准则函数:
3.2 基于改进的入侵性杂草优化算法的特征值选择搜索方法
特征向量的选择主要由两方面组成,一是标准的选择,可以采用3.1节介绍的可分离性判据,另一个关键问题是要找一个好的搜索方法,可以在较短的时间内选出最优的特征向量。由公式(8)可知特征向量的选择可以归结为有约束条件的非线性组合优化问题,入侵性杂草优化算法(IWO)不仅能解决这类问题,在性能上也优于遗传优化算法,因此本文采用入侵性杂草算法进行特征提取。
IWO算法是Lucas[5]等人在2006年提出的一种新颖的数值优化模型。它主要通过模拟自然界杂草生长过程,给出一种能够解决实际复杂非线性的工程问题的方法。由于杂草生长的顽强性、普遍性、强制性,IWO算法具有与之对应的鲁棒性、随机性和适应性。
由3.1节可知,特征向量的选择属离散问题,而IWO算法虽然能成功解决线性天线设计[6-7]、移动通信系统的基站选址及生物科学的DNA序列计算等问题[8],但都只是针对连续问题,不能直接运用到离散空间中,无法解决特征向量选择问题。文献[9]虽然提出了一种二进制离散杂草算法,但是该算法使用二进制编码序列,序列长度会比普通的十进制编码方式长数倍,不利于计算,而且它的进化过程是通过映射以概率形式作用每个二进制位,操作复杂,不适合解决本文中的特征向量选择问题。为此,本文提出一种改进的离散入侵性杂草优化算法。
3.2.1 编码
将二进制编码改为十进制编码,十进制编码具有精度高,便于大空间搜索的优点,相对于二进制编码计算简单[10]。设N为小波矩算法提取出的系统特征值总数,种群中的个体用n维数组表示,n为要选择的特征值个数,每一维上的元素为一个对应的特征值编号,取值范围是[1,N],表示所选的特征值组成的特征向量。个体编码后如表1所示,其中x1,x2,…,xn是1到N之间的不重复任意整数。
表1 小波矩特征值个体编码表
3.2.2 基于随机位变异的空间扩散方式
在父代个体基础上,进行随机位变异,实现种子的空间扩散,这种方式既能满足其在父代个体周围变化,又具有随机搜索能力。
设种群内的个体为X=(x1,x2,…,xj,…,xn),针对个体X中随机选取一个编码位置xj作为变异位,在从特征值空间([1,N])中随机选取特征值编号xm替换个体X中的元素xj,得变异后的新个体Xnew=(x1,x2,…,xm,…,xn),这里xm的选取需满足条件xm∉X,这样就完成了种群中一个个体的一个种子的扩散。
3.2.3 基于DIWO算法的特征向量选择实现步骤
基于DIWO算法的特征向量选择主要包括以下四步:
(1)种群初始化
根据3.2.1节的编码方式,随机产生初始种群,设置实验参数;由公式(8)计算适应度函数值。
(2)生长繁殖
生长繁殖是根据每个个体(解)自身的适应性,即适应度函数值,计算每个个体能产生种子的个数。适应性越好的个体,产生越多的种子,这是符合自然生长过程的。种子数与适应值的关系如图1所示,图中适于求解适应度值最大的问题,计算公式为:
式中,Nseed表示产生的种子数,f代表当前个体适应度值,fmax是种群中最大的适应度值,fmin为种群中最小的适应度值;smax、smin分别代表最大和最小种子数,为可调参数,一般认为smax=5,smin=1即足以解决绝大部分最优化问题。
图1 种子生长过程示意图
(3)空间扩散
利用3.2.2节中的随机位置变异的方式,将所有种子进行扩散,产生新个体,将产生的所有新个体与父代相加产生新的种群。
(4)竞争性排除
经过数代的繁殖后,克隆产生的后代数目将超过环境最大承受能力,通过预先设定的最大种群数目pmax,对种群数量加以控制。在算法迭代过程中,种群中的所有杂草和其后代按其适应度值从好到坏进行排序,只有适应度值最好的前pmax个个体能够存活下来,剩下的个体都将被环境所淘汰。当算法运行到预先设定的最大迭代次数时,算法终止。
4 实验仿真
为了验证本文算法在图像识别中特征向量选择的可行性和有效性,设计了针对3个人组成的30幅人脸的二值图像分别进行计算机仿真实验,识别所用的全部原图像如图2所示。本文采用BP神经网络作为分类器,进行分类识别验证。
图2 人脸二值图像
实验在Intel®Celeron®CPU、E430@2.60 GHz、2 GB内存的计算机上进行,软件编程采用M atlab7.1语言。
整个实验分三部分完成,第一步利用小波不变矩方法提取出特征值,确定特征值空间;第二步分别采用本文算法与文献[1]和文献[2]中的遗传算法(GA)实现特征向量的选择,并进行了运行时间的对比;最后采用BP神经网络作为分类器,验证两种算法的识别正确率;并且证明了进行特征向量的选择可以有效提高分类器的性能。具体实验步骤如下。
(1)采用小波不变矩方法共提取了68个特征值,用式(8)做为选择的标准,分别采用遗传优化算法(GA)和本文的DIWO算法作为搜索方法进行特征向量的选择,通过实验仿真验证,对比时间如表2所示。
表2 实验数据表
从表2可以看出DIWO进行特征值的选择时间明显比采用遗传算法的时间快。这是因为遗传算法采用二进制编码方式,个体维数大,增加了计算复杂度,导致运行时间慢,而本文算法提出使用十进制编码方式,效率更高。
(2)从已提取的68个特征值中,采用本文提出的选择方法选出使特征向量距离最大和最小的特征向量组合,得到BP神经网络的网络误差训练曲线分别如图3中(a)和(b);识别正确率对比如表3。
图3 BP神经网络网络误差训练曲线
通过图3可以看出进行特征选择大幅度降低了BP神经网络的均方误差和训练时间,提高分类器的运行速度;表3证明了特征选择有效降低了识别的错误率。
表3 识别正确率
5 结论
本文采用小波不变矩进行图像不变矩的特征值提取,提出了改进的入侵性杂草优化算法,利用类间、类内散布矩阵作为可分离性判据,实现特征值的选择,最后采用BP神经网络作为分类器进行最后的识别。通过仿真实验可以看出DIWO算法进行特征向量选择的时间低于GA所用的时间,而且证明了进行特征向量选择可以有效降低特征向量的维数,并且大幅度降低了BP神经网络的均方误差和训练时间,提高了分类器的性能,在模式识别中具有实际的应用价值。
[1]刘素华,侯惠,李小霞.基于遗传算法和模拟退火算法的特征选择方法[J].计算机工程,2005,31(16):157-158.
[2]陈果,邓堰.遗传算法特征选取中的几种适应度函数构造新方法及其应用[J].机械科学与技术,2011,30(1):124-128.
[3]Hu Xiaozhou,Kong Bin,Zheng Fei,et al.Image recognition based on wavelet invariant moments and wavelet neural networks[C]//Proceedings of the 2007 International Conference on Information Acquisition,ICIA,2007:275-279.
[4]Yang Ruihong,Pan Quan,Cheng Yongmei.The application of wavelet invariant moments to image recognition[C]// Proceedings of the 2006 International Conference on Machine Learning and Cybernetics,2006:3243-3247.
[5]章品正,徐琴真,王征.基于小波矩的面部特征匹配定位方法[J].计算机工程与应用,2007,43(26):245-247.
[6]Mehrabian A R,Lucas C.A novel numerical optimization algorithm inspired from weed colonization[J].Ecological Informatics,2006,1(3):355-366.
[7]Karimkashi S,Kishk A,Kajfez D.Antenna array optimization using dipole models for M IMO applications[J].IEEE Antennas and Propagation Society,2011(1):1-5.
[8]Roy G G,Das S.Design of non-uniform circular antenna arrays using a modified invasive weed optimization algorithm[J].IEEE Antennas and Propagation Society,2011 (1):110-117.
[9]张帅,王营冠.离散二进制入侵杂草算法[J].华中科技大学学报,2011,39(10):55-60.
[10]毕晓君.信息智能处理技术[M].北京:电子工业出版社,2010:189-217.
YU Lei1,ZHOU Zhongliang1,ZHENG Liying2
1.College of Information and Communication Engineering,Harbin Engineering University,Harbin 150000,China
2.College of Computer Science and Technology,Harbin Engineering University,Harbin 150000,China
Due to the large number of feature values which can be extracted from wavelet moment,a discrete invasive weed optimization algorithm is proposed to select the feature vectors with between-class scatter matrix and within-class scatter matrix,and finally can recognize images with the help of BP neural network as the classifier.The simulation results show that,com pared to the feature selection algorithm,the improved discrete invasive weed optimization algorithm has the shorter selection time of image feature vectors,the higher accuracy,and can effectively improve the performance of the classifier.
image recognition;features selection;wavelet moment;invasive weed optimization algorithm
A
TP391
10.3778/j.issn.1002-8331.1208-0302
YU Lei,ZHOU Zhongliang,ZHENG Liying.Research of image recognition based on invasive weed optimization algorithm.Computer Engineering and Applications,2014,50(16):188-191.
国家自然科学基金(No.61003128)。
于蕾(1977—),女,博士,副教授,研究方向为图像处理;周忠良(1985—),男,硕士,研究方向为图像识别;郑丽颖(1975—),女,博士,副教授,研究方向为图像识别。E-mail:liangzi305@126.com
2012-08-24
2012-10-11
1002-8331(2014)16-0188-04
CNKI网络优先出版:2012-11-21,http://www.cnki.net/kcm s/detail/11.2127.TP.20121121.1508.049.htm l