棉花图像检索中的分块权重优化
2016-08-12史书伟桑小田
史书伟,夏 彬,冀 翼,桑小田
(中华全国供销合作总社郑州棉麻工程技术设计研究所,郑州 450000)
棉花图像检索中的分块权重优化
史书伟,夏彬,冀翼,桑小田
(中华全国供销合作总社郑州棉麻工程技术设计研究所,郑州450000)
摘要:针对棉花图像检索中颜色直方图方法中的各图像分块权重难以设定的难题,提出一种基于粒子群算法的多分块权重自动优化方法,它将图像各分块权重设定转化为智能求优过程,使用粒子群算法求取较佳分块权重组合。结合棉花数据集的实验结果表明,与均等权重方法以及用户自定义权重方法相比,该方法能够取得较为优化的权重组合,提高棉花图像的检索性能。
关键词:棉花图像;分块颜色直方图;粒子群算法;权重优化
0 引 言
棉花图像检索就是根据棉花图像本身的颜色、纹理、形状等内容属性,在目标图像数据库中查询具有指定特征或内容图像的过程,是目前图像检索中较为常用的方法。在颜色特征中,由于全局颜色直方图计算简单,且具有较强的鲁棒性,已广泛应用[1-2]于图像检索中。但是,由于全局颜色直方图没有考虑图像颜色的空间关系,不同的图像有可能具有相同的直方图,从而造成误检,因此,文献[3-4]提出采用对棉花图像进行分块和加权的方法,将图像分成N*N块,计算相应块之间的直方图距离,然后为每个图像块设置权重,棉花图像整体的相似度根据相应子块的距离和权重综合得到。
对于棉花图像各个分块权重,一般情况下,有3种设置方法:a)图像的每个分块设置相同权重,即,都赋值为“1”,这样以来,图像所有分块均被同等对待;b)每个图像分块实行选择对待,这样它们的权重有两种可能:“1”或者“0”,分别表示该分块被选中或者没被选中,这样有效降低了分块所构成的特征维数,但会忽略没有被选中的图像块;c)手工设置权重,也即是通过实验分析预先求取优化过的权重值,显然,这种权重选取方法主观性较强。由于划分的不同图像分块在整幅图像中的重要程度不相同,对检索结果的影响也不一致,所以,如何为这些图像分块自动赋予合适的权值,进而提高图像检索的性能,成为一个亟待研究的课题。
针对上述问题,本文提出一种基于粒子群算法的图像分块权重自动优化方法,用粒子群算法[5-6]来求取棉花图像检索中合适的分块权重组合,并结合棉花图像数据集进行了实验。
1 相关知识
1.1粒子群算法原理
粒子群算法,也称粒子群优化算法[7-9](particle swarm optimization,PSO)是Eberhart和Kennedy发明的一种新的全局优化算法,它来源于对鸟群捕食过程中的行为研究。假设有一个场景:在特定区域中只有一块食物,一群鸟在空间中随机搜索该食物,所有的鸟都不清楚食物的具体位置。但它们知道当前的位置距离食物的远近。那么找到食物简单、有效的就是搜索当前距离食物最近的鸟的附近区域。而PSO算法就是通过模拟鸟群觅食行为而提出来的,该算法通过群体行为中个体间协作和信息共享来求取最优解,已成为一种常用的自动优化方法。
在求解问题时,PSO将搜索空间中的一个粒子(particle)对应一个问题解法。其中,每个粒子都拥有自己的位置、速度和适应值(fitness value),每个粒子在解空间中跟随当前最优粒子进行搜索,且不断更新自身的位置和速度。具体求解过程如下:首先,PSO随机初始化一群粒子,假设粒子数目为N,那么,第i个粒子的位置采用D维向量表示xi,xi=(xi1,xi2,…xiD),其中,i=1,2,…N。接着,粒子通过跟踪两个极值来更新自身的位置和速度,直到找到最优解。其中,在全局版PSO中,两个极值分别是指:一个是全局极值,表示群体找到的最优解;一个是个体极值,表示粒子个体找到的最优解。在局部版PSO中,粒子除了跟踪个体极值之外,另外还追踪局部极值。对于全局版PSO,每次迭代中,粒子根据式(1),式(2)更新自身的位置和速度:
(1)
(2)
1.2权重设置问题的转化
定义1棉花图像库的定义为:
DB={Ii}n,i=1
其中:Ii表示图像库中的一幅棉花图像,n表示图像库中的棉花图像总数。
定义2任意两幅棉花图像I1,I2间相似程度函数S定义为:
(3)
定义3样本训练数据库为db⊂DB,训练对定义为:
TD=(Ie,IT,IR)
(4)
其中:Ie为检索示例棉花图像,IT为与该示例图像相似的目标数据集,IT={It1,It2,…,Itk},IR为实际检索出的图像集,即S(Ii,Ie) 定义4图像检索评价指标查全率(recall)和查准率(precision)定义为: (5) 其中:P为查准率,是指在检索过程中,查询到的相关图像数量同该次查到的所有图像数量的比值;a为检索出的与示例图像相关的图像数量;z为检索出图像总数量;R为查全率,指在检索过程中,查询到的相关图像数量与图像库中实际与目标图像相关的所有图像数量的比值;k为目标图像数量。 (6) 其中:num为检索示例图像总数。在棉花图像检索中,查全率和查准率越高,说明该棉花图像检索算法性能越优越。 2.1优化策略与实现 粒子群算法开始时随机生成粒子的初始位置Xi=(Xi1,Xi2,…,Xim),(i=1,2,…,n),n为群中粒子数,m为粒子维数,并且每个粒子都随机分配一个初始速度Vi=(Vi1,Vi2,…,Vid),(i=1,2,…,n)。在计算过程中,粒子的当前速度Vi,粒子搜索过程中的最优点Pi,群体的最优点Pg。粒子在迭代过程中实时改变速度向前Pi和Pg移动[10]。 在棉花图像检索中,使用PSO进行分块权重优化的方法流程如图1所示。 图1 图像块权重优化流程 优化策略具体步骤如下: Step1对粒子群进行初始化,随机生成各个粒子的初始位置Xi、初始速度Vi。 Step2将各个粒子位置Xi载入优化目标函数,计算粒子适应度。 Step3将各个粒子当前值与其自身最优适应度值Pi进行比较,如果当前值小于Pi,则用当前适应度值替换Pi,并使用当前位置更新自身最优位置。 Step4将各个粒子适应度值Pi与全局最优适应度值Pg进行比较,如果小于Pg,则替换Pg,同时,使用该粒子位置更新全局最优粒子位置。 Step5各粒子速度和位置使用式(1)和式(2)更新。 vid(t+1)=w×vid(t)+φ×rand() ×[pid(t)-xid(t)]+φ2+rand()× pgd(t)-xid(t)] (7) xid(t+1)=xid(t)+vid(t+1) 1≤i≤n,1≤d≤D (8) 其中:φ1和φ2为加速因子;w为惯性因子,w越大探查范围越大,w越小适用于小范围开挖;rand()为在[0,1]上的随机数;xi为迭代中位置;vi为速度。 Step6如果满足迭代终止条件(足够好的位置或最大迭代次数),优化完成,否则转Step2。 2.2关键参数选取 为了获取稳健和高效的优化效果,按照方差分析选择适应的算法参数设置水平,关键参数选取如下: a)选取适应度函数E=Y(W)。 b)群中粒子数n:通常在[25,42]区间取值,对于一般情况,32个粒子已经足够;对于特定类别的问题或较难问题,粒子数n可以在[50,1000]区间中选取。 c)粒子维数m:一般情况下,问题解的长度通常设为粒子的范围宽度。 d)加速因子φ1和φ2:加速常数值取值越小,可使粒子在远离目标区域内振荡搜索;而取值较大的加速常数值,可使粒子迅速向目标区域移动,甚至又离开目标区域。模拟结果表明,当φ1由2.5线性递减至0.5,φ2由0.5线性递增至2.5时,算法容易获得最优适应值。 e)惯性因子w:让m随着叠代次数的增加,在[1.4,0]区间逐步减少可以获取较好的实验结果。 在算法验证试验中,采集白棉三级棉花图像作为数据集进行实验,该数据集包括1960例棉样图像,每副图像分辨率为1400×1400;实验硬件平台是一台联想M490便携式计算机,该计算机配备CORE i5 CPU,4GB内存。 3.1图像分块数目分析 对于棉花图像检索来讲,重要的就是确定图像分块数目,而分块的数目取决于单块图像的分辨率像素点数。为了选取合适的图像块大小尺寸,本文针对常用的不同分块尺寸进行了实验,结果如表1所示。 表1不同图像块尺寸对比实验 图像分块尺寸/pixel检索响应时间/s8*82.124*241.948*481.864*641.5128*1281.3256*2561.1 根据表1数据,考虑到数据集中图像的分辨率以及检索响应时间,实验选取64 pixel*64 pixel作为图像块尺寸进行算法间对比分析。 3.2不同方法间对比分析 为了验证本文方法的有效性,将其与现有权重相等方法和用户自定义权重方法进行比较和分析。其中,本文方法选取64 pixel*64 pixel为图像块尺寸,粒子群算法参数根据2.1节的方法设置;用户自定义权重方法中各分块权重按照实验中经验值设置。实验结果如图2所示。 图2 3种方法的性能比较 由图2可见,由于本文方法采用粒子群算法优化分块权重,通过训练学习的优化方法弥补了由于用户自定义设置权重的不足,提高了检索效果,本文提出的方法在查全率和查准率上优于其它分块权重方法,具有一定的有效性。 本文提出一种在棉花图像检索中,基于粒子群算法的图像分块权重自动优化方法,用粒子群算法来自动求取棉花图像检索中合适的分块权重组合,将图像各分块权重设定转化为智能求优过程,改善图像检索性能。这种方法思路较为新颖,在棉花图像检索的实验结果表明,该方法具有学习能力,分块权重的自动优化,提高了系统查全率和查准率,在提高棉花图像检索效率上有一定的优势。对于一些特定应用,该论文有很好的参考和借鉴作用。 如何进一步优化算法,在更大棉花数据集上进行实验将是下一阶段的主要工作内容。 参考文献: [1] 夏彬.基于内容的近似图像检测算法研究[D].武汉:湖北工业大学,2010. [2] 汪启伟,万寿红,岳丽华.一种新的空间颜色直方图及其度量方法[J].小型微型计算机系统,2014,46(6):34-36. [3] 温泉彻,彭宏,黎琼.基于内容的图像检索关键技术研究[J].微计算机信息,2007,23(3):278-280. [4] 方俊,郭雷,汪子强.一种改进的基于颜色空间特征的图像检索方法[J].计算机工程与应用,2005,24(25):68-70. [5] 薄玉玲,姜静清,孙艳红.粒子群优化算法研究进展[J].内蒙古民族大学学报(自然科学版),2010,29(6):91-93. [6] 张丹,韩胜菊,李建,等.基于改进粒子群算法的BP算法的研究[J].计算机仿真,2011,23(2):102-104. [7] 杨维,李歧强.粒子群优化算法综述[J].中国工程科学,2004,10(5):87-93. [8] 杨帆,胡春平,颜学峰.基于蚁群系统的参数自适应粒子群算法及其应用[J].控制理论与应用,2010,45(11):78-79. [9] 刘志雄,梁华.粒子群算法中随机数参数的设置与实验分析[J].控制理论与应用,2010,15(11):26-27. [10] 张琪,屈卫清,熊伟清.基于混沌粒子群算法的多目标调度优化研究[J].激光杂志,2015,29(1):57-59. (责任编辑:陈和榜) 收稿日期:2015-04-29 作者简介:史书伟(1979-),男,河南新郑人,高级工程师,主要从事棉花光电检测方面的研究。 通信作者:夏彬,E-mail:binxia@126.com 中图分类号:TP391 文献标志码:A 文章编号:1009-265X(2016)01-0001-04 Block Weight Optimization of Cotton Image Retrieval SHIShuwei,XIABin,JIYi,SANGXiaotian (Zhengzhou Cotton & Jute Engineering Technology and Design Research Institute of China Co-op, Zhengzhou 450000, China) Abstract:Aiming at the problem that it is difficult to set image block weight in cotton image retrieval with color histogram, this paper proposes multi-block weight automatic optimization method based on Particle Swarm Optimization (PSO). It converts the block weight setting into intelligent optimization process, and then PSO is used to gain optimal block weight combination. Experimental results combined with cotton data set show that the method ca gain optimized weight combination and improves cotton image retrieval property, compared with equal weighting method and user-defined weighting method. Key words:cotton image; block color histogram; PSO; weight optimization2 基于PSO的分块权重优化方法
3 实验结果与分析
4 结 语