一种基于集成学习技术的图像分割算法的研究
2012-01-10罗会兰王威王慧
罗会兰,王威,王慧
(江西理工大学信息工程学院江西赣州341000)
一种基于集成学习技术的图像分割算法的研究
罗会兰,王威,王慧
(江西理工大学信息工程学院江西赣州341000)
提出了一种基于集成学习技术的图像分割算法.该算法首先通过现有主流的图像分割算法对图像进行分割产生多个分割中间结果,然后利用集成技术对分割中间结果集进行集成,最后利用产生的集成结果对图像进行分割.实验使用了阈值分割算法、区域生长算法和FCM算法,实验结果表明基于集成技术的图像分割算法继承了各个算法的优点,弥补了单个算法的缺点,分割的效果好于采用单一分割算法的情况,很好地解决了图像分割中容易出现的不完全分割问题,同时较之于单一的算法,有更广的适用范围.
图像分割;集成学习;区域生长法
0 引言
图像分割是图像处理和图像分析识别的重要基础前提.图像分割是根据某种相似性度量将图像分成若干个有意义的局部,使得每一局部在某种准则的基础上相似或者说达到一致,而且任意两个相邻局部的合并都会破坏这种相似性.图像分割可以视为图像像素点集的聚类问题[1].图像分割由于分割的目的不同,分割的粒度不同,对于分割的结果要求会不同,并且不同应用领域中获得的图像性质不同,质量不同,这些都使得无法找到单一算法,使之适用于所有场合,适用于所有领域.每一种算法都有其适用的范围,例如基于阈值的分割算法是一种根据图像整体或局部灰度值分布情况,选择一个或者多个阈值,然后将阈值与图像像素点的灰度值比较,将图像分割成目标与背景或多个目标与背景的区域[2].图1(b)是使用阈值分割算法对图1(a)进行分割的结果,可以看出,对灰度分布不均匀或者说分布广的图像进行阈值分割会产生比较理想的结果.图1(d)是使用阈值分割算法对图1(c)进行分割的结果,可以看出阈值分割算法对于灰度分布均匀且灰度分布窄的图像难以得到准确的结果.阈值分割方法对噪声和灰度不均匀性很敏感,这使得该方法的应用受到很大的局限.从这个例子可以看出任何一种图像分割算法都有自己适用的范围,一种图像分割算法不可能适用于所有领域.而对于一个普通应用者来说,如果没有相关的领域知识,无法从繁多的图像分割算法中找到适合于当前任务的算法.随着多种新兴成像技术的研制和开发应用,单一的分割技术难以完成复杂的图像分割,将多个分割技术相结合,使之互为补充,达到比单一算法更好的平均性能和更强的鲁棒性.这正是集成学习的思想,集成学习集成多个学习器的结果来达到比单一算法更好的性能.如何产生多个学习器,使每个学习器利用不同的线索和信息,是集成学习的关键所在.而这也正是本文的研究动机,文中将集成学习应用于图像分割中,利用不同的图像分割算法,相当于不同的学习器,获得不同的图像分割结果,由于每种图像分割结果利用了不同的信息,依据不同的准则得到,所以集成这些分割结果可以得到比单一图像分割算法更好的效果.
图1 用阈值分割方法对不同灰度值分布的图像分割结果对比
文中提出了一种基于集成学习技术的图像分割算法,首先使用不同的图像分割算法对图像进行分割产生多个图像分割结果,然后利用集成技术将这些分割结果进行集成得到最终图像分割结果,对原图进行分割.基于集成学习技术的算法结合了多个图像分割算法的优点,提高了图像分割算法的适用范围,实验结果也表明当分割目标的边界比较模糊或者灰度值差异非常小的时候,算法能取得比单一算法更好的分割效果,很好的解决了不完全分割的问题.
1 经典图像分割算法
近年来国内外广泛应用的图像分割方法有:基于统计学的方法、可变模型法、模糊聚类法、基于遗传算法的分割方法、人工神经网络法、基于分形的分割方法和基于图谱的方法等.下面介绍几种应用在基于集成技术的分割算法实验中的经典图像分割算法.
1.1 阈值分割方法
基于阈值的图像分割方法,就是根据图像整体或局部灰度分布情况,确定一个或者多个阈值,通过比较图像每个像素的灰度值与阈值的大小,将图像二值化为目标与背景或切片成多个目标与背景的区域.阈值图像分割方法只考虑图像像素点的灰度分布信息,忽略了图像像素间的空间信息,因此对于噪声比较多的图像,或灰度分布均匀的图像,或局部区域间灰度过渡平滑的图像,分割效果不好.阈值分割方法的关键在于最佳分割阈值的确定.在文中提出的算法中,选用基于贝叶斯分类算法的阈值分割方法,力求在产生多个分割结果集的阶段,让每一种图像分割算法尽可能的产生分割效果较好的结果.基于贝叶斯分类方法的最优阈值分割算法伪代码如下所示:
count=count+1;
S0=0.0;n0=0.0;
S1=0.0;n1=0.0;
for i=1:x
for j=1:y
if double(Im(i,j))>=T
S1=S1+double(Im(i,j));
n1=n1+1;
else
S0=S0+double(Im(i,j));
n0=n0+1;
end
end
end
T0=S0/n0;
T1=S1/n1;
if abs(T-((T0+T1)/2))<0.00001
break;
else
T=(T0+T1)/2;
end
end
1.2 区域生长方法
区域生长图像分割方法是一种基于相似性准则基础上的图像分割算法,首先需要给定图像分割需要分割成区域的个数,然后需要给每个待分割区域选取一个种子像素,最后将种子像素邻域中与种子像素具有相同或相似性质的像素合并到种子像素所在的区域中.区域生长图像分割算法的关键在于确定区域生长过程中像素间的相似性准则,以及各区域种子像素.区域生长方法已经广泛应用到图像分割中[3].
A.Rosenfeld在文献[4-5]中将图像像素间模糊连接相似度的概念应用到图像处理中.J.K.Udupa在文献[6-7]中提出了应用图像像素间模糊连接相似度的图像分割方法,较好地解决图像分割中的模糊性,不均匀性和噪声污染等问题,推动了区域生长方法在图像分割中的应用.
1.3 基于模糊集理论的方法
将图像中的每个像素点作为一个数据点,图像分割就变成了数据聚类问题.由于图像局部间连接的模糊性,许多图像中不同区域间的过渡不明显.在这种情况下,运用模糊聚类方法来解决图像分割问题可以取得更好的效果.模糊C-均值(Fuzzy C-Means,FCM)聚类方法在图像分割中应用最为广泛.模糊C-均值是模糊理论与K-Means聚类方法结合的产物,是一种无监督的图像分割方法,具有简单,高效,准确等特点[8].但是传统的FCM算法也存在明显的缺点,那就是它认为图像像素点间是独立的,没有利用图像像素点间的空间信息,不能有效分割噪声图像和退化图像,而这些缺点刚好可以由阈值分割方法和区域生长分割方法来弥补.
2 基于集成学习技术的图像分割算法
集成学习技术已经在很多领域得到了应用.集成学习技术首先要产生学习器的集合,然后集成学习器的结果.图像分割的目标是根据图像不同像素包含的信息来聚类.由于描述图像信息的矢量的高维度,传统的机器学习方法趋向于产生非常不稳定且泛化能力差的模型[9-10].为了有效而且高效的解决这个问题,需要智能设计的学习器.多学习器模式似乎是一个好的选择.基于这种考虑,文中提出的基于集成学习技术的图像分割算法,使用多个分割算法来产生图像分割结果集,然后运用集成方法来集成这些分割结果,得到性能更好的图像分割效果.最近计算机视觉领域中流行的结合多个特征的趋势是使用多核学习方法(Multiple Kernel Learning,MKL).A.Vedaldi等人[11]和Marszaek等人[12]使用MKL学习到核的最优结合.P.Gehler等人[13]研究了多种学习不同特征的结合权值的模型.Koen E.A.van de Sande等人[14]在一个核函数中通过一种简单的方式结合了多个特征.
学习器集体是学习器的集合,它们的测试结果通过特定方法(一般是加权投票或简单投票方式)结合产生新的结果.集成学习在以下几个方面优于单个算法[15]:①更好的在不同领域和图像集中的平均性能;②能得到任何单个算法无法获得的结果;③对噪声、异常点和样本变化更不敏感;④并行性和可缩放性,成员可以独立在数据子集上并行学习.一个集体的性能只有在成员互不相同时才能比单个成员更好[10,16].结合多个从不同方面给出的结果的集成方法,是现存的最强的机器学习算法之一.文中的思想就是将集成方法的优势应用到图像分割中.
每一种图像分割结果可以看成是图像像素集的一个聚类.这里使用聚类集成来提高结果的质量和鲁棒性,可以达到提高聚类算法质量的目的.聚类集体也用来表达不同类型的图像信息,其中的每个成员聚类器能分别表达不同的图像特征.所以使用此聚类器集体去分割图像时,就可以得到更好的、更鲁棒的结果.高差异性的集体对于减少建立一个准确模型所需要的监督程度也非常有效.
X(m,n)表示一幅待分割的图像,它大小为m×n.首先使用阈值分割算法对它进行分割,产生一个图像分割结果,用Y(x)表示阈值分割算法对X(m,n)的像素x的分割结果.并行使用区域生长算法对同样的这幅图像进行分割,用S(x)表示区域生长算法对X(m,n)的像素x的分割结果.并行使用FCM算法再对这幅图像进行分割,用F(x)表示FCM算法对X(m,n)的像素x的分割结果.这样就可以得到同一幅图像的三个不同的图像分割结果:
文中提出的基于集成学习技术的图像分割方法提供了一种可以利用图像多方面信息和特征来分割图像的框架.虽然只应用了三种不同的分割算法来产生分割结果集,但基于集成学习技术的图像分割算法不局限于此,还可以使用更多的不同算法,或使用同一分割方法但设置不同参数值来生成更多的不同图像分割结果.这些分割结果的产生是相互独立的,可以并行运行,所以在保证性能提高的同时,并不会降低效率.
运用不同的图像分割算法产生多个分割结果后,集成它们的常用方法有两种,第一种是加权和,第二种是简单投票法.对于加权和集成方法,设定三个正数:
对图像分割结果集中的成员进行加权和,得到一个新的图像分割结果.用m(x)表示集成后对X(m,n)的像素x的分割结果:
如果采用投票法则进行集成的话,通过对二值化图像分割结果集进行投票,一个简单的利用投票方法进行集成的例子如表1所示.通过比较三种算法在每个像素点的灰度值来决定最后基于集成技术的图像分割算法分割原始图像的结果.
表1 一种简单的投票集成例子
投票法较之于第一种加权法来说,差别在于参与投票的每一种算法的权重是一样的,文中采用的集成方法是基于加权求和法则进行的.文中提出的基于集成学习技术的图像分割算法的伪代码如下所示:
Step1:输入一幅待分割的图像X(m,n),它大小为m×n.
Step2:利用不同的图像分割算法产生图像分割结果集,例如使用阈值分割算法、区域生长算法、FCM算法产生三个不同的图像分割结果:
Y:阈值分割算法,Y(x)为使用阈值分割算法得到像素x的分割结果;
S:区域生长算法,S(x)为使用区域生长算法得到像素x的分割结果;
F:FCM算法,F(x)为使用FCM算法得到像素x的分割结果;
Step3:对待分割图像X(m,n)的每一个像素x的所有分割结果进行加权和:
输出m(x)的值作为像素x的最终图像分割结果.
3 实验
为了验证文中提出的算法的有效性,用实验数据做了大量的实验,分别比较了基于集成技术的分割算法与其它几种算法的分割效果,在CPU为Intel Pentium4 3.0 GHz,内存为DDR 400 MHz(1.5 GB)的Windows XP系统上,用MATLAB 7.6进行编程实验.
1)实验一
本实验主要分析比较基于集成学习技术的图像分割集成结果与单个分割算法的结果.选用了一副灰度分布较集中的脑部MRI图像作为待分割图像,如图2(a)所示,首先分别使用阈值分割算法和区域生长算法对原图进行分割,得到的结果分别如图2(b)和图2(c)所示.从图2(a)可以看出,由于这幅图像像素间的灰度值非常接近,虽然采用了基于贝叶斯分类算法的阈值分割方法对原图进行分割,但是可以看出脑部的主要部分根本就没有分割清楚.图2(c)是使用区域生长算法分割的结果图,虽然脑干中大部分的区域分割出来了,但是没有分割完整,可以看出图2(c)的左上角那部分脑组织是没有分割出来的.图2(d)是文中提出的基于集成技术的图像分割算法的分割效果,可以看出文中提出的算法较之于单个阈值分割方法,可以得到较完整的分割结果;较之于单个区域生长算法,分割得更准确,更清晰,在细节的保留上效果更好.
图2 阈值分割算法和区域生长算法集成后的比较图
2)实验二
本实验主要分析加权集成方法中权值的设置对基于集成技术的图像分割算法性能的影响.这三个系数的选取对最终的图像分割效果有直接的影响.图3(a)是设置阈值分割算法的分割结果的权重为0.9,而区域生长算法和FCM算法的分割结果的权重分别设置为0.05和0.05时,对图2(a)所示的原图集成分割的结果.可以看出,当阈值分割算法的结果占主要部分的时候,集成分割后的图像效果不是很明显,虽然较之于采用单一的阈值分割算法来说,集成技术的方法还是更优.图3(b)是三种算法的分割结果权重设置成一样的集成分割效果,效果也不是很理想,背景的灰度值和分割后的对象非常接近,因此会干扰分割结果,不便于理解,但也比单个阈值分割算法的效果更好.图3(c)是设置阈值分割算法的分割结果的权重为0.2,而区域生长算法和FCM算法的分割结果的权重分别设置为0.4和0.4时,对图2(a)所示的原图集成分割的结果,可以看出,集成后的分割效果很好.图3(d)是三种算法的分割结果的权重分别为0.1,0.45和0.45时对图2(a)所示的原图集成分割的结果,可以看出,集成后的分割效果更好.
图3 不同权值设置的图像集成分割效果比较
3)实验三
本实验目的在于分析比较文中提出的算法与其它三种经典算法,来验证文中提出的基于集成技术的图像分割算法分割效果.实验结果示于图4中.从图4中可以看出,文中提出来的算法,较之与三种经典分割算法有明显的改进.图4(a)是待分割的原图,图4(b)是FCM算法图像分割效果图,图4(c)是阈值算法分割效果图,图4(d)是区域生长算法分割效果图,文中提出的基于集成学习技术的图像分割效果图示于图4(e)中.从实验结果可以看出,与FCM图像分割方法比较起来,文中提出的方法得到的分割结果对比度和细节更为明显,这是因为文中提出的集成算法整合了区域生长算法的优点.和阈值分割算法比较起来,可以看出我们的算法将脑干的各个区域都分割清楚了.与区域生长算法比较起来,虽然区域生长算法分割界限明显,但是分割的结果却不完整.文中提出的基于集成技术的图像分割算法,继承了各个算法的优点,弥补了单个算法的缺点,分割的效果好于采用单一分割算法的情况.
图4 提出的算法与三种经典算法的分割结果比较
4 结论
人类并行使用多种信息,像颜色、形状和深度信息来分类,识别和辨别物体.基于这种认识,本研究融合多个不同图像分割算法来集成分割图像,从而达到利用多方面图像信息来分割图像的目的.文中提出了一种基于集成技术的图像分割算法,实验结果清楚表明集成方法能增加鲁棒性.图像分割的方法很多,用户通常不知道选择哪种方法好.集成方法可以使用许多的模型,然后结合它们产生稳定结果.集成方法能自动聚焦于最适合所给数据的信息.如果成员间有差异,成员性能不是太差,则集成性能大大高于最好个体,因此比较适合于对分割图像精度要求较高的场合,特别是用在医学图像分割领域,会为医生对脑部病变组织或颅内占位性病变术前分析提供较为准确的数据,具有较大的实用价值.
[1]康晓东.医学影像图像分割与存储若干问题的研究[D].天津:天津大学,2007.
[2]Christopher H Sotak.The role of diffusion tensor imaging in the evaluationofischemicbraininjury-a review[J].NMR in Biomedicine,2002,15(7-8):561-569.
[3]WanSY,HigginsWE.Symmetric region growing[J].IEEE Transaction on Image Processing,2003,12(9):1007-1015.
[4]Azriel Rosenfeld.Fuzzy digital topology[J].Information and Control,1979,40(1):76-87.
[5]Azriel Rosenfeld.On connectivity properties of grayscale pictures[J].Pattern Recognition,1983,16(1):47-50.
[6]JKUdupa,SSamarasekera.Fuzzyconnectednessandobjectdefinition:theory,algorithms,andapplicationsinimagesegmentation[J].Graphical modelandImageprocessing,1996,58(3):246-261.
[7]J KUdupa.Fuzzy connectedness and image segmentation[J].Proceedings of the IEEE,2003,91(10):1649-1669.
[8]余学飞.基于模糊理论的医学图像分割算法研究[D].广州:南方医科大学,2009.
[9]R Maree,P Geurts,J Piater,et al.Random subwindows for robust imageclassification[C].IEEEComputerSocietyConferenceonCVPR,2005:34-40.
[10]Lior Rokach.Ensemble-based classifiers[J].Artificial Intelligence Review,2010,33(1-2):1-39.
[11]A Vedaldi,V Gulshan,M Varma,et al.Multiple kernels for object detection[C].2009 IEEE 12th International Conference on Computer Vision,2009:606-613.
[12]M Marszalek,C Schmid,H Harzallah,et al.Learning object representations for visual object class recognition[C].Visual RecognitionChallengeworkshop,inconjunctionwithIEEE International Conference on Computer Vision,2007:1-20.
[13]P Gehler,S Nowozin.On feature combination for multiclass object classification[C].12th IEEE International Conference on Computer Vision,2009:221-228.
[14]K E A van de Sande,T Gevers,C G M Snoek.Evaluating color descriptorsforobject and scene recognition[J].IEEE Transactions on PatternAnalysisandMachineIntelligence,2010,32(9):1582-1596.
[15]A Topchy,A K Jain,W Punch.Clustering ensembles:models of consensusandweakpartitions[J].IEEETransactionPatternAnalysis and Machine Intelligence,2005,27(12):1866-1881.
[16]L K Hansen,P Salamon.Neural network ensembles[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1990,12(10):993-1001.
An image segmentation algorithm based on ensemble learning
LUO Hui-Lan,WANG Wei,WANG Hui
(Faculty of Information Engineering,Jiangxi University of Science and Technology,Ganzhou 341000,China)
image segmentation;ensemble learning;region growing
TP391.41
A
Abstarct:An image segmentation algorithm based on ensemble learning is proposed.First,several different image segmentation algorithms are used to produce many intermediate segmentation results.Then the intermediate image segmentation results are integrated with ensemble learning.Finally,the integrated output is adopted to image segmentation.The thresholding segmentation method,region growing segmentation method and FCM segmentation method are used in the experiments.Experimental results show that the quality of the proposed image segmentation algorithm based on ensemble learning technology significantly outperforms the best individual member.And the proposed method can be a good solution to incomplete image segmentation problem.At the same time,the performance of the proposed method is often more robust than a single algorithm.
2012-03-12
国家自然科学基金资助项目(61105042)
罗会兰(1974-),女,博士后,副教授,主要从事图像处理及机器学习等方面的研究,E-mail:luohuilan@sina.com.
2095-3046(2012)03-0056-06