基于混合高斯模型和相似度的阈值分割
2013-09-17郭红
郭 红
(重庆邮电大学信号与信息处理重庆市重点实验室,重庆 400065)
基于混合高斯模型和相似度的阈值分割
郭 红
(重庆邮电大学信号与信息处理重庆市重点实验室,重庆 400065)
阈值分割法在图像分割中是一种最为简单和有效的方法,然而如何选取合适的阈值实现有效分割,目前还没有统一的方法。结合信息论与图像的空间信息,提出一种新的阈值优化算法。首先建立图像的混合高斯分布(GMM),然后利用强度的类不确定性和相似度函数特性定制出目标函数,优化出局部阈值,从而获得高效的分割效果。实验结果表明,与大津法(OSTU)相比,该算法能够成功分割出模糊的边界,并且能够将图像中的各个组织有效的分割出来。
阈值;混合高斯分布;类不确定性;相似度函数;目标函数
图像的边缘含有非常丰富的图像信息。在图像信号的采集、传输和处理过程中将不可避免地引入各种类型的噪声,导致图像的边界模糊,因此如何有效地从模糊、噪声干扰的图像中检测出边缘是一个有意义的课题。传统的边缘提取方法较多,但仍存在许多问题。阈值分割是进行图像边缘分割的一种最常用,同时也是最简单的图像分割方法。它通过设定不同的特征阈值,把图像分成若干类。许多阈值分割方法根据一维灰度直方图或二维灰度直方图从背景中提取感兴趣的目标[1-3];最大类间方差法[4]通过最大化类间方差选取一个全局最优阈值;Kittler和Illingworth等人提出的最小误差法[5]将图像像素分类后误差率最小的值确定为图像阈值;信息论中熵指信息的不确定性,作为最佳准则引入阈值分割算法[6-7]中,并得到了很好的阈值分割效果,但是它没考虑图像的空间相关性,所以若不同图像直方图相同,那么得到的阈值也相同;基于模糊连接度的图像分割算法也已经广泛地运用到医学图像的分割中[8-9],能够很好地处理医学图像的模糊性和图像噪声。
图像的数据量比较大,其密度函数会有单峰或多峰,并呈现不规则状;对于复杂的图像,尤其是医学图像,一般来说图像的密度函数都是多峰的,比较复杂。所以用高斯混合模型(GMM)估计出来的结果更接近图像的真实分布,能够很好地刻画图像分布的细节。因此,本文通过建立高斯混合模型对图像进行建模,结合类不确定性和相似度函数特性选取最佳阈值进行分割,以获取高效的分割效果。
1 阈值的优化函数
本文提出的改进阈值分割法主要是能量函数的定制,能量函数有两部分组成:1)基于信息论的相关特性,本文通过建立混合高斯模型,求物体的类不确定;2)基于图形学的相似度,用于区域的计算,该方法依据高的类不确定性估计出物体的边界,分割出不同组织区域。在任何图像位置中,高的能量在类不确定性和相似度同时高或低的地方。最后,该方法的基本原理源于假设模糊图像边界,在最优分割下,高的类不确定性的像素出现在物体边界上。
1.1 建立GMM模型,推导类不确定性
GMM混合分布模型的建立如图1所示。
图1 混合高斯模型的概率分布(截图)
在高斯混合分布中,阈值将其分为前景区域和背景区域,本文中选取K=7个高斯模型。
数字图像可以被表示成一个有序实数对ζ=C,()f,在这里C表示图像域,f表示一个强度函数,即f|C→[IMIN,IMAX],这里的[IMIN,IMAX]表示像素强度最小和最大值。通常,在二维图像的像素域C中,像素点一般用矢量p,q,r表示C的元素,在三维或高维中,则另有表示。根据阈值和各混合高斯模型中的均值,将高斯模型分为前景区Fo,t和背景区Fb,t。
对前景区域中的高斯分布,根据公式(3)求出该像素点离各个高斯分布的distance,distance最小,那么该像素点就属于那个高斯分布
那么该像素点强度值为g,在前景区域的概率为
式中:p代表高斯概率密度函数;表示像素p的混合高斯模型中第i个高斯分量的权重,满足;这里分别表示第i个高斯分布的均值及协方差,协方差定义为其中σ表示标准差,I表示单位矩阵,那么该像素点落在背景区域中的概率,可以用同样的方法求出,所以,强度值为g的像素点落在背景区域中的概率为
定义θ不依赖于像素的强度,表示属于Fo,t的像素的概率,(1-θ)表示Fb,t的像素概率。通常情况下,θ被称为密度函数
因此,任何像素点强度值为g的概率,表示为p(g),计算如下
用贝叶斯准则定义前景和背景类的像素点,强度值为g的后验概率,分别为
根据分类的不确定性,随着强度值g的像素值落入前景或背景类的图像域C中,根据后验概率熵公式,称为类不确定性,它的估计根据香农和韦弗的熵方程
根据以上的描述,任何给定的强度阈值t,计算像素点的强度密度概率f(g)
1.2 归一化的相似度
1979年将模糊连接度概念引入图像处理中,并提出了它的框架和对象表示,模糊空间的概念如下:设n维欧式空间Rn被n组相互垂直的超平面分割成一些超立方体,这些超立方体称为空间元素,当n=2时,这些空间元素称为像素。模糊空间的概念是设这些超立方体的中心坐标为n元的整数,则它对应于Zn中的一个点Zn上的模糊关系α是自反的、对称的,(Zn,α)被称为模糊数字空间[10],一般 α 的隶属函数 μα(c,d)(c,d∈Zn)是c,d距离‖c-d‖的递减函数。ζ=(c,f)被称为模糊数字空间(Zn,α)上的场。
考虑到每对相邻点的整体信息,相似度函数用如下公式计算
1.3 目标函数
为了求取阈值,定制出目标函数Q为
通过公式可以看出:1)不确定性高,且模糊相似度大时,目标函数值大,式中第一部分起主要作用;2)当不确定性值和模糊相似度低时,目标函数值大,式中第二部分起主要作用,只有一个大一个小,目标函数才能达到最小。目的是优化目标函数使其值最小,从而找到阈值t。
1.4 阈值优化方法
ITK(Insight Segmentation and Registration Toolkit)是一个开源,跨平台的图像分割框架,里面有大量的前沿算法,广泛用于图像配准和分割。在描述阈值t优化方法时,利用ITK中的vnlpowell这个类来实现。
本文后面的搜索空间仅仅是二维的,powell算法不需要计算导数,在每一维中使用brent算法迭代搜索,搜索速度比较快,局部寻优能力极强,在局部搜索中精度要高于其他的优化算法[11-12],所以采用powell法来优化阈值与梯度参数。
2 实验结果
为了验证本算法的性能,本文利用合成图像与实际图像进行了测试,并与ostu算法结果进行了比较(见图2~图5)。图2为2D脑区域图像,加入了混合高斯噪声并且对图像进行了模糊和噪声处理。从图中可以看出不确定性值与像素的亮度成正比,在边界上不确定性高,能够更清晰地分割出不同组接口。
从图6~图9中可以清楚看出,通过这种方法,可以把灰度图不同的组织,根据优化出来的局部最优阈值,清楚地分割出来,达到应用到医学图像的目的,从而提高了临床医生对人体内部病变部位的观察,提高了确诊率。
图9 不同组织分割效果
3 结束语
近年来,自动选取阈值的图像分割算法在图像分割中应用效果很好,而基于信息论熵理论的阈值自动选取算法,对图像分割的效果也得到了很好的验证。本文自动选取阈值的算法,给出了算法的数学推导过程及优化策略,从形式上看直观、简洁,并且在医学图像的应用中,也取得令人满意的结果,它能将医学图像中的不同组织分割开来。本文应用到的类的不确定性,将信息论的特征应用到图像中,将图像中的有用信息最大限度地保留下来,而且类不确定性这一特征也可以应用到其他的一些算法中,下一步将对此进行研究。
:
[1]张新明,郑延冰.二维直方图准分的Tsallis熵阈值分割及其快速实现[J].仪器仪表学报,2011,32(8):1797-1802.
[2]LU Rong,SHENG Yi.Image threshold segmentation method based on an improved 2-D histogram[J].Systems Engineering and Electronics,2004,26(10):1487-1490.
[3]ORLANDO J T,RUI S.Image segmentation by histogram thresholding using fuzzy sets[J].IEEE Trans.Image Processing,2002,11(12):1457-1465.
[4]OTSU N.A threshold selection method from grey-level histograms[J].IEEE Trans.Systems,1979,9(1):62-66.
[5]KITTLER J,ILLINGWORTH J.Minimum error thresholding[J].Pattern Recognition,1986,1(19):41-47.
[6]PUN T.A new method for gray-level picture thresholding using the entropy of the histogram[J].Signal Processing,1980,2(2):223-237.
[7]PRASANNA K,SAHOO G A.A thrsholding method based on two-dimensional Renyi's entropy[J].Pattern Recognition,2004,6(36):1149-1161.
[8]刘耀辉,陈官发生,黄展鹏.基于MITK的CT序列图像模糊连接度分割算法研究[J].湘南学院学报,2011,32(2):38-41.
[9]SAHA P K,UDUPA J K.Relative fuzzy connectedness among multiple objects:theory,algorithms and applications in image segmentation[J].Computer Vision and Image Understanding,2001,82(1):42-56.
[10]杨安荣,林财兴,李红强.一种基于模糊连接度和维诺图的混合分割方法[J].计算机应用与软件,2011,28(1):105-108.
[11]MAES F,VANDERMEULEN D,SUETENS P.Comparative evaluation of multiresolution optimization strategies for multimodality image registration by maximization of mutual information[J].Medical Image Analysis,1999,3(4):373-386.
[12]PLUIM J,MAINTZ J,VIERGEVER M.Mutual information based registration of medical images:a survey[J].IEEE Trans.on Medical Imaging,2003,22(8):986-1004.
Threshold Segmentation Based on GMM Model and Similarity
GUO Hong
(Chongqing Key Laboratory of Signal And Information Processing,Chongqing University of Posts and Telecommunications,Chongqing 400065,China)
Threshold segmentation method in image segmentation is one of the most simple and effective methods,but how to select appropriate threshold to achieve effective segmentation is still not unified method at present.Based on information theory and image space information,a new threshold optimization algorithm is put forward.Firstly,image mixed Gaussian distribution(GMM)is established,and by using the intensity of the class uncertainty and similarity function characteristic custom out the target function,the local threshold value is optimized,so as to achieve efficient segmentation effect.The experimental results show that compared with the OSTU,the proposed algorithm can successfully segment fuzzy boundary and image of each effective organization segmentation out.
threshold;GMM;class uncertainty;similarly function;target function
TN911.73;TP391.41
A
【本文献信息】郭红.基于混合高斯模型和相似度的阈值分割[J].电视技术,2013,37(3).
国家自然科学基金项目(61071196);教育部新世纪优秀人才支持计划项目(NCET-10-0927);信号与信息处理重庆市市级重点实验室建设项目(CSTC,2009CA2003);重庆市自然科学基金项目(CSTC,2009BB2287;CSTC,2010BB2398;CSTC,2010BB2411)
郭 红(1984— ),女,硕士生,主研图像处理。
责任编辑:时 雯
2012-09-11