图像分割中改进空间约束贝叶斯网络模型的应用

2017-05-24张海艳高尚兵

计算机应用 2017年3期

张海艳，高尚兵

(1.淮阴工学院计算机与软件工程学院，江苏淮安 223003； 2.江苏省物联网移动互联技术工程实验室(淮阴工学院)，江苏淮安 223003； 3.南京晓庄学院可信云计算与大数据分析重点实验室，南京 211171) (*通信作者电子邮箱24472074@qq.com)

张海艳1,2*，高尚兵1,3

针对马尔可夫链蒙特卡罗方法普遍存在的迭代收敛性问题，在具有空间平滑约束的高斯混合模型条件上提出改进空间约束贝叶斯网络模型并在图像分割领域进行具体应用。所提模型应用隐狄利克雷分布(LDA)概率密度模型和高斯-马尔可夫定理的随机域参数混合过程来实现参数平滑。所提方法根据空间信息先验平滑变换操作，在待处理像素点的上下文混合结构中引入LDA符合多项式分布，用来替换传统期望最大化算法中映射操作。LDA参数采用闭合形式将有利于准确估计最大后验概率(MAP)框架与上下文混合结构的相关比例。实验结果表明，应用PRI、VoI、GCE和BDE指标进行效果比较，该方法比联合系统工程组(JSEG)、当前变换矩阵(CTM)和最大后验概率-最大似然法(MM)方法的图像分割应用效果较好，高斯噪声对于该算法的鲁棒性影响较小。

隐狄利克雷分布；期望最大化方法；贝叶斯模型；高斯混合模型；图像分割

0 引言

目前，很多科学研究文献已经提出了多种图像分割方法。其中，图像聚类方法主要受到数据分组初始安排规则影响。近些年来的主要科学研究成果均集中在图形理论方法研究、基于均值漂移(Mean Shift，MS)的相关图像分割算法和Rate-distortion理论方法[1]。

针对有限混合模型(Finite Mixture Model, FMM)的概率密度函数(Probability Density Function, PDF)的像素点相关属性(如：强度、纹理等属性)建模到群体数据上是自然形式，因为它会根据组件自动提供产生分组混合结构。此外，针对聚类性能来说，FMM概率密度函数是米制单位[2]。基于FMM的概率密度函数建模方法已经成功应用在生物信息学[3]、图像检索[4]等相关领域。FMM模型参数能够通过极大似然估计融合期望最大化算法求得[5]。

图像先验属性针对强化空间平滑程度操作有着重要意义，而强化空间平滑度是图像处理应用的关键问题[6]。图像处理应用包括图像恢复、图像去噪、图像分割、图像优化等各种问题。在常见概率密度函数框架中，图像平滑操作是针对图像先验特征的具体方法。

本文提出的模型与现有方法有区别。首先，文本、场景和目标分类均为有监督学习问题且相关分割方法也是无监督性质;同时，在现有科研成果来看，针对隐狄利克雷分布(Latent Dirichlet Allocation, LDA)参数估计通常是由变分推理或者简化Logistic模型来完成。本文提出的改进模型优点是在E-step步骤中可表示在密闭形式上，也明确说明本文模型假设改进空间约束贝叶斯网络模型的概率向量具体比例。通过期望最大化(Expectation Maximization, EM)算法的推理将执行LDA参数的多项式方程，因此，密闭形式M-step步骤所得参数能够满足概率约束所需条件。

1 空间变化有限混合模型

(1)

假定像素点位置xi的标准有限混合模型概率密度函数可以表示为式(2)形式:

(2)

φ(xi|θj)的高斯分布参数是θj= {μj,Σj}，其中μj=(μj,1,μj,2,…,μj,L)是平均矢量，Σj是L维高斯分布的协方差矩阵，Π可定义为随机变量和Θ参数。

空间变化有限混合模型使用先验密度分布p(Π)的随机变量Π，因此，X表示该组像素点的特征向量{xi}，当i=1,2，…,N时，本文假设像素点是独立统计，应用贝叶斯模型条件，将所得后验概率密度函数由式(3)计算：

(3)

根据密度对数函数，可推导出式(4):

(4)

p(Π)是Gauss-Markov随机域[8]表达的典型实例，具体形式如式(5)所示:

(5)

因为参数βj可获取集群数据的空间平滑性和执行不同平滑度，所以在每个集群数据上都找到j以便适应数据模型。

SVFMM空间变化模型具体如图1所示。在标准FMM模型中，对于给定的像素点特征向量x取决于离散隐变量z来表示混合部分，最终生成特征向量x。如果zj=1，像素点x则属于j类。在这种情况下，对于给定类混合比例属于该类别像素点百分比。在SVFMM情况下，每个像素点i都有自身固定混合比例πi，称为像素点标签概率。这些上下文混合比例均由平滑先验知识来执行空间约束。

图1 空间变化有限混合模型

最大后验概率(Maximum A Posteriori, MAP)估计模型参数估计的EM算法[9]需要在E-step迭代步长t计算隐变量的条件期望值，具体如式(6)所示：

(6)

在M-step步骤中，考虑到完整数据是隐变量的线性似然对数，那么完整数据的最大化对数似然估计模型参数如式(7)所示:

(7)

式(7)中的函数Q(·)能够针对每个参数执行独立最大化操作，并提供以下在t+1步骤的混合模型参数。

(8)

(9)

2 改进空间约束贝叶斯网络模型

为了克服SVFMM算法局限性，本章提出改进空间约束贝叶斯网络模型。本改进空间约束贝叶斯网络模型依据LDA，基于上层分布混合结构来提出图像分割上下文混合模型Π。LDA是多项式形式，概率向量πi的相关参数是由LDA分布产生[5]。相似先验知识已经在改进空间的上下文约束条件中提出，其中LDA参数估计通过迭代梯度下降来进行方法优化[7]。此外，空间平滑通过隐Dirichlet分布参数的方程形式以密闭形式计算实施具有真正非负解。

假设生成图像模型为了产生第i个像素点以求达到第j个组件目的，实现LDA过程，因此，式(6)的隐变量zi具有第j个分量。在这种情况下，后验概率混合模型结构可表述为式(10)形式：

(10)

考虑LDA实现过程(M=1)与Γ(x+1)=xΓ(x)，式(10)中标签的第i个像素点概率可改写成为式(11)：

(11)

新型模型有可能通过引入LDA分布参数A达到空间变化目标。假设高斯-马尔可夫随机域来估计闭合形式具体参数[8]。

(12)

已有先验知识主要特征是为了提供更好的先期适应数据，强制每个数据簇中拥有不同程度的平滑程度。

图2代表这种分层办法提出的图形模型。本文参考LDA分布的空间变化有限混合模型(LDA-SVFMM)模型，LDA-SVFMM产生图像模型工作原理如下：首先产生样本ξ(概率向量)使用LDA分布相关参数，从而获得多项式分布参数ξ。隐变量z表示观察点类的x变量，它是用ξ参数进行多项式计算所得结果。LDA分布空间参数的约束平滑条件α需要根据标准化SVFMM算法执行。

图2 LDA上下文混合模型

3 MAP-EMM方法

本文模型主要思想是在最大后验概率(Maximum A Prior, MAP)算法上应用EM方法。应用式(12)中的Gauss-Markov参数A产生下面所提MAP函数，以最大化EM算法的M-step目标。关于参数A，本文给出定义如下：

(13)

(14)

(15)

本文MAP-EMM算法的具体过程如下所述：

步骤1 初始化算法参数和LDA分布向量参数αi。

步骤2 应用式(13)计算MAP函数：

步骤2.2 (M-Step)：

步骤2.2.1 应用式(8)计算改进空间约束贝叶斯网络模型参数；

步骤2.2.2 应用式(14)所得非负解针对LDA分布参数进行替换；

步骤2.2.3 通过像素点标签替换像素点已有概率参数；

步骤2.2.4 应用式(15)计算像素点标签参数。

步骤3 直至MAP函数收缩至无穷小范围，算法自动达到结束条件。

4 实验结果与分析

本文实验环境为Matlab2014b，图像大小是256×256。本文针对MAP-EMM改进算法的迭代次数和初始化随机生成条件，确保提供对数似然函数的最大值。这里考虑EM算法结束条件准则是收敛定义成在式(4)的对数似然变化的百分比在两个连续迭代次数之间小于0.001%。

HAIMER位于德国Igenhausen市，是一家中型家族企业，研发和生产革命性的超高精度工具。其产品主要有高精度动平衡刀柄、刀具专用动平衡机、刀柄热缩机、3D寻边器及对中仪等。2009年，HAIMER于上海成立中国总部，全面负责中国大陆的市场推广、产品应用以及售后服务。

为了验证MAP-EMM改进算法提出的先验LDA的必要性，针对SVFMM[7]提出在不同复杂程度下的相同分段图像分割的具体实例。经过实验证明，在人工图像和自然图像中，高斯噪声对于MAP-EMM改进算法的鲁棒性影响很小。

本文针对MAP-EMM改进算法在Berkeley图像数据库的300张图像中进行图像分割[6]。本文MAP-EMM改进算法与JSEG[10]、MAP-ML(MM)[3]、CTM[5]进行效果比较。

应用标准滤波器进行特征描述，在最近文献中的纹理描述主要方法包括Blobworld特征[11]和MRF特征[12]。Blobworld特征通过生成六维颜色矢量和纹理信息数据的过程关键特点是正确估计纹理规模。MRF特征只应用于PCA进行降维操作，其次是像素点终止窗口的向量化操作。

图3(a)～(d)和图4(a)～(d)展示本文方法和其他三种方法分割300幅Berkeley图像数据库部分图像的结果比较。从中可得，本文方法分割结果中，噪声区域比较少，边界保持较好；其次，从本文方法和MM分割结果的比较可见，两种方法都采用了图像优化方法，分割结果的边界保持较好(如图3中MM的分割结果第1～3及第5行)，但图像的标签数量对分割结果影响较大，尽管MM在分割过程中能够根据能力的变换自动调整标签数，但容易造成过分割或欠分割。

对比其他方法，JSTG能够得到较为同质的区域，但已得到过分割结果，并且不能很好地区分视觉差异不明显区域。CTM采用基于超像素的区域合并策略对图像进行分割，从图3和图4可见，其分割结果边界不光滑、错位，采用的最小描述长度准则并不能较好地适应Berkeley数据库300幅图像，造成过分割或欠分割现象。

图3 四种方法分割简单纹理图像的比较结果

图4 四种方法分割复杂纹理图像的比较结果

为了更好评价各比较方法的分割性能，采用四个常用评价指标函数：PRI(ProbabilisticRandIndex)、VoI(VariationofInformation)、GCE(GlobalConsistencyError)和BDE(BoundaryDisplacementError)对分割结果进行评价。其中:PRI是统计机器分割和多个人工分割之间标签一致的像素对的个数占整个像素对个数的比率；VoI则把机器分割和人工分割之间的距离定义为在给定人工分割的条件下机器分割的平均条件熵，它能够测量机器分割中不能被人工分割所解释的随机性的量；GCE测量一个分割可被看作为另外一个分割的程度；BDE则是测量两个分割结果中边界像素的平均位移误差。量化结果中PRI值越大，VoI、GCE和BED值越小，则机器分割结果与人工分割结果越接近。

表1给出了4种方法分割300幅图像的结果在评价指标上的量化分析。可见，本文方法在PRI、VoI、GCE指标上优于其他3种方法，在BDE指标上仅次于CTM，相对于JSEG、MM和CTM，本文方法的分割结果更加接近于人工分割结果。

表1 4种方法分割性能比较

5 结语

本文根据贝叶斯理论和空间分层建模约束混合模型提出MAP-EMM改进算法。本文模型应用LDA概率密度模型和高斯—马尔可夫定理的随机域参数混合过程来实现参数平滑。本文方法根据空间信息先验平滑变换操作，在待处理像素点的上下文混合结构中引入LDA符合多项式分布，从而用来替换传统期望最大化算法中映射操作。本文仿真结果对比图显示空间变化的混合模型性能方面比采用投影步骤的混合结构约束方法有很大改进。

)

[1]MAY,DERKSENH,HONGW,etal.Segmentationofmultivariatemixeddatavialossydatacodingandcompression[J].IEEETransactionsonPatternAnalysisandMachineIntelligence, 2007, 29(9): 1546-1562.

[2]TAYLORCJ.Towardfastandaccuratesegmentation[C]//Proceedingsofthe2013IEEEConferenceonComputerVisionandPatternRecognition.Washington,DC:IEEEComputerSociety, 2013: 1916-1922.

[3]GREENSPANH,DVIRG,RUBNERY.Context-dependentsegmentationandmatchinginimagedatabases[J].ComputerVisionandImageUnderstand, 2004, 93(1): 86-109.

[4]BOYKOVY,VEKSLERO,ZABIHR.Fastapproximateenergyminimizationviagraphcuts[J].IEEETransactionsonPatternAnalysisandMachineIntelligence, 2001, 23(11): 1222-1239.

[5]BLEIDM,NGAY,JORDANMI.LatentDirichletallocation[J].JournalofMachineLearningResearch, 2013, 3: 993-1022.

[6]MARTIND,FOWLKESC,TALD,etal.Adatabaseofhumansegmentednaturalimagesanditsapplicationtoevaluatingsegmentationalgorithmsandmeasuringecologicalstatistics[EB/OL]. [2016- 01- 08].http://vision.ics.uci.edu/papers/MartinFTM_ICCV_2001/MartinFTM_ICCV_2001.pdf.

[7]MADSENR,KAUCHAKD,ELKANC.ModelingwordburstinessusingtheDirichletdistribution[C]//Proceedingsofthe22ndInternationalConferenceonMachineLearning.NewYork:ACM, 2005: 545-552.

[8] NIKOU C, GALATSANOS N P, LIKAS A C. A class-adaptive spatially variant mixture model for image segmentation [J]. IEEE Transactions on Image Processing, 2007, 16(4): 1121-1130.

[9] BLEKAS K, LIKAS A, GALATSANOS N P, et al. A spatially constrained mixture model for image segmentation [J]. IEEE Transactions on Neural Networks, 2005, 16(2): 494-498.

[10] ARBELAEZ P, MAIRE M, FOWLKES C, et al. Contour detection and hierarchical image segmentation [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2011, 33(5): 898-916.

[11] CARSON C, BELONGIE S, GREENSPAN H, et al. Blobworld: image segmentation using expectation maximization and its application to image querying [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24(8): 1026-1038.

[12] 周良芬,何建农.基于GrabCut改进的图像分割算法[J].计算机应用,2013,33(1):49-52.(ZHOU L F, HE J N. Improved image segmentation algorithm based on GrabCut [J]. Journal of Computer Applications, 2013, 33(1): 49-52.)

[13] 杨明川,吕学斌,周群彪.不完全K-means聚类与分类优化结合的图像分割算法[J].计算机应用,2012,32(1):248-251.(YANG M C, LYU X B, ZHOU Q B. Image segmentation algorithm based on incomplete K-means clustering and category optimization [J]. Journal of Computer Applications , 2012, 32(1): 248-251.)

This work is partially supported by the National Natural Science Foundation of China (61402192), the Key Laboratory of Trusted Cloud Computing and Big Data Analysis.

ZHANG Haiyan, born in 1980, lecturer. Her research interests include image processing.

GAO Shangbing, born in 1981, Ph. D., associate professor. His research interests include pattern recognition, image processing.

Application of improved spatially constrained Bayesian network model to image segmentation

ZHANG Haiyan1,2*, GAO Shangbing1,3

(1.FacultyofComputerandSoftwareEngineering,HuaiyinInstituteofTechnology,Huai’anJiangsu223003,China; 2.JiangsuProvincialInternetofThingsTechnologyEngineeringLaboratory(HuaiyinInstituteofTechnology),Huai’anJiangsu223003,China; 3.KeyLaboratoryofTrustedCloudComputingandBigDataAnalysis,NanjingXiaozhuangUniversity,NanjingJiangsu211171,China;)

Aiming at the problem of iterative convergence of Markov chain Monte Carlo method, an improved spatially constrained Bayesian network model was proposed and applied in the image segmentation domain based on the Gaussian mixture model with spatial smoothing constraint. Latent Dirichlet Allocation (LDA) probability density model and the parameter mix process of Gauss-Markov theorem were used to achieve parameter smoothing. According to the spatial information transcendental transformation operation, the LDA conformance polynomial distribution was introduced into the context hybrid structure of the pixel to be used to replace the mapping operation in the traditional expectation maximization algorithm. LDA parameters were represented by a closed form, which facilitated to accurately estimate the relative proportion of MAP (Maximum A Posteriori) framework to context mixture structure. The experimental results in terms of PRI (Probabilistic Rand Index), VoI (Variation of Information), GCE (Global Consistency Error) and BDE (Boundary Displacement Error) show that the proposed method has better effect in image segmentation, its robustness is less influenced by Gauss noise compared with JSEG (Joint Systems Engineering Group), CTM (Current Transformation Matrix) and MM (Maximum A Posteriori Probability-Maximum Likelihood).

Latent Dirichlet Allocation (LDA); Expectation Maximization (EM) method; Bayesian model; Gaussian Mixture Model (GMM); image segmentation

2016- 09- 05;

2016- 10- 24。

国家自然科学基金资助项目(61402192)；可信云计算与大数据分析重点实验室资助项目。

张海艳(1980—)，女，江苏淮安人，讲师，主要研究方向：图像处理；高尚兵(1981—)，男，江苏淮安人，副教授，博士，主要研究方向：模式识别、图像处理。

1001- 9081(2017)03- 0823- 04

10.11772/j.issn.1001- 9081.2017.03.823

TP391.413