基于形状相似性的活动轮廓模型
2017-09-15倪波,吕璐,袁涌,纪鹏
倪 波,吕 璐,袁 涌,纪 鹏
(湖北理工学院 计算机学院,湖北 黄石 435003)
基于形状相似性的活动轮廓模型
倪 波,吕 璐,袁 涌,纪 鹏
(湖北理工学院 计算机学院,湖北 黄石 435003)
从超声图像中准确地分割出病灶区域在基于图像引导的放射治疗中具有重要的临床意义。活动轮廓模型被广泛地应用于医学图像的分割,但超声图像的低信噪比、灰度分布不均匀等缺点导致活动轮廓容易搜索到错误的区域。为解决以上问题,提出了一种基于形状相似性的活动轮廓模型,将低秩属性作为图像序列中目标形状的先验知识融入到活动轮廓分割框架中,利用矩阵的秩对图像序列中目标形状变化的相似性进行度量,证明了目标形状的变化符合低秩属性。为了验证该方法的性能,采用真实的超声图像序列作为训练和测试集合,并与其他3种分割方法在同一测试集合下进行比较。实验结果显示,针对超声图像中出现的边缘模糊、缺失等缺点,该方法能够提供更准确和鲁棒性更高的分割结果。
超声图像序列分割;活动轮廓模型;形状相似性
高强度超声聚焦(High Intensity Ultrasound Focused,HIFU)是一种基于超声图像引导的计算机辅助治疗方法[1-2]。HIFU治疗流程如图1所示。对超声图像中的病灶区域进行准确定位是制定HIFU术前计划的重要环节。目前,制定HIFU术前计划需要有经验的超声影像医生在超声图像上手动标注目标区域,但是手动标注的准确性受医生的主观认知影响,具有不准确性。因此,超声图像分割方法对提高制定HIFU术前计划效率具有重要的临床应用价值。然而,超声图像分割方法依然面临以下挑战:
1)超声成像的特点造成图像具有低信噪比和灰度分布不均匀等特点。
2)体内软组织受呼吸或外力作用的影响产生形变,反映在超声图像上则为复杂的目标区域形变。
3)在成像过程中,部分目标区域容易受到周边组织的干扰,产生误导性边缘特征。
以上因素导致超声图像的目标分割是一个具有挑战性的课题。
图1 HIFU治疗流程图
过去十几年,图像分割一直是医学图像处理领域的一个研究热点[3-4],其中,活动轮廓模型(Active Contour Model, ACM)对不同组织的分割取得了令人满意的效果。ACM通常用一个有序的标记点[5-6]或者一个水平集(Level Set, LS)函数[7-8]作为目标形状的参数化表达模型。然后,把目标分割转化为对一个能量方程进行最优化的过程。在优化过程中,来自图像的目标特征驱动ACM对目标边缘进行搜索。早期的ACM采用图像的梯度信息、灰度统计信息[9]、纹理特征[10]等作为图像的目标特征[6,11-12]。在图像质量较高的情况下,以上目标特征能够驱动ACM搜索到准确的目标区域。由于超声成像所具有的局限性,造成超声图像的质量往往不够理想,导致ACM在图像的噪声、模糊边缘等因素的干扰下搜索到错误的目标区域。为了提高ACM在不同图像质量上分割目标的精确度和鲁棒性,有学者通过机器学习对一些组织器官的轮廓形状进行学习,构建相应的形状先验模型,进而约束ACM的演化。活动形状模型(Active shape model, ASM)[10,13]代表了其中的一类方法。ASM 分为2个步骤:
1)对训练集中每一张图像的目标形状用一个有序的标记点序列进行标记,该标记点序列组成的一维向量表示一个目标形状的参数化模型,则训练集中的目标形状可用向量组成的矩阵表示。
2)利用主成分分析对该矩阵进行奇异值分解,则目标形状的先验模型可表示为训练集中形状的平均值和奇异值分解后最显著分量的线性组合。针对不同图像质量的分割,由于目标形状的先验模型可以对轮廓的演化进行约束,因此ASM对不同超声质量的目标分割具有一定的鲁棒性。文献[14-16]则构建了不同的形状先验模型作为一个约束项被融入到LS中。Zhang等[17]为了更加精确地描述目标形状变化的复杂性,采用基于流形的方法对训练集中形状变化的非线性部分进行学习,所构建的目标形状先验模型能够提高ACM分割复杂形状变化的能力。近年来,有学者针对目标组织的形变规律,引入了非线性时间序列、流体模型等物理学方法对形变规律进行建模,从而提高形状先验模型对ACM在分割复杂目标时的约束能力[18-19]。Zhang等[20]将训练集中的目标形状用一个过完备的矩阵表示,该矩阵为目标形状的变化空间,然后利用稀疏表达生成目标形状的先验模型。近年来,有学者利用图像序列中目标形状的相似性对目标形状进行建模。其中,Yan等[21]针对前列腺超声图像中目标的底部形状容易受到周边组织干扰的情况,利用引入超声图像序列中图像之间的目标底部形状具有相似性的特点对目标的先验形状进行建模。
由此可知,形状先验模型是提高ACM对超声图像分割鲁棒性的一种有力工具,但以上的工作也存在一定的局限。
1)目前对目标图像特征的提取方法大多属于概率统计类。该方法首先需要用概率分布函数对目标灰度概率进行描述,然后通过大量样本对概率密度函数的参数进行最大似然估计。然而,超声成像固有的缺陷使得用一个或几个明确的概率分布函数很难准确地描述目标灰度的统计特征。
2)目前对形状先验模型的训练主要属于基于有监督的学习方法。然而,有监督学习得到的模型性能取决于训练样本的规模,如果样本数量不够,容易造成模型泛化能力不足。在临床实践中,搜集并标注大量的训练样本是一件十分困难的事情,而且有监督的学习中样本的质量直接影响模型的欠拟合或过拟合。
本文利用超声图像序列中图像之间目标形状具有相似性的特点,用矩阵的秩对形状的相似性进行度量,证明了组成图像序列形状的矩阵符合低秩属性;然后将低秩属性作为目标形状变化先验知识整合进ACM分割框架中,构建一个目标方程用于对超声图像序列的分割;最后,通过一种邻近梯度优化算法对目标方程进行最优化,从而实现对超声图像序列的分割。实验结果显示,本文方法在不同的超声图像质量下,能够取得令人满意的分割结果,提高了制定HIFU术前计划的效率。
1 基于矩阵秩度量的形状先验
当超声成像设备对目标进行连续扫描时,超声图像序列内目标形状的变化具有一定的相似性。本文用一个矩阵[P1,P2,…,Pn]表示该图像序列所构成的目标形状空间,其中,向量Pi(1≤i≤n)表示一个轮廓上标记点的集合。通常情况下,可以通过计算不同轮廓上对应标记点的平均欧式距离对轮廓的相似性进行度量。但是,当一个轮廓形状通过尺度变化得到另一个轮廓时,通过平均欧式距离进行度量会显示两者之间属于2个不同的目标形状,这与本文所描述的目标形变状况不相符。本文使用矩阵的秩对不同轮廓之间形状变化的相关性进行度量。当矩阵[P1,P2,…,Pn]的秩为1时,则该空间中所有轮廓属于同一个目标形状,如果矩阵[P1,P2,…,Pn]是一个满秩矩阵,则矩阵中所有轮廓均表示不同的目标形状。假设目标形状空间中任意一个目标形状轮廓可由其中一个目标轮廓通过线性变化而产生,并且组成目标形状空间矩阵的秩满足低秩属性,具体的推导过程如下:
Pi=MP1+T,∀Pi∈{P1,P2,…,Pn},i≠1
(1)
式(1)中,矩阵A表示线性变化系数;B表示一个平移向量。由文献[22]可知, [P1,P2,…,Pn]可表示为公式(2)的形式:
[P1,P2,…,Pn]T=ω[φ1,φ2,…,φn]
(2)
式(2)中,
定理1 针对A∈m×k和 B∈k×n,矩阵的秩满足以下性质:
rank(A)+rank(B)-k≤rank(AB)≤
min{rank(A),rank(B)}
(3)
式(3)中rank(·)表示求矩阵秩的操作。因此,P1可表示为形状空间[P1,P2,…,Pn]的一个基向量,φi可看作为该基向量的变化系数。当φi在线性变化情况下,可用矩阵的低秩属性来描述形状空间[P1,P2,…,Pn]中形状变化的相似性。使用该低秩属性作为图像序列中目标形状变化的先验知识,可以看作是对目标形状变化的无监督学习。该形状先验可以避免基于有监督学习形状先验的过拟合或欠拟合所带来的问题,从而提高ACM分割结果的鲁棒性。
2 本文方法
给出一个超声图像序列I1,I2,…,In,本文首先使用文献[23]中的活动轮廓分割方法对每一帧图像进行分割,如公式(4):
(4)
式(4)中Ω1和Ω2分别表示轮廓内部和外部的区域;μ1和μ2分别表示Ω1和Ω2内部的灰度均值;Ii(x1)和Ii(x2)分别表示活动轮廓上标记点的灰度值;系数β被用来控制活动轮廓的平滑度。在分割过程中,低秩属性作为形状先验被整合进ACM框架用于图像序列的分割,如公式(5):
(5)
式(5)中f(Pi)代表公式(4),C=[P1,P2,…,Pn];rank(C)表示对矩阵C进行求秩运算;K是一个阈值。由于求矩阵的秩运算是一个非凸运算,因此核范数常被用作求矩阵秩的凸的近似逼近,则公式(5)可转化为:
(6)
式(6)中‖C‖*表示矩阵C的核范数,即C的奇异值分解的和;β表示一个权重系数, 该权重系数意义在后面小结详细讨论。本文使用一种近似梯度(Proximal Gradient,PG)算法对公式(6)进行优化[23]。PG算法主要用以对以下目标方程的优化:
(7)
(8)
式(8)中〈·,·〉表示计算2个向量之间的内积;‖·‖F表示Frobenius范数;μ表示一个常数。优化过程中的X' 可以通过公式(9)计算:
(9)
引理1 已知X∈m×n,公式(8)的解:
(10)
由X*=Dα(Z)给出:
(11)
式(11)中ui和vi分别表示矩阵Z经过奇异值分解后的向量;σi表示矩阵Z的主要变化分量;Dα(Z)代表对矩阵Z进行奇异值分解操作。因此,本文算法的更新步骤可以表示为:
(12)
▽fi(pi)=(1-λ)e(Pi(m))N(m)-
λK(m)N(m)
(13)
(14)
式(14)中tk是一个人工设定的值。算法1描述了公式(6)的整个计算流程,即:首先根据目标的图像特征对初始化的ACM进行驱动,在ACM搜索目标边缘的过程中,由图像序列中的目标形状先验模型对ACM的活动形状进行约束。
算法1:基于PG算法计算公式(6)。初始化:X0=X-1,t0=t-1=1,threshold=0.011) Dowhile2) Yk=Xk+tk-1-1tk(Xk-Xk-1)3) While i≤n4) yki←-1μæèçöø÷▽fi(yki)5) i=i+16) EndWhile7) Xk+1=Dλ-(Yk)8) tk+1=1+μ1+4(tk)229) IF‖Xk+1-Xk‖F 3.1材料和评价标准 心脏和子宫肌瘤的超声图像在超声图像分割领域具有一定的代表性。因为,在超声成像过程中心脏的跳动会对真实的目标边缘有干扰。子宫肌瘤在超声成像过程中受到腹部其他组织器官的挤压或外力影响也会对目标的成像特征有干扰。实验采集50个真实的心动和子宫肌瘤超声图像序列,共1 760张图像作为训练样本集,并采取随机抽取交叉验证的方式对本文方法的性能进行测试。为了提高运算效率,将每帧图像的尺寸等比例缩小为200×150个像素,每个像素的尺寸为0.15 mm×0.15 mm。选用经验丰富的临床医生对目标的轮廓进行标注作为分割的Ground Truth。实验的硬件计算环境为英特尔酷睿i7-6700,主频 3.40 G赫兹,运行内存是16 G,所有算法均在MATLAB2015a环境下进行。 使用TP(The true position)和FP(The false position)对计算得到的分割区域和目标区域之间的重叠率进行定量分析, 定义如下: (15) (16) 式(15)~(16)中Ωm和Ωa分别表示目标区域和计算区域上的像素集合,TP值越高表示分割的区域与目标区域的覆盖率越高,FP值越高表示计算的分割区域与错误区域的覆盖率越高。此外,还使用平均最小欧式距离(Average minimum Euclidean distance, AMED)和霍斯多夫距离 (Hausdorff distance, HD) 这2个指标定量分析计算分割轮廓和目标轮廓相应标记点之间的距离,AMED和HD分别定义如下: (17) HD(A,B)= (18) (19) AMED值越低,说明2个轮廓上标记点的平均距离越近;HD值越低表示2个轮廓中对应标记点之间的距离越近。 3.2不同方法分割结果的比较 选择文献[25]和文献[26]的方法作为参考方法与本文方法进行比较。文献[25]方法使用低秩子空间聚类方法对视频中目标运动在不同图像帧之间的纹理特征相关性进行建模,并结合graph-cut分割方法将视频中的运动目标从背景信息中分割出来。文献[26]方法提出了一种新的ACM分割方法,该方法通过构建稀疏形状字典对形状先验进行建模,通过增量学习构建目标的图像特征空间,使用主成分分析来生成目标边缘特征的生成模型。通过对形状先验模型和目标边缘特征生成模型的优化驱动ACM逼近图像中的目标边缘。图2显示了不同方法在5个图像序列上的分割结果,其中序列1~3为超声心动图像序列;序列4和序列5 为子宫肌瘤图像序列。从最值上观察,文献[25]方法和文献[26]方法在不同序列中均出现优于本文方法的分割结果,但根据平均值比较,本文方法在一个序列上的整体分割性能要优于其他的方法。从各个分割序列箱型图的中值线观察,本文方法与其他2种方法相比中位值和平均值更接近,上、下分位的波动幅度也小于其他方法。这说明针对不同类型的超声图像序列,本文方法能提供更为稳定的分割结果,而其他方法的分割结果容易受到图像质量的影响而出现分割结果不稳定的现象。这一点可以在图2中AMED指标上得到进一步验证,本文方法的AMED值不仅比其他方法的AMED值低,而且在5个图像序列中保持比较稳定。这说明文献[25]方法和文献[26]方法容易受到噪声、边缘泄漏、误导性目标特征等影响,导致对整个图像序列进行分割的AMED值波动较大。比较文献[25]和文献[26]的方法,由于文献[26]方法采用目标形状的先验模型,其分割结果要比单纯使用目标图像特征的文献[25]方法的鲁棒性较高。这进一步说明了在对超声图像进行分割时,构建目标的形状先验是提高ACM分割鲁棒性的一种有力工具。但文献[25]的方法在构建目标的图像特征时采用增量学习方法,该方法容易造成序列前期分割的误差积累到后期目标特征模型中,从而造成序列后期的图像分割结果越来越不理想。 综上所述,相对于单纯地依靠目标的图像特征和基于有监督学习的形状先验模型,本文利用无监督学习所构建的基于图像序列之间形状相似性的形状先验模型对超声图像序列中的噪声、模糊边缘等缺点具有良好的鲁棒性。 图2 不同指标下不同方法分割结果的量化比较 图3显示了不同方法对一个超声图像序列分割结果的示例,图中显示的超声图像是从该序列中选择的图像,其中虚线表示手动标注结果,实线表示不同方法分割的结果。 图3 不同方法在超声图像序列分割实例 3.3参数β对分割结果的影响 参数β被用来控制图像序列中目标形状变化的权重,当选择一个较大的β值时,分割的目标轮廓形状之间会具有很高的相似度,这就会导致在一些图像中目标区域的形变特征没有被活动轮廓搜索到;而当选择一个较小的β值时,容易导致形状先验对活动轮廓的约束变小,从而降低活动轮廓分割不同质量超声图像结果的鲁棒性。 本文采用AMED和HD来观察不同β值对分割结果的影响,参数β对分割结果的影响如图4所示。 图4 参数β的影响 图4显示随着β取值的增大,AMED和HD值分别呈现了近似二次多项式曲线,选择在曲线最低(β= 35)时作为本文实验的参数值。 3.4不同方法的运算效率比较 不同分割方法的运算效率比较见表1。本文方法的运算时间比文献[26]方法短,比文献[25]方法要长。文献[26]方法在活动轮廓的初始化时是利用前一帧的分割结果作为分割下一帧的初始化轮廓,减少了活动轮廓收敛到目标边缘的距离。文献[25]方法在分割过程中采用的graph-cut方法对图像的每个像素信息进行计算,然后构建目标的特征方程,导致对图像序列的分割,文献[25]方法运行效率最低。 表1 不同方法的运行时间和迭代次数比较 3.5本文方法的局限性 本文方法是假设图像序列之间的目标形状变化发生在线性空间时,图像序列的形状矩阵的秩才满足低秩的要求。然而,在超声成像过程中,部分目标组织的形变受许多复杂因素的影响,如胃、肝脏等组织,这些目标形状的变化往往不满足线性变化的过程,则基于低秩属性的形状先验会遗失图像序列中目标形状变化的细节,图像中目标形状相似性作为一种无监督学习的形状先验模型虽然可以避免有监督学习形状先验模型的局限,但不合理的相似度权重也会让部分目标区域没有被分割到。因此设置参数β经验值需要耗费大量前期的时间。 本文根据图像序列之间目标形状变化具有低秩属性,提出了一种基于无监督学习的形状先验模型,并将该模型和活动轮廓模型用于对超声图像序列的分割。实验证明,本文所提出的形状先验模型在对图像序列进行分割时比基于有监督学习的形状先验模型能够提供更多分割目标形状的信息,提高了不同质量下超声图像活动轮廓模型分割的鲁棒性,对提高HIFU的治疗效果具有一定的应用价值。下一阶段,我们设想构建一个不同组织器官的超声图像大数据平台,利用深度学习等方法提高对不同病灶区域的分类和识别精度,并将利用云计算平台实现不同算法的高效率。 [1] Zhang L,Wang ZB.High-intensity focused ultrasound tumor ablation:review of ten years of clinical experience[J].Frontiers of Medicine in China,2010,4(3):294-302. [2] Leung JH,Yu SC,Cheung EC,et al.Safety and efficacy of sonographically guided high-intensity focused ultrasound for symptomatic uterine fibroids:preliminary study of a modified protocol[J].Journal of Ultrasound in Medicine Official Journal of the American Institute of Ultrasound in Medicine,2014,33(10):1811-1818. [3] Saini K,Dewal ML,Rohit M.Ultrasound imaging and image segmentation in the area of ultrasound:a review[J].International Journal of Advanced Science & Technology,2010,24(24):41-60. [4] He BS,Zhu F,Shi YG.Medical image segmentation[J].International Journal on Computer Science & Engineering,2013,3(4):1209-1218. [5] Cootes TF,Taylor CJ,Cooper DH,et al.Active shape models-their training and application[J].Computer Vision & Image Understanding,1995,61(1):38-59. [6] Xu C,Prince JL.Snakes,shapes,and gradient vector flow[J].IEEE Transactions on Image Processing,1998,7(3):359-36. [7] Malladi R,Sethian JA,Vemuri BC.Shape modeling with front propagation:a level set approach[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,1995,17(2):158-175. [8] Chan TF,Vese LA.Active contours without edges[J].IEEE Transactions on Image Processing,2001,10(2):266-277. [9] Yezzi A,Tsai A,Willsky A.A statistical approach to snakes for bimodal and trimodal imagery.In:Proceedings of International Conference on Computer Vision[C].Kerkyra(Corfu):IEEE Computer Society,1999:898-903. [10] Ginneken BV,Frangi AF,Staal JJ,et al.Active shape model segmentation with optimal features[J].IEEE Transactions on Medical Imaging,2002,21(8):924-933. [11] Mcinerney T,Terzopoulos D.T-snakes:topology adaptive snakes[J].Medical Image Analysis,2000,4(2):73-91. [12] Goldenberg R,Kimmel R,Rivlin E,et al.Fast geodesic active contours[J].IEEE Transactions on Image Processing,2001,10(10):1467-1475. [13] Yuan HE,Luo YP,Dong-Cheng HU.Unsupervised texture segmentation based on geodesic active regions[J].Journal of Software,2007,18(3):592-599. [14] Paragios N.A level set approach for shape-driven segmentation and tracking of the left ventricle[J].IEEE Transactions on Medical Imaging,2003,22(6):773-776. [15] Li C,Xu C,Gui C,et al.Distance regularized level set evolution and its application to image segmentation[J].IEEE Transactions on Image Processing,2010,19(12):3243-3254. [16] Li C,Huang R,Ding Z,et al.A level set method for image segmentation in the presence of intensity inhomogeneities with application to MRI[J].IEEE Transactions on Image Processing,2011,20(7):2007-2016. [17] Zhang Q,Zhang Q,Zhang L,et al.Ensemble manifold regularized sparse low-rank approximation for multiview feature embedding[J].Pattern Recognition,2015,48(10):3102-3112. [18] Shepherd T,Prince SJ,Alexander DC.Interactive lesion segmentation with shape priors from offline and online learning[J].IEEE Transactions on Medical Imaging,2012,31(9):1698-1712. [19] Ni Bo,He Fazhi,Yuan Zhiyong.A novel ultrasound image segmentation based on a dynamical statistical shape model[J].Science China Information Sciences,2015,45(11):1449-1465. [20] Zhang S,Zhan Y,Dewan M,et al.Sparse shape composition:A new framework for shape prior modeling[J].Proceedings of IEEE Conference on Computer Vision and Pattern Recognition,2011,42(7):1025-1032. [21] Yan P,Xu S,Turkbey B,et al.Adaptively learning local shape statistics for prostate segmentation in ultrasound[J].IEEE Transactions on Biomedical Engineering,2011,58(3):633-641. [22] 张贤达.矩阵分析与应用[M].北京:清华大学出版社,2013:41-53. [23] Nesterov Y.Gradient methods for minimizing composite objective function[J].Core Discussion Papers,2015,38(3):768-785. [24] Xie Xiaomin,Wang Changming,Zhang Aijun,et al.A robust level set method based on local statistical information for noisy image segmentation[J].Optik-International Journal for Light and Electron Optics,2014,125(9):2199-2204. [25] Li S,Li K,Fu Y.Temporal subspace clustering for human motion segmentation[C].Proceedings of the IEEE International Conference on Computer Vision,2015:4453-4461. [26] Qin X,Tian Y,Yan P.Feature competition and partial sparse shape modeling for cardiac image sequences segmentation[J].Neurocomputing,2015,149:904-913. (责任编辑高嵩) Active Contour Model Based on Shape Similarity NiBo,LüLu,YuanYong,JiPeng (School of Computer,Hubei Polytechnic University,Huangshi Hubei 435003) The exact segmentation of the lesions region in ultrasound image sequences plays a crucial role in many clinical applications of image-based radiation therapy.Active contour models have been widely used in medical image segmentation.But,the inherent limitations of ultrasound image such as low signal-to-noise ratio,inhomogeneous distribution of intensity and deformation of softer tissues have prevented the classical active contours from yielding desired results.To cope with the limitations,the similarity of object shapes in the images sequences is also exploited as a shapes prior through proving that the variation of object shapes has the low-rank property,which can be interpreted as a unsupervised approach of shapes prior modeling.In order to verify the performance of this method,the clinical image sequences are used as the training and test set to validate.The proposed method is compared with three well-known methods in the same test set.The results demonstrate that the proposed method can consistently improve the performance of active contour models and increase the robustness against image defects consequently,which improves the efficiency and effect of the computer assisted therapy. ultrasound image sequence segmentation;active contour model;shape similarity 2017-04-05 湖北省教育厅青年人才项目(项目编号:Q20154404)。 倪波,讲师,博士,研究方向:计算机视觉。 10.3969/j.issn.2095-4565.2017.04.007 TP309 :A :2095-4565(2017)04-0031-083 实验与分析
4 结论与展望