多尺度单特征谱分割算法*

2018-03-12张敬茂沈艳霞

计算机与生活 2018年3期

张敬茂，沈艳霞

江南大学物联网技术与应用教育部工程研究中心，江苏无锡 214122

1 引言

图像分割是图像理解的关键步骤之一[1-2]，将输入图像分割为不相交的连贯区域，从中提取整个区域的特征信息，减小分析的计算消耗。针对图像分割，已经提出了很多优秀的图像分割算法，主要分为两类：不基于图的算法，如均值漂移算法[3]、EM（expectation-maximization）[4]和基于图的算法[5-9]。与不基于图的算法相比，基于图的算法能够自适应地权衡局部相似关系[10]。

规范割（normalized cut，Ncut）算法是一种广泛应用的基于谱图理论的谱分割算法。在图像分割中，Ncut能够同时权衡类内相似性和类间不相似性，并且可以近似为广义特征向量问题。使用Ncut进行图像分割时，关于图的相似矩阵对图像分割结果有很大的影响。目前，为了提高谱分割效果，已有很多研究对该相似矩阵的构建进行改进。一种方法是结合图像中像素点（或者超点）的不同特征信息构建相似矩阵[11-13]。例如文献[12]结合4种特征信息即超点的均值和方差、像素点的颜色和边缘信息构建相似矩阵；文献[13]考虑结合多种局部轮廓信息，如亮度、颜色和纹理差异、结构森林轮廓等。另一种方法是对输入图像进行多层分解，或者结合不同的分解方法对图像进行分解[14-17]，然后利用分解后的图构建相似矩阵。文献[15]对图像进行多层分解，并以此构建多尺度相似矩阵；文献[16]和文献[17]利用不同的方法对图像进行分解，然后利用分解图构建相似矩阵。无论利用不同图像不同特征信息，还是对图像进行不同的分解，都有多种组合特征信息和分解图的方式。然而在实际应用中，确定使用哪种方式是个复杂的过程，尤其是在核磁共振影像（MRI），合成孔径雷达影像（synthetic aperture radar，SAR）等应用领域，无法提供颜色信息，此时根据颜色特征信息改进的算法就不适用，因此有必要考虑从相似矩阵中提取多尺度特征，构建新的相似矩阵，提高使用单一特征信息时谱分割的效果。

目前，扩散映射（diffusion map）在三维形状分析[18]、图像表示[19]、语言识别[20]等许多领域得到广泛应用。扩散映射能够提取出输入图像的本质几何描述，对像素点来说，即以该点为中心的所有几何结构的局部信息。基于扩散映射[21]，本文定义了一种多尺度特征描述器（diffusion map based multiscale feature descriptor，DMFD）。然后，建立扩散映射与谱图小波[22]的关系，利用谱图小波中切比雪夫多项式算法进行快速计算，避免计算输入图像DMFD全部特征值和特征向量的问题。最后，构建基于DMFD的谱分割算法，提出一种能够自适应选择最优尺度计算相似矩阵的方法，避免执行算法时选择尺度的过程。

2 基于扩散映射的多尺度特征描述器

Coifman等人[21]根据马尔科夫随机游走定义了扩散映射。对于输入图像G，包含N个像素点，根据其特征信息构建的相似矩阵为A，对角矩阵转移矩阵P=D-1A，矩阵P的特征值和特征向量分别为 (λl)l=0,1,…,N-1和 (χl)l=0,1,…,N-1，则扩散映射定义为：

其中，c表示尺度参数；g(∙)表示关于特征值的函数。

给定像素点a，根据以上定义，定义基于扩散映射的多尺度特征描述器为：

在给定尺度c下，像素点之间的距离采用欧氏距离度量，即：

式（3）也被称为扩散距离[21]。

如上所述，计算DMFD及扩散距离的步骤如算法1。

算法1计算DMFD与扩散距离

输入：图，尺度。

（1）对输入图像提取每个像素点的特征信息，利用这些特征构建相似矩阵；

（2）根据相似矩阵，计算转移矩阵P；

（3）计算转移矩阵P的特征值 (λl)l=0,1,…,N-1和特征向量 (χl)l=0,1,…,N-1；

（4）根据式（1）和式（2）计算所有点的DMFD；

（5）根据式（3）计算扩散距离。

3 快速计算算法

由式（1）和式（2）可知，对于尺寸为m×n的输入图像，需要计算DMFD的mn个特征值和特征向量。例如Berkeley数据库中图像尺寸为321×481，则需要对维度为N2(N=154 401)的矩阵进行特征分解，计算N个特征向量和特征值，这在实际应用中是不现实的。考虑到谱图小波的定义与特征值和特征向量有密切关系，并且存在快速计算谱图小波的切比雪夫多项式算法，建立谱图小波与扩散映射之间的关系，利用切比雪夫多项式算法来快速计算DMFD，避免对所有特征值和特征向量的计算。

由式（1）和式（3）可得：

谱图小波中，在尺度c下，以a点为中心的基函数定义为：

由式（5）计算欧氏距离为：

根据文献[21]，在平方可积测量空间(X,μ)中，式（6）可根据式（5）写为如下形式。

4 多尺度单特征谱分割算法

下文首先定义算法的流程，然后分析其在实际应用时的不足，并提出一种自适应尺度选择方法解决该问题。

4.1 基于DMFD的多尺度单特征谱分割

Ncut作为被广泛应用的谱分割算法，其相似矩阵尺寸为N2，然而对于一般电脑来说，无法计算和存储该矩阵。为此，将图像分割为超点，提取超点的特征信息计算相似矩阵A。本文使用两种特征信息，即颜色和纹理。对于颜色特征，采用RGB和HSV颜色空间，计算两个超点间的26种颜色距离[1,23]dcolor；对于纹理特征，采用超点间的64种纹理差异[1,24]dtexture。提取超点的特征信息后，首先构建相似矩阵A和转移矩阵P。其中Aij=exp(-dcolor/σd)或Aij=exp(-dtexture/σd)。计算扩散映射、DMFD以及dc(a,b)后，利用提出的特征描述器计算超点之间的相似性度量：

进而构成相似矩阵S。

基于DMFD的多尺度单特征谱分割算法（DMFDNcut）可描述如算法2。

算法2DMFD-Ncut

输入：图，k，尺度c。

输出：分割图像。

（1）对输入图像进行超点分割，并对超点提取单一特征信息，如颜色、纹理等；

（2）利用提取的特征信息构建相似矩阵A和转移矩阵P；

（3）由式（2）计算DMFD，并由式（6）计算式（3），得到距离度量；

（4）根据式（8）计算相似矩阵S及拉式矩阵

（5）计算L的前k个特征向量，构成新的特征空间；

（6）由k-means算法对k个特征向量构成的特征空间进行聚类，得到图像分割结果。

4.2 自适应尺度选择

在执行DMFD-Ncut时，需要指定尺度，然后对输入图像在指定尺度下进行分割。DMFD-Ncut虽然可以让用户指定分割尺度，但是得到分割结果后才能判断哪个尺度更为合适。这无疑为算法执行增加了困难。因此，本文提出一种逐点自适应确定最优尺度（pointwise self-adaptive optimal scale，PSOS）的方法，在分割之前确定最优尺度。

图方差[15]可用来判断相似向量携带的信息量，图方差越大，携带的信息量越大。因此，本文使用图方差作为判断最优尺度的方法。假设输入图像的相似矩阵为S，a为图像的第i个点，则Sa=Si∙表示以a为中心的所有相似度量值。图方差定义如下：

考虑上述自适应最优尺度选择方法，DMFDNcut算法可更新为算法3。

算法3自适应DMFD-Ncut（PSOS）

输入：图，k，尺度集C。

输出：分割图像。

（1）对输入图像进行超点分割，并对超点提取单一特征信息，如颜色、纹理等；

（2）利用提取的特征信息构建相似矩阵A和转移矩阵P；

（3）由式（2）计算DMFD，并由式（6）计算式（3），得到距离度量；

（4）根据式（8）计算相似矩阵S；

（5）使用式（9）计算图方差，选取最优尺度；

（6）使用式（10）对相似矩阵进行更新，并计算相应拉式矩阵

（7）计算L的前k个特征向量，构成新的特征空间；

（8）由k-means算法对k个特征向量构成的特征空间进行聚类，得到图像分割结果。

5 实验分析

为了验证本文提出的算法，在真实数据集上进行实验，并对DMFD-Ncut和 DMFD-Ncut（PSOS）进行分析，对比这两种算法的差别。具体数据选择、参数设置及结果对比如下文所述。

5.1 参数设置

本文算法与使用单一特征信息构建相似矩阵的Ncut算法（Ncut_color，Ncut_texture）进行对比。实验采用Berkeley图像分割数据库（BSD300），该数据库包含测试集（100幅图）和训练集（200幅图）。根据实验及经验，对于灰度特征取σd=1；对于颜色特征取σd=1；对于纹理特征取σd=15。对于灰度信息，选取尺度c={10,15,20,25,30,35}；对于颜色和纹理信息，选取尺度c={20,25,30}。Ncut_color与Ncut_texture的相似矩阵使用Aij=exp(-dcolor/σd)和Aij=exp(-dtexture/σd)分别计算。取4个参数对图像分割结果进行量化评估，分别为 F-measure（F）、Segmentation Covering（Covering）、Probabilistic Rand Index（PRI）、Variation of Information（VOI）[14]。其中，F-measure度量边缘分割效果。对每个量化评估参数，使用两种度量方式：ODS（optimal dataset scale），对所有图像使用固定参数进行分割；OIS（optimal image scale），对每个图像选取最优分割参数。为了计算这两种度量方式，本文将ODS和OIS中使用的参数设置为图像的分割数目，k={2,3,…,40}。

5.2 实验结果

表1为使用颜色和纹理特征的量化评估结果，最优结果用粗体标注。其中Ours_color和Ours_texture为DMFD-Ncut在所有3个尺度下的最优结果；PSOS_color和PSOS_texture为使用自适应最优尺度选择方法的评估结果。从表1中可以看出，在使用单一特征信息进行图像分割时，本文提出的算法相对于原Ncut算法，几乎在所有的评估结果中，都显示了对分割结果明显的优势。在只使用灰度信息时，DMFD-Ncut的ODS评估与Ncut大部分相同，OIS评估则优于Ncut。而在实际应用时，往往只会对单独的一幅图片进行分割，从这方面考虑，OIS评估更能反映出算法的应用价值。尽管在使用PSOS方法时，因为式（10）对两点取平均导致图像分割结果与直接使用DMFD-Ncut时相同或略有降低，但PSOS方法的大部分结果依然优于原Ncut算法。因此，使用PSOS方法可避免尺度选择的过程，但直接使用DMFD-Ncut可取得更为优秀或相同的分割结果。

图1和图2对颜色和纹理分别提供了视觉结果对比。

（1）颜色

图1选取人、动物、植物3类图进行对比。在所有的3幅图中，DMFD-Ncut能够在k=10时将显著目标分割出来，而Ncut_color则无法识别。在细节方面，如图（1）中，DMFD-Ncut在k=20时就可以将人、帆船、海分割出来，而Ncut_color则一直无法将三者完全分割；图（2）、（3）中，DMFD-Ncut始终能较完整地将鸟与蘑菇识别出来，而Ncut_color在分割数增加时，将背景和目标物都进行不适当的分割。以上说明，DMFD能够提供更加本质的特征描述，从而提升图像分割效果。

（2）纹理

图2选取人、动物、建筑进行对比。在图像背景复杂（图（1）、（3））或背景简单（图（2））时，DMFDNcut都能够尽量将符合视觉直觉的区域分割到一类，得到较满意的分割结果。如图（1），DMFD-Ncut完美地将路面分为一类，且将人识别出来，而Ncut_texture将路面过分割。而图（3）中，随着分割数k增加，DMFD-Ncut仍能将船以及建筑物识别出来，而Ncut_texture倾向于将目标过分割。这说明，在使用纹理特征时，DMFD仍能对图像提供更为本质的特征描述。

图3为使用颜色特征时，利用PSOS方法的图像分割结果与不同尺度下DMFD-Ncut分割结果对比。如图所示，PSOS方法可以将最优的尺度选取出来。如小丑鱼部分，使用PSOS方法可以将小丑鱼较完整地分割出来。但是在背景的珊瑚部分，使用PSOS的分割效果比尺度为25时差，但是优于尺度为30时的结果。这是因为计算PSOS相似矩阵的公式（10）对逐点的最优结果取平均导致的。因此，使用PSOS方法可避免尺度选择的过程，但直接使用DMFD-Ncut可取得更为优秀或相同的分割结果。

Table 1 Quantitative evaluation on BSD300表1 BSD300量化评估结果

Fig.1 Comparison of segmentation results on color图1 使用颜色特征的分割结果对比

5.3 运行时间

图4为在给定尺度c下，随着相似矩阵尺寸N的变化，对一个像素点计算扩散映射的时间对比。其中N=100,150,200,…,5 000 ，“diffusion map”表示未使用快速计算方法时的时间曲线，“DMFD”表示使用快速计算方法时的时间曲线。当相似矩阵尺寸不大时，如N＜1 000时，两者相差不大；但是随着N变大，本文方法计算时间明显低于直接计算扩散映射所用时间。

图5为本文算法运行时间与Ncut算法运行时间的对比，随机选取20幅图片，设置分割数目k=30。其中“+”表示Ncut运行时间，“◆”表示 DMFD-Ncut运行时间，“o”表示PSOS DMFD-Ncut运行时间。DMFD-Ncut在单尺度下运行，PSOS DMFD-Ncut则选取3个尺度进行自适应选择。如图所示，在大部分数据上，DMFD-Ncut和PSOS DMFD-Ncut运行时间小于Ncut，而在小部分情况下PSOS DMFD-Ncut运行时间远高于其余两种算法，这是因为需要在不同尺度中自适应地选择合适的尺度，并根据待选择尺度的多少，运行时间也会有所变化。

Fig.2 Comparison of segmentation results on texture图2 使用纹理特征的分割结果对比

6 结束语

使用谱分割算法进行图像分割时，无论使用多特征融合还是图分解方法，都是十分复杂的，尤其是在某些应用领域如MRI影像、SAR影像等，无法提供某些特征如颜色，因此本文提出一种基于扩散映射的多尺度特征描述器（DMFD），提高使用单一特征信息下，谱分割在图像分割上的效果。DMFD可以描述输入图像更为本质的结构，为后续谱分割过程提供更为本质的特征描述。为了使DMFD在实际应用中可行，本文建立了扩散映射与谱图小波的关系，利用谱图小波中的切比雪夫多项式算法快速计算DMFD，避免了扩散映射必须计算全部特征值和特征向量的问题。基于DMFD，构建了相应谱分割算法DMFD-Ncut，提出了一种能够自适应选择最优尺度计算相似矩阵的方法，避免了执行算法时选择尺度的过程。实验显示，DMFD-Ncut和使用自适应尺度选择方法的DMFD-Ncut都能够显著提升使用单一特征的Ncut在图像分割中的效果。然而使用超点分割解决Ncut计算量大的问题，使得图像分割结果过分依赖于超点分割的效果，下一步工作将集中研究适用于DMFD-Ncut的快速计算方法。

Fig.3 Comparison of segmentation results with PSOS and DMFD-Ncut图3 使用PSOS的图像分割结果与不同尺度DMFD-Ncut结果对比

Fig.5 Comparison of running time with different algorithms图5 不同算法运行时间对比

[1]Kim S,Nowozin S,Kohli P,et al.Higher-order correlation clustering for image segmentation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2011,36:1761-1774.

[2]Mobahi H,Rao S R,Yang A Y,et al.Segmentation of natural images by texture and boundary compression[J].International Journal of Computer Vision,2011,95(1):86-98.

[3]Comaniciu D,Meer P.Mean shift:a robust approach toward feature space analysis[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,24(5):603-619.

[4]Carson C,Belongie S,Greenspan H,et al.Blobworld:image segmentation using expectation-maximization and its application to image querying[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1999,24(8):1026-1038.

[5]Yuan Yonghua,Li Yu,Zhao Xuemei.High-resolution panchromatic remote sensing image segmentation based on spectral clustering[J].Chinese Journal of Scientific Instrument,2016,37(7):1656-1664.

[6]Yang Nongying,Li Feng,Gui Yan.Repeated texture elements extraction from texture images[J].Journal of Frontiers of Computer Science and Technology,2016,10(8):1154-1165.

[7]Shi Jianbo,Malik J.Normalized cuts and image segmentation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2000,22(8):888-905.

[8]Benson A R,Gleich D F,Leskovec J.Tensor spectral clustering for partitioning higher-order network structures[C]//Proceedings of the 2015 International Conference on Data Mining,Vancouver,Apr 30-May 2,2015.Philadelphia:SIAM,2015:118-126.

[9]Aytekin Ç,Ozan E C,Kiranyaz S,et al.Extended quantum cuts for unsupervised salient object extraction[J].Multimedia Tools andApplications,2017,76(8):10443-10463.

[10]Estrada F J,Jepson A D.Benchmarking image segmentation algorithms[J].International Journal of Computer Vision,2009,85(2):167-181.

[11]Rohkohl C,Engel K.Efficient image segmentation using pairwise pixel similarities[C]//LNCS 4713:Proceedings of the 29th Annual Symposium of the German Association for Pattern Recognition,Heidelberg,Sep 12-14,2007.Berlin,Heidelberg:Springer,2007:254-263.

[12]Li Xiang,Jin Lianghai,Song Enmin,et al.An integrated similarity metric for graph-based color image segmentation[J].Multimedia Tools and Applications,2016,75(6):2969-2987.

[13]Pont-Tuset J,Arbeláez P,Barron J T,et al.Multiscale combinatorial grouping for image segmentation and object proposal generation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2016,39(1):128-140.

[14]Arbelaez P,Maire M,Fowlkes C C,et al.Contour detection and hierarchical image segmentation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2011,33(5):898-916.

[15]Cour T,Bénézit F,Shi Jianbo.Spectral segmentation with multiscale graph decomposition[C]//Proceedings of the 2005 Conference on Computer Vision and Pattern Recognition,San Diego,Jun 20-26,2005.Washington:IEEE Computer Society,2005,2:1124-1131.

[16]Kim T H,Lee K M,Lee S U.Learning full pairwise affinities for spectral segmentation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2013,35(7):1690-1703.

[17]Wang Xiaofang,Tang Yuxing,Masnou S,et al.A global/local affinity graph for image segmentation[J].IEEE Transactions on Image Processing,2015,24(4):1399-1411.

[18]Sidi O,van Kaick O,Kleiman Y,et al.Unsupervised co-segmentation of a set of shapes via descriptor-space spectral clustering[J].ACM Transactions on Graphics,2011,30(6):126.

[19]Seo D,Ho J,Vemuri B C.Covariant image representation with applications to classification problems in medical imaging[J].International Journal of Computer Vision,2016,116(2):190-209.

[20]Keller Y,Coifman R R,Lafon S,et al.Audio-visual group recognition using diffusion maps[J].IEEE Transactions on Signal Processing,2010,58(1):403-413.

[21]Coifman R R,Lafon S.Diffusion maps[J].Applied and Computational HarmonicAnalysis,2006,21(1):5-30.

[22]Hammond D K,Vandergheynst P,Gribonval R.Wavelets on graphs via spectral graph theory[J].Applied and Computational HarmonicAnalysis,2011,30(2):129-150.

[23]Pele O,Werman M.Fast and robust earth mover's distances[C]//Proceedings of the 12th International Conference on Computer Vision,Kyoto,Sep 27-Oct 4,2009.Washington:IEEE Computer Society,2009:460-467.

[24]Leung T,Malik J.Representing and recognizing the visual appearance of materials using three-dimensional textons[J].International Journal of Computer Vision,2001,43(1):29-44.

附中文参考文献：

[5]袁永华,李玉,赵雪梅.基于谱聚类的高分辨率全色遥感影像分割[J].仪器仪表学报,2016,37(7):1656-1664.

[6]杨弄影,李峰,桂彦.纹理图像中重复纹理元素提取方法[J].计算机科学与探索,2016,10(8):1154-1165.