图像分割方法综述
2019-05-23侯红英高甜李桃
侯红英 高甜 李桃
摘要:图像分割是图像处理中的一项关键技术,并且在工业、医学、军事等诸多领域得到了广泛应用。该文主要对传统的图像分割方法和近年来出现的一些新方法进行了综述。介绍了传统方法中的阈值法、区域法、边缘检测法以及新方法中的超像素法和语义分割法,分析了各种方法的原理及特点。
关键词:图像分割;传统方法;语义
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2019)05-0176-02
1 引言
图像分割是对图像进行分析的重要步骤之一。图像分割是根据相似性规则将一幅图像划分为多个子图像区域的过程 [1]。 每个子区域中的每个像素在某些度量或计算的特征(如灰度,颜色,纹理和形状)下是相似的。我们还可以从数学的角度来理解图像分割:整个图像区域用集合R来表示,那么图像分割则是要把R分成一组连通且非空的子集
2 传统的图像分割方法
图像有低级、中级和高级三种语义。传统图像分割方法主要是利用了图像的低级语义,比如颜色、文理以及形状等。常用方法主要有阈值法、区域法以及边缘检测法。
2.1 阈值法
阈值法的基本原理是结合图像的灰度特征计算一个或多个灰度阈值,并将图像中每个像素的灰度值与阈值进行比较,最后根据比较的结果将像素划分到相应的类别[2]。 因此,阈值法的关键是根据一定的准则来求出最优灰度阈值。典型的全局单阈值分割方法是由Prewitt等人提出的直方图双峰法。该方法假设图像具有不同的目标和背景,并且其灰度直方图具有双峰分布特性,选择两个峰值之间的谷相对应的灰度级作为阈值。通常,目标和背景之间的对比度在图像中的每个地方都各不相同,并且难以用一个全局阈值将目标与背景分离。因此,有必要根据图像的局部特征使用不同的阈值进行图像分割。在处理过程中,需要根据实际问题将图像划分为若干个子区域来求解阈值,从而进行图像分割。 阈值分割的优点是计算简单、快速。然而,由于阈值的确定取决于灰度直方图,没有考虑图像像素的空间位置关系,因此如果图像的背景复杂且目标和背景灰度值差别不大时,部分边界信息很容易丢失。
2.2 区域法
区域分割是具有相似属性像素的连接,以形成所需的分割区域。该方法结合了图像的局部空间信息,可有效地克服图像分割时空间不连续的缺点,但同时也会造成图像的过分割。区域法主要包括区域生长法和区域分裂合并法。区域生长法的基本思想如下:从能够表示每个生长区域的一组种子像素开始,将满足条件的种子像素邻域内的像素合并到由种子像素表示的生长区域中,并将合并的新像素作为种子像素继续之前的合并过程,直到找不到符合条件的新像素时停止合并操作[3]。所以,区域生长法的关键点在于选择恰当的初始种子像素并确定有效的生长规则。通常还要受到具体问题的限制和影响,初始种子像素和生长准则决定了最后形成的分割区域,对这两个因素的不恰当处理可能会导致过度分割或者欠分割的问题。区域分裂合并算法有分裂与合并两个步骤,可以先进行分裂,再进行合并,也可以分裂和合并同时进行,在连续的分裂和合并之后,获得图像的分割结果。该方法是结合图像中的区域特征指定分裂准则,如果区域的特征不一致,则会继续分裂成四个相邻的区域,然后再对分裂后的每个区域进行相同的操作,直到不再满足给定的分裂准则。
2.3 边缘检测法
边缘是图像中两个不同区域的边界线上连续像素点的集合,体现了图像特征的变化,如灰度、颜色、纹理。边缘检测则是检测图像的结构或灰度级突然变化的位置,这通常是一个区域的开始和另一个区域结束的地方。由于边缘灰度值会产生屋顶型和阶跃型两种变化,基于边缘的分割方法则是基于灰度值的边缘检测。图像的灰度级变化可以通过图像灰度分布的梯度来表示,可以使用微分算子進行边缘检测[4]。其中比较常用的有Roberts算子、Sobel算子、Prewitt算子、Laplace算子和Canny算子等。 在实际的应用中,微分算子常用小区域模板加以表示,微分运算则是利用小区域模板与图像进行卷积来实现的。这些算子对噪声敏感,适用于低噪声且不太复杂的图像。因为边缘和噪声都具有灰度不连续性,所以一般会在使用微分算子检测边缘之前,对图像先进行平滑滤波处理。
3 图像分割的新理论
在利用低级语义信息对图像进行分割时,如果只是针对一些简单场景中的物体,该方法是可行的,但如果是场景较为复杂的图像,仅采用低级语义进行图像分割的效果则不是很理想。此时,可以结合图像的中、高级语义来提高分割效果。
3.1 超像素法
在2000年左右,研究者将图论的理论引入到图像分割,将待分割图像映射为带权无向图,根据图的顶点以及边的信息构造代价函数,并对其进行优化。图像分割转换为图的顶点标注,顶点标号相同像素属于同一个图像块,这些图像块则称为超像素[5]。另一种方法是根据图像中单个像素的信息以及像素之间的相互关系,借鉴无监督学习的思想,结合聚类算法,将具有相似特征的相邻像素划分到同一超像素。在超像素方法中,主要有NCut、Graph Cuts、Meanshift等经典算法,这类算法的时间复杂度较高。针对不足之处,在上述经典算法的基础上加以改进,产生了SEEDS、LSC、SLIC等算法,改进后的算法在生成图像块的质量和算法的时间复杂度上都有着更好的表现[6]。
3.2 语义分割法
采用高级语义的图像分割称为语义分割,Ohta等人于1978年最早提出图像语义分割的概念,认为语义分割是为图像中每个像素分配一个预先定义的表示其语义目标类别的标签[7]。语义分割分为两种形式:自顶向下和自底向上。自顶向下则是使用物体的形状模型在待分割图像中做匹配搜索,由于每种物体的形状差异性很大,所以这种方法的适应性不理想。自底向上的方法不需要物体形状的先验知识,先从图中生成候选区域,然后对候选区域进行分类预测[8]。在自底向上方法中的另一种思路是直接以图像像素或超像素为处理单位,提取其本身及领域的特征用于语义分割。该方法是以大量带有像素级标注的图像为样本,训练诸如支持向量机、神经网络等的分类器[9],然后对图像中每个像素进行分类。
随着图像分割应用范围的不断扩大,对图像分割的质量要求也越来越高。但到目前为止,还没有任何的分割算法可以适用于所有的图像,而且随着应用的不断深入,算法的复杂性越来越高,需要解决的问题也会越来越多。因此应该把图像分割方法的研究与新理论、新技术相结合,图像分割技术将会向着更精确、快速的方向发展。
参考文献:
[1] 罗希平,田捷,诸葛婴,等.图像分割方法综述[J].模式识别与人工智能,1999,12(3):300-312.
[2] Otsu N. A threshold selection method from gray-level histograms. IEEE Trans. on Systems Man and Cybernetics, 1979,9(1):62-66.
[3] Adams R, Bischof L. Seeded region growing. IEEE Trans. on Pattern Analysis and Machine Intelligence, 1994,16(6):641-647.
[4] Ziou D, Tabbone S. A study of edge detection techniques for segmentation computing approaches. Intl Journal of Computer Applications, 2010,CASCT(1):35-41.
[5] Ren X, Malik J. Learning a classification model for segmentation. In: Proc. of the 10th Intl Conf. on Computer Vision. IEEE, 2003:10-17.
[6] 姜枫,顾庆,郝慧珍,等.基于内容的图像分割方法综述[J].软件学报,2017,28(1):160-183.
[7] Csurka G, Perronnin F. An efficient approach to semantic segmentation. Intl Journal of Computer Vision, 2011,95(2):198-212.
[8] Todorovic S, Ahuja N. Learning subcategory relevances for category recognition. In: Proc. of the IEEE Conf. on CVPR.Washington: IEEE Computer Society, 2008. 1-8.
[9] Bai X, Wang W. Saliency-SVM: An automatic approach for image segmentation. Neurocomputing, 2014,136(8):243-255.
【通聯编辑:代影】