基于MSRM算法的感兴趣目标物提取
2023-07-10胡涵菲
胡涵菲
关键词:超像素分割;Mean Shift 分水岭;最大相似性原理;目标提取
中图分类号:TP18 文献标识码:A
文章编号:1009-3044(2023)14-0025-04
1 总体方案设计
1.1 功能模块的划分
一般图像中的颜色与形状特征较为复杂,很难实现目标物的全自动提取。本文结合图像分割的基本原理,采用与用户交互式的半自动分割方法,将系统分为对原始图像的初步分割和对分割后的图像进行相似度合并两部分,最后得到目标提取结果图像。
在像素分割模块中,通过按钮选择原始图像进行分割程序,并将分割后的图像结果单独保存;在目标提取模块中,将原始图像和分割图像作为输入,再通过画笔粗略地标记目标对象和背景的位置,分割块合并结束后,目标对象的边缘被标记出,即完成提取。图片在各功能模块的输入输出流程如图1所示。
1.2 主要实现功能的原理
1.2.1 基于Mean Shift 的图像初始分割
Mean Shift算法是指一个迭代计算的步骤,即先算出当前点的偏移均值,再移动该点到其偏移均值,然后以此为新的起始点继续移动,直到满足一定的条件后结束迭代[1]。Comaniciu等人把Mean Shift算法成功地运用到特征空间的分析,在图像分割中取得了很好的效果。此外,基于Mean Shift算法的图像分割结果中过度分割较少,可以很好地保持目标边界。
Mean Shift图像分割算法的输入可以是灰度图像或彩色图像,用户唯一需要调整的参数是分析的分辨率[1]。基于该算法的图像分割是间断保持平滑算法的前向扩展,每个像素都与位于其邻域内的联合域密度的显著模式相关联,在对相邻模式进行修剪后,生成图像区域分割结果。
1.2.2 基于最大相似度的区域合并
在Mean Shift分割图像的基础上,基于最大相似度的区域合并(MSRM)机制进行区域合并,从而实现目标对象的轮廓提取。MSRM能够自适应图像内容,不需要一个预设的阈值[2],其原理为:如果在所有R的相邻区域中,Q与其相似性最高,则将区域R与其相邻区域Q合并[3]。
通过使用笔画来粗略地标记目标对象和背景的位置后,该方法在标记的帮助下将Mean Shift分割的超像素按照是否被标记背景区域自动合并,非标记对象区域也将被识别,从而避免与背景合并。一旦所有的非标记区域都被标记出来,然后就可以很容易地从背景中提取出物体的轮廓。
2 各个功能模块的实现原理
2.1 Mean Shift 图像分割算法流程
通过Mean Shift 算法进行图像分割包括两个步骤:模点搜索和合并相似区域。通过模点搜索找到每个数据点的类中心,并以中心的颜色代替自己的颜色,以此来实现图像平滑。但通过搜索得到的模点太多,且模点间距离较近,如果将每个模点都作为一类会导致类别太多,容易产生过分割,因此模點搜索后需要进行相似区域合并。
不断重复步骤Step 1—Step 4,集合MB 覆盖区域逐渐扩大,非标记区域N 的数量越来越少,当整个标记背景区域MB 找不到新的合并对象时,迭代停止。第一阶段的区域合并后,一些非标记的背景区域与相应的背景标记合并;仍有一些非标记的背景区域由于彼此之间的相似性得分高于与标记的背景区域之间的相似性得分,因此未合并到背景集合中。图3(b)显示在第一阶段合并后,许多属于背景的区域的房子已合并,但仍有一些非标记的背景区域剩余。
循环执行这两个合并阶段,直到没有新的合并发生。一般图片的合并算法基本在2-3轮内结束,当所有区域被标记为提取目标或背景后,通过只提取目标区域可以很容易地得到物体的轮廓,如图3(d)所示。
3 测试和调试
对六个测试图像的像素分割和目标提取结果如图4所示,第一列为原始图像,第二列为Mean Shift初始分割结果,第三列显示感兴趣目标,并用白色线条勾勒出其轮廓。
由于图像合并时根据区域间的RGB颜色直方图计算区域间的相似度,因此目标对象颜色与背景颜色差异越大,合并效果也就越好。例如示例1、4、6,只需通过一笔标注就可以实现目标区域的准确提取。对于示例2、3,目标区域有部分像素块的颜色与背景差异较小,需要对这些差异较小的区域着重标记,才能较好地实现分割。示例5的分割效果不好,由于左前车轮的颜色与影子颜色太过相近,在像素分割时直接被划分到同一区域,因而在区域合并时,最终提取的目标轮廓也包含影子部分。可以通过其他的分割方法对示例5进行更细致的分割,或者手动进行图像分割,或许可以将影子与车轮分割开来。
4 总结与反思
初始分割是目标提取的基础,若是分割得太过细碎会导致合并效率降低,也会导致提取效果不太好。通过对比常用分割方法的效果发现,Mean Shift方法通过迭代产生规则形状的超像素,但不能控制超像素的数量、大小;SLIC方法基于颜色和距离相似性进行的超像素分割,可以产生大小均匀、形状规则的超像素;N-cut方法利用轮廓特征和纹理特征来全局最小化代价函数,可控制数量且形状规整紧凑,但图边界效果不好[5]。考虑到MeanShift方法可以规则提取物体边缘且分割块较少,最终选择该方法进行图像分割。在超像素合并阶段,宁纪锋教授提出的最大相似度区域合并方法较为经典,在MSRM合并算法的基础上进行了复杂度的简化,并对合并效果进行了测试。对提取结果进行分析后发现改进效果较好,可以有效提取出感兴趣目标物。