APP下载

二维Otsu 的Z 字折线阈值分割方法

2024-01-25梁义涛陈亚辉李永锋

清远职业技术学院学报 2024年1期
关键词:折线直方图边界

梁义涛,陈亚辉,李永锋

(河南工业大学a.粮食信息处理与控制教育部重点实验室;b.信息科学与工程学院,河南 郑州 450001)

0 引言

图像分割是图像处理中的一项基础且关键的技术研究,也是自动目标识别的重要组成部分[1]。在众多分割算法中,阈值分割法因其简单有效,计算量小,性能较稳定,成为了使用范围较广的方法之一[2],而且阈值分割法对于物体和背景有较强对比的图像分割特别有效。在阈值分割法中,全局阈值分割技术具有自适应分割的特点,并且容易实现,得到广泛的应用[3]。经典的全局阈值分割方法主要有最小误差法[4]、各种熵类分割法[5-8]、最大相关性法[9]、Otsu 法[10]。Otsu 法通过最大化类间方差的方法来确定最优的阈值,以实现对图像的二值化分割[11],在具有明显的双峰灰度分布直方图的图像,可以取得令人满意的效果[12]。但是当图像的噪声多或者目标和背景相差很大时,Otsu 法则容易出现阈值“偏移”[13],并且Otsu 也没有考虑像素的空间信息,因此噪声的存在使得分割效果变差。于是刘健庄等人[14]提出了灰度图像的二维Otsu 自动阈值分割算法,范九伦等人[15]提出三维Otsu 阈值分割算法。一维Otsu 算法的计算复杂度较低,但分割效果不尽人意。三维Otsu 算法的计算复杂度过大,因此往往难以在工程上大规模应用[16]。与之相比,二维Otsu 算法的分割效果较好,而且其计算复杂度在可接受的范围内。

二维Otsu 考虑了像素点与其邻域的空间信息,提升了算法的抗噪性能[17]。然而,该方法假设了边界区域信息对于图像分割的影响可以被忽略。这使得原始的二维Otsu法应用在边缘信息丰富的图像时,分割效果差[18]。因此,后续的研究者提出了多种改进算法:梁义涛等人[19]在原始二维Otsu 分割法的基础上,引入迭代的思想,在获得整个灰度图像的最大类间方差点后,对边界噪声区域进行迭代分割,以获得一系列阈值点,用依次相连的折线阈值进行分割,该方法的优点是用线阈值分割替代了传统的点阈值,提高了分割的精度,不足之处则是存在区域错分,而且人为根据经验给出迭代次数,降低了算法的自适应性;赵恒等人[20]为了得到正确的区域划分结果,获取图像边界点在二维直方图的坐标,并用曲线拟合这些点,再用斜分法对目标与背景区域进行划分,该方法在一定程度上纠正了错分的边界区域,但是对边界、噪声区域的划分不够精细,且计算量大;梁义涛等人[21]又在此构想上提出二维Otsu 拟合线阈值图像分割方法,将文献中的折线拟合成曲线,以此曲线阈值进行图像分割,并以小概率事件标准作为停止迭代的条件,也即边界和噪声区域像素点的总概率之和小于某一较小值。但该方法未充分利用二维直方图的先验信息,因此对图像中边界和噪声区域的划分效果不准确,且对于复杂的图像拟合结果的精度不够高。吴一全等人[22-23]给出了二维直方图的区域斜分法以及快速算法,并将算法推广到法线与灰度级轴成任意角,虽然有效提高了该方法的适用面,但是在工程实践中,往往采用固定值[24]。且该方法存在明显的错误分类,将部分目标噪声归于背景区域,将小部分背景噪声归于目标区域,使得图像分割精度下降。

由此可见,现有算法普遍存在像素分类错误、自适应能力不强的问题,这影响了图像的分割精度,还导致了图像边界形状的不准确、内部像素分布不均匀等问题[25]。同时,这还会影响到随后对图像的进一步处理,包括分析、识别等,从而降低了处理效果[26]。因此本文提出一种基于二维Otsu 的Z 字折线阈值分割法,充分利用二维直方图进一步的先验知识,得到噪声区域、边界区域、背景区域,目标区域的进一步细化,确定背景噪声、背景边界、目标噪声、目标边界的分类,有效提高了二维Otsu 的分割能力,实现了高精度图像分割。为了进一步提高本文方法的自适应能力,有效确定图像边界与噪声的分界线(也即图4 中的L3 和L4 线段),本文采用小概率事件原则和二分法,可以根据不同场景调节参数来区分图像边界与噪声。

1 传统二维Otsu 分割法

对于一幅M×N 的图像,像素点(x,y)的灰度值用f(x,y)表示,g(x,y)表示图像上的K×K 邻域平均灰度,其公式为:

其中,k 一般取奇数,0<x<M,0<y<N。图像灰度级为L,对应的邻域平均灰度级为L,以f(x,y)和g(x,y)组成C(i, j)数组来定义二维直方图。直方图上任意一点的联合概率密度为Pij,其公式如下:

根据上式给出的定义,假设(t,s)为最佳阈值点,二维直方图就被分成了四块,在图1(b)中,对角线上的区域I 和区域III 分别对应目标和背景,其他两块则对应边界和噪声。

图1 二维直方图及其区域划分

图2 二维Otsu 曲线阈值直方图

2 二维Otsu 曲线阈值分割法

在二维直方图区域直分法中假设区域II 和IV 的像素概率值为0[27],这种假设忽略了边界和噪声的信息,造成了算法的自适应性降低。对于需要进行高精度图像分割的任务而言,忽略区域II 和IV 中的边界和噪声信息会显著地降低分割的准确性。范九伦等人[28]提出了二维Otsu 曲线阈值分割法。该方法中选取点(t,s)为阈值,过该点作曲线r(i,j),将二维直方图一分为二,背景和目标分别用C0(t,s)和C1(t,s)表示。在该算法中,如何选取曲线是一个关键问题。为了工程上容易实现,这些方法在具体实现上往往将曲线转为直线,且经过阈值点(t,s)。在这种方法中,由于阈值点的存在,区域I 和III 中的像素点已经明确分类,而区域II 和IV 有未被分类的像素点。因此,阈值曲线上的点必然分布在区域II 或IV 中,在不同的图像中,区域II 和IV 像素的占比不同,最佳的线性阈值也就取决于此[29]。最佳线性阈值假设如图3 所示,我们将这类最佳线性阈值分割方法称为“展翼”线性阈值分割方法。

图3 最佳线性阈值直方图

然而,这种方法是非常耗时的。因此,吴一全等人[22]提出了二维直方图区域斜分阈值分割法,该方法是上述“展翼”型线性阈值的一个特例。此方法采用与主对角线垂直的一条斜线g=-f+T (T 为阈值,0≤T≤2L)将二维直方图分为目标与背景两类,根据图像灰度值与其邻域平均灰度值之和的大小对图像进行划分,像素的分类方式为:

其中,fT(x,y)表示分割后的图像。相比于传统二维Otsu 算法,斜分法采用与主对角线垂直的斜线进行分割,覆盖了较多的分割区域,提高了阈值分割的精度。但斜分法中也存在明显的区域误分,以0<T≤L-1 为例,结合图4 二维直方图区域斜分阈值分割法,具体错误分类的子区域为:(1)BN1 区域,该区域属于背景噪声但却被分成目标区域;(2)ON2 区域和ON3 区域,该区域属于目标噪声但却被归到背景区域。这些区域的错误分类势必影响了图像分割的精度。

图4 传统二维直方图区域斜分

斜线g=-f+T 将二维直方图分成了目标(I 类)和背景(III 类),它们的概率分别为ω0(T)和ω1(T):

其中,ω0(T)+ω1(T)=1。目标和背景对应的均值矢量为U0和U1,其表达式分别为

二维直方图上总的均值矢量为UT

易得,

定义类间的离差矩阵为SB

使用SB的迹作为类间离散度测度,有

“师傅型”教师的职业素养主要分为三个层面,即教师岗位应具有的职业素养、培养学徒过程中应具有的职业素养和从事专业领域岗位的职业素养。只有具备良好职业素养的师傅,才可以通过言传身教和潜移默化促使学徒自我内化职业道德、职业意识和职业行为习惯。

通过i+j=t+s,对图像进行阈值分割,因此归类方式就变为了:

这种方法我们称之为二维Otsu 的直线阈值分割法。

3 二维Otsu 的Z 字折线阈值分割方法

本文主要目的是通过二维直方图的先验知识,实现高精准的图像分割,准确地提取出需要的目标和背景。在给出传统二维直方图区域斜分阈值分割法的原理性描述之后,以此为基础,正确划分二维直方图的区域实现高精细的图像分割。本文通过折线的方式,将传统二维直方图区域斜分中错分的三个子区域进行重新划分,该折线呈倾斜的Z 字型,分为三段(图3 中的AP 段、PQ 段、QD 段),本方法在解决传统二维直方图区域斜分方法错分子区域的同时,充分利用了其优势,形成了一种更有效、更精准的图像分割技术。通过在各种图像上进行实验,对所提出的方法进行了评估,证明了它与其他方法相比拥有更高的分割精度和更好的适用性。具体线段APQD 如图5 所示。

图5 二维Otsu 的Z 字折线阈值分割方法

图6 算法流程图

其中L3 和L4 的方程分别为:

其中,N 为L3 和L4 分别与坐标轴的截距。为了确定N 的大小,受文献的启发,使用小概率事件原则作为标准(称为设定概率值ε),通过计算L3 和L4 之外的像素占全部像素的比率是否小于ε,若小于则停止划分确定N 的值,通过应用小概率事件原则,本文算法可以在不同场景中选择合适的值,有效地解决了算法普适性低的问题。理论上N 应该从0 到L-1 进行递增,则可以得到最优解,但为了提高计算速度,本文选择二分法对进行加速划分[30],用以确定L3 和L4 的方程,同时二分法上下限也可根据具体实用场景进行调节,进一步提高了本文算法的适用性。因此AP、PQ、QD 三段方程就可以确定:

图7 输入图像

图8 对Ⅱ、Ⅳ区域的像素进行标记

4 实验结果和分析

实验硬件配置为AMD 锐龙55600H,RadeonGraphics @3.30GHz 16GB RAM 的PC 机,使用MATLAB R2018a 软件进行实验。本章从主观视觉和客观图像质量指标对算法进行评价,通过实验,证明了本文方法的可行性,通过不同方法的比较,本文方法提高了分割的精度和普适性。实验的算法包括原始二维Otsu 法,二维Otsu 区域斜分法,二维Otsu 折线阈值分割法及本文方法。

表1 图像中未分类的像素占比

通常我们把发生概率在0.01~0.05 之间的事件称为小概率事件。因此,我们选择了0.01、0.02 和0.05 作为实验参数ε,旨在展现本文算法的参数可调优势。此外,我们还加入了参数ε 为0.1 和0.2 的情况,以进一步评估本文算法的适应性和鲁棒性。通过实验结果的对比分析,我们可以更全面地了解本文方法在不同参数设置下的表现,为进一步优化和推广本方法提供有价值的参考。下表中统计了输入图像的运行时间,选取了5 次实验的平均运行时间。

图9 不同设定概率值的实验结果

图10 不同算法的实验结果(从左到右为:(a)原始二维Otsu 法;(b)二维直方图区域斜分阈值分割法;(c)二维Otsu 折线阈值分割法;(d)本文方法)

根据表2 的数据,本文算法的运行时间受到参数值ε 的影响。可知,随着ε 值的增加,处理后图像中的噪点数量也增加,从而影响了图像的视觉效果。因此,本文算法在实际应用中可以根据需求选择不同的ε 值,体现出算法的自适应性能。针对高精度图像本文提出的算法分割具有明显优势,既能提高图像分割的准确性,同时又能缩短程序运行时间。

表2 不同设定概率值的影响比较

4.1 分割性能实验

通过分割性能实验,突出本文方法的优势,并给出实验结果,实验图像依次为: 病毒、斑马、狒狒、大街、道路和雪地。

4.2 实验分析

在斑马、大街、雪地、道路图中都是属于噪声点较多的典型情况,二维Otsu 的折线阈值分割法和二维直方图区域斜阈值分割法比原始二维Otsu 方法处理效果好很多,但分割细节不足。结果表明,我们的方法与其他包含较少噪声和边缘信息(例如病毒)的图像分割方法类似。在斑马图中,我们的方法对斑马条纹进行了准确的处理,而其他所有方法都存在严重的错误分类。从街道图中可以看出,本文提出的算法展现出了其优势,原始的二维Otsu 法和二维Otsu 的折线阈值分割法对地面文本的分割效果都很差,二维直方图区域斜分阈值分割法无法清晰地分割出地面上的文本。相比之下,本文提出的方法可以清楚地分割文本区域。对于雪地图,我们的方法比其他方法表现更好。在雪影和人影方面,在处理雪地阴影和人体影子方面,本文方法更加细致,能够更准确地区分出这些影响因素,从而得到更加精准的图像分割结果。在道路上,其他三种方法无法精准分割路面,而本文的方法可以准确地分割出路面的分布。对于狒狒眼睛的分割,原始二维Otsu 法的分割结果是合理的。不过,本文对狒狒胡须的处理比其他四种方法更为精细。为了更清楚地看到细节的分割,我们放大了图像的一部分,如图11 所示。

图11 部分所选图片效果细节展示

4.3 分割质量评价

图像分割质量的主观方法在不同图像分割效果中有不同的标准。因此客观评价就显得十分必要且有意义[31]。

本文中采用最大相关准则(MCC)作为分割效果的客观评价指标[21]。该指标是Yen等人[32]基于最大熵准则提出,通过计算相关数总量和分割质量之间的正相关关系来评估分割效果。在陈修桥等人[33]的推广之下拓展到了二维。表3 为四种不同方法的分割效果评价,结果显示本文算法在主观和客观评价指标方面都有较好的表现。

表3 不同方法分割效果的客观评价

5 结论

本文研究发现,二维Otsu 分割法在实际应用中存在着像素分类错误和适用性差的问题。针对这些问题,本文提出了二维Otsu 的Z 字折线阈值分割法。通过实验证明边界和噪声区域不能全部忽略,否则会导致分割准确性大幅降低。为了解决这个问题,本文采用原始的二维Otsu 方法进行二维直方图分割,当边界信息或噪声区域所占比例可以被视为小概率事件时,可以适当忽略这些区域,从而解决了经典二维Otsu 算法假设前提不合理的问题。本文利用了二维直方图分割中的先验信息,改进了现有的二维直方图区域斜分阈值分割算法,解决了明显的错误分类问题。同时,本文充分考虑了边界信息或噪声区域对于灰度图像分割的影响,通过修正像素分类错误的问题,有效提高了分割的精准度。通过实验可以看出本文所推方法修正了二维直方图区域斜分算法中的错分区域后,对边界信息丰富的图像有着优秀的分割效果。为解决适应性差的问题,本文通过小概率事件参数的调节,以及二分法的应用,有效提高了算法的自适应能力。本方法能使图像分割精度更高,自适应性更强,边界形状更准确,内部像素分布更均匀。但在处理时间上要略长于原始二维Otsu 算法以及其他改进算法,使得本文方法在应用场景上有限制性。

猜你喜欢

折线直方图边界
统计频率分布直方图的备考全攻略
符合差分隐私的流数据统计直方图发布
拓展阅读的边界
用直方图控制画面影调
论中立的帮助行为之可罚边界
折线的舞台——谈含绝对值的一次函数的图象
折线
折线图案
基于直方图平移和互补嵌入的可逆水印方案
“伪翻译”:“翻译”之边界行走者