基于改进结构森林的黑色素瘤病灶分割算法
2021-01-13范玉张乾白金华张宇航
范玉 张乾 白金华 张宇航
摘要:由于皮肤癌黑色素瘤特有的噪声分布不均一、关键信息占比小的问题,使得图像病灶边缘模糊,容易出现误分割,无法满足精度要求。提出一种改进的结构森林模型对黑色素瘤图像病灶进行分割,设计一种有效的输入方案,通过二维高斯函数进行去噪,根据图像像素特点自适应选择阈值增强病灶边缘,结合数学形态学突出有效信息,从而提高分割精度。在ISIC公开的数据集HAM10000上选取的部分数据试验结果表明,改进后的模型在保持大部分关键信息的情况下,比原始模型分割速度更快、效果更好。
关键词:皮肤癌黑色素瘤;改进结构森林;数学形态学;病灶分割
中图分类号:TP393文献标志码:A文章编号:1008-1739(2021)22-66-5
0引言
医学图像分割是医学图像处理与分析领域复杂而关键的步骤,目的是将医学图像中具有某些特殊含义的部分分割出来,有助于后续提取图像感兴趣区域的相关特征,并给临床诊疗和病理学研究提供可靠的依据,辅助医生做出更为准确的诊断。
目前国内外广泛使用的医学图像分割方法有很多种,包括传统算法和深度学习[1]算法,本文主要了解关于传统的图像分割方法。阈值分割是最常见的一种分割方法,基于对灰度图的假设,有效对图像进行了分割,比如伏金浩等人[1]提出的一种基于改进阈值与边缘梯度的亮场干细胞图像分割方法,准确分割了细胞的边缘轮廓,比传统的阈值分割方法具有更好的分割效果。基于边缘的分割方法是人们最早研究的方法,由于区域边缘上的像素变化一般比较剧烈,所以该方法试图通过检测不同区域间的边缘来解决图像分割问题,庞明明和安建成[3]将模糊数学与局部二值模式相融合,结合Canny算子[4]提出了一种FLBP-Canny算法来提取图像目标区域轮廓,实验结果表明该算法有较好的检测率;基于区域的分割方法按照图像的相似性准则对图像区域进行划分,比如柳丁和张东[4]对分水岭算法多分割的缺点用2种算法进行了改进,并将其有效用到了超声肿瘤图像中进行分割。还有一种通过求解能量泛函的最小值找到目标轮廓来实现分割过程的活动轮廓模型,王孝义[6]等人提出了一种基于自适应能量偏移场的无边缘主动轮廓模型AEOF-CV,对DDSM数据库的乳腺肿块图像进行处理后,使用该模型乳腺肿块进行分割,总识别率高达94%,提高了乳腺癌检测的精准度和效率。基于图论的分割方法则将图像分割问题与图的最小割问题关联,由于皮肤图像在边界、对比度和形状大小方面存在的困难,Seetharani等人[7]用GrabCut算法[8]对皮肤病灶进行分割,再用传统的K-means聚类算法[10]改善了分割边界,在PH2与ISBI2017的数据集上试验后,Dice系数值分别为0.913 9和0.823 6,展示了不错的分割效果,显示了图论方法分割的优良。
本文充分借鉴前人在传统机器学习领域所做的工作,参考Dollár Piotr和Zitnick C Lawrence[9]提出了一种结合结构化学习与随机森林(Random Forest,RF)的结构随机森林算法[12],针对获取的黑色素瘤皮肤镜图像,考虑黑色素瘤本身的特性,对结构森林模型进行改进后用于皮肤病灶的精确分割。
1相关理论
1.1随机森林
RF[13]是集成多棵决策树的组合,这些决策树之间是相互独立的,且该算法实现简单、计算开销小、稳定性高,比单棵决策树具有更好的泛化能力和抗过拟合能力。随机森林是对个独立树的训练,给定一个样本,输入在树上的输出,存储在到达的叶子处的预测可以是目标标签∈或是标签上的分布,使用一个集成模型将决策树的预测结果组合成单个输出,RF流程如图1所示。
为了使输出空间更泛化,引入一个近似的更一般的信息增益准则,并用于结构化标签中得到广义结构森林公式,将随机决策森林扩展到结构随机森林。
1.2结构森林
图像局部块的边缘是高度相互依赖的,而一种被称为结构化学习的方法被用于解决这种表现出相似特征的问题,本文利用图像边缘块的这种固有结构,提出一种应用于边缘检测的结构化学习方法,通过将随机决策森林扩展到二维空间,利用其框架捕获结构化信息来进行训练,得到结构森林模型。
结构森林是一个用结构化标签训练RF的过程,使用结构化标签来确定树中每个分支的分裂函数来学习ID3决策树,这也同时带来了2个主要挑战,一是结构化标签的信息增益定义困难;二是结构化输出空间高维复杂,计算复杂度较高,下面针对2个挑战提出了以下的解决措施:
2本文方法
結构森林将边缘检测问题表达为在给定输入图像块的情况下预测局部分割掩模,且结构化标签可以预测整个图像领域的信息,大大减少了需要评估的树的数量,相比同类算法极大提升了训练效率。
3实验分析
3.1数据采集
本文的研究对象是皮肤癌黑色素瘤,本实验数据集HAM10000来源于国际皮肤图像官网ISIC,该数据集收集了大量常见的色素性皮肤病变的多源皮肤镜图像,数据具备充分性和多样性,研究证明可以作为学术机器学习的基准数据集[16]。
本文仅选取部分图像进行试验,图像数据如图2所示。数据选取具有随机性,主要包括良性和恶性皮肤镜图像,数据格式为常用的JPG格式,分辨率大小一致,均为600 pixel×450 pixel。
3.2结果分析
试验的结构森林模型训练环境为MATLAB2014a;实验环境为个人PC机,处理器Intel(R) Core(TM) i7-8750H CPU @ 2.2 GHz,内存为8 GB,软件环境Windows10(64-bit)操作系统。
根据本文选取的黑色素瘤的良性和恶性皮肤镜图像数据,先将数据集中的图像输入原始结构森林模型进行训练,结构森林训练结果如图3所示,其中分割图seg1与分割图seg2均为结构森林模型的分割结果,二者是一对二值反色图,本质上是一致的,目的是增强模型分割的对比效果。
从结构森林的训练结果可得,左侧两图中的恶性图像具有噪声扰动大和边界不规则的性质,训练时图像容易受到这些特性的影响,造成分割效果较差,而右侧两图中的良性图像的边界分布较均匀,扰动也较小,但是分割效果也不佳,明显观察到其中的毛发、气泡这些信息被误认为是主要分割内容,掩盖了真正要分割的部分,造成整体分割精度不理想。
原始的结构森林的黑色素瘤分割主要带来了2个问题:一是图像属性差异使得病灶边缘模糊,不易确定分割区域;二是医学图像本身的毛发、气泡等噪声干扰使得分割时易产生误分,关键信息占比也受到极大影响。为了解决这些问题,本文对结构森林模型进行改进,通过高斯滤波去除图像噪声,减少干扰因子,利用大津阈值法确定图像病灶边缘。图4(a)为经大津法得到的双峰直方图,用于确定最佳阈值,通过该阈值的选取完成对图像的初步分割,得到图4(b)中初分割后的直方图,从图4中可以看到,不同灰度级(0~255)对应的像素个数随着灰度级的变化而变化的情况。
接着采用二值形态学闭运算去除黑色素瘤的毛发、气泡等无关信息,突出关键信息,改进后的结构森林效果显著,图5是改进后的模型分割差异对比,对比原始结构森林,模型改进后的图像分割效果远远好于改进前,这是因为本文提出的方法在处理具有类似黑色素瘤图像这样的特质时有较强的针对性,使得图像中的噪声干扰大大降低,明显观察到图像分割边界更加完整,關键信息尤其突出,分割效果大大提升,且训练速度相比原始的模型更快、更稳定,再次验证了本文的改进方法应用于黑色素瘤中时分割效果相当显著。
4结束语
通过将皮肤癌黑色素瘤在改进前后模型中的分割图进行对比,得出改进后的结构森林对于黑色素瘤图像分割效果明显提升,首先因为黑色素瘤的图像不同于普通图像,不仅包括普通图像的特征,还有医学图像固有的特性,需要针对这种特性使用有针对性的处理方法。而实验结果也表明,本文使用的这种改进方式能有效解决提出的问题,不仅减弱了噪声,还凸显了关键信息,提升了模型分割精度,且改进的结构森林算法对医学领域具有较好的解释,对于同类问题的应用有很好的发展前景,为更准确地对皮肤癌进行早期诊断打下坚实基础。
参考文献
[1]彭璟,罗浩宇,赵淦森,等.深度学习下的医学影像分割算法综述[J].计算机工程与应用,2021,57(3):44-57.
[2]伏金浩,王剑平,闻路红,等.基于改进阈值与边缘梯度的亮场干细胞图像分割方法[J].电子测量技术,2020,43(20):109-114.
[3]庞明明,安建成.融合模糊LBP和Canny边缘的图像分割[J].计算机工程与设计,2019,40(12):3533-3537.
[4]李祥健,朱家明,徐婷宜.基于改进Canny算子的双水平集医学图像分割[J].无线电通信技术,2021,47(2):226-231.
[5]柳丁,张东.改进的分水岭算法在超声肿瘤图像分割中的应用[J].半导体光电,2017,38(6):898-901.
[6]王孝义,邢素霞,王瑜,等.基于自适应能量偏移场无边缘主动轮廓模型的乳腺肿块分割与分类方法研究[J].中国医学物理学杂志,2020,37(8):1010-1016.
[7] SEETHARANI M J, PALANIAPPAN M, CHANDRABOSE A. Automated Skin Lesion Segmentation of Dermoscopic Images Using Grabcut and K-Means Algorithms[J]. IET Computer Vision, 2018,12(8):1088-1095.
[8] U NVER H M,AYAN E. Skin Lesion Segmentation in Dermoscopic Images with Combination of YOLO and GrabCut Algorithm[J]. Diagnostics,2019,9(72):97-114.
[9]王波,冯旭鹏,刘利军,等.基于改进YOLO算法的肺部CT图像中结节检测研究[J].北京生物医学工程,2020,39(6): 615-621.
[10]宗晓萍,田伟倩.采用K-means的脑肿瘤磁共振图像分割与特征提取[J].计算机工程与应用,2020,56(3):187-193.
[11] DOLLA R P, ZITNICK C L. Fast Edge Detection Using Structured Forests[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015,37(8):1558-1570.
[12] LIU X H. Cell Coverage Estimation Based on Structured Random Forests Edge Detection and Boundary Tracking Proceedings of 2020 International Conference on Artificial Intelligence and Communication Technology (AICT 2020). Chongqing: Clausius Scientific Press, 2020: 22-25.
[13]李长胜,王瑜,肖洪兵,等.基于随机森林算法的阿尔茨海默症医学影像分类[J].中国医学物理学杂志,2020,37(8): 1005-1009.
[14]刘侠,甘权,李冰,等.融合加權随机森林的自动3D椎骨CT图像主动轮廓分割方法[J].光电工程,2020,47(12):37-48.
[15] RAFAEL C G.数字图像处理:第3版[M].阮秋琦,译.北京:电子工业出版社,2017.
[16] PHILIPP T,CLIFF R,HARALD K. The HAM10000 Dataset, a Large Collection of Multi-Source Dermatoscopic Images of Common Pigmented Skin Lesions[J]. Scientific Data, 2018,5(1):1068-1073.