基于ResUnet对抗网络的脑瘤图像分割方法
2021-07-29罗耀
罗耀
(广东机电职业技术学院 计算机与设计学院,广东 广州 510550)
0 引言
将脑瘤从图像中分离出来是图像医学和人工智能医学的重要分支。脑瘤可以分布在大脑的任意区域,几乎可以变成任意大小和形状,使得人工分割的时候容易产生误差。同时,由于病人人数激增,产生大量亟待处理的磁共振成像MRI(Magnetic Resonance Imaging)等影像资料。为提高效率和准确率,同时减轻工作人员的工作负担和工作压力,使用计算机技术设计一款辅助软件分担他们的工作是非常必要的。
随着计算机科学的发展,机器学习成为医学图像分割的重要研究方向。从监督的角度看,这些机器学习分割方法可分为:非监督学习方法、半监督学习方法和监督学习方法。非监督学习方法属于传统方法,按照原理大致分为:基于阈值的方法、基于区域的方法、基于像素的方法和基于形态学的方法。优点是简单,计算速度快,对算力要求不高,对样本数的要求也不高。缺点是不太准确。监督学习方法的方法众多,从复杂性和可解释性来分,有比较简单并容易解释的svm,rf和crf等方法,也有较复杂的不易解释神经网络[1]等方法。较非监督学习方法来说,监督学习方法较准确,缺点是所用样本较多,对算力的要求较高,计算速度也较慢。半监督学习方法则需要在以上二者之间进行权衡,努力寻找优缺点间的平衡点。
基于ResUnet对抗网络的脑瘤图像分割方法(以下简称对抗法)为了保证准确率采用监督学习的方法,融合了ResUnet和对抗网络的技术,为进一步提高准确率使用混合滤波器对输入图像进行预处理。
1 方法描述
对抗法由两部分组成,一部分是预处理部分,另一部分是对抗网络。其中对抗网络分为生成器和判别器[2-3],生成器中内嵌ResUnet。
1.1 预处理
通过预处理可以对图像起到去噪、去冗余以及增强的作用。通过对比度受限的自适应直方图均衡化(CLAHE)、高斯滤波与Gabor滤波相结合进行预处理可以获得比较好的预处理效果。直方图均衡化能比较好地突出图像的细节,但是可能使得图像对比度严重失真。通过使用CLAHE,提高图像的局部对比度,起到了增强图像的作用,同时避免因过度调整对比度造成的图像失真。为尽可能去除更多的噪音,采用二维旋转高斯滤波的方法,以水平方向为起点,每旋转10度做一次高斯滤波。高斯滤波器在去除噪音的同时也使得图像变得模糊,特别是图像的边界变得模糊。为了使得图像中的边界变得清晰,使用了Gabor滤波器。Gabor滤波器利用Gabor小波对纹理和边缘较高敏感性,突出图像中的边缘。具体细节如图1所示。
图1 预处理图
1.2 网络结构
对抗法目标是实现像素到像素的直接输出。脑部磁共振图像MRI经预处理后进入生成器。内嵌于生成器的ResUnet分成编码器(encoder)和解码器(decoder),如图2所示。
图2 对抗法结构图
编码器各模块处理过程中,首先使用自然分布的方法对输入数据进行归一化处理(BN),在激活层中使用relu函数抑制或激活部分信号。在卷积层中,使用VGGNet卷积网络处理图像,一张磁共振图像有 512×512 个像素点,在dicom文件中每个像素由2字节表示,图像中每个像素都是整数,由于图片为单通道,画图渲染出来为黑白图。按照VGGNet的思想使用多个较小卷积核(3×3)的卷积层代替一个卷积核较大的卷积层,一方面可以减少参数,另一方面可以增加网络的拟合能力。编码器各模块结构,按从上至下编号,如表1所示。
表1 编码器结构表
在解码器中,反卷积层是stride为2的卷积的逆运算,它可以将图像扩大一倍。连接层将对应层的图像连接融合在一起,起到降低计算量的作用。解码器各模块结构,按从下至上编号,如表2所示。
表2 解码器结构表
由解码器输出的图像和按金标准分割的图像在判别器中进行比较,当判别器不能分辨金标准分割图与编码器输出图的区别时训练结束,否则不断优化生成器,同时判别器不断进化提高自己的判别能力。
ResUnet是Unet和残缺网络的结合体。对于一个给定的图像Imagei,经过网络模块处理后得到目标值为Yi,设网络参数为Net,图像Imagei经过网络后的实际值为F(Imagei;Net)。由此可以给出网络的损失函数如式(1)。
(1)
1.3 网络训练
对抗法属于监督式学习,以金标准作为标签来调整整个网络的参数,以便网络在训练过程中快速收敛,从而达到获得病灶图像的目的。网络主体采用GAN模型,训练网络的过程是一个对抗博弈的过程。
首先以判别器的损失函数为指引,采用动量随机梯度下降算法和反馈算法先训练判别器。训练判别器时,先将生成器的权值参数固定,优化判别器D的过程就是最小化交叉熵的过程,其损失函数如式(2)。
(2)
其中,Pdata(x)为x的概率分布函数;Pz(z)(噪声分布)为z的概率分布函数;E(·)为数学期望。将式(2)整理成连续空间上的表达式,如式(3)。
(3)
给定生成器G,最小化表达式(3),目标函数LOSTD(θD,θG)在D(x)取以下的DG(x)值时得到最小值,如式(4)。
(4)
判别器的目标是,当数据来源于真实数据时,判别器的输出值即D(x)趋近于1,当数据来源于生成器生成的数据G(z)时,判别器的输出值即D(G(z))趋近于零。
判别器训练好后固定判别器,训练生成器。判别器和生成器之间是一个零合博弈的过程,他们的损失函数互为相反数。判别器内嵌了一个ResUnet,所以判别器的优化过程也是一个ResUnet的优化过程。优化过程通过采用梯度下降的方法使得式(1)中的损失函数值LOST(Net)达到最小值,并求得当损失函数达到最小值的时候网络参数Net的值。
就整体而言,整个网络的优化问题就是一个极小化生成器极大化判别器的问题,GAN网络的目标函数为式(5)。
(5)
2 实验
验证对抗法可行性的程序用Python语言编写完成。
2.1 数据集
验证过程所使用的数据集是由广东某大医院提供的胶质脑损伤的MRI图像。此数据集收录了49个病患的病例,每个病例中包含若干个切片图像,总共1 127个切片图像。每个病例都由专业医生对肿瘤部位进行了标注。为了进行精确标注,数据集使用二进制的mask图形进行标注,每张切片图像的大小为512×512个像素。
2.2 实验过程
为验证对抗法在MRI图像上分割脑瘤的有效性,特将此方法与区域生长法(Region Growing,下文简称RG)和模糊C均值法(Fuzzy C Means,下文简称FCM)的结果进行比较。
在使用区域生长法得出分割图像的时候,首先请医生帮忙在最有可能出现肿瘤的地方设置种子点,然后运行算法得到分割图像;在使用模糊C均值法分割图像时,为方便实验将聚类类别设置为2 ,收敛系数设置为0.000 1。
实验结果如图3所示。
图3 3种方法分割脑瘤结果对比图
其中,A列是医院提供的原始MRI图像;B列是由区域生长法产生的图像;C列是由模糊C均值法生成的图像;D列是对抗法生成的图像;E列是由专家提供的金标准。
从图3的结果来看使用区域生长法分割图像时,当图像灰度值变化不大时效果较好,一旦肿瘤质地不均匀效果就不好;使用模糊C均值法分割图像时,当肿瘤与背景区别不大时效果欠佳。使用对抗法分割出来的图像比前面两种都要全,细节把握的也比较理想。
2.3 定量分析
经过上述的实验后,发现单纯使用传统方式分割图像,未必得到满意的效果,究竟传统方法和对抗法得到的分割图与金标准谁更相似,特用以下几个评价指标对这些图像进行客观评价,即将区域生长法RG[4]、模糊C均值法FCM[5]和对抗法(GAN)分割出来的图像与金标准相比较。这几个标准分别是:峰值性噪比PSNR(Peak Signal-to-Noise Ratio)、结构相似性SSIM(Structural Similarity Index)及COSIN相似度(余弦相似度)。评价结果如表3所示。
表3 三种方法结果评价表(广东某大医院提供数据)
其中,PSNR 是使用最广泛最普遍的一种图像客观评价指标,它是基于对应像素点间的误差,即基于误差敏感的图像质量评价。PSNR值越大,图像越接近。第二个尺度是SSIM,它用于评估两张图片整体上的相似性。具体而言,SSIM分别从亮度、对比度和结构3方面度量图像的相似性,取值范围为[0,1],值越大相似性越高。第三个尺度是COSIN,它通过测量两个向量夹角的余弦值来度量不同图像之间的相似性,取值范围为[-1,1],值越大相似性越高。从表3数据可以看出,对抗法优于区域生长法和模糊C均值法。
3 总结
预处理是对抗法重要的一步,它保证了图像分割的质量。对抗法将GAN网络与ResUnet网络融合。GAN的特点可以保持图像较高分辨率,ResUnet网络具有跳过若干层再连接的特点,这一特点不仅简化了训练,而且简化了整个神经网络,大幅度减少了计算量。通过实验和数据验证,对抗法相对于传统分割算法有一定的先进性。