基于ResUnet对抗网络的脑瘤图像分割方法

2021-07-29罗耀

微型电脑应用 2021年7期

罗耀

(广东机电职业技术学院计算机与设计学院，广东广州 510550)

0 引言

将脑瘤从图像中分离出来是图像医学和人工智能医学的重要分支。脑瘤可以分布在大脑的任意区域，几乎可以变成任意大小和形状，使得人工分割的时候容易产生误差。同时，由于病人人数激增，产生大量亟待处理的磁共振成像MRI(Magnetic Resonance Imaging)等影像资料。为提高效率和准确率，同时减轻工作人员的工作负担和工作压力，使用计算机技术设计一款辅助软件分担他们的工作是非常必要的。

随着计算机科学的发展，机器学习成为医学图像分割的重要研究方向。从监督的角度看，这些机器学习分割方法可分为：非监督学习方法、半监督学习方法和监督学习方法。非监督学习方法属于传统方法，按照原理大致分为：基于阈值的方法、基于区域的方法、基于像素的方法和基于形态学的方法。优点是简单，计算速度快，对算力要求不高，对样本数的要求也不高。缺点是不太准确。监督学习方法的方法众多，从复杂性和可解释性来分，有比较简单并容易解释的svm，rf和crf等方法，也有较复杂的不易解释神经网络[1]等方法。较非监督学习方法来说，监督学习方法较准确，缺点是所用样本较多，对算力的要求较高，计算速度也较慢。半监督学习方法则需要在以上二者之间进行权衡，努力寻找优缺点间的平衡点。

基于ResUnet对抗网络的脑瘤图像分割方法(以下简称对抗法)为了保证准确率采用监督学习的方法，融合了ResUnet和对抗网络的技术，为进一步提高准确率使用混合滤波器对输入图像进行预处理。

1 方法描述

对抗法由两部分组成，一部分是预处理部分，另一部分是对抗网络。其中对抗网络分为生成器和判别器[2-3]，生成器中内嵌ResUnet。

1.1 预处理

通过预处理可以对图像起到去噪、去冗余以及增强的作用。通过对比度受限的自适应直方图均衡化(CLAHE)、高斯滤波与Gabor滤波相结合进行预处理可以获得比较好的预处理效果。直方图均衡化能比较好地突出图像的细节，但是可能使得图像对比度严重失真。通过使用CLAHE，提高图像的局部对比度，起到了增强图像的作用，同时避免因过度调整对比度造成的图像失真。为尽可能去除更多的噪音，采用二维旋转高斯滤波的方法，以水平方向为起点，每旋转10度做一次高斯滤波。高斯滤波器在去除噪音的同时也使得图像变得模糊，特别是图像的边界变得模糊。为了使得图像中的边界变得清晰，使用了Gabor滤波器。Gabor滤波器利用Gabor小波对纹理和边缘较高敏感性，突出图像中的边缘。具体细节如图1所示。

图1 预处理图

1.2 网络结构

对抗法目标是实现像素到像素的直接输出。脑部磁共振图像MRI经预处理后进入生成器。内嵌于生成器的ResUnet分成编码器(encoder)和解码器(decoder)，如图2所示。

图2 对抗法结构图

编码器各模块处理过程中，首先使用自然分布的方法对输入数据进行归一化处理(BN)，在激活层中使用relu函数抑制或激活部分信号。在卷积层中，使用VGGNet卷积网络处理图像，一张磁共振图像有 512×512 个像素点，在dicom文件中每个像素由2字节表示，图像中每个像素都是整数，由于图片为单通道，画图渲染出来为黑白图。按照VGGNet的思想使用多个较小卷积核(3×3)的卷积层代替一个卷积核较大的卷积层，一方面可以减少参数，另一方面可以增加网络的拟合能力。编码器各模块结构，按从上至下编号,如表1所示。

表1 编码器结构表

在解码器中，反卷积层是stride为2的卷积的逆运算，它可以将图像扩大一倍。连接层将对应层的图像连接融合在一起，起到降低计算量的作用。解码器各模块结构,按从下至上编号,如表2所示。

表2 解码器结构表

由解码器输出的图像和按金标准分割的图像在判别器中进行比较，当判别器不能分辨金标准分割图与编码器输出图的区别时训练结束，否则不断优化生成器，同时判别器不断进化提高自己的判别能力。

ResUnet是Unet和残缺网络的结合体。对于一个给定的图像Imagei,经过网络模块处理后得到目标值为Yi，设网络参数为Net，图像Imagei经过网络后的实际值为F(Imagei;Net)。由此可以给出网络的损失函数如式(1)。

(1)

1.3 网络训练

对抗法属于监督式学习，以金标准作为标签来调整整个网络的参数，以便网络在训练过程中快速收敛，从而达到获得病灶图像的目的。网络主体采用GAN模型，训练网络的过程是一个对抗博弈的过程。

首先以判别器的损失函数为指引，采用动量随机梯度下降算法和反馈算法先训练判别器。训练判别器时，先将生成器的权值参数固定，优化判别器D的过程就是最小化交叉熵的过程，其损失函数如式(2)。

(2)

其中，Pdata(x)为x的概率分布函数；Pz(z)(噪声分布)为z的概率分布函数;E(·)为数学期望。将式(2)整理成连续空间上的表达式，如式(3)。

(3)

给定生成器G，最小化表达式(3)，目标函数LOSTD(θD,θG)在D(x)取以下的DG(x)值时得到最小值，如式(4)。

(4)

判别器的目标是，当数据来源于真实数据时，判别器的输出值即D(x)趋近于1，当数据来源于生成器生成的数据G(z)时，判别器的输出值即D(G(z))趋近于零。

判别器训练好后固定判别器，训练生成器。判别器和生成器之间是一个零合博弈的过程，他们的损失函数互为相反数。判别器内嵌了一个ResUnet,所以判别器的优化过程也是一个ResUnet的优化过程。优化过程通过采用梯度下降的方法使得式(1)中的损失函数值LOST(Net)达到最小值，并求得当损失函数达到最小值的时候网络参数Net的值。

就整体而言，整个网络的优化问题就是一个极小化生成器极大化判别器的问题，GAN网络的目标函数为式(5)。

(5)

2 实验

验证对抗法可行性的程序用Python语言编写完成。

2.1 数据集

验证过程所使用的数据集是由广东某大医院提供的胶质脑损伤的MRI图像。此数据集收录了49个病患的病例，每个病例中包含若干个切片图像，总共1 127个切片图像。每个病例都由专业医生对肿瘤部位进行了标注。为了进行精确标注，数据集使用二进制的mask图形进行标注，每张切片图像的大小为512×512个像素。

2.2 实验过程

为验证对抗法在MRI图像上分割脑瘤的有效性，特将此方法与区域生长法(Region Growing，下文简称RG)和模糊C均值法(Fuzzy C Means，下文简称FCM)的结果进行比较。

在使用区域生长法得出分割图像的时候，首先请医生帮忙在最有可能出现肿瘤的地方设置种子点，然后运行算法得到分割图像；在使用模糊C均值法分割图像时，为方便实验将聚类类别设置为2 ，收敛系数设置为0.000 1。

实验结果如图3所示。

图3 3种方法分割脑瘤结果对比图

其中,A列是医院提供的原始MRI图像;B列是由区域生长法产生的图像;C列是由模糊C均值法生成的图像;D列是对抗法生成的图像;E列是由专家提供的金标准。

从图3的结果来看使用区域生长法分割图像时，当图像灰度值变化不大时效果较好，一旦肿瘤质地不均匀效果就不好；使用模糊C均值法分割图像时，当肿瘤与背景区别不大时效果欠佳。使用对抗法分割出来的图像比前面两种都要全，细节把握的也比较理想。

2.3 定量分析

经过上述的实验后，发现单纯使用传统方式分割图像，未必得到满意的效果，究竟传统方法和对抗法得到的分割图与金标准谁更相似，特用以下几个评价指标对这些图像进行客观评价，即将区域生长法RG[4]、模糊C均值法FCM[5]和对抗法(GAN)分割出来的图像与金标准相比较。这几个标准分别是：峰值性噪比PSNR(Peak Signal-to-Noise Ratio)、结构相似性SSIM(Structural Similarity Index)及COSIN相似度(余弦相似度)。评价结果如表3所示。

表3 三种方法结果评价表(广东某大医院提供数据)

其中，PSNR 是使用最广泛最普遍的一种图像客观评价指标，它是基于对应像素点间的误差，即基于误差敏感的图像质量评价。PSNR值越大，图像越接近。第二个尺度是SSIM，它用于评估两张图片整体上的相似性。具体而言，SSIM分别从亮度、对比度和结构3方面度量图像的相似性，取值范围为[0，1]，值越大相似性越高。第三个尺度是COSIN，它通过测量两个向量夹角的余弦值来度量不同图像之间的相似性，取值范围为[-1，1]，值越大相似性越高。从表3数据可以看出，对抗法优于区域生长法和模糊C均值法。

3 总结

预处理是对抗法重要的一步，它保证了图像分割的质量。对抗法将GAN网络与ResUnet网络融合。GAN的特点可以保持图像较高分辨率，ResUnet网络具有跳过若干层再连接的特点，这一特点不仅简化了训练，而且简化了整个神经网络，大幅度减少了计算量。通过实验和数据验证，对抗法相对于传统分割算法有一定的先进性。