APP下载

低剂量CT图像去噪的改进型残差编解码网络

2019-09-04章云港杨剑锋易本顺

上海交通大学学报 2019年8期
关键词:空洞复杂度残差

章云港, 杨剑锋, 易本顺

(武汉大学 电子信息学院, 武汉 430072)

经过数十年的发展,CT技术已被广泛应用于医学诊断中.然而,CT扫描产生的高剂量辐射会对病人的健康产生新的威胁,因此,低剂量CT成为了当前医学成像领域的重要研究方向[1].而当辐射剂量降低时,探测器接收到的光子数也随之减少,因此容易受到统计波动的影响,导致由投影数据重建出的CT图像带有明显的噪声与条纹伪影[2].目前,研究者针对这些问题所提出的去噪算法主要包括投影域去噪算法、图像重建算法以及图像域去噪算法三大类.

投影域去噪算法[3-6]与图像重建算法[7-8]都依赖于投影数据,可充分利用噪声在投影域服从泊松分布的特性[9].但在实际应用中,投影数据作为CT扫描仪的中间结果,通常难以被一般用户直接获取.图像域去噪算法可以直接对重建后的CT图像进行去噪而不依赖于原始的投影数据,因此成为目前低剂量CT去噪领域的研究热点.文献[10]提出一种基于小波域内统计建模的低剂量CT图像去噪方法;文献[11]和文献[12]分别利用改进的三维块匹配滤波算法和非局部平均算法对低剂量CT图像进行去噪;文献[13]通过字典学习与稀疏表示的方法去除低剂量CT图像噪声.由于图像域中的噪声统计特性复杂且可能伴随着伪影,所以传统的图像域去噪方法在抑制噪声与伪影的同时难以有效保留边缘与细节信息.

近年来,深度学习与图像处理的结合越来越紧密.在图像处理中,最常用的深度学习模型是卷积神经网络.该网络具有强大的特征学习与映射能力,因此在去除低剂量CT图像的复杂噪声时比传统方法更有优势.文献[14]将SRCNN[15]应用于低剂量CT图像去噪,和传统方法相比,其主观效果与客观指标均有所改善.文献[16]在文献[14]的基础上做了更为详尽的实验与分析,充分显示了卷积神经网络应用于低剂量CT图像去噪时相较于传统方法的优越性.文献[17]进一步提出一种基于残差编解码结构的卷积神经网络(Residual Encoder-Decoder Con-volutional Neural Network, RED-CNN),其实验结果表明,RED-CNN不仅在主观效果上,而且在峰值信噪比(Peak Signal to Noise Ratio, PSNR)与结构相似性(Structural Similarity, SSIM)等客观指标上优于传统方法.尽管RED-CNN在低剂量CT图像去噪效果上达到了目前较先进的水平,但其网络复杂度较高且运算耗时较长.本文提出一种改进型的残差编解码网络,与RED-CNN相比,在大幅降低了网络复杂度的同时,提升了去噪效果.

1 用于低剂量CT图像去噪的残差编解码网络

1.1 原始的残差编解码网络

文献[17]中提出的RED-CNN网络结构如图1所示,其中:Conv为卷积层;Deconv为反卷积层;ReLU为修正线性单元[18];记k为卷积核尺寸,n为输出特征图数量,所以k5n96表示卷积核大小为5像素×5像素且输出特征图数量为96,以此类推.

Conv—卷积层,Deconv—反卷积层,ReLU—修正线性单元图1 RED-CNN网络结构图Fig.1 Network architecture of RED-CNN

由于学习残差比直接学习端到端映射容易[19],所以RED-CNN在对应的卷积层与反卷积层之间加入了短连接来学习残差.网络输入是带噪的CT图像,输出是去噪的CT图像.从输入到输出之间分别有5个卷积层和反卷积层,连续的卷积层、反卷积层可以看作“编码”、“解码”的过程.网络中所有卷积层与反卷积层的卷积核大小为5像素×5像素,每个隐层的特征图数量为96.

1.2 改进的残差编解码网络

用于低剂量CT图像去噪时,RED-CNN虽然可取得较好的效果,但其网络复杂度较高.本文对RED-CNN进行了改进,改进后的网络结构如图2所示,其中:BN为批量归一化(Batch Normalization, BN)[20]层;记d为空洞卷积(Dilated Convolution)的空洞步长.新的网络在降低复杂度的同时,提升了去噪效果.下文将从3个方面详述对RED-CNN网络隐层中的4个卷积层与4个反卷积层的改进.

(1) 引入批量归一化:深度神经网络的不断加深使得网络的训练以及调参变得愈加困难.对此,研究者提出了许多解决方法,批量归一化是其中比较有代表性的方法之一.它通常作用于网络中的非线性映射单元之前,通过改变激活输入值的分布,使得激活输入值落在非线性函数对输入比较敏感的区域,以避免梯度消失的问题.该方法具有加快收敛速度、提高网络性能、对权重初始化不敏感等优点.本文将批量归一化引入RED-CNN中,即每个卷积层与反卷积层都紧接一个批量归一化层.

(2) 用空洞卷积替换普通卷积:在图像去噪中,像素点重建所依赖的上下文信息越丰富,去噪效果越好.对于卷积神经网络,上下文信息的获取范围可以用输出图像中某个像素点对应于输入图像中的区域,即感受野来衡量.空洞卷积的原理如图3所示,其中(a)、(b)、(c)图的空洞步长分别为1、2、3.显然,在不改变卷积核参数的情况下使用空洞卷积可以增大感受野;而在保持感受野不变的情况下使用空洞卷积可以减少卷积核参数.本文将每个卷积核的尺寸设为3像素×3像素,并且按顺序分别使用空洞步长为1、2、2、3的空洞卷积,即它们的实际尺寸分别为3像素×3像素、5像素×5像素、5像素×5像素以及7像素×7像素,每个反卷积核的尺寸与对称位置上的卷积核尺寸相同.与原始的RED-CNN相比,采用此网络的感受野不变,但卷积核与反卷积核的参数减少.

Conv—卷积层,Deconv—反卷积层,ReLU—修正线性单元,BN—批量归一化层图2 改进型RED-CNN网络结构图Fig.2 Network architecture of improved RED-CNN

图3 空洞卷积示意图Fig.3 Schematic diagram of dilated convolution

(3) 优化隐层的特征图数量:RED-CNN将每个隐层的特征图数量均设为96,而本文改进的网络特征图数量则随着“编码”的过程逐渐减少,随着“解码”的过程逐渐增加.从图2中可以看出,隐层特征图数量依次为96、80、80、64、80、80、96以及96.

2 实验仿真

使用CPU为Intel Core i7-6850K的计算机进行实验仿真;使用型号为Nvidia GeForce GTX 1080 Ti的GPU进行加速计算.在软件配置方面,使用Ubuntu 16.04 操作系统,基于Caffe[21]进行神经网络的训练并在MATLAB R2015b上进行测试.

2.1 训练

TCIA(The Cancer Imaging Archive)是一个包含常见肿瘤医学图像及相应临床信息的大规模公用数据库,本文从中选取了200幅人体不同部位、尺寸为512像素×512像素的CT图像作为训练数据.模拟低剂量CT图像的方法是对原始图像做投影变换,并在投影域中加入泊松噪声,再通过FBP算法重建出CT图像.开始训练前,使用尺寸为55像素×55像素的滑动窗,以8为滑动间隔,将带噪CT图像及其对应的无噪CT图像分割为一系列图像块并进行旋转、翻转的数据增强处理来扩充训练数据集,训练网络时将这些图像块作为输入.网络中的权重均采用均值为0,标准差为 0.01 的高斯分布初始化,偏置均初始化为0.网络损失层的损失函数为欧氏距离:

(1)

式中:L为损失值;N为网络进行一次迭代训练输入的图像块数量,本文实验中取N=128;Yi为第i幅输入的低剂量CT图像块;f(Yi)为网络的输出;Xi为对应的正常剂量CT图像块.对损失函数采用Adam算法[22]进行优化,初始学习率设为10-3,并随着训练的进行逐渐下降至10-5.

2.2 主观效果

将随机选自TCIA数据集的10张图作为测试图,且不与训练用的200张图片重复,如图4所示.图5从左至右分别为图4中第⑤、第⑦幅测试图的原图、低剂量图、RED-CNN去噪图和本文改进网络去噪图.

可以看出,RED-CNN与本文改进的网络在去噪后的主观效果上非常相似,都能够较好地去除噪声与伪影.图6是图5中红色方框区域的放大图.可以看出,相比RED-CNN,本文改进的网络能更好地保留图像的边缘细节,如箭头所指,原图中有明显的边缘分界线,RED-CNN去噪图中的边缘模糊不清,而本文改进网络去噪图中的边缘则较为清晰.

图4 测试图Fig.4 Test images

图6 图5中红色方框区域放大图Fig.6 Zoomed parts over the region marked by the red box in the Fig.5

2.3 客观指标

本文采用PSNR与SSIM作为去噪效果的客观评价指标对图4中的10幅图进行测试,具体结果见表1.

可以看出,本文改进的网络在大部分测试图的客观指标优于RED-CNN,仅在少数测试图上略微落后于RED-CNN.观察所有测试图的平均值,相比RED-CNN,改进网络的PSNR值提升了 0.36 dB, SSIM值提升了 0.001 2,因此具有一定的去噪改进效果.

表1 所有测试图的客观评价指标Tab.1 Objective index of all the test images

2.4 复杂度

本文所述网络复杂度C的计算公式为

(2)

式中:nl为网络第l层输出的特征图数量;fl为网络第l层的卷积核大小.复杂度C能近似表示网络中参数的数量.另外,计算耗时的测试方法为:在MATLAB上调用Caffe的forward函数,对图4中的10幅测试图分别做正向传播并计算其平均耗时.RED-CNN以及本文改进网络的复杂度与计算耗时对比如表2所示.

可以看出,相比于RED-CNN,本文改进的网络降低了约72%的复杂度,同时降低了约一半的计算耗时,明显提高了计算速度.

表2 复杂度与计算耗时对比Tab.2 Comparison of complexity and time for calculation

2.5 网络结构的影响

本文通过批量归一化、空洞卷积以及特征图数量优化的方法对RED-CNN进行改进.为了验证这些方法的提升网络去噪效果,本小节对图2所示的网络分别进行调整并对比各项评价指标的变化,实验结果如表3所示.表中所述的调整仅针对网络中部的8个隐层,即不包括第一个卷积层与最后一个反卷积层.特征图数量结构P-Q-P表示特征图数量依次设为96、P、P、Q、P、P、96、96.从表中可以看出:(1)删去批量归一化层后,虽然计算耗时有所减少,但网络去噪效果明显下降;(2)空洞卷积通过增大感受野有效提高了网络的去噪效果;(3)当特征图数量结构设为96-96-96或72-48-72时,网络的去噪效果下降.综上所述,本文改进的网络已在降低复杂度和提高去噪效果之间达到了较好的平衡.

表3 网络结构调整对性能的影响对比Tab.3 Impact of network architecture changes on performance

3 结语

针对传统去噪方法难以有效去除低剂量CT图像复杂噪声的问题,本文对RED-CNN的网络结构进行了改进,提出一种改进型的残差编解码网络.改进措施主要包括:(1) 引入了批量归一化层;(2) 使用了空洞卷积;(3) 优化了隐层特征图数量.改进后的网络复杂度降低了72%且主客观去噪效果均有所提高,其中平均PSNR提高了约 0.36 dB,SSIM提高了约 0.001 2.

猜你喜欢

空洞复杂度残差
基于双向GRU与残差拟合的车辆跟驰建模
锻造过程中大截面塑料模具钢中空洞缺陷的闭合行为
基于残差学习的自适应无人机目标跟踪算法
如何避免想象作文空洞无“精神”
基于递归残差网络的图像超分辨率重建
一种低复杂度的惯性/GNSS矢量深组合方法
求图上广探树的时间复杂度
空洞的眼神
某雷达导51 头中心控制软件圈复杂度分析与改进
综合电离层残差和超宽巷探测和修复北斗周跳