APP下载

面向临床需求的CT图像降噪综述

2021-02-12蒲晓蓉黄佳欣刘军池孙家瑜罗纪翔赵越陈柯成任亚洲

数据与计算发展前沿 2021年6期
关键词:卷积噪声医学

蒲晓蓉,黄佳欣,刘军池,孙家瑜,罗纪翔,赵越,陈柯成,任亚洲

1.电子科技大学,计算机科学与工程学院,大数据研究中心,四川 成都 611731

2.四川大学华西医院,四川 成都 610044

引 言

党的十八届五中全会提出《“健康中国2030”规划纲要》,着力推进健康中国建设,提高人民生活水平。“十四五”规划纲要突出“全面推进健康中国建设”,强调科技创新要面向人民生命健康,指出新一代人工智能技术要原创性引领临床医学和健康领域的应用。目前,计算机视觉和人工智能技术已对诸多领域产生了巨大影响。在医疗健康领域,医学图像智能分析一直是医工交叉融合的热点和难点之一,其中涵盖医学图像质量优化、分割、检测和识别等关键问题。医疗设备和操作环境等产生复杂的噪声因为降低医学图像质量、影响临床诊断,已成为医学影像诊断的痛点和医学图像研究的焦点之一。

医学影像诊断已成为现代临床医学不可或缺的手段。作为最常见的医学影像,计算机断层扫描 (Computerized Tomography, CT)是一种无需开刀就能生成不重叠的轴向切片图像的医学影像技术[1],相比磁共振成像 (Magnetic Resonance Imaging, MRI)和正子发射断层扫描 (Positron Emission Tomography, PET),CT 因其扫描速度快且成像清晰等优势,广泛应用于常规体检、疾病诊断、术后评估等各环节。CT 利用X 线束对人体某些部位进行断层扫描。理论上,X 线在均匀介质中的衰减系数服从指数规律。但是,人体器官或组织具有复杂的物质成分和不同的密度,当X 线穿透人体器官或组织时,各点对X线的衰减系数(吸收系数)是不同的。CT 成像将各体素的衰减系数的二维分布转换为图像的灰度分 布[2]。CT成像对人体扫描过程中,涉及光电信号转换、输入计算机处理前的模数转换(Analog to Digital Conversion, ADC)以及将存储于计算机中的数字矩阵转换成像素点的数模转换(Digital to Analog Conversion, DAC)等复杂处理,通常因硬件设备、操作者、被检查者或环境等各种因素,产生复杂噪声,降低CT 图像质量[3]。其中光电转换和数模转换过程产生的电子噪声是不可避免且无法消除的[4]。因而,CT 图像降噪一直都是医学图像处理的研究热点和重点之一。然而,现有绝大多数研究将CT 图像的噪声人为假设为高斯白噪声、泊松噪声或两者混合噪声,这类简单假设的噪声与临床应用的实际场景和需求严重不符。此外,如何科学评价医学图像的质量,目前也缺乏规范、公认的评价机制。大多数研究采用自然图像降噪的评价指标,即峰值信噪比、结构相似度和均方根误差等。事实上,医学影像诊断重点关注病灶的位置、大小、密度、形态等重要特征,与自然图像降噪评价指标差异甚大。因此,需要研究面向临床实际需求的医学图像质量优化方法和评价机制。

本文立足临床医学的实际需求,综述CT 图像的降噪技术,重点分析了低剂量CT (Low-dose Computed Tomography, LDCT)[5]图像降噪的主流方法,特别是深度学习方法。本文强调CT 图像降噪和效果评价必须面向临床的实际需求,重点分析了LDCT 图像降噪的最新方法及效果评价机制。

1 CT 图像降噪研究现状

CT 的广泛普及和应用给医疗诊断带来福音的同时,其辐射剂量问题也越来越受到各方关注。有研究表明,大剂量χ 和γ 射线会危害病人和医生的身体健康,甚至可能增加诱发癌症和某些遗传疾病的风险。20 世纪90年代,随着LDCT 技术的出现,一些国家先后推行LDCT 肺癌筛查,已成为近30 余年来肺癌筛查领域的应用热点。尽管目前LDCT 肺癌筛查依然存在诸多问题,但是国际上已认同其在肺癌高危人群中的积极作用[6]。Guo 等人[7]研究表明,LDCT 在COVID-19 流行期间,尤其是在早期阶段有着重要作用,同时该研究表明LDCT 对疾病诊断、严重性定量等非常敏感。

与临床常规剂量扫描的正常剂量CT (Normal-Dose Computerized Tomography, NDCT)相比,LDCT 能减少辐射剂量、降低对人体的危害,但较小的X 射线电通量导致LDCT 图像包含复杂的噪声(如白色噪声点)以及块状和蜡状的伪影(如图1 所示),这些噪声和伪影严重时会掩盖图像中病灶的纹理或结构细节,影响临床诊断的准确性[8]。可见,LDCT图像降噪研究具有深远的价值和应用潜质。

图1 LDCT-and-Projection-data 数据集[52]中C002 患者的263 号成对的NDCT 和LDCT 切片图像。用BM3D(Block matching 3D)和RED-CNN(Residual Encoder-Decoder CNN)两种方法分别作为传统方法和深度学习方法的代表,通过红色虚线框中的两个黄色感兴趣区域(Region of Interest, ROI)对比降噪结果:(a)NDCT 图像;(b)LDCT 图像;(c)利用BM3D 的降噪结果;(d)利用RED-CNN 的降噪结果。Fig.1 No.263 paired NDCT and LDCT slice images of patient C002 from the LDCT-and Projection-data data set [52].Two methods, BM3D and RED-CNN, are selected as the representatives of traditional methods and deep learning methods, respectively.The noise reduction results are compared through the two yellow ROI regions in the red dashed box: (a) NDCT; (b) LDCT; (c) The result of noise reduction using BM3D; (d) The result of noise reduction using RED-CNN.

下面主要介绍LDCT 图像降噪的传统方法,基于卷积神经网络(Convolutional Neural Networks, CNN)和生成对抗网络(Generative Adversarial Networks, GAN)的深度学习方法。重点介绍经典方法的网络结构、不同方法之间的差异及其优缺点,讨论降噪过程中产生伪影以及降噪后的过渡平滑、细节丢失等问题和应对策略。

1.1 传统低剂量CT 图像降噪方法

传统CT 图像降噪一般基于数字信号处理相关技术,主要分为三大类:

(1)正弦滤波技术(Sinogram Filtering-Based Techniques)。该方法直接作用于CT 重构前的投影数据[9],因其可以获取噪声的先验信息,故降噪效果较好、计算效率较高。然而,该方法可能导致CT图像结构信息的丢失和分辨率降低[10]。而且,由于其严重依赖投影数据,若CT 图像的投影数据难以获取,则无法使用[11]。

(2)迭代重构(Iterative Reconstruction)。过去十多年,基于迭代重构算法进行LDCT 图像降噪一直保持较高的热度[12]。该类方法将正弦滤波的统计特性、图像域的先验信息和成像系统的参数等合成到目标函数,如总变差(Total Variation, TV)[13]、非局部均值(Nonlocal Means)[14]、字典学习(Dictionary Learning)[15]、低秩(Low-rank)[16]等。此类方法总体降噪效果较好,但是大多数现代CT 扫描仪用红外技术取代了滤波反投影(Filtered-back Projection, FBP)的图像重建技术,以减少辐射。由此也引起设备的参数改变,而这些参数往往由CT 仪器厂商独家掌握,直接影响迭代重构算法的应用和降噪效果。此外,迭代重构方法的计算太耗时,也制约其应用。

(3)图像域降噪技术(Image Space Denoising Techniques)。该类方法直接作用于重构后的CT 图像,因此无论采用何种CT 设备采集数据,都可以使用该方法进行降噪,泛用性能较好。常见方法如非局部均值滤波器(Non-Local Means Filter)[17]和三维块匹配算法(Block Matching 3D, BM3D)[18]等。然而,上述方法存在图像边界模糊和分辨率损失等问题。

1.2 基于深度学习的LDCT 图像降噪方法

1.2.1 基于卷积神经网络CNN 的LDCT 图像降噪

卷积神经网络是目前深度学习领域中应用最广泛的神经网络之一,在图像分割和检测等方面效果显著。不同于自然图像中的噪声,LDCT 图像的噪声统计特征无法轻易在图像域中获取,导致中值滤波等传统信号处理方法的降噪效果较差。因此,在2017年Chen 等 人[19]将CNN 用于LDCT 图像降噪,提出在该基于深度学习的LDCT 降噪方法中学习的过程依赖于训练数据集,而非假设的噪声分布。该研究将图像降噪分为三步(每步都采用卷积运算),首先进行分块编码,利用不同卷积核将图像块编码成稀疏表示,然后利用非线性滤波对稀疏表示(N 维特征向量)进行过滤,最后将处理后的块加权合并重建,获得最终的降噪图像。这种早期基于CNN 的LDCT 图像降噪研究,是深度学习方法用于LDCT 图像降噪的有益尝试,尽管所用CNN 架构比较基础,且降噪思路相对简单,但其研究成果证明了深度学习在CT 图像降噪方面的潜力。

同年,Chen 等人[20]又结合自编码器、反卷积网络和残差连接提出RED-CNN(Residual Encoder-Decoder Convolutional Neural Network)。自编码器(Auto Encoder, AE)在图像降噪中的最初应用是对噪声输入进行非监督学习,AE 与CNN 结合可提升CT 图像降噪效果[21]。RED-CNN 同时使用了卷积和反卷积层,并在对应的卷积层和反卷积层之间添加了残差连接,以提高学习效率。相比于文献[22],为了限制残差学习的正性约束,RED-CNN 删除了残差求和前的线性整流函数(Rectified Linear Unit, ReLU)层。RED-CNN 包含5 个卷积层和5 个对称的反卷积层,每一层都采用ReLU 函数。RED-CNN中的关键元素包括:(1)块提取。在成对的LDCT和NDCT 图像中提取重叠块,作为对应的网络输入。(2)堆叠编码器。RED-CNN 使用一个全连接的卷积层链作为堆叠编码器,用于抑制图像噪声和伪影,并去掉池化层,以最大程度地保留所提取块的细节。(3)堆叠解码器。采用链式全连接反卷积层组成堆叠解码器,用以重构图像。(4)残差补偿。采用残差补偿机制,在反卷积的输出中叠加原图像。相比之前单一的CNN 架构,RED-CNN 不仅可以避免训练过程中的梯度爆炸问题,增加训练过程的稳定性,还可以提升图像恢复的精度,保留更多细节信息。RED-CNN 分别在开源模拟数据集NBIA (National Biomedical Imaging Archive)[20]和真实临床数据集[23](the 2016 NIH-AAPM-Mayo Clinic Low Dose CT Grand Challenge)上取得了较显著的效果。尽管后续呈现出更多改进方法,但RED-CNN 在LDCT图像降噪方面的启示和影响是非常显著的。

大多数深度学习模型都采用均方误差(Mean Squared Error, MSE)作为损失函数,能使降噪后图像的峰值信噪比(Peak Signal to Noise Ratio, PSNR)较好,但往往过度平滑。2017年Yang 等人[24]提出感知损失(Perceptual Loss, PL)卷积神经网络,在特征空间中将降噪结果的感知特征与原图像的感知特征进行比较,可以显著提升降噪效果,并最大程度地保留纹理细节。该网络主要由两部分组成:(1)CNN 降噪网络。该网络包含8 个卷积层,前7 个卷积层分别使用32 个3×3 的卷积核和ReLU 激活函数,并用一个3×3 的卷积核作为输出层。(2)感知损失计算器。利用一个预训练好的VGG(Visual Geometry Group)网络[25]作为感知损失计算器,将降噪结果和无噪声图像输入VGG 网络,计算感知损失,并将重建损失反向传播给CNN 降噪网络,同时更新CNN的权重(VGG网络的权重不变)。实验表明,相较于对抗损失(Adversarial Loss),使用感知损失能更有效地保留图像的细节和纹理特征。后续有研究将两者结合起来,同时作为模型的损失函数对网络进行约束优化,但没有获得显著的改进效果。

表1 总结了2018-2021年基于CNN 的LDCT 图像降噪主流方法,并比较了图像质量优化评价指标。不难发现,早期大多数基于CNN 的LDCT 图像降噪方法主要聚焦网络架构设计和目标函数优化,前者涉及CNN 的复杂度,后者影响CNN 的训练精度,二者共同提升CNN 的特征学习和映射能力,获得较显著的降噪效果。然而,CNN 的学习能力受限于训练数据集、硬件配置以及运行时间等多种因素,只有在数据集足够大、网络层数足够深、迭代次数足够多的情况下才能取得较好的降噪效果[26]。真实临床场景中,很难获得足够多的成对LDCT 和NDCT图像,难以满足CNN 训练所需的大样本对数据集。

表1 2018-2021年基于CNN 的LDCT 图像降噪主流方法(表中PSNR 为峰值信噪比,SSIM 为结构相似度,RMSE 为均方根误差,三者均为常用的CT 图像评价指标)。Table 1 Summary of representative CNN-Based LDCT image denoising methods between 2018-2021(In the table, PSNR is the peak signal-to-noise ratio, SSIM is the structural similarity, and RMSE is the root mean square error, which are commonly used in CT image evaluation).

1.2.2 基于生成对抗网络GAN 的LDCT 图像降噪

为了解决基于CNN 的LDCT 图像降噪因数据集较小可能导致的模型训练不充分、网络欠拟合等问题,2017年Wolterink 等人[38],受风格迁移CNN的启发[39],提出了一种基于GAN 的LDCT 图像降噪模型。GAN 的功能是依据原始输入信息分布和极大似然估计生成指定分布的样本,实现该功能需要两个网络,一个是用于获取输入并将其映射到样本空间的生成网络,另一个是判别网络[40]。这两个网络相辅相成、相互博弈,生成网络学习生成更多逼真样本,判别网络则在训练过程中提升区分生成数据与实际数据的能力。其目的在于,通过两个网络交替训练和相互竞争,使得生成样本与真实数据几乎无法区分,以生成足以骗过判别网络的样本。使生成网络拟合的数据分布与真实数据分布接近,进而达到模拟给定数据分布的目的。

文献[38]借鉴了GAN 的思想,训练一个生成网络用于LDCT 图像降噪,即用生成网络生成降噪后的图像,并训练一个判别器用于区分生成的图像与真实NDCT 图像,再向模型输入一个带噪声的图像,并在输出端给模型没有噪声的图片,让模型通过CNN 学习降噪过程。在生成网络中,噪声被一步步地消除。每次卷积都使噪声信息减小,图像内容的部分细节也可能随之丢失。但判别网络能鉴别图像的“真假”,生成网络最后的输出结果会保留图像的主要内容。

具体而言,该模型中的生成器的输入是一个65×65×19 的矩形体,由七层连续卷积层组成,采用3×3×3 的3D 卷积核[41]。卷积核的数量是递增的,第一层为32 个、中间层为64 个、最后层为128个。其中CNN 生成器的生成结果为预测的噪声图,用输入图像减去得到的预测噪声图便是最终的生成器输出。网络的每一层都使用了Leaky ReLU(Leaky Rectified Linear Unit)函数来提高生成网络的稳定 性[42]。判别器的输入则是一个3D 的51×51×5 矩形体,前两层采用3×3×3 的卷积核,最后层使用Sigmoid 函数输出1(即真实的NDCT 图像)或0(即生成的NDCT 图像)。判别网络的权重使用了文献[43]中初始化的参数。该研究证明了GAN 在LDCT图像降噪领域的可行性,并取得了较满意的效果。但该研究基于传统GAN 模型,训练过程中存在诸多问题。尽管加入了Leaky ReLU 层和批归一化层等优化方法提升网络训练性能,但依然无法解释模型中的生成器和判别器的损失函数的输出是如何影响网络训练的,并且缺乏针对训练过程中生成图像的质量评价方法。

表2 总结了2018-2021年基于GAN 的LDCT图像降噪主流方法。值得关注的是,一方面在降噪方法上,基于GAN 的降噪框架相比传统的CNN 降噪框架在解决训练数据集不充分、网络训练欠拟合问题上有了较大改善,也有研究试图通过优化GAN来提升降噪效果,如Hong 等人[47]采用条件生成对 抗网络(Conditional Generative Adversarial Nets, CGAN), Yang 等人[50]选择WGAN(Wasserstein GAN)来提升模型的降噪效果,但这些方法依然存在泛化性能较差以及特征提取不充分等问题。另一方面,从表1和表2 中不难发现,现有研究的评价指标大多基于客观评价指标,仅少数研究在评价指标中加入了双盲评分,即在医生不了解试验分组、图像结果无参照,仅由研究者来安排和控制全部试验的情况下,让两位及以上的影像科医生对不同的降噪结果进行打分,用以评价降噪效果[49-50]。同时先前的研究中无论是基于CNN 还是基于GAN 的LDCT 图像降噪方法,鲜有学者关注到真实的临床应用场景或医生实际阅片过程中的需求,例如保证CT 图像中的病灶信息不会在降噪过程中被一并去除等。

表2 2018-2021年基于GAN 的LDCT 图像降噪主流方法Table 2 Summary of representative GAN-Based LDCT image denoising methods between 2018-2021

2 面向临床需求的LDCT 图像降噪方法

随着LDCT 在临床的广泛应用,LDCT 图像质量优化日益成为领域研究热点。基于神经网络的LDCT 图像降噪必须依赖LDCT 和NDCT 样本对。然而,由于医学伦理、数据隐私、成像协议等诸多因素,很难获得足够的LDCT 和NDCT 图像样本对。此外,现有LDCT 图像降噪方法几乎都忽略了临床诊断等高阶任务,而追求PSNR、SSIM 等评价指标的提升,很难应用于临床真实场景。

2.1 从LDCT 图像中学习噪声的降噪方法

2020年Chen 等人[51]首次提出基于LDCT 图像学习提取噪声的深度学习框架,用于LDCT 图像降噪。如图2 所示,该框架基于临床LDCT 图像,采用变分自编码器(Variational Autoencoder, VAE),在相对干净的背景中提取学习图像的噪声分布,并与大量开源的NDCT 图像结合,构造LDCT/NDCT样本对数据集。

图2 基于LDCT 图像学习/提取噪声的深度学习框架[51]:首先,从真实LDCT 图像中学习并提取近似噪声,利用编解码器增强噪声;然后将噪声随机添加到NDCT 图像中,获得LDCT/NDCT 伪样本对;最后利用构造的数据集训练基于CNN的降噪网络。Fig.2 Deep learning framework based on LDCT image learning to extract noise [51].The approximate noise samples extracted from real LDCT images are enhanced by an Encoder-Decoder.Then noise is randomly added to NDCT images to obtain paired pseudo LDCT / NDCT images.Finally, the constructed data set is used to train the noise reduction network based on CNN.

2.2 基于协同训练的LDCT 图像降噪

现有LDCT 图像降噪方法大多追求PSNR 和SSIM 等评价指标的提升,而忽略影像诊断等临床高阶任务。2021年Chen 等人[37]提出一种即插即用的医学图像降噪网络LID-Net(Lesion-Inspired Denoising Network)。该方法将图像降噪(低阶任务)与病灶检测(高阶任务)相结合,协同训练LID-Net网络,显著提升了LDCT 图像的降噪性能和病灶检测精度。

该方法主要包含两部分:第一,使用丰富易得的NDCT 图像预训练检测网络,使其可以提取较高精度的ROI;第二,利用ROI 的感知损失,构造联合能量函数和多损失的目标函数,协同训练降噪网络和检测网络,并将目标检测任务的反馈插入到降噪网络。其中,检测网络包括骨干网络ResNet50、区域提议网络RPN 和后续网络。提取的ROI 及其对应的分数由 RPN 获得。根据得分,选择降噪后的CT 图像中有意义的ROI 和相应的NDCT 图像,用于计算感知损失。该网络需要历经多轮交替协同训练,如图3 所示。LID-Net 网络的降噪结果评价指标,既保留了PSNR 和SSIM,还增加了医生的人工盲评,即将医生针对降噪后图像中的病灶进行评价,并将其反馈到降噪网络中,以显著提升图像降噪的说服力和可解释性。

图3 基于协同训练的LDCT 图像降噪框架[37]:降噪网络由一个生成网络和一个判别网络组成,其中生成网络负责对LDCT 图像降噪。检测网络由主干网(ResNet50)、区域建议网(RPN)和后续网络三个网络组成。通过RPN 获得ROI建议和相应的对象分数。根据目标得分,选择降噪后的CT 图像中有意义的前景ROI 和相应的NDCT 图像,以计算感知损失。Fig.3 LDCT image denoising framework based on co-training[37].The denoising networks includes a generator and discriminator.The denoised CT image is produced by the generator.The detection network includes the backbone network (ResNet50), the region proposal network (RPN), and the subsequent network.The ROI proposals and corresponding object scores are obtained by the RPN.According to the object score, the meaningful foreground ROIs in a denoised CT image and corresponding NDCT are selected for the computation of perceptual loss.

3 医学图像质量评价

目前,就图像质量评价而言,医学图像和自然图像的评价机制几乎没有差异。然而,医学影像诊断完全不同于自然图像,前者更注重病灶的细节,如颜色、边缘和密度变化等关键特征。可见,医学图像降噪及其质量评价更复杂和特殊,使得其更具挑战性[52]。

3.1 客观评价方式

目前,图像质量的客观评价方式主要基于峰值信噪比PSNR 和结构相似度SSIM 两种指标。

以CT 图像为例,采用峰值信噪比进行评估时,PSNR 可以定义为:

其中,4095 是HU 值,HU(Hounsfield 单位)是计算机断层扫描中普遍使用的无量纲单位,用于标准、便捷的表达CT 数值[51],MSE 为均方误差。

SSIM 的评价方法是从亮度、对比度以及结构上对两幅图像的相似性进行比较,与自然图像降噪评价指标相同,这里不再赘述。

从临床应用角度看,这两种评价指标存在明显缺陷,且一定程度上与临床医生进行影像诊断时的关注点无关,甚至相悖。其中,SSIM 定义的图像“结构信息”不够准确,无法体现同一图像中不同区域具有不同视觉重要性等特性。因此,有研究完全放弃上述两种评价指标,而采用人工质量评估[53]。

可以将PSNR、SSIM 与图像中的其他特征相结合,获得混合的评价指标。例如,基于梯度方向的图像质量评价方法[54]、使用图像的相位一致性信息和梯度生成局部质量图谱[55]等。除此之外,有研究表明基于噪声功率谱(Noise Power Spectrum,NPS)测量的客观评价方式更为全面,NPS 的评价方式是以傅里叶变换为基础,将信号变换至频域进行测量分析,从而描述重建数据中的噪声频率变化,以此作为指标进行评价。但在面向临床的实际场景中,NPS 测量过程中的信号容易受到0 阶直流信号的影响,不够稳定,虽然能够采用重复扫描同一层面进行图像相减的方法来消除部分直流信号以获取足够纯净的噪声信息,但这样会提高患者的扫描剂量,不符合医学伦理[56]。

此外,现有医学图像质量评价指标缺乏临床应用的可解释性,因为图像的特征或简单的数值计算无法反映真实场景中医生诊断需要的信息。

3.2 主观评价方式

医学图像的普通主观评价没有专门的标准,通常是参考普通图像的主观评价标准,以医生为观察主体根据事先制定的评价尺度或经验,由人的主观感受对待测医学图像的优劣做出评分,然后对评分进行统计学处理,从而得出评价结果[57]。主观评价大体上又可分为绝对评价和相对评价两种。前者是观察者根据事先规定的评价尺度或自己的经验对被评价图像进行质量判断,评价结果表达为绝对评分表达(Mean Opinion Score, MOS);后者是观察者将一批图像由好到坏进行分类,即对图像进行相互对比得出好坏从而进行评价,评价结果表达为差值表达(Difference Mean Opinion Score, DMOS)[52]。医学图像是为临床诊断服务的,所以主观评价方式是较为合理的医学图像质量方法。但主观评价方式虽基于临床诊断,却过度依赖主观经验和专业知识,很难科学量化和实现计算机辅助诊断。

在近几年涌现出的众多针对主观评价方式的研究中,影像组学因其从医学影像中提取和分析大量高通量的高维特征[58],涵盖大小、形状、图像直方图以及描述图像体素之间关系等若干具备一定物理意义的特征,获得越来越多研究者关注。目前,影像组学的高维特征已经被用于肺癌相关病理学模式识别[59],其中使用了三种学习方法分析100 多个特征。有研究结合影像组学进行乳腺癌细胞的良恶性分类[60],其中计算了高通量的364 个特征,包括形状特征、强度统计、灰度共生矩阵、纹理特征和轮廓波纹理特征,量化了肿瘤的形状、硬度和硬度异质性等。影像组学还被用于预测临床治疗效果[61],该研究发现182 例肺癌中的35 个CT 放射学特征是癌细胞转移的重要预测因素,6 个特征是患者存活的预测因素。可见,由于能可靠地刻画医学图像的相关内容,可以将影像组学用于医学图像质量评价。然而,该方法依赖大量成对数据集,在临床实际场景中难以获取,故用于LDCT 图像降噪评价的可信度不高。此外,基于影像组学的图像质量评价,其临床可解释性也比较差。

事实上,现有医学图像质量评价机制都没有充分考虑医学影像的临床诊断目的。不同于自然图像降噪,医学图像降噪应该尽量避免图像外观模糊化,甚至图像细节和纹理特征丢失,特别是病灶区域。单纯的PSNR、SSIM 评价指标往往导致图像过渡平滑,严重影响临床诊断。因此,医学图像质量优化必须考虑影像诊断、分割、病灶勾画等高阶任务。

4 结论与展望

本文综合分析了CT 图像降噪现有主流方法,重点分析了面向临床实际需求的LDCT 图像降噪方法。文章提出,当前CT 图像降噪应该立足临床实际应用需求,并与病灶分割、自动标注、识别分类等高阶任务紧密结合,将医学临床先验知识融入CT 图像降噪过程,实现多任务并行优化。

此外,CT 图像的噪声与扫描剂量大小紧密相关,需要深入研究适应多种剂量的CT 图像质量优化方法。如果能获得CT 扫描的最低剂量及其降噪方法,可以进一步降低现有CT 辐射剂量,最大限度地降低人体的辐射危害。

最后,如何将人工主观盲评指标进行科学量化,或将双盲评价与客观指标进行有机结合,构造面向临床实际应用的、可解释性强的图像质量评价机制,都需要进一步深入研究。

利益冲突声明

所有作者声明不存在利益冲突关系。

猜你喜欢

卷积噪声医学
舰船通信中的噪声消除研究
本刊可直接使用的医学缩略语(二)
基于3D-Winograd的快速卷积算法设计及FPGA实现
医学的进步
预防新型冠状病毒, 你必须知道的事
卷积神经网络的分析与设计
从滤波器理解卷积
汽车制造企业噪声综合治理实践
基于傅里叶域卷积表示的目标跟踪算法
医学、生命科学类