基于深度学习的人工智能在肺结节诊断领域的进展

2020-12-12刘新疆

分子影像学杂志 2020年3期

张俊，侯聪，刘新疆，2

1滨州医学院附属医院放射科，山东滨州 256603；2上海市浦东医院（复旦大学附属浦东医院）放射科，上海201399

肺癌是世界上发病率及死亡率最高的恶性肿瘤之一［1］，全世界每年约有60万的新发肺癌患者。降低肺癌死亡率，最关键的是早期发现及诊断，肺癌的早期多表现为肺内小结节，而CT尤其是薄层高分辨率CT使得肺结节的检出率大大提高。但是薄层高分辨率CT会使影像图像数量增加，从而增加了放射科医师的工作量。由于诊断医师的疲劳以及人为主观性，有可能导致肺结节的漏诊和误诊。近年来，人工智能（AI）发展迅速，为医学图像的自动分析和辅助医生实现疾病的高精度诊断提供了良好的机遇。AI技术是随着大数据的进步而兴起的一门新兴技术，在医学领域中得到广泛应用，尤其在肺结节的检测方面具有较大进展［2］。

基于AI的计算机辅助诊断（CAD）系统可以提高放射科医师的工作效率和肺结节诊断的准确性。当前，深度学习（DL）是AI技术的研究热点，该技术可以有效地完成图像检测、识别和分类等任务。本文总结了DL的模型及其在肺结节领域中的研究进展。

1 AI、机器学习(ML)及DL

“AI”这一概念最初于1956年提出。AI是计算机科学的一个分支，是一门用于研究模仿和拓展人类智能的理论及应用系统的新兴技术类科学。AI技术能够从图像中获得肉眼容易忽视和（或）无法提取的各种信息，从而提高对图像的诊断效能，概括来说，AI代表了机器模仿人类认知功能的能力。

ML是用来定义计算机从数据积累中自动学习的AI领域。机器学习算法随着数据的增加而进化，它们并不是完全基于规则，而是随着经验的进步，学会通过评估大量数据给出具体的答案。在医学中，机器学习指的是一种能够改进和学习识别疾病特征模式的系统。

DL是ML的一个子集，实质是通过构建含大量隐藏层的ML模型。它可以通过海量训练集来学习有价值的特征，从而提升分类或诊断的准确性。DL意味着计算机拥有多层算法，这些算法相互连接，并按重要性分层。这些层从输入中积累数据，并提供输出，一旦AI系统从数据中学习到新的特征，输出就会逐步改变。

ML是AI的一个分支，而DL则是ML的一种。概括来说，AI是使计算机或软件模仿人类学习和解决问题等功能的技术；ML是一种AI技术，在没有明确编程的情况下自动学习与改进；DL是使用多层神经网络算法的ML技术。

2 DL模型及其在肺结节中的应用

DL模型通常分为监督学习和非监督学习两种形式，其中监督学习需要使用带有分类标签的数据，此类模型包括卷积神经网络（CNN）和海量训练人工神经网络（MTANN）；非监督学习则使用无标签数据，此类模型包括自编码器（AE）和深度信念网络（DBN），目前最常用的模型是CNN。

2.1 CNN

CNN是监督学习下的代表性深度学习模型，是端到端机器学习中的一种类型。它的主要构成分为卷积层、池化层和全连接层。卷积层利用特定大小的卷积核对图像卷积，从而学习和提取抽象的、深层次的特征。池化层常被放置在卷积层后，主要作用是对提取到的特征进行压缩和降维，从而减少运算数据量。全连接层则主要将最终获得的特征映射到输出层。应用于肺结节领域的的CNN主要包括二维CNN（2D-CNN）和三维CNN（3D-CNN）以及多流、多尺度的CNN（MMCNN）等。

2D-CNN是最早应用于肺结节的深度网络模型，其不受肺部CT图像层厚的影响，且处理数据速度快，所需资源少。2D-CNN相比传统神经网络，增加了卷积层和降采样层，有利于减少肺结节图像的特征维数，但2DCNN提取的是单张图像的特征，这样容易造成模型过度拟合，进而导致诊断效能下降。而3D-CNN将单张的CT图像堆积成连续的肺结节立方体，卷积核与每张图像进行连接并运算，极大地提高了识别精度。因此，在使用相同网络参数设置对相同的数据集进行分类识别时，3D-CNN比2D-CNN具有更高的准确率。

Hua等［3］在2015年将2D-CNN应用于肺结节的分类中，解决了传统CAD性能稳定性差、人工制定的诊断规则不全面和准确率较低等问题；但2D-CNN会丢失肺结节的空间立体信息。有研究提出将3D-CNN应用于肺结节分类的想法并设计了2个不同结构的3D-CNN在相同的数据集进行训练和测试，通过对实验结果所生成的受试者操作特征曲线进行评估［4］，该实验表明，3DCNN的效果较好，并且其不需要依靠特定的专业知识，通过不断学习便有助于系统的进一步完善，从而提高了肺结节的诊断效率和准确性，但是3D-CNN存在特征较多、数据量较大和计算时间较长等问题。

有研究提出了一种基于MMCNN的肺结节检测方法［5-6］，此方法不需要进行分割等预处理操作，可以直接处理原始数据，相比于只能提取单一尺度特征的卷积神经网络。MMCNN方法能够提取到多尺度的特征，从而更加有利于肺结节的分类。

2.2 MTANN

MTANN是另一种类型的端到端的机器学习，它包含多层人工神经网络，全连接网络是其核心处理单元。它的特点是直接以候选肺结节CT图像的灰度值作为输入，但它的输出是一幅图像。在得到输出图像后，采用加权和的方式进行输出图像的量化。不同类型的肺结节有不同的分布特征，通过量化分析图像像素的分布特征可将肺结节进行分类，达到了图像处理与模式识别的目的。该模型减少了由于特征提取和分析导致的误差，非常适合在小样本数据应用［7］。有研究在肺结节检测和分类方面，对MTANN和CNN的性能进行比较［8］，结果表明在使用有限的训练数据时，MTANN的性能优于CNN，但是随着数据量的增加，CNN的性能逐渐提高。因此，在有限的训练样本中，MTANN获取的中、低等级的图像特征可以满足肺结节的检测与分类。

2.3 AE

AE是一种非监督学习下的深度学习模型，包括输入层、隐藏层和输出层。输入层压缩图像数据，输出层将其扩展，中间的隐藏层学习图像内像素的复杂关系［9］，可以对目标特征进行提取和降维，这相对于传统的人工标记提取更为客观和可靠。为了实现分类，在AE的基础上，相继产生了稀疏自编码（SAE）、去噪自编码和堆栈去噪自编码（SDAE）等深度模型。该类模型通过编码与解码过程，可以在较低维空间下对数据进行分类。

SAE由Bengio等［10］提出，它在自编码的基础上加入了稀疏性的限制，引入纠正激活函数，提高了算法的鲁棒性，进而有效提高了信息表达的准确率和全面性。DAE由Vincent等［11］提出，它在自编码器的基础上，对输入的数据加入噪声以防止过度拟合，使所学的编码器具有较强的鲁棒性，增强了模型的泛化能力。Hinton等［12］提出堆栈自编码器，它是一种从无标签数据中逐步多层地提取更抽象图像特征的模型。当多个降噪自编码器叠加起来时，也就是SDAE。SDAE将上层的隐层作为下层的输入层，通过非监督学习的逐层预训练来初始化深度网络的参数，大大提高了表征能力。

有学者使用5层的DAE对肺结节进行诊断，得到的准确率为75.01%，灵敏度为83.35%［13］。Mao等［14］建立了一种结合局部和全局特征的肺结节图像模型，他将图像分割为局部补丁后，在深度AE中提取局部特征构建视觉词汇袋，这样可以获取更详细的特征信息。有研究提出一种改进的深度半监督稀疏自编码器（SSAE）模型对肺结节进行检测，与其他模型（SAE、SSAE、RBM）相比，该模型获得了较高的准确性、敏感性、特异性，更适用于肺结节的精准检测［15］。

2.4 DBN

DBN是一种生成模型，这一概念由Hinton等［16］提出。它通过训练神经元间的权值，使整个神经网络按照最大概率生成训练数据，用于特征识别、数据分类和数据生成。经典的DBN由受限玻尔兹曼机和一层反向传播组成，受限玻尔兹曼机可分为显性神经元和隐性神经元［17］。显性神经元用于接收输入，隐性神经元用于提取特征，层与层之间的神经元存在连接，但层内的神经元间不存在连接［18］，这种连接方式是其高效性的基础。2015年，Hua等［3］首次将DBN应用在肺结节良恶性分类上，实验获得了73.4%的敏感度和82.2%的特异度，超过了传统的机器学习方法。有研究将DBN与极限学习机相结合，不仅提高了肺结节的诊断准确率，而且大大缩短诊断时间［19］。

3 问题与展望

对于DL来说，高质量标注图像模型的构建很重要。当前由于标记肺结节图像的不足，基于DL的网络模型容易出现过拟合，准确率有待进一步提高。有学者将迁移学习应用到肺结节的分类中，有效地解决了肺结节样本缺乏标注的问题，能够大大提高分类的准确度［20-21］。由于医学图像的复杂性，如何更有效地将迁移学习应用于肺结节的分类中还需要进一步的研究。另外，DL本身存在一些缺陷，神经网络只是将图像和最终的输出结果联系起来，其中的分类过程不可知，虽然已有多个网络模型学习分叶和恶性肿瘤等特征［22］，但绝大部分特征仍是未知的。对于医疗这种要求特别严格的行业来说，模型可解释性是非常重要的。临床医生在看模型结果的时候，更关注模型所产生结果的逻辑过程，所以对于模型可解释性的探索是未来发展的一个方向。此外，尽管目前基于DL的肺结节检测与诊断模型有很多，小规模的验证也可以达到较高的诊断性能，但缺乏统一的权威研究机构对过程进行评估和比较，也没有统一的标准和大型的临床试验证明DL算法在临床应用中的可靠性［23］。与此同时，AI的伦理和法律问题也应值得我们思考：在医学应用中安全性尤为重要，如何最大限度避免AI系统出现差错，怎样控制出错后的风险以及如何对此负责。

目前AI技术还处于深度研发阶段，还不能作为直接的检查诊断方法，结果还需要影像医师进行判断审核。因此影像科医师必须具备处理AI的技能，充分了解AI在影像学诊断中的优缺点。但不可否认的是，AI技术在病灶检出率、缩短时间耗时等方面具有明显优势。DL系统在进行肺结节的检测时，也可以加入乳腺、胸膜、心脏和淋巴结等其他部位的检测，这种全面的检测可以有效避免漏诊和误诊。

综上所述，基于DL的AI对于肺结节检测和诊断具有非常重要意义，它能够降低影像医师及临床医师工作量，提高工作效率。相信随着AI进一步的深度学习、算法改进，对于病变识别的准确性也一定会得到显著提升。在未来的医学影像学乃至整个医学领域中，基于DL的AI将发挥关键作用。