基于CT的计算机辅助检测与诊断肺结节技术研究进展
2018-01-25吴光耀伍建林大连大学附属中山医院放射科辽宁大连116001
吴光耀,伍建林(大连大学附属中山医院放射科,辽宁 大连 116001)
肺结节指最大径≤30 mm的病灶[1],分为实性、部分实性和纯磨玻璃密度三种结节,其恶性概率分别约为7%、63%和18%[2],准确检测肺结节对于肺癌早期诊断具有重要临床价值。胸部CT是目前肺癌筛查与诊断最重要且可靠的非侵入性检查手段,但在提供丰富影像信息的同时,也使阅片工作量大幅增加,导致放射科医师疲劳或漏检、误判。计算机辅助诊断(computer-aided diagnosis, CAD)系统有助于缓解影像科医师压力,减少肺结节漏检,提高诊断效率和准确率。CAD可分为CAD检测(CADe)系统和CAD诊断(CADx)系统。本文对基于CT的计算机辅助检测与诊断技术流程及其在肺结节中的应用进行综述。
1 CADe系统
CADe系统的目标是识别图像中可能存在的异常改变区域,并向医师提出警示,其工作流程包括数据获取、图像预处理、肺实质分割、肺结节检测和剔除假阳性结节。
1.1 数据获取 CADe系统的数据主要来源于医院内部和公共数据库。虽然医院内部数据库也能有效支持CADe的算法,但目前尚存在以下问题:①医院内部数据不公开,不利于CAD算法的可重复性研究和比较不同算法的性能;②不同影像设备获取和重建协议有较大差异,缺乏统一标准;③对于大数据分析,单个医院样本量不足。为解决以上问题,先后有不同的国际组织建立了可用于开发、维护和培训的CT图像公共数据库,如LIDC、LIDC-IDRI、ELCAP、NELSON和ANODE09等,可用于医师培训、罕见案例储存等,还可进行不同CADe系统性能的比较[3]。
1.2 图像预处理 为可选流程,目的在于去除不同类型或不同来源数据间的差异,提高图像质量,从而获得更好检测效果。目前常用预处理技术包括线性插值、中值滤波、形态学帽操作、高斯滤波以及加权求和滤波等;其他尚有增强滤波器、对比限制自适应直方图均衡、自动增强维纳滤波器、快速傅立叶变换、小波变换以及平滑滤波器和噪声校正等[4]。
1.3 肺实质分割 系CADe关键步骤之一,包括人工分割和自动分割,前者存在耗时多、主观性强、重复性差、不易实现三维分割等缺陷,后者是当前医学影像图像分析领域的研究热点之一,可分为五类:基于阈值方法、基于区域方法、基于形状方法、邻近解剖引导方法和机器学习方法[5]。由于肺组织存在一定异质性及多种结构密度相似,目前尚无认可度较高的通用分割算法。高精度、全自动特定图像分割算法是未来的发展趋势。
1.4 肺结节检测 肺结节形状各异,易与肺内气管、血管混淆,且分布位置不确定,易与肺内组织粘连,检测肺结节存在一定难度。现有技术包括基于阈值法、聚类法、模板匹配法、形状增强滤波器法等[5],均存在不同程度假阳性率。
1.5 剔除假阳性结节 检出候选肺结节后,需进行分析、归类,保留真性肺结节,去除假性肺结节。目前多分为两个阶段:①基于规则分类剔除假阳性结节,根据肺结节的某些特点,设计某种规则,计算相应的一个或多个特征,并设定相对宽松的特征阈值去除明显的假阳性结节[6];②基于机器学习分类进一步剔除假阳性肺结节,提取候选肺结节数据集相关特征,采用人工神经网络[7]、支持向量机[8]、线性判别分析[9]等分类器法对候选肺结节训练集数据进行训练,再对候选肺结节测试集进行分类,进一步剔除假阳性肺结节。
2 CADx系统
CADx系统的目标是帮助放射科医师判断病灶良恶性、评估病理分型及分期、监测治疗反应、评估预后等提供帮助,其工作流程包括特征提取与量化和分类预测。
2.1 特征提取与量化 目前文献[10]提到的特征主要分为语义特征及统计学特征,前者指用于定量影像科医师日常描述的结节大小、形状、位置、边界等特征,后者指利用数学或统计学方法定量提取的特征,如直方图、纹理、小波等特征。为便于分析,在特征选择和提取前,需对特征降维,可采用机器学习或统计学方法来实现;也可通过最大相关最小冗余[11]或主成分分析法[12]获得有显著提示作用的特征。还可收集患者临床特征、基因特征、生化检查特征等资料,将影像学特征和其他特征结合,为分类和预测提供更准确和详细的信息。
2.2 分类和预测 基本思路为将数据分为训练集和测试集,采用机器学习算法从训练集中构建分类器,再到测试集中验证其可靠性。目前常用且效果良好的机器学习算法[13]有人工神经网络、贝叶斯网络、支持向量机及决策树学习。根据训练集数据结果是否被标记,又可将其分为无监督学习(未标记结果)、半监督学习(标记部分结果)和监督学习(标记结果)。人工神经网络具有自主学习、自动适应的特点,同时还具有并行处理、分布式存储和容错性等优势,是目前应用较为广泛的学习算法之一。深度学习系人工神经网络的深入发展,是目前最先进的人工智能技术,已在多个领域取得重大进展[14]。在可预见的未来,无监督深度学习可望实现高效、快捷、自动,成为下一场技术革新的亮点。
3 CADe检测肺结节
目前CADe检测肺结节的敏感度较高,假阳性率亦较高,原因可能有以下方面:
3.1 CT图像层厚、重建间隔及剂量 CADe的性能取决于CT扫描层厚和重建间隔。Brown等[15]使用层厚为1 mm、重建间隔为0.5~1.0 mm的CT图像,发现CADe检测直径>3 mm肺结节的敏感度为100%。Demir等[16]的类似研究结果为敏感度98%。使用层厚为5~10 mm的CT图像时,肺结节检出敏感度大为降低,每项检查出现的假阳性结节可达几十个[17]。可利用较小的层间距重建CT图像来弥补层厚过大的负面效果,如Kim等[18]将重建间隔从5 mm减少至1 mm,其敏感度明显提高,每项检查中的假阳性结节从23.6个降至9.7个。
Hein等[19]用两种CADe系统比较管电流为5 mAs的超低剂量CT(ultra-low-dose CT, ULD-CT)和75 mAs标准剂量CT(standard-dose CT, SD-CT),ULD-CT对肺结节的检出率为62%和72%,SD-CT为56%和73%,该两种CADe系统在两种剂量CT间检出率差异无统计学意义。Bodelle等[20]对比了两种管电压(70 kV和100 kV)下CADe对肺实性结节的检测率,发现两者的检测率分别为94.7%和92.4%。因此,降低管电流或管电压可降低辐射剂量,且不影响CADe系统对肺结节的检测率。
3.2 肺结节位置、大小及质地 肺结节按位置可分为孤立性肺结节、胸膜旁肺结节和血管旁肺结节。CADe系统检测孤立性肺结节最为敏感,原因是孤立性结节与周围肺组织的对比度更高,且最多见,作为训练集时样本量更大。一般来说,CADe对肺结节检测的敏感度随结节减小而降低。Brown等[15]发现,对直径>3 mm的肺结节,CADe检测敏感度为100%;而对直径≤3 mm肺结节,其敏感度降至70%。Setio等[21]观察直径>10 mm肺实性结节,发现CADe敏感度可达94.1%。目前CADe检出直径≤3 mm肺结节尚面临较大挑战。Yanagawa等[22]评估商业性CADe系统检测磨玻璃结节的性能,发现放射科医师的检测敏感度为60%~80%,明显高于CADe的21%,其原因是实性结节对比度高且数量多,而磨玻璃结节较透明,与肺内气体灰度值对比不明显,故检测磨玻璃结节的难度较实性结节更高。
4 CADx
CADx的基本目标是将计算机提供的结果作为第二意见,提高放射科医师诊断的准确率和减少阅片时间。在判断肺结节良恶性方面,Armato等[23]将自动检测出的肺结节利用CADx根据形态和灰度级进行分类,诊断敏感度达84%,ROC曲线下面积为0.79。Suzuki等[24]利用人工神经网络CADx判断肺结节良恶性,其诊断恶性肺结节的准确率可达100%,而诊断良性肺结节的准确率仅为48%。最近有学者[25]对LIDC-IDRI数据库的1 012个肺结节采用纹理特征分析方法来判断其良恶性,ROC曲线下面积达0.927。大量研究[26-28]比较观察者在使用和不使用CADx时判断肺结节良恶性的准确率,发现放射科医师使用CADx后对肺结节良恶性判断的准确率有不同程度提高。
近年来,影像组学实现了肺结节分割、特征提取与模型建立,凭借对海量影像数据信息进行更深层次的挖掘、预测和分析来辅助医师做出更为准确的诊断[29]。影像组学来源于CADx,结合了大数据技术特点,已发展成融合影像、基因、临床等信息的辅助诊断、分析和预测的新方法[30]。有学者[31]对孤立性肺结节的影像组学特征进行贝叶斯分析,结果显示其在肺结节良恶性分类中的准确率为89.3%。Lee等[32]观察86个部分实性肺结节,将临床信息和CT图像作为纹理分析的特征,诊断肺结节良恶性的准确率达92.9%。另有研究[33]对86个部分实性肺结节结合纹理特征分析和更高峰度方法,鉴别浸润性腺癌与浸润前病变的ROC曲线下面积达0.981。虽然CAD对磨玻璃结节的检测率尚不高,但在鉴别良恶性及病理分型上仍有较好的效果。目前影像组学在判断肺癌的病理分期、基因表型,预测其治疗效果、转移、复发、生存率等方面取得了一定进展[34],却仍鲜见针对表现为结节的早期肺癌的基因判断及预后预测的研究报道,而这将成为未来研究的方向。
5 问题与展望
在肺结节检测方面:①尚无认可度高的通用分割算法,有些算法尚无法提供高效精准的分割效果;②假阳性率较高;③CT图像的采集与质量评价尚无统一标准;④结节位置、大小、质地影响检测效果。在肺结节诊断方面:目前多数研究旨在评估结节的良恶性,而判断肺癌病理分型、分期,判断基因表型,预测治疗效果、转移、复发、生存率等方面的研究较少。随着深度学习方法不断发展和人工智能浪潮的推动,上述问题可能会逐步得到妥善解决,对肺结节的多维度、多模态分析与定性、风险评估、预后判断等研究将会越来越多,CAD有望真正实现高效和精准的检测与诊断目标,早日成为影像科医师的得力助手。