人工智能辅助CT肺结节良恶性鉴别的研究进展
2021-01-05陈师胡剑鹏徐伟张骥吴吉明
陈师 胡剑鹏 徐伟 张骥 吴吉明
[摘要] 肺癌属于临床常见的恶性肿瘤之一,当前胸部CT是进行早期肺癌鉴别的重要方式,但是因其存在“异病同影”等情况,加之受到临床经验等因素影响,在病灶良恶性鉴别方面有较大差异,极易出现误诊或漏诊情况。近年来人工智能被逐渐应用于临床,其在肺结节良恶性鉴别方面也发挥着一定作用。本文从人工智能评估肺结节良恶性的基本过程、人工智能模型在鉴别肺结节良恶性方面效能、人工智能诊断肺结节效能的影响因素、问题及展望方面进行分析,以期提升人工智能辅助CT鉴别肺结节良恶性效果。
[关键词] 良恶性;肺结节;计算机断层扫描成像;人工智能;手动分割
[中图分类号] R445 [文献标识码] A [文章编号] 1673-9701(2021)30-0184-04
[Abstract] Lung cancer is one of the common clinical malignant tumors. At present, chest CT is an important way to differentiate early lung cancer. However, because of its "different diseases with the same shadow" and the influence of clinical experience, there are significant differences in the differentiation of benign and malignant lesions, and it is easy to have misdiagnosis or missed diagnosis. In recent years, artificial intelligence has been gradually applied in clinical practice, which also plays a role in differentiating benign from malignant pulmonary tuberculosis. This article analyzes the basic process of artificial intelligence in evaluating benign and malignant pulmonary nodules, the efficacy of the artificial intelligence model in differentiating benign and malignant pulmonary nodules, and the influencing factors, problems and prospects of artificial intelligence in diagnosing pulmonary nodules, in order to improve the effect of artificial intelligence assisted CT in differentiating benign and malignant pulmonary nodules.
[Key words] Benign and malignant; Pulmonary nodules; Computed tomography imaging; Artificial intelligence; Manual segmentation
據一项临床调查显示[1],男性肺癌患病率和死亡率约占全部恶性肿瘤首位,而女性肺癌患病率居于恶性肿瘤第三位,死亡率则仅次于乳腺癌。伴随科学技术水平的进步,人工智能技术被逐渐应用于临床中,其在鉴别疾病良恶性时能够发挥良好作用[2]。机器学习作为人工智能的关键技术,而深度学习计算方法作为新研发的一种方式,其展示形式为嵌套层次概念,能够发挥较强的功能性和灵活性[3]。对于传统机器学习而言,该种方式无需手动提取特征,仅需将病理检查情况和肺结节影像数据录入,则自动生成对应关系。所以,将其应用于高通量图像分析中,可发挥诊断价值高及效率快等特点。本文在参阅临床大量文献的基础上,对人工智能辅助CT在鉴别肺结节良恶性方面情况进行研究,现就相关内容作出综述。
1 人工智能判断肺结节性质的流程
1.1 获得图像并重新组合
在检查者数量方面,传统机器学习无特殊要求,但是对于深度学习而言,其需要更多的检查数量才可有效开展检查。当前主要是通过公开数据库和临床大型医院获取有关肺结节的CT图像数据。在数据采集及处理方面,传统机器学习困难度较高,出自不同医院的CT影像,采用传统机器学习进行计算时,针对扫描参数和重组参数需开展重新规范,步骤繁琐。人工智能利用公开数据库,例如美国肺图像数据库联盟等,其能够规范采集图像,并提供全面的资料,操作容易,但是病理结果和临床数据缺乏真实性,因此一定程度上使准确度下降,仅能最大限度接近影像科医师的判断。当病例数量较少时,能够通过开展图像处理方式,例如移动、翻转及旋转等提升图像多样性,进而相对性增加病例数量[4]。CT图像中介质衰减、噪声及运动伪影会使影像发生失真情况,无法准确的将肺结节有效分类。所以,获取影像后,利用平滑、归一化及增强等方式进行预处理,可提升稳定性。在黄云开[5]的研究中,其在肺结节良恶性诊断中采用人工智能及CT进行干预,结果发现医师阅片诊断准确性为90.00%,而人工智能诊断准确性为94.00%。因此其认为在肺结节诊断中采用人工智能阅片,可提升准确度,进而减少误诊及漏诊情况。在范鸿禹等[6]的研究中,其发现对于低年资的医师而言,其在利用人工智能进行阅片后,诊断准确性及敏感度有明显提升,同时有效缩短阅片时间。因此,其认为采用人工智能方式进行阅片,有利于提升低年资医师阅片诊断效能,提高准确性。
1.2 分割轮廓
以往将人工勾画轮廓作为分割主要标准,但是近年来发现,为尽可能多地包含特征,勾画者所标记的感兴趣区域一般超过实际范围,进而导致结果准确性较差。并且进行人工勾画可重复性差、效率低下。二十世纪八十年代出现自动分割方式,其将区域生长方式作为基础,当前在全自动与半自动分割方面已经研发出更有效的方法。据临床一项调查显示[7],自动勾画法相较于人工分割方式有更高的诊断效能,并且相较于磨玻璃结节,实性结节采用自动分割所获得的效果更佳,而对于肺外缘结节而言,肺内结节分割效果更佳。若肺结节邻近纵膈或胸壁处,会导致所识别的感兴趣位置沿着周围结构盲目性扩大。其中肺磨玻璃样结节相较于四周结构对比性不高,并且分隔情况也较低,但是也存在有效进展。尽管其有较多优势,但是也出现一些问题,由于计算方式存在差异,导致分隔情况也发生差异,尤其在不规则胸膜旁结节方面更加突出,一定程度上限制其在临床的使用。伴随卷积神经网络方式的发展,可以在计算方式内采用隐式方式处理分割,期待可提供同结节分割同时开展的机会。在孟祥鹿等[8]的研究中,其在构建模型时通过3D深度卷积神经网络及递归神经网络结合方式,对肺结节密度类型进行分类及分割,结果发现骨重建、纵膈重建及肺重建在对肺结节密度类型分类准确度依次是(97.89±7.32)%、(98.38±6.61)%、(98.67±5.70)%。因此其认为当深度学习算法在结合递归神经网络以及3D卷积神经网络后,针对不同CT重建计算方法图像内肺结节分类及分割均有较稳定作用。
1.3 提取特征及筛选
由CT影像内采集肺结节硬度、形状和纹理情况,CT水平和分布数据代表强度,形态作为重要补充数据,纹理作为显示肺结节内部性质的关键数据。对于恶性结节而言,其内部异质性较明显,相较于良性肺结节而言,恶性肺结节峰度更高、偏度更低,另外其熵、熵和、熵差值和对比水平等相较于良性肺结节有明显升高,其中在一致性、相关度、能量和灰度值方面,恶性结节均低于良性[9]。当对肺结节影像内采集的全部特征进行利用,则会出现“过拟合”情况,在新数据集上无法重现模型的高准确度,故而需要开展筛选。由影像学专家筛选出可靠性高、鉴别度高和独特性征象,可助于建立良好的肺结节评估模型。在开展深度学习时,能够通过采用部分方法对图像进行约束,强制模型对输入进行选择,对肺结节图像中重要特征进行自动提取,可一定程度上避免手工标记,发挥良好的标记效果。在张晓宇等[10]的研究中,其发现采用双路径自动提取深度特征,并与残差网络以及密集连接网络进行结合,进而达到特征复用,在候选框提取时应用三维编码解码网络结构,并与结节空间信息以及上下文信息进行融合,对结节位置进行准确定位,生成多尺度候选框,并在全卷积网络框架内嵌入网络,进而对结节进行分类。上述计算方法能够提升肺结节检测速度以及检出率,敏感度可达到90.50%,在一个序列的肺部CT图像方面,处理时间仅为5.9 s。
1.4 构建预测模型并进行验证
传统机器学习方法主要是采用支持向量机,在临床应用过程中发现,其在运行时对内存提出很大要求,同时在调节参数时难度较高,当需要开展分类的肺结节数量过多时,会明显提升运行时间,并且调控性较差。另外,传统肺结节分类方法有随机森林和Logistic回归,在祁闻等[11]的研究中,其发现利用χ2检验对良恶性磨玻璃结节的有关因素进行筛选,并通过构建多因素Logistic回归模型,并绘制出ROC曲線,结果发现密度、囊状透亮影、界面征、毛刺征及分叶征在鉴别肺结节良恶性方面具有重要作用,并进行分析发现毛刺征、毛糙边界及分叶征同肺结节恶性有关。因此其认为对于磨玻璃结节病患而言,出现毛糙边界、毛刺征以及分叶征时,则提示有恶性病变。在孔令重等[12]的研究中,其对发现采用Fire Voxel软件对肺结节CT影像内纹理参数进行自动提取,结果发现多因素Logistic回归分析提示熵、能量、胸膜牵拉征、分叶征、毛刺征以及边界光整是恶性肺结节的独立预测因素,并依据其建立ROC曲线,曲线下面积为0.894,而敏感度及特异性依次为93.43%、84.18%。因此其认为对构建预测模型,进行纹理分析,能够提升早期肺癌预测价值。卷积神经网络获得广泛应用,采用卷积操作可将目标同周围的像素点进行关联性计算,降低参数数量以及内存量。依据卷积神经网络,有延伸并发展出较多变型,例如多尺度卷积神经网络,其对不同尺度肺结节图像块特征分别训练分类器进行提取,一方面能够提升准确性,另一方面对不同噪声的鲁棒性较高[13]。但多尺度卷积神经网络也存在一定缺点,例如提取耗时等。针对该项问题,通过实施多区域池化,在对不同区域进行提取时,使用不同次数的池化操作,能够有效规避耗时长问题。在高慧明等[14]的研究中,其对每个候选肺结节分别输入不同尺度的三维卷积神经网络,并开展训练,结果发现在每次扫描一次以及四次假阳性时,敏感度依次为84.90%、90.90%。因此其认为在体积式医学CT数据开展特征学习时应用多尺度三维卷积神经网络,能够一定程度上降低假阳性,提升诊断有效性。
2 人工智能模型用于鉴别肺结节性质的效能
纹理分析是传统机器学习的重要方式,其效果已经获得临床认可。在李晓卿等[15]的研究中,其发现熵敏感度为57.10%、特异性为93.20%,熵和敏感度为78.60%、特异性为52.30%,熵差敏感度为85.70%、特异性为70.50%。其认为CT纹理分析在鉴别肺结节良恶性方面具有一定价值,其联合诊断敏感度较高。临床还有研究显示[16],肺结节边缘部位增殖速度快、微血管密度高,相较于中心而言,边缘纹理特征更加具有诊断价值。由于肿瘤病灶部位血管生成以及缺氧,在肿瘤位置有大量血管形成和处于缺氧状态,通过开展增强扫描可以更加有效的显示病灶内异质性。但存在研究发现,通过增强扫描会影响病灶纹理[17]。传统机器学习方式,需要进行多项图像分析和模式选择操作才可对肿瘤进行定量鉴别,前一步性能会对下一步产生重要影响,故而调整分类性能困难度较高。在梁淑芬等[18]的研究中,其联合极限学习机进行分类计算,结果显示分类准确度为94.12%。因此其认为相较于其他分类计算方法,极限学习机分类计算方式能够提升分类准确性。
3 人工智能诊断肺结节效能的影响因素
3.1 数据量差异
模型数据量越高,其质量越优,在分类准确度方面则更加好。传统机器在进行学习时,仅需数十例即可获得良好效果,数据过度则会增加计算量,同时对其准确性也有一定影响。故而,深度进行深入学习有利于提升自我进化学习功能,通过采集大量数据开展训练,进而改善模型瓶颈情况。
3.2 采集特征的方式
相较于传统神经网络,2D卷积神经网络增加降采样层以及卷积层,可降低肺结节图像特征维数。但是2D卷积神经网络提取时仅为单张图像特征,极易出现模型过拟合情况,从而降低诊断效能。3D卷积神经网络能够将单张CT图像通过堆积方式形成连续肺结节立方体,将每张图像与卷积核开展连接以及计算,故而在肺结节识别率方面,3D卷积神经网络显著高于2D卷积神经网络。在王祥等[19]的研究中,其发现3D卷积神经网络的肺结节深度学习算法模型检出敏感度是90.00%,准确性是71.00%,平均每例假阳性2.8个。因此其认为3D卷积神经网络相较于传统的CAD系统,能够提升肺结节检出敏感度。但是因受到训练数据集偏倚等因素的影响,会对其敏感度造成一定影响。通过实施针对性补充训练数据集,例如提升磨玻璃结节的比重,能够进一步增加肺结节检出敏感度。在苗光等[20]的研究中,其对针对肺结节诊断效率不高和大量假阳性等问题,提出首先实施2D卷积神经网络检测CT图像,针对图像中疑似结节部位进行快速识别以及定位,并输出一张同原图尺寸一样且有明显标记的图像,之后计算出疑似结节区域坐标,依据坐标值提取疑似结节的三维立体图像块训练构建的3D卷积神经网络框架,最终使用训练的3D模型对候选结节实施二分类处理,进而将假阳性去除。研究后发现,在将假阳性去除后,假阳性在1时及4时准确率依次为87.30%、97.00%。
3.3 不同重建核
当重建核不相同时,在图像像素值分布方式及噪声模式方面也有一定差异。在像素间关系改变的基础上,提取肺结节特征也已经出现改变。在刘珍娟等[21]的研究中,其分别观察骨窗重建、纵膈重建以及肺窗重建在诊断肺结节方面的作用,结果发现上述三种重建方式诊断肺结节敏感度依次为92.73%、86.97%、92.33%,准确性依次为27.84%、37.91%、23.55%。因此其认为在骨窗、纵膈以及肺窗重建下检测肺结节,能够获得良好性能,有利于提升工作效率及诊断质量。
4 讨论
肺癌主要是指起源自气管、支气管黏膜或是腺体的一种恶性肿瘤,同时其也是作为常见的肺部原发性恶性肿瘤[22]。在全世界范围内,肺癌患病率及死亡率均较高,并且呈现升高趋势。目前,影像学检查方式是临床诊断肺结节的常用手段,其中胸部计算机断层扫描成像技术(CT)在早期肺癌诊断中较为常用。医师在进行良恶性肺结节鉴别时主要是依据CT影像进行判断[23]。但是由于CT检查时会出现不同疾病同样影像及相同疾病不同影像等特点,并且不同年资及临床经验的医师,在鉴别肺结节良恶性方面也存在一定差异,使得肺癌误诊或是过度诊断情况时常发生[24]。尽管临床将肺组织穿刺活检作为诊断肺结节良恶性的主要依据,但是该种检查方式会对机体造成损伤,并且重复操作性不高,容易出现漏检等情况,病患满意度也相对较低[25]。因此,采用新型技术辅助CT进行肺结节良恶性鉴别具有重要意义。
本文包含机器学习以及深度学习方式,在人工智能评估肺结节方面,建立初步认识框架。随着临床大数据和人工智能算法的进步,其低鉴定肺结节性质方面将会获得更加优异的效果,并且还可对恶性结节进行分级以及分期,并为制定诊疗措施提供依据[26]。通过确定基于人工智能的模型,能够对结节类型进行有效分类,并诊断癌症,有利于减少病死率,改善疾病预后。尽管已经有大量研究显示人工智能能够提升影像科医师诊断准确性,但是其在临床上依旧未能有效推广和使用。传统机器学习在重复性方面较差,受到疾病进展和成像形式不同的影响,其纹理特征也会发生显著改变[27]。而深度学习自身也有部分不足,神经网络仅是将最终结果同图像进行联系,但是无法了解分类过程,尽管已经存在多任务和多属性丢失来协助模型嘻嘻分叶以及恶性肿瘤等特征,但大部分特征仍是未知的[28]。并且在模型建立时会受到高质量胸部CT标注影像缺乏的影响。图像分割困难,人工分割和标注复杂等均是导致图像互通性较差的因素[29]。相信伴随临床研究的不断深入,在突破数据数量限制方面,利用迁移学习能够有效进行规避,利用迁移学习,在极易获得的大数据上对参数进行训练,随后通过以训练肺结节诊断的神经网络提升诊断准确性[30]。目前,在人工智能肺结节诊断模型方面,临床已经有多种形式,在小范围内进行验证可以获得良好的诊断效果,但是依旧无规范化尺度和权威研究机构评估、对比。因此,希望在今后能够拥有公开、共同以及共享的数据集,为不同模型衡量提供标准,为人工智能可反复操作奠定基础。当前还需从多方面实施深入研究,进而为人工智能在未来成为辅助诊断肺结节重要方式提供可能性。
[参考文献]
[1] 李会荣,钟秀,王江川,等.miR-140-5 p通过调控Wnt1通路对非小细胞肺癌迁移与侵袭能力的影响[J].中国免疫学杂志,2021,37(2):186-190,200.
[2] 潘元威,董军强,胡丽丽,等.螺旋CT灌注成像联合血清microRNA-20 a、microRNA-210水平对非小细胞肺癌同步放化疗预后的预测价值[J].鄭州大学学报(医学版),2020,55(2):281-286.
[3] 王娟,杨震,朱强,等.一种基于人工智能的细胞病理诊断系统在肺癌诊断中的初步应用[J].解放军医学院学报,2020,41(9):897-900.
[4] 宋冬冬,朱晓明,朱丽娟,等.双能CT融合图像在人工智能肺结节筛查中检测效能的探索研究[J].中国医疗设备,2021,36(2):73-76.
[5] 黄云开.CT高分辨重建联合人工智能在肺结节识别诊断中的应用效果分析[J].现代医用影像学,2021,30(1):87-89.
[6] 范鸿禹,孙丹丹,张清,等.人工智能辅助低、高年资规培医师对CT肺结节检测效能的对比研究[J]. 中国中西医结合影像学杂志,2021,19(2):175-179.
[7] Yang Wenjian,Ding Huafeng,He Yong,et al.Studying the optimal layout of topological graphs to facilitate the automatic sketching of kinematic chains[J].Journal of Mechanical Design,2017,139(8):182-185.
[8] 孟祥鹿,幸子健,卢山.基于深度学习的肺结节分类分割算法及其在不同CT重建算法下的效能评估[J].中华医学杂志,2021,101(7):476-480.
[9] 崔效楠,刘颖,叶兆祥,等.影像组学特征对肺纯磨玻璃结节侵袭性腺癌与非侵袭性腺癌的鉴别价值[J].国际医学放射学杂志,2018,41(4):375-378.
[10] 张晓宇,强彦.Ziaur REHMAN.基于双路径网络的端到端肺结节检测模型[J].计算机工程与设计,2020,41(12):3503-3509.
[11] 祁闻,赵红,王龙胜,等.应用Logistic回归分析方法研究肺部良、恶性磨玻璃结节的HRCT影像特征[J].医学研究杂志,2019,48(11):41-45.
[12] 孔令重,姜壮国,曹小江,等. Logistic回归分析高分别率CT的纹理特征对孤立性肺结节诊断价值[J].新疆医科大学学报,2019,42(2):198-202.
[13] 周围,胡富碧,刘亚斌,等.人工智能CT定量参数预测肺腺癌磨玻璃结节的侵袭性[J].成都医学院学报,2021, 16(1):50-53.
[14] 高慧明,赵涓涓,刘继华,等.多尺度卷积神经网络用于肺结节假阳性降低[J].计算机工程与设计,2019,40(9):2718-2724.
[15] 李晓卿,徐志豪,齐银萍.CT纹理分析与MSCT三维重建对孤立性肺结节良恶性鉴别诊断效能分析[J].影像科学与光化学,2020,38(5):914-918.
[16] 尹泚,毛文杰,李斌,等.人工智能系统在肺结节检出及良恶性鉴别中的应用研究[J].中华胸心血管外科杂志,2020,36(9):553-556.
[17] 高晨,叶剑锋,吴林玉,等.平扫与增强CT影像组学特征诊断肺腺癌浸润性的应用研究[J].浙江临床医学,2019,21(8):1009-1011.
[18] 梁淑芬,付迎迎,秦传波,等.正则化极限学习机的改进及其在肺结节良恶性分类中的应用[J].五邑大学学报(自然科学版),2019,33(2):63-69.
[19] 王祥,李清楚,邵影,等.基于三维卷积神经网络肺结节深度学习算法模型临床效能初步评估[J].放射学实践,2019,34(9):942-946.
[20] 苗光,李朝锋.二维和三维卷积神经网络相结合的CT图像肺结节检测方法[J].激光与光电子学进展,2018, 55(5):129-137.
[21] 刘珍娟,傅迎霞,张羽,等.不同CT图像重建算法下基于深度学习的肺结节检测算法效能[J].中国医学影像技术,2019,35(12):1775-1779.
[22] 戴正行,胡春洪,王希明,等.基于DenseNet网络深度学习法CT图像人工智能分析技术判断肺结节良恶性[J].放射学实践,2020,35(4):484-488.
[23] 杨锋,樊军,田周俊逸,等.人群肺亚实性结节CT筛查及人工智能应用研究初探[J].中华胸心血管外科杂志,2020,36(3):145-150.
[24] 李甜,李曉东,刘敬禹.人工智能辅助诊断肺结节的临床价值研究[J].中国全科医学,2020,23(7):828-831,836.
[25] 宋振春,于铁链.基于人工智能肺结节CT特征性诊断优势分析[J].影像研究与医学应用,2020,4(20):67-68.
[26] 陈长波.肺部影像人工智能诊断系统对肺结节性质的诊断价值分析[J].中国数字医学,2020,15(11):40-42,131.
[27] 崔兆国,吴昊,汤敏,等.重建层厚(1/2/3 mm)对人工智能检测肺结节效能的影响[J].中国医疗设备,2020,35(10):103-105.
[28] 马宁强,赵子光,樊玮,等.人工智能与人工阅片不同联合方法在肺结节CT筛查中的比较[J].实用放射学杂志,2020,36(8):1317-1321.
[29] 南岩东,李玉娟,刘苗苗,等.人工智能在肺结节良恶性鉴别诊断中的价值分析[J].中华肺部疾病杂志(电子版),2020,13(6):760-763.
[30] 赵呈华.人工智能辅助诊断系统联合CT检查肺结节的诊断价值[J].实用临床医药杂志,2020,24(19):9-11.
(收稿日期:2021-04-29)