基于深度学习的人工智能影像辅助诊断系统对肺结节的诊断效能评价
2022-12-05耿然
耿 然
(洛阳市第一人民医院CT室,河南 洛阳 471002)
肺癌是最常见的恶性肿瘤之一,据美国癌症学会2020年1月公布的数据,肺癌的发病率和病死率均居恶性肿瘤首位[1],早期诊断与治疗可有效提高肺癌患者的生存率[2]。肺结节是肺癌的早期表现,其检出率随着薄层计算机断层扫描(computed tomography,CT)技术的发展而提高,但明显增多的CT图像数据量也增加了影像诊断医师的阅片负担,从而可能导致肺结节的漏诊[3]。随着人工智能(artificial intelligence,AI)技术的进步,通过深度学习算法对肺结节进行识别、分类、重建及降噪处理,能够提取影像图像上肺结节的主要特征,对肺结节的早期发现及病变良恶性质的判断等进行预测[4-5]。本研究旨在通过比较AI影像辅助诊断系统与常规人工阅片在肺结节检出率以及对肺恶性结节定性的灵敏度、特异度、假阳性率、假阴性率等方面的差异,探讨AI影像辅助诊断系统诊断胸部CT肺结节的价值。
1 资料与方法
1.1 一般资料回顾性分析2016年1月至2019年12月于洛阳市第一人民医院经术前CT检查及病理检查结果确诊的85例肺结节患者的胸部CT影像资料。其中男33例,女52例;年龄25~79(55.23±11.02)岁。结节的定性以病理检查结果为金标准。病例纳入标准:(1)CT检查前未接受过穿刺活检和手术、放射治疗等相关治疗;(2)对于高度疑似恶性结节者,CT检查后1个月内行CT引导下穿刺活检或手术,获得明确的病理诊断;(3)对于判定为良性结节者,连续随访1 a,1 a内肺结节无变化者定为良性结节,1 a内肺结节有进展者以穿刺活检或手术切除后的病理诊断判定其良恶性。排除标准:(1)其他部位原发性恶性肿瘤肺部转移者;(2)缺乏层厚1.0 mm及以下的薄层CT图像;(3)图像有呼吸运动伪影及金属伪影干扰病变者。
1.2 CT检查方法所有患者均于术前行胸部CT扫描。使用联影UCT528 40排CT(上海联影医疗科技股份有限公司)及西门子 DEfinition AS+128层CT机[西门子(中国)有限公司]分别进行扫描。扫描范围:肺尖至肺底水平,扫描参数:层厚5.0 mm,层距5.0 mm,管电压120 kV,管电流auto dose。扫描结束后对全肺行肺窗薄层CT重建,重建层厚1.0 mm。
1.3 结节危险度诊断标准根据结节的形态、大小、边缘状态、结节内实性成分的位置及结节邻近胸膜改变等影像特征作为诊断结节危险度的标准。(1)结节形态:斑片状形态可见于任何良恶性结节中;条片状形态多见于良性结节中;形态不规则以恶性结节居多,且病灶恶性程度越高形态不规则越明显。根据结节的形态进行计分:规则为0分,不规则为1分,高度不规则为2分。(2)结节大小:排除炎症病变后,结节体积越大性质越趋于恶性,且恶性程度趋于更高。根据结节的平均直径进行计分:直径<5 mm为0分,5 mm≤直径≤10 mm为1分,直径>10 mm为2分。(3)结节边缘状态:观察结节边缘是否模糊及有无毛刺征,边缘清晰的结节以炎症结节居多。根据结节边缘的状态进行计分:清晰为0分,模糊为1分,毛刺为2分。(4)结节内实性成分的位置:结节内无实性成分或实性成分位于结节边缘者多为良性病变,实性成分位于中心或偏中心位置的结节多为恶性病变。根据结节内实性成分的位置进行计分:结节内无实性成分或实性成分位于边缘计为0分,结节内实性成分偏中心位置计为1分,结节内实性成分位于结节中心计为2分。(5)结节邻近部位胸膜的变化:结节邻近部位胸膜的变化包括胸膜增厚、胸膜凹陷、胸膜牵引,其在良、恶性结节中的分布差异不明显,但胸膜牵引以恶性结节居多[6],宜作为辅助征象。根据结节邻近部位胸膜的变化进行计分:胸膜无改变计为0分,胸膜增厚或凹陷计为1分,胸膜牵引计为2分。将每个结节的各项评分进行合计,根据其总分进行定性诊断:0~2分为低危结节,3~4分为中低危结节,5~7分为中危结节,≥8分为高危结节,将高危者定义为恶性结节。
1.4 图像分析分别采用常规人工阅片和AI影像辅助诊断系统对患者的CT图像进行分析和诊断。(1)常规人工阅片:采用单纯人工阅片方式,由3位从事CT诊断工作满5 a的主治医师组成诊断组,依据“1.3”项的结节危险度诊断标准分别对检出的肺结节进行定性诊断。如组内医师对肺结节的定性诊断有分歧,则经过讨论达成一致意见,最终判定结节的性质。(2)AI影像辅助诊断系统阅片:将85例患者的肺结节CT图像输入医准智能Direct AI系统(北京医准智能科技有限公司),通过网络学习自动提取结节的形态、大小、边缘状态、结节内实性成分的位置及结节邻近胸膜改变的特征,依据“1.3项”的结节危险度诊断标准对检出的肺结节进行定性诊断。
1.5 诊断效能评价通过比较常规人工阅片与AI影像辅助诊断系统阅片对肺结节诊断的灵敏度、假阳性率、假阴性率及评定结节性质的特异度,评估这2种阅片方法对肺结节定性的诊断效能。
1.6 统计学处理应用SPSS 22.0软件进行统计学分析。计数资料以例数和百分率表示,组间比较采用χ2检验,P<0.05为差异有统计学意义。
2 结果
2.1 常规人工阅片与AI影像辅助诊断系统阅片对肺结节检出情况比较85例患者共检出真性结节290枚,其中平均直径<5 mm结节171枚,5 mm≤直径≤10 mm结节83枚,直径>10 mm结节36枚。171枚平均直径<5 mm的小结节中,AI检出162枚(94.74%),人工阅片检出78枚(45.61%),其中人工阅片检出而AI阅片未检出9枚(5.26%),人工阅片未检出而AI阅片检出93枚(54.38%),AI阅片检出率显著高于人工阅片检出率,差异有统计学意义(χ2= 4.317,P<0.01)。83枚5 mm≤直径≤10 mm 的结节中,AI阅片检出83枚(100.00%),人工阅片检出45枚(54.21%),其中人工阅片检出而AI阅片未检出0枚(0.00%),人工阅片未检出而AI阅片检出38枚(45.78%),AI阅片检出率显著高于人工阅片检出率(χ2=1.744,P<0.01)。36枚平均直径>10 mm的结节中,AI阅片检出率和人工阅片检出率均为100.00%(36/36)。
2.2 常规人工阅片与AI影像辅助诊断系统阅片对肺结节良恶性的评定结果比较在检出的290枚真性结节中,AI阅片检出281枚,其中AI阅片评定为低危结节99枚、中低危结节52枚、中危结节38枚、高危结节(恶性结节)92枚,另有9枚未检出;人工阅片检出159枚,其中人工阅片评定为低危结节59枚、中低危结节24枚、中危结节21枚、高危结节(恶性结节)55枚,另有131枚未检出。经病理证实的恶性结节共66枚,其中AI判定正确62枚,4枚未检出,准确率为93.93%(62/66),AI判定为恶性而实际为良性者30枚;人工阅片判定正确者52枚,14枚未检出,准确率为78.79%(52/66),人工阅片判定为恶性而实际为良性者3枚;AI判定准确率显著高于人工阅片,差异有统计学意义(χ2=3.216,P<0.05)。
2.3 2种阅片方法对肺结节良恶性判定的效能比较结果见表1。85例患者中,病理诊断为良性24例,其中结核13例,隐球菌3例,炎症结节8例;病理诊断为恶性61例,其中肺鳞癌7例,腺癌54例。AI阅片对肺恶性结节检查的灵敏度、假阳性率显著高于人工阅片,特异度和假阴性率显著低于人工阅片,差异均有统计学意义(χ2= 2.311、4.165、7.896、2.311,P<0.05)。
表1 2种阅片方法对肺结节良恶性判定的效能比较
3 讨论
AI技术是随着大数据的进步而兴起的一门新兴技术,其在医学领域中得到广泛应用,尤其在肺结节的检测方面具有较大进展[6]。基于AI的计算机辅助诊断(AI computer-aided diagnosis,CAD)系统方案大多比较复杂和耗时,需要更多的图像处理模块,且相关敏感度及特异度较低[7]。目前,深度学习是AI技术的研究热点,其敏感度和特异度较传统的 CAD 高,在肺结节检出及定性方面应用较多。但以往的研究对不同模型算法的 AI的探讨大多侧重于其原理、算法步骤等[8],很少从临床应用角度评价其对肺结节的诊断价值。深度学习通过算法使AI可以从影像资料中提取肺结节的各项特征数据,通过大量的数据分析,从中提取到规律,从而对肺结节进行识别并判断肺结节的良恶性。基于此,本研究结合病理和随访结果,对比常规人工阅片与AI影像辅助诊断系统阅片对肺结节的诊断效果,探讨AI影像辅助诊断系统诊断肺结节的价值。
本研究结果显示,对于直径<5 mm的微小结节及5 mm≤直径≤10 mm的小结节,AI检出率分别为94.74%、100.00%,显著高于常规人工阅片。对于直径>10 mm的结节,AI及常规人工阅片均能全部检出。在对肺结节的定性分析中,AI的特异度为64.5%,而常规人工阅片的特异度为85.2%。分析其原因如下:(1)AI对与肺纹理位置相近、形态相似病灶的检出率高于常规人工阅片。(2)AI对于平均直径<5 mm的微小结节及5 mm≤直径≤10 mm的小结节检出率高于常规人工阅片,尤其是对微小结节的诊断效果更显著,可以明显降低临床诊断的漏诊率及假阴性率,但假阳性率也明显增高。对于肺结节的定性,AI的特异度显著低于人工阅片,尤其是对直径<5 mm的微小结节定性中特异度更低。李欣菱等[2]研究认为,AI对较小结节(特别是<5 mm的结节)诊断的临床意义有待商榷,若完全按照 AI 的结果进行临床干预会增加医疗负担及造成过度治疗。(3)目前肺结节诊断主要依赖于薄层CT,图像数据量大,影像医师相对短缺,导致工作压力过大,精神及注意力无法长时间集中,进而造成肺小结节的漏诊。(4)人工阅片对于肺小结节良恶性的鉴别有赖于影像医师自身的临床经验,具有较强的主观性,从而导致诊断精确度和可信度较低。
肺癌的早期诊断、早期治疗是延长患者生存期的最佳途径[9-10]。肺结节作为肺癌的早期表现,其早期发现及良恶性的鉴别对肺癌的早期诊断、早期治疗有重大意义,是目前临床医师工作中面临的挑战。本研究结果显示,AI阅片诊断肺结节的灵敏度、假阴性率高于常规人工阅片,但其假阳性率亦高于常规人工阅片,特异度低于常规人工阅片。分析其原因,主要是由于AI会将支气管内黏液栓、交叉的血管、肺纤维化灶、局部肺实变、肺尖部胸膜帽等误诊为高危结节,所以需要进一步加强AI软件数据集的质量管理,扩大数据集训练数量,以进一步减少误诊,提升恶性结节检出的准确性[11]。虽然常规人工阅片的特异度高于AI阅片,但对于早期缺乏特异影像学表现的肺结节,影像医师无法客观评价其形态、大小、边缘、病灶内实性成分的位置及病灶邻近胸膜改变情况,只能依据既往经验进行主观判断,进而影响肺小结节良恶性的判断;而AI阅片是基于对大数据深度学习基础之上的进一步分析,能对早期恶性肺结节进行客观分析及诊断。
综上所述,AI影像辅助诊断系统阅片有较高的检出率及灵敏度,能有效减少临床工作中的漏诊率;但其特异度低于常规人工阅片,有一定的假阳性率。因此,在临床工作中推荐运用AI影像辅助诊断系统阅片联合常规人工阅片的模式,以有效提高对肺结节的早期发现及良恶性鉴别的准确度,减少漏诊率。