人工智能阅片在体检肺结节筛查中的应用价值
2022-03-17左玲子黄艳李双
左玲子 黄艳 李双
肺癌是威胁人类健康和癌症致死的主要原因之一[1,2]。肺癌的早发现、早治疗是提高生存率和降低病死率的关键[3]。随着国人对健康体检意识的逐渐加强和低剂量计算机断层扫描(computed tomography,CT)技术的应用,肺CT 在体检中的应用逐渐增多,同时也增加了放射医师的阅片负担,从而容易导致肺结节的漏诊。近年来,随着人工智能(artificial intelligence,AI)技术的不断成熟,其在肺结节筛查中的应用也逐渐被认可[4]。本研究旨在评估基于深度学习的AI 技术在筛查体检人群中肺结节中的应用价值。
1 资料与方法
1.1 一般资料 回顾性分析2020 年9~12 月于本院接受低剂量肺CT 扫描,并检出肺内至少1 个≥3 mm 非钙化结节的体检者150 例,男102 例,女48 例;年龄29~87 岁,平均年龄(59.6±12.3)岁。图像纳入标准:①经2 名放射科医师阅片;②排除报告中肺结节部位和数量认定不清的;③排除肺内弥漫性病变、胸膜多发病变。
1.2 检查方法 采用GE optima CT670 128 层螺CT机,在被检者吸气末进行全肺低剂量扫描,取仰卧位、头先进,扫描范围从肺尖至肺底扫描参数:管电压80 kV,管电流采用自动毫安技术;扫描层厚5 mm,重建层厚1.25 mm,重建间隔1.25 mm,扫描野(FOV)300~350 mm,矩阵 512×512,肺窗算法重建,窗宽:1500 HU,窗位:-600 HU;软组织算法重建,窗宽:350 HU,窗位:40 HU。
1.3 肺结节阅片方法 分别通过医师阅片和AI 阅片记录150 例肺CT 的全部肺结节,医师阅片是以PACS系统存档并有2 名放射科医师双签的肺CT 影像报告为基础记录肺结节的,AI 阅片是将150 例肺CT 数据分别传输至由依图公司提供的基于深度学习模型的AI 软件,自动分析出肺结节的数量、部位和大小,<3 mm 的微小结节不被记录。肺内结节认定的金标准是由2 位资深放射诊断医师在结合医师阅片和AI 阅片结果后一致认定得出的,并根据2018 版肺结节诊治中国专家共识将肺结节大小分为3 组:<5 mm 微小结节、5~10 mm小结节和11~30 mm 结节,肺结节的大小取结节最长径和最短径的平均值。
1.4 观察指标 比较医师阅片和AI 阅片在肺结节筛查中的真阳性率,分析漏诊和误诊的原因,评估AI 阅片在体检肺结节筛查中的应用价值。
1.5 统计学方法 采用SPSS22.0 统计学软件进行统计分析。计数资料以率(%)表示,采用χ2检验。P<0.05 表示差异具有统计学意义。
2 结果
2.1 两种阅片方式在肺结节筛查中的真阳性率比较入选的150 例肺CT 图像经过2 位资深放射诊断医师结合影像报告和AI 阅片结果(金标准)共认定557 个真结节。医师阅片共检出328 个肺结节,其中真结节326 个,误诊结节2 个,漏诊结节231 个;AI 阅片共检出958 个肺结节,其中真结节556 个,误诊结节402 个,漏诊结节1 个;AI 阅片检出肺结节的真阳性率99.8%(556/557)明显高于医师阅片的58.5%(326/557),差异有统计学意义(χ2=287.995,P=0.000<0.05)。见表1。
表1 两种阅片方式在肺结节筛查中的真阳性率比较(个,%)
2.2 AI 阅片误诊和医师阅片漏诊的原因分析 AI 阅片误诊402 个肺结节,占总检出结节的42.0%(402/958),平均每例误诊2.7 个结节(402/150),<5 mm 的误诊结节占误诊结节总数的84.6%,误诊原因多见于血管分叉、增粗,肺内索条影,胸膜结节和肺小叶结构(见图1),其他还有血管弯曲、增厚并扩张的细支气管、片状实变或渗出影、树芽征、胸膜斑、叶间胸膜肥厚、瘢痕、凸向肺野的纵隔血管(见图2,图3);医师阅片误诊2 个肺结节,均把血管轴面当做结节。AI 阅片漏诊1 个肺结节,占0.2%(1/557),为肺门区结节(见图4);医师阅片漏诊231 个肺结节,占41.5%(231/557),多为<5 mm 的结节,占漏诊结节的91.3%,主要漏诊原因是把微小结节误认为正常血管轴面。见表2。
表2 AI 阅片误诊和医师阅片漏诊结节的数量统计(个,%)
图1 右肺中叶血管分叉,AI 阅片假阳性
图2 右肺下叶增厚并扩张的细支气管,AI 阅片假阳性
图3 左上肺凸向肺野的纵隔血管,AI 阅片假阳性
图4 右肺门区结节,AI 阅片漏诊
3 讨论
应用于肺结节筛查的AI 技术大致经历了图像处理法、经典机器学习法和深度学习法三个阶段的发展过程。目前以卷积神经网络(convolution neural network,CNN)为代表的深度学习法在医学影像中得到广泛关注[5,6]。国内有研究报道,基于深度学习的AI 软件在肺结节检出中的敏感度为99.1%[7],而影像科医师在双阅片情况下肺CT 结节检出率仅为82.4%[8],AI 阅片不仅能降低肺结节筛查的漏诊率,在肺结节良恶性的判断方面也有很好的诊断效能[9-12]。
本研究基于深度学习法的AI 阅片在肺结节筛查的真阳性率方面明显高于医师阅片,弥补了医师阅片较高的漏诊率。医师漏诊的结节多数为微小结节,本研究<5 mm 的漏诊结节占所有漏诊结节的91.3%,主要原因是在水平轴位图像上这些微小结节容易与血管混淆,其次是放射诊断医生长时间阅片造成的视觉疲劳和注意力不集中[13],所以通过AI 阅片的辅助诊断能够明显减少放射诊断医生的漏诊率,同时减轻诊断医生的工作强度。但是,目前AI 阅片在肺结节的筛查中也有自身的不足,其中最主要的是假阳性率比较多[14],本研究中AI 阅片检出的假阳性结节占总检出结节的42.0%,平均每例肺CT 的假阳性结节为2.7 个,少于文献[15]报道的平均每例肺CT 4~22 个,可能是本研究选择的人群是健康体检者,并且在记录肺结节时用AI阅片自动滤过了<3 mm 的结节。因为通过AI 阅片发现<3 mm 的结节多为误诊的正常肺结构,尤其是大小2 mm×3 mm 的结节大多为正常血管结构或者是胸膜下索条影,所以<3 mm 结节没有纳入本研究。另外在AI 阅片筛选出的肺结节中,大小为2 mm×4 mm 的结节也多数为假阳性,主要误诊原因与大小2 mm×3 mm的结节一样,是否AI 阅片能通过结节的形状筛掉一些微小的假阳性结节有待进一步研究。造成AI 阅片假阳性结节的原因有血管分叉、增粗,肺内索条影,胸膜结节和肺小叶结构等,造成诸多假阳性的原因可能这些结构在形态、边缘和密度上同真结节有影像重叠之处,AI 阅片在特定的算法学习下还无法辨别真伪。医师阅片之所以能分辨这些假阳性结节,是因为医师能够识别结节邻近结构及判断结节的来源,并且能辨认病灶内部细微结构,比如小叶中心性结构由增厚的小叶间隔围绕形成,片状实变或渗出影中形成的假结节,胸膜结节起源于胸膜等,所以说诊断医师在识别AI 阅片中出现的假阳性结节是非常必要的。AI 软件在肺结节筛查中怎样降低假阳性率还有待进一步研究。
AI 阅片在肺CT 筛查中明显提高了肺结节检出的真阳性率,降低了漏诊率,但是所有被AI 阅片检出的结节是否都有临床意义以及需不需要进一步诊治,尤其是微小结节,还需要临床医生判断,比如2018 版肺结节诊治中国专家共识中指出,无肺癌危险因素≤4 mm 的实性结节不需要进行随访。因此AI 阅片在提高结节检出率的同时,如果临床医生不能对这些肺结节进行恰当的解释和处理,也会给人们带来心理负担,甚至是不必要的有创诊疗和医疗资源的浪费。
本研究是一篇回顾性研究,同时存在病例选择上的偏倚,比如纳入的病例都是医师阅片发现肺结节的病例,还有一些临床上漏诊病例无法纳入本研究,另外诊断医生水平和经验不一致,影像报告结果也存在诊断上的偏差。
综上所述,基于深度学习的AI 软件应用于肺CT筛查中,能够减少肺结节漏诊率和减轻放射科医生的工作负担,同时也有较高的假阳性率,只有AI 阅片与医师阅片相结合才能提高肺结节检出的准确率。