APP下载

人工智能与不同级别医师对肺结节检出效能的对照研究

2020-10-22张正华蔡雅倩韩丹周小君黄益龙段慧

中国医学影像学杂志 2020年9期
关键词:阅片胸膜阳性率

张正华,蔡雅倩,韩丹,周小君,黄益龙,段慧

昆明医科大学第一附属医院医学影像科,云南昆明 650000; *通讯作者 韩丹 kmhandan@sina.com

随着高分辨率CT(HRCT)在肺癌早期筛查应用的普及,图像数量倍增及对小结节显示率增高使阅片工作量剧增。高强度工作可导致影像科医师视觉疲劳,加之经验不足等,不可避免地导致小结节的漏诊和误诊。如何在人力资源不足的情况下,在大量图像中准确检出肺结节并早期定性成为临床的迫切需求。基于深度学习的人工智能(artificial intelligence,AI)凭借其较准确的算法模型可快捷地检出结节,并已开始在临床试用。然而目前有关AI 对肺结节检测效能的相关研究报道较少,且尚无明确定论[1-2]。本研究拟通过对比不同级别医师与AI 对肺结节的检出能力,评价AI 对肺结节检出的敏感性。

1 资料与方法

1.1 研究对象 随机抽取2018年10月—2019年6月昆明医科大学第一附属医院行胸部CT 平扫患者550 例,其中男382 例,女168 例;年龄18~78 岁,平均(58.6±11.7)岁。纳入标准:①肺结节1~40 枚,且直径≤3 cm;②CT 图像层厚为1 mm。排除标准:①肺部弥漫性病变;②按1~5 分制评价图像质量,排除评分≤3 分者。评分细则:1 分,无法显示正常结构,完全不能满足诊断要求;2 分,肺纹理及分支模糊,无法满足诊断要求;3 分,边缘模糊,肺纹理及分支尚可,基本可以满足诊断要求;4 分,边缘略模糊,肺纹理及分支清晰,满足诊断要求;5 分,边缘清晰,肺纹理及分支清晰,完全满足诊断要求[3]。

1.2 仪器与方法

1.2.1 CT 检查 采用Siemens Somatom Definition AS 128、Siemens Somatom Definition Flash 及联影UCT 760 CT 机行胸部HRCT 扫描。扫描参数:①Siemens Somatom Definition AS 128 层螺旋CT 机及Siemens Somatom Definition Flash:管电压100 kV,管电流80 mAs,半自动管电压调制,自动管电流调制,螺距0.938,重建卷积函数采用B70f。②联影UCT 760:平扫管电压100 kV,管电流80 mAs,自动管电流调制,螺距0.938、肺窗滤波函数B-SHARP-C。重建层厚1 mm,层间距1 mm。扫描范围从肺尖至肺底全部区域,两侧包括胸壁、腋窝。观察采用肺窗窗宽1500 Hu、窗位-400 Hu。

1.2.2 结果判读 由2名从事胸部影像诊断的主任医师采用盲法对550 例患者的胸部CT 图像共同阅片,分析结节的数目、位置、大小。当2 名主任医师判读结果不一致时,请第3 名主任医师共同协商确定一致性意见作为参照标准,以此计算肺结节的检出率和假阳性率。

根据肺结节位置分为胸膜下结节(与胸膜相连)、中心性结节(距肺门2.0 cm 以内)、外周性结节(肺门区以外,但不与胸膜相连);根据结节最大径分为小结节(<0.5 cm)、中等结节(0.5~1.0 cm)、大结节(>1.0 cm)。

1.2.3 分组及测定方法 根据阅片医师不同分成4组:A 组5 名5年制本科实习生(第5年临床实习,已从事肺部CT 诊断工作3 个月);B 组5 名住院医师(从事住院医师工作3年);C 组5 名主治医师(从事主治医师工作3年);D 组为AI(医学影像辅助诊断软件Dr.Wise Lung Analyzer,版本V1.1.0.1,型号MIDSPNA)软件。阅片内容:①每组结节检出的数目、位置、大小,并与参照标准对照,根据公式(1)、(2)分别计算每组肺结节的检出率和假阳性率;②医师阅片时间指医师在3兆巨鲨专业显示屏逐层观察全部肺窗图像,得出每例患者结节数目、位置、大小的时间;AI 阅片时间是点击AI 软件显示屏显示结节数目、位置、大小的时间。分别比较4 组肺结节检出情况和阅片时间。

1.3 统计学方法 采用SPSS 23.0 软件,符合正态分布的计量资料以±s表示。肺结节检出率的组内和组间比较采用χ2检验;各组阅片时间比较采用秩和检验或单因素方差分析,两两比较采用LSD 法。P<0.05 表示差异有统计学意义。

2 结果

2.1 参照标准 2 名主任医师共检出5520 枚结节。每例患者肺结节数为1~32 枚,平均(10.0±1.3)枚,结节直径0.2~2.8 cm。

2.2 结节检出情况比较 A、B、C 组内5 名医师肺结节检出率差异无统计学意义(χ2=9.266、7.130、5.618,P>0.05)。4 组平均检出率依次为A 组

A、B、C 组胸膜下、外周性及中心性结节检出率依次为A 组

表1 各组不同肺结节位置与大小检出率比较(%)

图1 AI 将体外衣物误判为结节(箭),致假阳性率较高(A);左肺下叶前基底段胸膜下磨玻璃结节(箭)容易漏诊,术后病理证实为腺癌(B)

2.3 阅片时间 各组组内阅片时间差异均无统计学意义(P>0.05);各组阅片时间分别为(14.9±2.5)min、(6.9±2.1)min、(5.0±1.5)min、(0.1±0.0)min,差异有统计学意义(P<0.001)。D 组阅片时间明显短于A、B、C 组,差异均有统计学意义(P<0.001)。

3 讨论

本研究结果显示人工阅片肺结节的检出率随着医师级别增高依次递增,且假阳性率依次递减,表明肺结节的检出需要一定的临床经验水平。在实际工作中,由于人员配备不均衡,部分医院缺乏高年资医师。高效的肺结节检测对肺癌的风险评估具有重要意义,快速准确定位肺结节的确切位置具有重要意义和挑战性。近年研究涉及基于传统计算机视觉算法计算机辅助诊断系统(CAD)和AI。CAD 方案大多比较复杂和耗时,需要更多的图像处理模块,且相关敏感度及特异度较低[4-5];AI 是一种基于卷积神经网络的肺结节检测模型,其敏感度和特异度较传统的CAD 高,目前在肺结节检出及定性方面应用较多,但以往研究对不同模型算法的AI 探讨较多,大多基于其原理、算法步骤等展开讨论[6-10],很少从临床及实用性评估其在临床工作中运用的准确性及弊端。2017年Fleichner 肺结节指南总原则指出,结节随访的重要指标包括数目及大小[11]。因此,本研究主要探讨AI 辅助诊断软件对肺结节位置、数目及大小的检测效能。

本研究结果显示,AI 组肺结节检出率为94.3%,高于以往研究报道的CAD 对肺结节的检出率[12-13]。金文忠等[2]报道以6 名资深影像专业医师作为参照标准,AI 肺结节检出率平均达96.6%,与本研究结果相似。本研究通过与不同级别的医师检出情况对照显示,AI 的检测水平略高于本院主治医师水平,若影像医师在临床工作中参考AI 检测结果,可大大减少肺结节的漏诊,特别是对于实习医师及住院医师而言。对于不同位置结节的检出情况,主治医师组胸膜下结节检出率与AI 组差异无统计学意义。由于胸膜下结节表现为与胸膜相连的结节影,易于观察。AI 组外周及中心性结节检出率显著高于人工阅片,由于该区域肺纹理相对较多,结节与血管断面相似,加之长时间人工阅片导致注意力难以集中。对于不同大小结节的检出情况,主治医师组大结节检出率与AI 组差异无统计学意义,两组大结节检出率为98.5%、96.8%。刘晓鹏等[1]以病理结果为“金标准”,AI 的肺结节(1~3 cm)检出率为96.4%,表明AI 在大结节检出方面具有较完善的算法。AI 组中等结节及小结节检出率明显高于人工阅片,其可能原因为结节较小且人工阅片易疲劳,容易漏诊。AI 肺结节的高检出率使得临床工作中肺结节的检出率增加;而李欣菱等[14]研究认为其对较小(特别是<0.5 cm)结节的临床意义有待商榷,若完全按照AI 的结果进行临床干预会增加医疗负担及过度治疗。因此,对肺结节的判断及干预需要医师参考AI 结果并进一步分析。

本研究发现,AI 检出结节总数大于参照标准。由于AI 的高敏感性而出现假阳性率较高(14.0%)的特点,表明目前AI 的重点集中在阳性结节的学习上,而对假阳性结节的学习尚需完善。本研究中AI 容易将血管截面及肺外部分结构标注成结节(如体外衣物、胸锁关节及胃肠道内容物等),易于辨认,在临床工作中需影像医师进行复诊。有研究采用训练大规模数据集的方式自动化学习和提升,可明显降低假阳性率[15]。尽管AI 组肺结节检出率高于人工阅片,但也会遗漏一些结节,AI 未检出结节的可能原因包括:①结节较小;②结节位于胸膜下;③结节位于血管旁;④结节密度浅淡;⑤不明原因。在实际工作中发现,对于密度较淡且位于胸膜下的磨玻璃结节AI 更易漏诊,而这些磨玻璃结节往往是恶性结节。因此,在临床工作中应注意观察胸膜下、肺门及血管旁区域,防止漏诊。而对于那些不明原因的未检出结节,可能与软件的分割算法有关[11]。因此,基于深度学习的AI 算法仍需有针对性地改善模型并进一步优化参数,以提高肺结节的检出率并降低假阳性率。以往研究表明AI 较人工阅片时间明显缩短,每张胸片平均用时约为0.28 s[16];而本研究显示AI 阅CT 片时间仅为(0.1±0.0)min,大大提高了工作效率。Li 等[17]报道对于多发肺结节患者,AI 能快速直接显示结节的位置、数目及大小,为后续诊疗计划提供参考依据。因此,AI 协助影像科医师可提高阅片的速度和诊断准确率,使更多的患者从中受益。

总之,AI 对于肺结节的检出率较高,其水平略高于主治医师,作为肺结节筛检的有效辅助工具,在临床上可广泛应用。随着AI 算法的不断完善及多中心大样本研究的开展,有望进一步提高AI 的肺结节检出效能。

猜你喜欢

阅片胸膜阳性率
ThinPrep玻片扫描分析影像系统在子宫颈细胞学中的临床应用
多层螺旋CT鉴别恶性胸膜间皮瘤与胸膜转移瘤的应用价值
破伤风抗毒素复温时间对破伤风抗毒素皮试阳性率的影响
视频宣教结合回授法对肺结核患者病原学阳性率的影响
胸腔镜下胸膜活检术对胸膜间皮瘤诊治的临床价值
人工智能阅片在体检肺结节筛查中的应用价值
抗核抗体谱IgG 检测在自身免疫疾病中的应用分析
恶性胸膜间皮瘤、肺鳞癌重复癌一例
破伤风抗毒素复温时间对破伤风抗毒素皮试阳性率的影响
成人胸膜肺母细胞瘤1例CT表现