基于人工智能诊断系统的胸部CT 肺结节检出率及良恶性诊断研究
2022-12-29崔晓剑吴晓明舒锦尔
崔晓剑 吴晓明 舒锦尔 王 波
金华市人民医院医院影像介入科,浙江金华 321000
肺癌是临床常见恶性肿瘤之一,病死率较高,已成为世界各国努力攻克的医学难题。肺癌早期缺乏特异性表现,患者出现症状就诊时多已处于中晚期,其5 年生存率仅为15%~16%[1]。早发现、早治疗是降低肺癌病死率的重要手段。肺结节是肺癌的早期阶段,肺结节的早期发现有助于实现早期干预。胸部CT 检查是肺结节早期检出的重要手段,随着胸部CT 技术与人工智能(artificial intelligence,AI)辅助诊断技术的不断发展,肺部小结节的检出率得到极大提升[2,3]。AI 诊断系统的诞生既是高科技时代的产物,也是临床工作的迫切需要。研究发现,海量的CT 图像容易引起阅片医生的视觉疲劳,因疲劳状态而造成小结节的漏诊率高达40%[4]。目前已有研究证实AI 诊断系统输出的“第二意见”不仅准确性较高,还可减轻影像科医生的阅片压力[5,6]。本研究拟探讨基于智能诊断系统的胸部CT 在肺结节检出及良恶性判断中的作用,现报道如下。
1 资料与方法
1.1 一般资料
收集2021 年2 月至2022 年3 月于金华市人民医院影像介入科行胸部CT 扫描且同时接受肺结节AI诊断系统检查的97例患者的临床资料,纳入标准:①具有胸部高分辨率的CT 图像;②患者至少1 个结节有完整的病理资料;③AI诊断结果完整。排除标准:①合并肺间质病变、慢性阻塞性肺疾病、肺部多发性感染、肺纤维化;②肺不张、纵隔淋巴结肿大;③既往有明确的肺部手术史。97 例患者中男51 例,女46 例;年龄35~73 岁,平均(53.29±8.77)岁。
1.2 方法
1.2.1 胸部CT扫描方法 仪器:飞利浦Ingenuity Core 128 排螺旋CT 扫描仪;参数:管电压120kV,管电流240mA,层厚5mm,间距5mm,矩阵512×512,视野30cm×30cm。患者取仰卧位,头先进,扫描从胸廓入口至双肾上缘,采用肺窗图像与纵隔窗图像,扫描后采用0.625mm 层厚与间隔进行图像重建与后处理。
1.2.2 AI 诊断系统 采用基于自适应3D 深度学习模型技术的深睿医疗AI 影像辅助筛查系统(版本号:MIDS-PNAB V1.2.0.1),将患者的薄层重建数据导入工作站,系统自动得出结节位置、大小、密度、危险度,其中“高危”为恶性,“中低危”为良性[7]。
1.3 影像评估
1.3.1 金标准 由2 名高级职称影像诊断医生共同判定[7]。①纯磨玻璃:密度稍淡且基本一致<3cm 的异常密度影,可见病变部位血管影;②混合磨玻璃:磨玻璃结节中可见实性结节;③实性:完全高密度且均匀,掩盖肺纹理;④钙化:边界清且密度高。
1.3.2 良恶性 病理结果由2 名高级职称病理医生确认,包括结节部位、大小、组织病理类型[参考《肺结节诊治中国专家共识(2018 年版)》[8]]。AI 诊断系统良恶性为自动报告(高危、中低危)。
1.3.3 评估 分别记录人工检出结果与AI 诊断系统结果,并计算真阳性结节检出率、假阳性结节检出率、假阴性结节漏检率、敏感度与阳性预测值。
1.4 统计学方法
采用SPSS 20.0 统计学软件对数据进行分析处理。计量资料以均数±标准差()表示,比较采用独立样本t检验;计数资料以例数(百分率)[n(%)]表示,比较采用χ2检验。P<0.05 为差异有统计学意义。
2 结果
2.1 AI 诊断系统与人工对肺结节检出效能的比较
AI 诊断系统共检出结节532 个,其中实性结节302 个,混合磨玻璃结节81 个,含钙化结节75 个,纯磨玻璃结节74 个,假阳性结节79 个,假阴性结节2 个,敏感度99.6%,阳性预测值84.4%;79 个假阳性结节中实性结节56 个,混合磨玻璃结节2 个,钙化结节17 个,纯磨玻璃结节4 个;2 个假阴性结节中实性结节1 个,混合磨玻璃结节1 个。人工诊断检出结节419 个,假阴性结节32 个,敏感度92.9%,阳性预测值100%;32 个假阴性结节中实性结节11个,混合磨玻璃结节5 个,纯磨玻璃结节16 个。人工诊断的敏感度显著低于AI 诊断系统(χ2=27.508,P<0.001),阳性预测值显著高于 AI 诊断系统(χ2=71.621,P<0.001)。
2.2 AI 诊断系统与人工诊断对各类肺结节漏诊情况的比较
AI 诊断系统各结节漏诊率分别为实性结节0.41%(1/244)、混合磨玻璃结节1.25%(1/80);人工各结节漏诊率分别为实性结节4.51%(11/244)、混合磨玻璃结节 7.50%(6/80)、纯磨玻璃结节21.43%(15/70),AI 诊断系统实性结节、混合磨玻璃结节、纯磨玻璃结节的漏诊率均显著低于人工诊断(χ2=8.543,3.735,16.800,P<0.05)。
2.3 AI 诊断系统的假阳性结节结果分析
AI 诊断系统共检出假阳性结节79 个,其中实性结节56 个,主要表现为血管影,部分为心包突起与胸膜凹陷,见图1;混合磨玻璃结节2 个,主要表现为血管纹理,见图2;钙化结节17 个,为肋软骨钙化、胸椎骨刺等,见图3;纯磨玻璃结节4 个,主要表现为肺纹理,见图4。
图1 实性结节
图2 混合磨玻璃结节
图3 钙化结节
图4 纯磨玻璃结节
2.4 AI 诊断系统与人工诊断结果比较
AI 诊断系统结果与病理诊断的符合率为72.28%,与病理结果一致性的Kappa 值为0.430;人工诊断与病理诊断符合率为90.02%,与病理结果一致性的Kappa 值为0.791,人工诊断的符合率显著高于AI 诊断系统(χ2=46.390,P<0.05)。
3 讨论
目前临床多采用高分辨率CT 筛查与定性肺结节,但在获得高清晰度图像的同时,高分辨率CT 图像的数量也成倍增加,放射科医生阅读大量图像时难免会产生视觉疲劳,进而造成误诊、漏诊。AI 诊断系统能够有效提升工作效率,减轻放射科医生的工作负荷[9]。
基于自适应3D 深度学习模型技术的AI 影像辅助筛查系统采用三维卷积神经网络技术,其优势在于根据类似结构在图像中出现的不同位置原理进行权重分配,软件能自动提取识别相应特征及经过标识的数据;能通过不断增加新病种数据不断提升学习能力[10,11]。本研究结果发现,实际结节数为451,而AI 诊断系统共检出结节532 个,假阳性结节79个,假阳性率较高。这些结节多为发生于肺门区的血管断面、心包突起、胸膜凹陷等。分析原因:肺结节的形态与位置存在较明显的多变性,当结节发生慢性炎症或接近肺正常组织时,AI 诊断系统就越容易被干扰;AI 诊断系统对于肋软骨钙化、胸椎骨刺等难以与钙化结节进行有效区分。假阴性结节2个,为肺门区附近,分析原因:可能与肺门血管走行较为复杂相关,AI 诊断系统误以为是正常血管影。人工检出无假阳性,但假阴性结节32 个,与罗亚敏等[12]报道的结果基本一致,分析原因:人工阅片对微小结节的检出难度较大,特别是当结节直径<5mm,甚至<3mm 时,难度更大。两者比较,AI 诊断系统的结节检出假阳性率较高,假阴性率低,而人工诊断假阳性率低,假阴性率较高。二者结合,在人工阅片时参考AI 诊断系统的输出结果,不仅可降低小结节的漏诊率,还能大幅度减轻人工工作负荷。
肺结节的鉴别诊断主要是根据特定征象进行评价,首先是判断其良恶性,再进行病变的分类分型。常规思路是从结节形状特点作为切入点,一般良性病变的边缘清晰、光滑,恶性病变边缘可见毛刺、分叶等[13,14]。当然,良恶性的诊断还需要考虑结节周围的肺野情况,索条状纤维灶、卫星灶、胸腔积液、胸膜增厚等都有一定的参考意义[15,16]。本研究结果显示,AI 诊断系统结果与病理诊断符合率为72.28%,与病理结果一致性的Kappa 值为0.430,与既往研究结果基本一致[17,18]。AI 诊断系统能够进行肺结节的自动检测、病灶的自动分隔、测量定量和定性参数,从而判断结节的类型与良恶性,这是AI 诊断系统的优势所在,但也是不足点,需要对系统软件数据库与计算方法进行不断扩大与优化,才能提升“恶性概率”的准确性[19,20]。结合本研究结果,建议在今后的临床工作中,可将AI 诊断系统作为初筛工具,对可疑病变进行标记,然后影像科医生开展二次阅片,以提升肺结节检出率,将人工经验与AI 诊断结果提示的高危结节进行重点分析,从而对结节性质做出精准判断。
综上所述,基于AI 诊断系统的胸部CT 肺结节检出假阳性率较高,假阴性率低;在结节的定性诊断上与人工诊断还有一定差距,可作为人工诊断的参考。