APP下载

人工智能辅助软件可提升疲劳状态下放射科规培医师对肺结节的检测效能

2021-04-26王亮许迪孙丹丹顾俊伍建林于晶

放射学实践 2021年4期
关键词:规培放射科结节

王亮,许迪,孙丹丹,顾俊,伍建林,于晶

近几年来,国内外学者越来越关注医疗差错、疲劳等因素在医学诊断和治疗等方面产生的影响,尤其是在放射领域。在放射医师中,回顾性分析发现首诊错误率(假阳性和假阴性)高达约30%[1],其中疲劳所致的诊断错误占有相当高的比例。随着CT薄层图像技术的广泛应用,图像负荷骤然增加,导致放射科医师工作量及工作时长日益增长。近年来人工智能技术发展迅速,基于人工神经网络的智能计算机辅助诊断系统已逐渐嵌入临床工作流程之中[2],尤其以基于深度学习的肺结节检测软件的表现更为抢眼。人工智能辅助肺结节检测系统作为放射科医师的“密友”,有助于提高对肺结节的检出率和准确性[3]。国内外众多学者对不同的类似软件及模型在辅助临床工作中的价值和限度等进行了深入研究和分析,但少有学者研究其对疲劳状态下放射科医师工作效能的影响。目前放射科处于一线诊断工作的医师绝大多数为规培医师。本文旨在探究AI辅助软件能否提高疲劳状态下放射科规培医师在临床工作中对肺结节的诊断效能。

材料与方法

1.临床资料

前瞻性将2019年1月1日-1月10日在本院使用2代炫速双源CT行胸部CT检查的200例患者纳入观察。图像纳入标准:①深吸气后屏气状态下连续扫描图像;②无金属伪影、呼吸伪影等原因导致的CT图像质量不佳;③无肺炎、肺不张和胸腔积液等病变而影响病灶的确认及标注者;④排除肺内无结节或结节数量过多(结节总数大于20个)的患者;⑤排除肺叶或肺段切除术后患者。最终共纳入符合条件的182例患者,女103例,男79例,年龄21~77岁,平均(49.5±14.2)岁。

2.图像采集和重建

使用Somatom Definition Flash CT机,常规行CT平扫,扫描范围自胸廓人口至后肋膈角尖端水平,于吸气末单次屏气内完成扫描。标准扫描方案:管电流采用自动曝光控制技术,120 kV,准直宽度128×0.6 mm,螺距1.2,常规重建层厚1.0 mm、层距0.7 mm。图像采集完成后分别采用高分辨算法(B70f)和标准算法(B30f)自动重建原始扫描数据,并将所有图像传输至PACS和人工智能服务器(InferRead CT Lung Research,Infervision,Beijing,China)进行肺结节自动检测,获得检测结果(包括结节数目、长径及位置等)。

3.金标准及阅片方式

由2位从事胸部影像诊断工作超过8年的中级医师结合AI辅助软件的检测结果逐层阅片并记录结节数目、长径及位置,两人检测结果交由第3位从事胸部影像诊断工作超过15年的主任医师进行审核,做出最终诊断作为金标准。

受试者为影像专业规范化培训医师(从事胸部影像诊断工作4~12个月),测试前将肺结节标注标准告知受试者并进行培训(依据2018年《胸部CT肺结节数据标注与质量控制专家共识》进行培训,达到能够在正常工作状态下准确识别各类型结节)。受试者按以下3种模式下进行阅片:模式A为不借助AI辅助软件,受试者在正常状态下(即一天工作之前)独立阅读每个病例的CT图像;模式B为两周过后(洗脱期),受试者在疲劳状态下(即一天工作满8小时后)不借助AI辅助软件再次阅片;模式C为再次洗脱期过后,受试者在疲劳状态下结合AI辅助软件的检测结果再次阅片。三组阅片结果分别以Excel表格形式记录结节的位置、大小和数量。每次阅片之后,将肺结节的检测结果与金标准进行比对,并由受试者回顾分析每次漏检结节的原因并记录。

图1 患者,男,56岁。金标准确认左肺上叶有一磨玻璃结节。a)正常状态下(模式A)该结节被检出(红色圆圈);b)在疲劳状态下(模式B)独立阅片时未检出;c)AI软件辅助下疲劳状态(C模式)的规培医师准确检出结节(绿色方框)。 图2 患者,男,57岁。金标准确认左肺下叶前内基底段有一磨玻璃结节。a)正常状态下(模式A)该结节未被检出;b)在疲劳状态下(模式B)独立阅片时未检出此结节;c)AI软件辅助下疲劳状态(C模式)的规培医师准确检出此结节(黄色方框)。

表1 正常状态和疲劳状态下对肺结节检测情况的比较

4.统计学分析

分别计算3组中检出肺结节的敏感度、(患者)人均误诊结节数。敏感度计算方法为每组真阳性结节总数/总结节数;人均误诊结节数计算方法为每组假阳性结节数(误诊结节总数)/CT检查患者例数。比较三种阅片模式对肺结节的检测能力。进一步将结节按照大小分为3类,分别为长径<4 mm、4 mm≤长径<10 mm和10 mm≤长径<30 mm[4],分别计算B、C两组中对3类肺结节的检出敏感度和人均误诊结节数。利用SPSS 20.0统计学软件进行统计学分析,对正态分布的计量资料采用配对样本t检验,非正态分布的计量资料的组间比较采用(配对样本)Wilcoxon秩检验,以P<0.05为差异具有统计学意义。

结 果

按照金标准,200例患者共检出1281个肺结节。A、B和C三种阅片模式对肺结节的检出情况及比较结果见表1。A、B模式之间敏感度和人均误诊结节数的差异均具有统计学意义(P<0.05),疲劳状态下规培医师对肺结节的检测敏感度下降,但人均误诊结节数也有所有下降。应用AI辅助软件后,疲劳状态下规培医师对肺结节的检测效能明显提升,人均误诊结节数下降(图1),差异均具有统计学意义(P<0.05)。应用AI辅助肺结节检测软件后,疲劳状态下的规培医师对肺结节的检测效能已经超过其正常状态的水平(图2),人均误诊结节数下降程度更为明显,差异均具有统计学意义(P<0.05)。

图3 患者,男,23岁。金标准确认右肺中叶有一实性结节位于血管旁。a)正常状态下(模式A)此结节被准确检出(红色圆圈);b)在疲劳状态下(模式B)独立阅片时虽观察到此结节但未确认,最终导致漏检此结节;c)AI软件辅助下疲劳状态(C模式)的规培医师准确检出此结节(绿色方框)。

表2 疲劳状态独立阅片与疲劳状态AI辅助阅片对不同大小结节检测情况的比较

两种阅片模式对不同大小肺结节的检出情况见表2。应用AI辅助软件后规培医师对<4 mm结节的检出敏感度提升了40.28%,对4~10 mm结节检出敏感度提升了27.08%。

回顾性分析191个漏检结节的特征和原因:64个结节的长径为0.9~3.0 mm;28个结节位于血管旁或与血管走行相延续,短径与血管相仿(图3);28枚结节位于胸膜下;28个结节为密度对比较低的纯磨玻璃结节;另有43个结节被规培医生成功发现,但又将其错误地排除。显示经金标准确认的右肺中叶实性血管旁结节,短径与血管管径相近,在日常工作前和在人工智能辅助下的疲劳状态下的规培医生准确检出,在疲劳状态下独立阅片时虽被观察到,但未被确认为结节,最终漏检该结节。

讨 论

Waite等[5]对疲劳在放射学中的影响进行了综述,从本质上讲,它是一种精神疲倦和体能消耗,可以表现在身体和认知两方面[5]。对于放射科医生来说,长时间的集中注意力工作、全面地观察不同负荷的图像、使用三维图像观察复杂的解剖结构,以及快速阅读的时效要求等诸多方面,都是导致其产生疲劳的因素。众多因素中,眼睛疲劳和视力模糊的严重程度随着阅读图像的数量和总阅读时间增加而增加,并且保持聚焦变得越来越困难[6-7]。瑞典职业疲劳量表提供了一个感知疲劳的模型,它通过5个方面(缺乏能量、体力消耗、身体不适、缺乏动力和嗜睡)的评分来评价疲劳程度[8]。Krupinski等[9-10]应用瑞典职业疲劳量表进一步研究发现,放射科医师在日常工作中疲劳感是不断蓄积的过程,在日常的临床图像判读工作满8小时后,其SOFI评分更差,并且阅片诊断的错误率增加、准确性降低。因此,本研究中以日常工作满8小时作为疲劳状态的定义。临床工作中,由于疲劳所造成的错误最常见的是遗漏错误和假阳性错误,由此引发的医患双方对簿公堂的案例屡见不鲜。如何破解疲劳对临床工作带来的不利影响,众多学者提出的各种理论和方案尚未达成共识。而人工智能辅助软件的临床应用及其优异表现,给解决临床医师的疲劳问题带来了新的思路。

疲劳状态可导致放射科医师对肺结节的检出率降低、漏诊结节增多及准确性下降[10],而这一表现在缺乏工作经验的规培医师中体现得更为明显[11]。本研究中得到了类似结果,B模式比A模式的检出敏感度下降了5.85%,多漏检191个结节,这对于本身诊断经验不足的规培医师来说较正常状态下降了近12.66%;尽管,人均误诊结节数下降了0.39,但其主要原因并非单纯误诊结节数的减少,而是与相对应的患者检查例数减少,进而导致检出结节总数(A组889个、B组742个)的下降有一定关系。准确检出直径过小、密度对比差及位置隐匿的结节对规培医师来说即使在正常状态下独立阅片时也是一件不容易的事,此类结节在疲劳状态下易出现漏检是在意料之中的,这与类似CAD辅助检测结节的研究结果相符[11-12]。我们推测规培医师之所以会错误的排除结节,可能与规培医师的诊断经验不足、以及疲劳后认知能力、记忆力和注意力下降等原因有一定关系[5]。

使用AI辅助软件后,疲劳状态下漏检的191个结节中有154个结节被正确检出,约占漏检结节数的80.6%。不仅如此,敏感度也有近乎成倍的提升,从40.36%提升至3组最高的77.67%,提升率达37.31%,且人均误诊结节数降至3组最低的0.91。由此可见,疲劳在肺结节检测中所引起的错误(假阴性、假阳性)绝大部分被纠正,同时带来了准确性的大幅度提升。但在AI软件辅助下仍有漏检结节的存在,其中包括规培医师与AI软件共同漏检的结节,以及由于经验不足或者认知能力下降所致的漏检结节。如果随着规培医师临床诊断经验的不断积累和提升,对此类结节的漏检概率会显著降低。

进一步对不同大小肺结节的检测情况进行分析,放射科规培医师在疲劳状态下应用AI辅助软件后,<4mm结节组中检出敏感度大幅度提升,程度超过110%,人均误诊结节数下降也较为明显。一方面说明越小的结节越容易被漏诊,尤其是在放射科医师在长时间工作产生疲劳之后,这符合临床上对肺结节检测的普遍经验;另一方面说明AI人工智能辅助肺结节检测软件能够“不知疲倦”的达到稳定的检出效能;同时软件检出的结节需要与医师互动,进行人工再判断,这对于诊断经验有限的规培医师,人均误诊结节数的下降表现也是符合预期的。假阳性结节数的减少可以让临床医师无需对这些无临床价值的结节耗费一天中有限的精力,同时让呈现此类结节表现的患者避免不必要的紧张和焦虑。我们注意到,4~10 mm结节组中B模式与C模式之间检出敏感度的差异具有统计学意义(P<0.05),但在人均误诊结节数方面的差异并无统计学意义(P>0.05)。相对于<4 mm结节来说,4~10 mm结节的形态学特征更为复杂,这对于规培医师来说,正确分析判断具有一定的难度,人均误诊结节数略微升高情有可原。

本研究的局限性:首先,金标准没有利用外部参考标准(如组织学证据),而是采用两位从事胸部影像诊断的中级医师及一位主任医师(工作时间超过15年)的3次阅片的共识作为内部参照标准,这一局限性在评价CAD效能的研究中普遍存在;其次,本研究中并没有对两次疲劳程度进行量化,我们考虑到造成电脑终端操作者视觉疲劳的原因包括众多不可控的客观因素及复杂的主观因素,不可能精确控制或重复,而且本研究中10~30 mm的结节数量较少,对这类结节的检测评价需要更大数据量的研究来进一步分析探讨;最后,本研究结果仅代表一个特定算法的在特定参数时CAD的表现,并不能完全等同于其它类似软件。本研究的重点是阅片者和CAD之间的交互所能产生的提升效果,并非单纯对软件性能的评价。

综上所述,疲劳确实能让放射科规培医师对肺结节诊断效能下降,应用AI辅助肺结节检测软件能帮助其提升诊断效能,甚至超越其正常状态的诊断水平,对直径<4 mm结节检出率的提升尤为显著。

猜你喜欢

规培放射科结节
肿瘤放射治疗学临床规培医师教学中应用EBM联合PBL的效果分析
岗位胜任力结合情景教学模式在急诊住院医师规培中的应用价值探讨
体检发现的结节,离癌症有多远?
肺结节,不纠结
发现肺结节需要做PET/CT吗?
肺结节≠肺癌,发现肺结节如何复查?
“互联网+CBL”模式在核医学规培中的创新应用效果研究
规培医生为主讲的小讲课在规培教育中的应用
探讨影像学技术在放射科的作用与现代影像质量研究
医院影像学发展与放射科数字化改造