APP下载

人工智能对医师诊断新鲜肋骨骨折的应用价值

2024-10-31李玲郑爽爽柳丽

分子影像学杂志 2024年3期
关键词:计算机断层扫描人工智能

摘要:目的 "探讨人工智能(AI)软件对放射科住院医师、主治医师在新鲜肋骨骨折病灶检出率的差异及其应用AI前后的一致性评价,评估应用AI后各级医师诊断新鲜肋骨骨折效能的提高情况。方法 "收集因急性胸部外伤行胸部CT扫描病例300例,其中确诊为肋骨骨折的152例病例。将6位医师分为住院医师组和主治医师组两组,3人/组,对随机分配的300例CT图像独立阅片。在间隔为4周的洗脱期后,医师结合AI第2次阅片。采用卡方检验比较两组医师对新鲜肋骨骨折病灶及不同类型病灶检出率的差异,并评价各组应用AI前后的一致性、敏感度、特异度差异。结果 "应用AI后住院医师、主治医师对所有新鲜肋骨骨折、完全性骨折、不完全性骨折的检出率均高于医师单独阅片,差异有统计学意义(Plt;0.001)。住院医师+AI、主治医师+AI对全部肋骨骨折、不完全性骨折的Kappa值与Phi系数均明显提高,不完全性骨折提高幅度最显著。住院医师+AI、主治医师+AI检出新鲜肋骨骨折敏感度与住院医师、主治医师单独阅片的差异有统计学意义(Plt;0.001),特异度的差异无统计学意义。结论 "AI可有效提高不同级别医师对新鲜肋骨骨折的检出效能,并提高不同级别医师之间的一致性、敏感度。

关键词:人工智能;新鲜肋骨骨折;计算机断层扫描

Application value of artificial intelligence in the diagnosis of fresh rib fractures by physicians

LI Ling, ZHENG Shuangshuang, LIU Li

Department of Radiology, the Affiliated Fuxing Hospital of Capital Medical University, Beijing 100038, China

Abstract: Objective To investigate the difference of detection rate of fresh rib fracture lesions between radiology residents and attending physicians by artificial intelligence (AI) software and the consistency evaluation before and after application of AI, and to evaluate the improvement of efficiency of doctors at all levels in diagnosing fresh rib fractures after applying AI. Methods "A total of 300 patients with acute chest trauma underwent chest CT scan, 152 of which were confirmed to be rib fracture. 6 physicians were divided into resident physician group and attending physician group, with three physicians in each. 300 randomly assigned CT images were reviewed independently. After the washout interval of 4 weeks, the physicians combined with AI read the film for second time. Chi-square test was used to compare the difference in the detection rate of fresh rib fracture lesions and different types of lesions between the two groups, and to evaluate the difference in consistency, sensitivity and specificity before and after the application of AI in each group. Results After applying AI, the detection rate of all fresh rib fractures, complete fractures and incomplete fractures by residents and attending physicians was higher than that by physicians alone, and the difference was statistically significant (Plt;0.001). The Kappa values and Phi coefficients of all rib fractures and incomplete fractures were significantly improved by residents+AI and attending physicians+AI, and the improvement of incomplete fractures was the most significant. The sensitivity of fresh rib fractures detected by residents+AI, attending physicians+AI were significantly different from that by residents and attending physicians alone (Plt;0.001), there was no significant difference in specificity. Conclusion AI can effectively improve the detection efficiency of fresh rib fractures among physicians of different levels, and improve the consistency and sensitivity among physicians of different levels.

Keywords: artificial intelligence; fresh rib fracture; computer tomography

单纯肋骨骨折是急性胸部创伤后发生率最高的骨折类型,约44%[1] ,在钝性外伤中占比更高达55%[2],是法医临床学鉴定有关的胸部骨折中最常见的损伤[3]。肋骨骨折的数量及并发症与预后相关,根据病情及时选择正确的治疗方法,可达到满意的效果[4-5]。胸部CT已经成为胸部外伤后常规且必要的检查方法,可发现胸部X线平片容易漏诊的肋骨骨折[6]。但目前医师对肋骨骨折的误诊漏诊率较高[7]。近年来已有应用深度卷积神经网络模型自动诊断胸部CT肋骨骨折,但DNCC模型仅能诊断肋骨骨折,不能对骨折类型进行区分,且存在一些假阳性和假阴性病例[8-9]。目前已有的评价肋骨骨折一致性报道中只有单组医师的分析,没有对不同年资医师组别间的差异进行分析,也没有对不同类型骨折的一致性分析[10]。既往缺少对不同年资医师应用人工智能(AI)软件诊断不同类型的新鲜肋骨骨折的一致性评价的研究。因此探讨应用AI软件在诊断一致性的前提下提升低中年资医师的肋骨骨折检测效能极具临床意义。本研究旨在评估AI软件对基层不同级别影像医师诊断胸部CT新鲜肋骨骨折的应用价值及不同类型新发肋骨骨折病灶检出率的差异,并对各组医师应用AI前后诊断肋骨骨折的一致性、敏感度、特异度做出评价。

1 "资料与方法

1.1 "一般资料

回顾性分析我院2022年11月~2023年9月因急性胸部外伤行胸部CT检查病例300例,其中诊断为肋骨骨折的152例。300例患者中,男性150例,女性150例,年龄21~97(59.1±19.8)岁。图像纳入标准:有急性胸部外伤史;有薄层胸部CT图像(层厚0.625 mm);年龄≥18岁。图像排除标准:陈旧性肋骨骨折;图像有严重的运动伪影或呼吸伪影影响肋骨骨折诊断的病例;病理性肋骨骨折;体外异物伪影干扰。本研究获得了首都医科大学附属复兴医院伦理委员会的批准(批件号:2023FXHEC-KSP020)。

1.2 "检查方法

所有患者均采用64排螺旋CT(GE Revolution evo CT)进行扫描。扫描体位:仰卧位,上臂上举(部位患者因外伤无法上举则自然置于身体两侧),扫描范围自胸廓入口到第12肋骨下缘水平。扫描参数:管电压120 kV,使用自动管电流调制技术,噪声指数NI11(105~60 mA),层厚5 mm,矩阵512×512,使用骨算法重建层厚0.625 mm。

1.3 "参考标准

由3位高年资放射医师(工作经验≥20年)分别对肋骨骨折病例进行分析,对每个病例的所有肋骨骨折病灶进行标记,分型,诊断意见不一致的,以2人及以上同意结果作为诊断标准。

骨折根据形态分两种类型:完全性骨折定义为双侧骨皮质连续性中断,可伴有断端移位、成角、嵌插、碎骨片。不完全性骨折定义为骨折线局限于单侧骨皮质,或骨折累及双侧骨皮质但未穿透全部骨小梁结构。或仅有一侧或双侧骨骨皮质凹陷、外翘。

1.4 "AI流程

本研究使用的AI软件是北京深睿博联科技有限责任公司研发的辅助骨折诊断软件,扫描完成后将经过骨算法重建的薄层图像发送至深睿AI软件系统,AI自动对图像进行后处理及骨折部位标注、类型分析,医师进行阅片时可同时参考AI肋骨分析结果。

1.5 "阅片

将300例患者随机分成3组,每组100例。将6名医师分为2组,分别为3位住院医师和3位主治医师,6位影像医师对每组病例图像进行随机阅片。分2次阅片,第1次为3位住院医师、3位主治医师在PACS系统通过横断薄层图像单独阅片,对所有肋骨骨折病例进行分析。在间隔为4周的洗脱期后,住院医师、主治医师结合AI软件提取的肋骨骨折结果进行第2次阅片。各级医师+AI的阅片过程均为医师在PACS系统先对薄层图像进行研判,然后再结合AI检测结果对肋骨骨折病灶做出判断。可根据病灶情况结合AI的全肋、单肋分析多角度旋转观察及MPR后处理功能(图1)。

1.6 "有效性评价

将住院医师、主治医师、住院医师+AI、主治医师+AI的诊断结果与参考标准比对,其结果分为3类。真阳性:各组与参考标准均检测出某处肋骨骨折病灶。假阳性:各组检测出肋骨骨折病灶但参考标准未检出。假阴性:参考标准检出某处肋骨骨折,但各组未检出相同部位的肋骨骨折病灶。从患者层面,分别比较住院医师、主治医师应用AI前后检出肋骨骨折病灶的敏感度、特异度。

1.7 "统计学分析

采用SPSS27.0统计学软件,计量资料以均数±标准差表示,采用配对χ2检验比较两组医师应用AI前后对新鲜肋骨骨折检出率、患者层面敏感度及特异度的差异。采用Kappa检验与关联强度Phi系数评价两组应用AI前后的一致性。Kappa值≤0.4表明一致性很差,0.4lt;Kappa值≤0.6表明一致性中度,0.6lt;Kappa值≤0.75表明一致性较好,Kappa值gt;0.75表明一致性好。关联强度Phi系数ф,0.3lt;ф值表明相关很弱,0.3lt;ф值lt;0.6表明相关中度,0.6lt;ф值表明相关较强。以Plt;0.05为差异有统计学意义。

2 "结果

2.1 住院医师与主治医师诊断效能比较

300例病例中确诊肋骨骨折病例152例,3位高年资医师共检出新鲜肋骨骨折531处,其中完全性161处,不完全性370处。住院医师阅片共检测出新鲜肋骨骨折345处,其中完全性141处,不完全性204处。住院医师+AI阅片后检测出487处新鲜肋骨骨折,其中完全性159处,不完全性328处。主治医师阅片共检测出新鲜肋骨骨折341处,其中完全性135处,不完全性206处。主治医师+AI阅片后检测出492处新鲜肋骨骨折,其中完全性160处,不完全性332处(表1)。

2.2 "骨折病灶检出率

2.2.1 全部新鲜肋骨骨折病灶(完全性骨折+不完全性骨折)检出率 " 住院医师肋骨骨折检出率为64.97%,住院医师+AI检出率为91.71%,差异有统计学意义(Plt;0.001);主治医师肋骨骨折检出率为64.21%,主治医师+AI检出率为92.66%,差异有统计学意义(Plt;0.001,表2)。

2.2.2 "完全性肋骨骨折检出率 " 住院医师、住院医师+AI的肋骨骨折检出率分别为87.58%、98.76%,差异有统计学意义(Plt;0.001)。主治医师、主治医师+AI的肋骨骨折检出率分别为83.85%、99.38%,差异有统计学意义(Plt;0.001,表2)。

2.2.3 "不完全性肋骨骨折检出率 " 住院医师、住院医师+AI的肋骨骨折检出率分别为55.14%、88.65%,差异有统计学意义(Plt;0.001)。主治医师、主治医师+AI的肋骨骨折检出率分别为55.68%、89.73%,差异有统计学意义(Plt;0.001,表2)。

2.3 "一致性评价

应用AI后全部肋骨骨折的Kappa值明显提高,完全性肋骨骨折Kappa值变化不明显,不完全性肋骨骨折的Kappa值提高幅度最大,一致性程度由很差提高到中度。应用AI后全部肋骨骨折的Phi系数明显提高,完全性Phi系数变化不大,不完全性Phi系数提高明显,由很弱提高至中度(表3~4)。

2.4 "敏感度、特异度评价

在患者层面,住院医师、主治医师应用AI后检出新鲜肋骨骨折病灶敏感度优于单独医师组(97.37% vs 81.58%,Plt;0.001;96.71% vs 80.26%,Plt;0.001),两组特异度的差异均无统计学意义(P=0.590、0.803,表5)。

3 "讨论

肋骨骨折是法医鉴定胸部外伤中最常见的损伤,X线诊断符合率约80%,CT平扫符合率约95%[11],胸部CT对肋骨骨折的检出效能已经得到临床医生的充分肯定[12]。由于肋骨特殊的解剖学形态特点,目前医师对肋骨骨折的误诊漏诊率较高[7],但各种类型肋骨骨折的准确定位、定量涉及司法鉴定的多发当事人切身利益。探讨应用AI软件辅助医师提高肋骨骨折诊断率、并能有效提高不同年资医师的诊断结果一致性、敏感性具有实际临床应用意义。一项对包括肋骨在内的多个骨关节部位的多中心、大样本的研究结果显示,AI可有效提高放射科医师检测骨折的敏感性并缩短阅片时间[13]。该研究针对所有骨关节部位的AI分析对象均为X线平片,本研究AI软件的分析图像均为胸部高分辨薄层CT图像,能更清晰的显示病灶,使研究结果更为客观、精准。既往国内有基于深度学习的计算机辅助诊断系统对急性肋骨骨折诊断的研究将4位医师分为实习医师组及主治医师组,2人/组,从敏感度、特异度、阳性预测值、阅片时间及诊断信心多个角度进行分析探讨[14],但该研究未对不同年资医师应用AI前后对不同肋骨骨折类型评价的一致性及关联性进行探讨。本研究重点探讨不同年资医师应用AI前后对不同肋骨骨折一致性评价,进一步充分拓展了探讨AI软件诊断肋骨骨折的全面性,研究更为详细、深入。也有研究从检测召回率和分类准确率、敏感性角度评价深度学习模型辅助放射科医师诊断肋骨骨折取得良好效果[15-16]。

本研究结果显示,应用AI软件后,住院医师、主治医师对全部新鲜肋骨骨折、完全性肋骨骨折、不完全性肋骨骨折的检出率均明显提高。住院医师、主治医师对不完全性肋骨骨折的检出率均相对较低,应用AI后对不完全性肋骨骨折的检出率显著提高。住院医师、主治医师对完全性肋骨骨折的检出率均明显高于不完全性肋骨骨折的检出率,与不完全性肋骨骨折、尤其是细微骨折影像特征不明显有关。受各种因素影响,骨皮质局部略向内凹陷的细微骨折在厚层图像上极易漏诊,即使在0.625 mm的薄层图像上也较容易被忽略。应用AI后,住院医师、主治医师对不完全性肋骨骨折的检出率显著提高,显示AI在不完全性肋骨骨折检出能力方面更具优势。一致性分析结果显示结合AI用于诊断后,住院医师、主治医师在全部肋骨骨折的Kappa值与Phi系数均有明显提高,在不完全肋骨骨折的诊断上Kappa与Phi提高幅度最大,说明AI可以提高不同年资医师诊断肋骨骨折、尤其是不完全性肋骨骨折的一致性;而AI对住院医师、主治医师在完全性肋骨骨折的诊断上的Kappa值与Phi系数变化不大,对一致性结果并无改善,这可能与完全性肋骨骨折影像表现较为明显,相对容易诊断有关。有研究使用AI软件评价其对肋骨骨折的一致性结果,显示可提高不同阅片者之间的一致性[10],但该研究均为住院医师,不能更精准地进行不同年资医师组别间的影像诊断经验差异分析,且关联性Kappa值只有各医师及各医师+AI的比较,没有进一步对不同类型骨折的一致性做比较。因此,本研究全面研究全部新鲜肋骨骨折、完全性肋骨骨折、不完全性肋骨骨折应用AI前后的一致性比较,达到更客观更深入的研究结果。

住院医师与主治医师应用AI后检出新鲜肋骨骨折病灶敏感度优于单独医师组,住院医师的肋骨检测敏感度由81.58%提高至97.37%,主治医师的肋骨检出敏感度由80.26%提高至96.71%,表明不同年资医师结合AI软件均可以有效提高肋骨骨折病例检出敏感度。两组医师单独及应用AI后检出肋骨骨折敏感度差异无统计学意义,表明结合AI对提升不同年资医师检出肋骨骨折能力方面差异不大,对于诊断经验相对不足的基层影像医师来说,AI是适合的辅助肋骨骨折检测方法。也有研究显示,放射科医师应用AI算法后检出肋骨骨折的敏感度由89.8%提升至93.5%[17]。

AI检出肋骨骨折的假阳性病灶数量较多,主要原因是AI较难区分一部分正常变异结构,如走形变异的肋软骨钙化、呼吸运动伪影或手臂遮挡产生的硬化线束伪影或局部骨皮质略微增厚、血管沟等。AI对住院医师、主治医师在不完全肋骨骨折的检出率提高上起到了重要的提示作用,一部分不典型肋骨骨折被AI用蓝框标记骨折部位、类型后,医师会重点关注这些可疑部位,并仔细观察确认,有助于这些骨折病灶的检出。目前,我国的医学影像数据年增长率高达30%,而影像科医师年增长率不足4%[18-19],2017中国医师协会放射医师年会数据显示,全国放射医师约8.6万人,其中住院医师加主治医师约5.8万人[20],高年资医师总体缺乏,中低年资医师占比高,基层医疗机构放射医师更是严重不足且诊断经验有限。放射科医师中低年资医师占比较高,AI的应用对于低中年资医师提高肋骨骨折检出率极具价值,并能有效提高肋骨骨折诊断水平,使外伤患者能在短时间内得到准确诊断、有效评估病情。

本研究为单中心胸部CT数据回顾性分析,存在一定的局限性,样本量也有进一步扩容的需求,后续可联合进行大样本多中心合作,使检测结果更为客观全面。本研究为验证检验结果的精准性,选择6位不同资历的中低年资医师,克服了单一级别医师诊断经验的不足,契合基层放射医师以中低年资医师为主的工作布局。本研究以薄层横断图像为主要观察对象,医师自行根据病灶情况决定是否结合三维重建、MPR、AI全肋及单肋立体多角度观察等后处理技术。AI的肋骨旋转及拉直可使医师更详尽的观察细微骨折及可疑骨折。将来可评价薄层横断图像结合医师手动后处理容积再现与AI软件自动容积再现功能比较的诊断效能评估,目前国内尚没有结合AI的AR角度来进行肋骨骨折的相关分析。

综上所述,本研究发现AI可有效提高不同级别医师对新鲜肋骨骨折的检出效能,并提高不同级别医师之间的一致性,对辅助放射科低中年资医师诊断肋骨骨折有良好的应用前景。

参考文献:

[1] " 刘 "基, 尹婷婷, 王 "康, 等. DR与CT三维重建在胸部外伤骨折中的诊断意义[J]. 中华肺部疾病杂志: 电子版, 2022, 15(1): 105-7.

[2] " Sharma OP, Oswanski MF, Jolly S, et al. Perils of rib fractures[J]. Am Surg, 2008, 74(4): 310-4.

[3] " 张光霞, 何 "英, 杨绍光, 等. 司法鉴定中肋骨骨折影像诊断符合率影响因素的研究[J]. 中国医药科学, 2022, 12(20): 24-9.

[4] " 赵润润, 苏宜江, 于一龙, 等. 胸部外伤手术107例临床分析[J]. 中国胸心血管外科临床杂志, 2015, 22(7): 707-8.

[5] " Bemelman M, de Kruijf MW, van Baal M, et al. Rib fractures: to fix or not to fix? an evidence-based algorithm[J]. Korean J Thorac Cardiovasc Surg, 2017, 50(4): 229-34.

[6] "Chapman BC, Overbey DM, Tesfalidet F, et al. Clinical utility of chest computed tomography in patients with rib fractures CT chest and rib fractures[J]. Arch Trauma Res, 2016, 5(4): e37070.

[7] "England JR, Cheng PM. Artificial intelligence for medical image analysis: a guide for authors and reviewers[J]. AJR Am J Roentgenol, 2019, 212(3): 513-9.

[8] " 孟祥虹, 吴迪嘉, 马信龙, 等. 深度卷积神经网络技术自动诊断肋骨骨折的CT应用初探[J]. 天津医科大学学报, 2022, 28(2): 205-10.

[9] " Zhou QQ, Wang JS, Tang W, et al. Automatic detection and classification of rib fractures on thoracic CT using convolutional neural network: accuracy and feasibility[J]. Korean J Radiol, 2020, 21(7): 869-79.

[10] 刘 "想, 谢辉辉, 许玉峰, 等. 人工智能对提高放射科住院医生诊断胸部肋骨骨折一致性的价值[J]. 北京大学学报: 医学版, 2023, 55(4): 670-5.

[11] 杨 "力, 蒲 "红, 朱 "缨. MSCT扫描及三维重建技术在降低隐匿性骨折漏诊率中的临床应用[J]. 中国CT和MRI杂志, 2017, 15(7): 137-40.

[12] "余开冠, 孙芳仁. MSCT与DR检查外伤性肋骨骨折的临床应用对比分析[J]. 医学影像学杂志, 2022, 32(7): 1260-3.

[13]Guermazi A, Tannoury C, Kompel AJ, et al. Improving radiographic fracture recognition performance and efficiency using artificial intelligence[J]. Radiology, 2022, 302(3): 627-36.

[14] 谭 "辉, 田占雨, 潘 "宁, 等. 基于深度学习的计算机辅助诊断系统在提高急性肋骨骨折诊断效能上的价值[J]. 临床放射学杂志, 2020, 39(12): 2493-7.

[15] Meng XH, Wu DJ, Wang Z, et al. A fully automated rib fracture detection system on chest CT images and its impact on radiologist performance[J]. Skeletal Radiol, 2021, 50(9): 1821-8.

[16]Zhou ZY, Fu ZH, Jia JC, et al. Rib fracture detection with dual-attention enhanced U-net[J]. Comput Math Methods Med, 2022, 2022: 8945423.

[17]Niiya A, Murakami K, Kobayashi R, et al. Development of an artificial intelligence-assisted computed tomography diagnosis technology for rib fracture and evaluation of its clinical usefulness[J]. Sci Rep, 2022, 12(1): 8363.

[18] 萧 "毅, 刘士远. 人工智能将改变影像医学的未来[J]. 科技与金融, 2018(10): 11-5.

[19] 程 "齐, 欧阳雪晖. 人工智能在影像医学中的实际应用[J]. 分子影像学杂志, 2023, 46(3): 571-4.

[20] "Cohen M, Puntonet J, Sanchez J, 等. 人工智能与放射科医生:X线片上手腕骨折的诊断效能[J]. 国际医学放射学杂志, 2023, 46(4): 493.

(编辑:林 "萍)

猜你喜欢

计算机断层扫描人工智能
MRI相较256层CT在直肠癌术前诊断分析中准确性更高
我校新增“人工智能”本科专业
IQ-单光子发射计算机断层扫描门控静息心肌灌注图像不同重建参数对测定左心室功能的影响
低剂量多层计算机断层扫描在耳鼻喉科患者鼻咽部检查中应用效果分析
2019:人工智能
人工智能与就业
本刊可以直接使用的英文缩略语(三)
本刊可以直接使用的英文缩略语(二)
数读人工智能
下一幕,人工智能!