APP下载

超声人工智能辅助诊断系统用于甲状腺髓样癌

2024-02-26张晓婷梁振威孙秀明邵玉红陈路增

中国医学影像技术 2024年2期
关键词:诊断系统预测值良性

江 柳,陈 蕾,张晓婷,刘 畅,梁振威,孙秀明,邵玉红,陈路增

(北京大学第一医院超声医学科,北京 100034)

80%以上甲状腺癌为甲状腺乳头状癌(papillary thyroid carcinoma, PTC),具有典型影像学表现[1]。甲状腺髓样癌(medullary thyroid carcinoma, MTC)起源于滤泡旁降钙素分泌细胞,恶性程度较高,占所有甲状腺癌的3%~5%,预后较差[2]。影像学主要依靠超声检出MTC,但恶性征象多不典型[3-5],且超声具有操作者依赖性,诊断存在一定困难。人工智能(artificial intelligence, AI)计算机辅助诊断系统在影像学领域迅速发展,提高了影像学诊断的准确性;超声甲状腺AI辅助诊断系统(以下简称AI辅助诊断系统)用于鉴别诊断甲状腺良、恶性结节具有较高价值[6-7]。本研究以PTC为对照,对比AI辅助诊断系统及不同年资超声医师诊断MTC的效果。

1 资料与方法

1.1 研究对象 回顾性分析2012年9月—2023年9月北京大学第一医院51例MTC、59例PTC及60例良性甲状腺结节患者。51例MTC中,男27例、女24例,年龄29~78岁、平均(50.4±12.1)岁;共63枚结节,平均最大径(1.77±1.19)cm。59例PTC中,男25例、女34例,年龄22~65岁、平均(43.8±10.7)岁;共70枚结节,平均最大径(1.13±0.64)cm。60例良性甲状腺结节患者中,男16例、女44例,年龄21~83岁、平均(51.2±15.4)岁;共62枚结节,包括结节性甲状腺肿33枚、滤泡性腺瘤29枚,平均最大径(1.82±0.81)cm。纳入标准:①经手术或活检病理证实诊断;②超声资料完整、图像清晰;③临床资料完整。本研究通过院伦理委员会批准(2021研491-001),检查前所有患者均知情同意。

1.2 仪器与方法 采用Philips EPIQ7/GE Volume E8/Siemens ACUSON S2000或ABVS超声诊断仪,7~14 MHz高频线阵探头扫查双侧乳腺并保存图像。

1.2.1 超声医师评估 由3名不知晓患者临床信息及病理结果的超声科医师(高、中及初级职称医师各1名,分别具有15、8和2年超声诊断工作经验)于医学影像工作站中调取并分析甲状腺声像图,按照我国甲状腺影像报告和数据系统(Chinese thyroid imaging reporting and data system, C-TIRADS)2020版[8-9]标准对甲状腺结节进行分类,包括C-TIRADS 2、3类(无恶性特征)、4a类(1个可疑恶性特征)、4b类(2个可疑恶性特征)、4c类(3~4个可疑恶性特征)和5类(5个可疑恶性特征)。

1.2.2 AI辅助诊断系统 采用德尚韵兴AI-SONICTM超声智能辅助诊断系统。由另1名具有10年以上工作经验、不知晓病理结果及其他医师分类结果的超声科医师将图像导入AI辅助诊断系统,自动勾画结节,经医师进行复核及手动修改后,系统计算结节恶性概率值(范围为0~1),以<0.40为偏良性、≥0.40且<0.60为可疑恶性、≥0.60为偏恶性,以0.40作为评估良、恶性结节的临界值。对所有图像均分析3次,取最高恶性概率值。

1.3 统计学分析 采用SPSS 22.0统计分析软件。以病理结果为金标准,分别计算AI辅助诊断系统和3名医师诊断甲状腺恶性结节的敏感度、特异度、阳性预测值、阴性预测值及准确率。绘制受试者工作特征(receiver operating characteristic, ROC)曲线,计算曲线下面积(area under the curve, AUC),评估AI辅助诊断系统和3名医师鉴别甲状腺良、恶性结节的价值,并以DeLong检验进行比较。行多重比较时,以Bonferroni法校正P值,P<0.05为差异有统计学意义。

2 结果

2.1 诊断效能 AI辅助诊断系统自动识别195个甲状腺结节,无漏诊病例;C-TIRADS 4a类及以上、AI恶性概率值≥0.40时考虑甲状腺结节存在恶性征象, AI辅助诊断系统诊断MTC和PTC的敏感度、特异度、阳性预测值、阴性预测值、准确率及AUC均低于3名医师。高、中级职称医师与AI辅助诊断系统诊断MTC和PTC的AUC差异均有统计学意义(P均<0.01),初级职称医师与AI辅助诊断系统AUC差异均无统计学意义(MTC:P=0.093;PTC:P=0.513),见表1及图1。

图1 超声甲状腺AI辅助诊断系统及3名医师诊断MTC及PTC的ROC曲线 A.MTC; B.PTC

表1 超声甲状腺AI辅助诊断系统及3名医师诊断MTC和PTC的效能

AI辅助诊断系统诊断MTC的敏感度、特异度、阳性预测值、阴性预测值、准确率及AUC均低于其诊断PTC,但AUC差异无统计学意义(P=0.297),见表1。

2.2 误诊分析 63枚MTC结节中,AI辅助诊断系统提示54枚倾向恶性、9枚为良性;70枚PTC结节中,AI辅助诊断系统提示66枚倾向恶性、4枚为良性。AI辅助诊断系统误诊为良性结节的恶性概率值及3名医师的C-TIRADS分类结果见表2、3。

表2 超声甲状腺AI辅助诊断系统误诊MTC为良性结节的恶性概率值及3名医师C-TIRADS分类结果

表3 超声甲状腺AI辅助诊断系统误诊PTC为良性结节的恶性概率值及3名医师C-TIRADS分类结果

AI辅助诊断系统和3名医师均误诊为良性结节的MTC超声表现为囊实性、偏低回声,纵横比<1,边界清晰,结节内未见点状强回声(图2);两种方法均误诊为良性结节的PTC表现为甲状腺双叶多发结节,超声呈实性、中等回声,纵横比<1,边界清晰,结节内见粗大强回声;其余同侧结节术后病理为结节性甲状腺肿,3名医师均考虑为结节性甲状腺肿并分类为C-TIRADS 3类。

图2 甲状腺AI辅助诊断系统诊断MTC A.患者男,43岁,MTC,AI辅助诊断系统及3名医师均诊断为恶性结节; B.患者男,38岁,MTC,AI辅助诊断系统误诊为良性结节,3名医师均诊断为C-TIRADS 3类

3 讨论

近年来,AI诊断系统临床应用日趋广泛[10-11]。龚忠静等[10]以AI-SONICTM评估195枚甲状腺结节,结果显示该系统对甲状腺结节具有优于医师的较高诊断价值。本研究采用AI辅助诊断系统,通过卷积神经网络对甲状腺结节超声图像进行深度学习,可自动检测甲状腺图像并勾画结节,快速分析结节特征并给出相应结节恶性概率值;但该系统诊断MTC和PTC的敏感度、特异度、阳性预测值、阴性预测值、准确率和AUC均低于3名医师;高级职称医师诊断效能最高,中级职称医师次之,初级职称医师及AI殿后。本研究3名超声医师以基于我国国情的最新C-TIRADS[8-9]进行评估,恶性征象包括垂直位、实性、极低回声、点状强回声、边缘模糊,对MTC具有较高诊断效能[1,12],但其对甲状腺恶性结节进行评分的标准之一为极低回声,易将MTC风险低估1个等级,故本研究以C-TIRADS 4a类及以上为恶性结节,以提高医师、尤其初级职称医师诊断甲状腺恶性结节的效能;且如此虽可能导致特异度降低,但C-TIRADS根据4a类结节大小推荐相应的临床决策,可避免临床过度诊治。

目前AI深度学习甲状腺结节的研究仍缺乏少见病理类型大数据样本。本研究AI辅助诊断系统诊断MTC的效能低于其诊断PTC而差异无统计学意义,与MTC恶性超声特征不如PTC典型有关;3名超声医师根据C-TIRADS诊断MTC结节的效能也均低于诊断PTC,与MTC发病率低有关。进一步完善和更新大数据,有助于提高AI辅助诊断系统识别和诊断MTC的能力。

本组不同职称超声医师间,经验和诊断水平存在差异。AI辅助诊断系统将9枚MTC及4枚PTC误诊为良性结节,其中1枚MTC结节和1枚PTC结节3名医师均诊断为C-TIRADS 3类,与超声表现不典型有关;医师1、2将另外8枚MTC结节均诊断为4a/4b类,医师3诊断3枚为3类、5枚4a类;3名医师均将其余3枚PTC诊断为4b/4c类结节。此外,本研究针对既往存储的静态声像图进行分析,图像质量易受操作者主观及超声仪器影响;观察动态实时图像或可提高诊断率。

综上所述,甲状腺超声AI辅助诊断系统诊断MTC效能较高,但仍需进一步完善及更新,以提高其对不典型甲状腺结节的诊断效能。但本研究为单中心回顾性分析,样本量有限,难以避免选择性偏倚;未来结合彩色多普勒图像有助于进一步提高状腺超声AI辅助诊断系统诊断MTC的能力。

利益冲突:全体作者声明无利益冲突。

作者贡献:江柳研究设计和实施、图像和数据分析、撰写和修改文章;陈蕾研究实施、图像和数据分析、修改文章;张晓婷、刘畅、梁振威和孙秀明研究实施、图像分析、修改文章;邵玉红修改和审阅文章;陈路增研究设计、修改和审阅文章。

猜你喜欢

诊断系统预测值良性
走出睡眠认知误区,建立良性睡眠条件反射
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
呼伦贝尔沙地实现良性逆转
法电再次修订2020年核发电量预测值
区间轨道电路智能诊断系统的探讨
设备在线诊断系统在唐钢的建设与应用
基层良性发展从何入手
甲状腺良性病变行甲状腺全切除术治疗的效果分析
连铸板坯质量在线诊断系统的应用