APP下载

人工智能超声辅助系统在不同超声参数下对甲状腺结节检测及诊断效能的研究

2024-02-26孙斌李盈盈阎琳肖静李欣洋张明博罗渝昆

中国医学影像学杂志 2024年1期
关键词:准确度增益恶性

孙斌,李盈盈,阎琳,肖静,李欣洋,张明博,罗渝昆*

1.川北医学院,四川 南充 637000;2.解放军总医院第一医学中心超声诊断科,北京 100853;*通信作者 罗渝昆 lyk301@163.com

甲状腺癌是最常见的内分泌和头颈部恶性肿瘤[1],近几十年在世界范围内发病率持续升高[2],我国发病率也同样逐年升高,并且这一趋势将持续下去[3]。超声是甲状腺检查的首选影像学方法,高达68%的成人在甲状腺超声检查中检测到甲状腺结节[4],其中约4.5%~10.0%可能是恶性结节[5-6],因此每年接受甲状腺超声检查的人数持续增多。但甲状腺超声图像判读很大程度上依赖医师的诊断经验[7-8]。由于初级医师欠缺经验,加上甲状腺良、恶性结节的超声图像特征存在较多重叠[9-10],可能会导致漏、误诊。人工智能(artificial intelligence,AI)系统的应用不仅提高了超声医师的筛查效率,也提升了初级医师的诊断效能。一项针对韩国S-Detect和国产ITS100系统的研究发现,初级医师使用AI系统后诊断效能得到提升[11-12],且可以减少不必要的穿刺[13]。超声检查是扫查和诊断同步进行的影像学检查方法,医师在检查过程中需要实时调节仪器参数。但不同年资医师在仪器参数调节能力方面存在一定差距,而超声参数调节的差异是否会影响AI系统对结节的检测和诊断效能目前鲜有报道。本研究在不同超声参数下,应用AI系统(ITS100)对结节进行自动检测和鉴别良恶性,以验证不同超声参数是否会影响AI系统对甲状腺结节的检测和诊断效能。

1 资料与方法

1.1 研究对象 前瞻性连续纳入2023年3月30日—5月1日在解放军总医院第一医学中心外科接受手术治疗的甲状腺结节患者147例,共289枚甲状腺结节,其中男35例,女112例,年龄20~73岁,平均(45.6±11.3)岁。结节最大径0.3~5.4 cm,平均(1.06±0.97)cm。纳入标准:①术前诊断为甲状腺结节并有手术指征;②术后病理证实结节良恶性;③术前1周内完成超声图像采集。排除标准:①患其他恶性肿瘤;②有甲状腺手术史或颈部放疗史;③临床或病理资料不完整。本研究获得本院伦理委员会批准(S2022-526-02),患者或家属在检查前均已签署知情同意书。

1.2 仪器与方法 采用飞利浦EPIQElite超声诊断仪,L18-4高频线阵探头。AI系统为脉得智能科技公司的ITS100型超声影像智能系统(V1.2),包括主机和AI辅助显示屏。该系统为实时动态AI系统,运用深度学习技术,并基于卷积神经网络建立甲状腺结节检测与诊断模型,能够实时自动地用方框检测标记可疑结节,当预测结节为恶性时方框显示红色,良性时方框为绿色,并在方框旁显示百分比表示预测的可能性大小。

1.3 图像分析 由1名具有12年甲状腺超声诊断经验并已接受AI设备系统培训的医师进行数据采集,在患者手术前1周内完成。所有患者均行甲状腺超声检查,并采集甲状腺结节大小、形态、回声、边界、钙化、纵横比等超声图像特征。检查时首先根据患者甲状腺以及脂肪、肌肉等周围组织情况,适当调节超声仪的增益、深度等参数;使甲状腺超声图像显示效果达到最佳,此时超声仪的增益、深度等各项参数的数值定义为标准参数,然后分别扫查甲状腺的横切面和纵切面,发现结节后记录基本特征,同时AI系统实时自动检测和诊断结节,分别记录AI系统对结节横切面、纵切面最大径检测以及良恶性诊断结果。然后分别单独调节增益、深度和放大等参数,调节其中1个参数时,其他参数保持标准参数设定。调节完参数后,用同样步骤分别进行横切面和纵切面动态扫查,并记录AI系统对结节的检测和诊断结果。

超声参数的高、低增益调节范围为标准参数上分别增加或减少15%左右,高、低深度调节范围为增加2.0 cm或减少1.0 cm。放大为在其他图像参数不变的前提下,将图像放大1.4倍。本研究选用的参数调节范围参考低年资医师与高年资医师使用本台仪器进行甲状腺超声检查时,相同患者甲状腺图像的参数调节范围的差异,并结合甲状腺超声检查中实际参数进行设定,是真实临床中低年资医师可能会出现的参数设置范围。

根据AI系统进行图像判读,结节横切面、纵切面均判断为良性时定义为良性,结节横切面、纵切面任意1个切面判断为恶性时定义为恶性。当结节仅有1个切面被AI系统准确检测时,该切面的判读结果即作为结节的良恶性诊断结果。患者手术后,以病理结果为“金标准”,将AI系统的判读结果与相对应结节的病理结果进行对照,判断AI系统的诊断效能。同时记录AI系统检测定位结节的准确性,当检测方框在横切面、纵切面均能准确标记结节位置时定义为检测准确,方框在横切面、纵切面任1个切面未能准确标记结节位置时为检测不准确。检测准确是检测框与结节完全匹配或方框与结节基本匹配(方框不匹配的轮廓占结节整个轮廓30%以下),检测不准确指方框不匹配轮廓占结节轮廓>30%,或结节周围未显示检测框[14-15](图1)。

图1 甲状腺结节的识别。A.右叶上极低回声结节,纵切面AI系统准确检测结节;B.横切面结节周围甲状腺组织较少,AI系统未能检测结节(A、B为相同结节);C.甲状腺右叶2个低回声结节;D.AI系统将2个结节错误检测为1个结节(C、D为相同结节)

1.4 统计学方法 采用SPSS 25.0和MedCalc 20.2软件,计量资料以±s表示,计数资料以例数表示;以术后病理结果为“金标准”,分别计算各超声参数调节下系统对甲状腺结节的敏感度、特异度、准确度和检测准确度,采用χ2检验比较标准参数与其他各参数的差异。绘制各参数的受试者工作特征(ROC)曲线,计算曲线下面积(AUC),各参数AUC比较采用Delong检验,P<0.05表示差异有统计学意义。

2 结果

2.1 结节病理结果 289枚结节中,术后病理结果提示恶性结节188枚,其中甲状腺乳头状癌187枚,滤泡癌1枚;良性结节101枚,其中结节性甲状腺肿64枚,滤泡性腺瘤21枚,炎性结节13枚,滤泡结节性病变3枚。

2.2 不同参数下AI系统识别准确度分析 289枚结节中,4枚结节在各参数下横切面、纵切面均未被AI成功检测。其余结节在横切面、纵切面上至少有1个切面被AI检测。最终各参数调节下AI系统检测准确度分别为94.1%(标准)、89.2%(低增益)、88.2%(高增益)、93.0%(高深度)、92.3%(低深度)、91.0%(放大)。与标准参数相比,高增益(χ2=6.215,P=0.013)和低增益(χ2=4.453,P=0.035)参数下的检测准确度降低,差异有统计学意义。

2.3 不同参数下AI系统诊断效能分析 AI系统在标准参数下诊断甲状腺结节良恶性的敏感度为90.9%,特异度为79.6%,准确度为86.6%,与标准参数下对比,低增益条件下的特异度(χ2=4.620,P=0.032)和准确度(χ2=7.521,P=0.006)、高增益下敏感度(χ2=6.170,P=0.013)和准确度(χ2=4.127,P=0.042)、高深度下准确度(χ2=5.011,P=0.025)均降低,差异有统计学意义(表1)。将各参数下诊断效能绘制ROC曲线,与标准条件下相比,低增益(Z=3.102,P=0.001)、高增益(Z=2.152,P=0.031)、高深度(Z=2.420,P=0.015)参数条件下AUC差异有统计学意义。

表1 不同超声参数下AI系统诊断效能比较

2.4 不同特征结节AI的检测及诊断准确度分析 结节在是否有钙化、低回声、边界清楚、形态规则、纵横比>1以及结节大小是否≤1 cm等特征下结节检测准确度和诊断准确度差异均无统计学意义(P>0.05,表2、图2)。

表2 不同结节特征下动态AI诊断准确度和检测准确度比较

图2 不同超声参数下AI系统诊断差异。A.标准参数下AI诊断结节为恶性;B.同一结节高增益条件下AI诊断为良性;C.术后病理结果提示结节为甲状腺乳头状癌(HE,×400);D.标准参数下AI诊断结节为恶性;E.同一结节高深度条件下AI诊断为良性;F.术后病理结果提示结节为甲状腺乳头状癌(HE,×400)

3 讨论

随着甲状腺AI系统不断研究和发展,多种AI系统已逐渐应用于临床工作,与其他诊断技术相比,AI系统耗时短、成本低、无创。AI系统与医师相比误诊率较低[16],其诊断效能明显优于初级医师,甚至与高年资医师的诊断效能相当[12,17],但是不同年资医师间诊断能力存在一定差异,调节仪器参数的能力也存在差异。本研究纳入包括增益、深度、放大等甲状腺检查中最常调节的参数,分析这些超声参数的调节对AI系统检测和诊断结节的影响。

增益是将组织返回到换能器的超声信号进行放大[18],不恰当地调节可能会失去细节或产生伪像。Lefebvre等[19]针对乳腺的超声研究发现,总增益的变化会导致纹理特征的变化,影响对乳腺结节良恶性的诊断。本研究发现,过高或过低的增益会影响AI系统的诊断准确度,其原因可能是较高的增益使一些低回声结节回声增强,导致AI系统判断为良性。相反,较低的增益会使结节回声减低,而低回声结节容易被AI系统判断为恶性。本研究也分析了深度对AI系统的影响,Girts等[20]针对骨骼肌的研究发现,图像中包含的组织会随深度增加而增多,从而影响感兴趣区的分辨率,导致图像质量相对降低。本研究发现较高的深度调节也会降低AI系统的诊断准确度,其原因可能是较高的深度降低了结节的分辨率,影响了AI系统的判断。

本研究同时验证了AI的检测准确度。张惠茅等[21]针对AI的问卷调查中,医师对AI系统最期待的作用是辅助检测和发现疾病。本研究发现,标准参数下,AI的检测能力较强。但较高或较低的增益均会影响AI对结节的检测,这可能因为较高或较低的增益会导致部分结节与周围甲状腺背景的差异相对缩小,导致检测准确度降低。

本研究发现,AI系统对结节是否有钙化、低回声、边界清楚、形态规则、纵横比等特征均有较好的检测和诊断稳定性,与既往研究结果[22]类似。在临床工作中,因为较小结节的恶性超声特征尚未完全表现出来,有时会对医师的诊断产生干扰。但本研究中AI系统对大小>1 cm或≤1 cm的结节检测准确度和诊断准确度均无显著差异。李盈盈等[23]研究表明,AI系统联合常规超声可以提高低年资医师对大小≤1 cm甲状腺影像报告和数据系统4类甲状腺结节良恶性的诊断效能。李晓宇等[24]及赵雯婷等[25]研究表明,AI系统联合超声造影或联合弹性成像同样可以提高医师对甲状腺结节良恶性的诊断效能。

本研究的局限性:纳入的研究对象均为手术患者,手术前患者大多经过超声造影、甲状腺细针穿刺活检,导致未纳入一些炎性病变、僵尸结节等超声图像有恶性征象的良性结节,恶性结节占比较高,研究对象选择有一定偏移。本研究为单中心研究,单机器,缺乏多中心、多型号机器及大样本数据,未来可能会增加多中心、多机型的数据进一步研究。

总之,AI系统在标准参数下,其检测准确度和诊断效能较高,可以提高医师的筛查效率和准确度。但当增益、深度调节不准确时,会使AI系统的检测和诊断准确度受到一定影响。标准超声参数的调节,需要医师根据患者颈部脂肪层、肌肉和甲状腺组织等不同的条件做出不同调整,获得最佳图像,从而使AI发挥最大效能。同时,AI系统软件的不断更新迭代,可以进一步增强系统的鲁棒性和泛化性,使其更好地应用于各级医疗机构和各年资医师,为更多患者服务。

猜你喜欢

准确度增益恶性
恶性胸膜间皮瘤、肺鳞癌重复癌一例
基于增益调度与光滑切换的倾转旋翼机最优控制
基于单片机的程控增益放大器设计
卵巢恶性Brenner瘤CT表现3例
基于Multisim10和AD603的程控增益放大器仿真研究
幕墙用挂件安装准确度控制技术
动态汽车衡准确度等级的现实意义
甲状腺结节内钙化回声与病变良恶性的相关性
多层螺旋CT在甲状腺良恶性病变诊断中的应用
高炉重量布料准确度的提高