S-Detect 联合SWE 及ACR TI-RADS 对甲状腺结节的诊断价值
2023-10-11赵雯婷杨晓徐杰魏杰赵梦茹
赵雯婷,杨晓,徐杰,魏杰,赵梦茹
安徽医科大学附属合肥医院/合肥市第二人民医院超声科,安徽 合肥 230011;*通信作者 杨晓 yx6081@126.com
随着高频超声的广泛使用,甲状腺结节检出率不断升高,而过度诊疗的风险也随之上升[1],提高对甲状腺结节良恶性的诊断准确度十分重要。然而,由于甲状腺结节的超声特征复杂,且诊断过程中会受医师主观因素影响,需要更加客观的诊断方法。剪切波弹性成像(shear wave elastography,SWE)作为第3代弹性成像技术,可以提供常规超声无法提供的组织硬度信息。S-Detect 是一种基于人工智能(artificial intelligence,AI)卷积神经网络的计算机辅助诊断(CAD)系统[2],作为近年的新型软件技术,为医师提供可能良性与可能恶性两种诊断,可以协助医师诊断甲状腺结节[3]。本研究使用S-Detect、SWE、甲状腺影像报告和数据系统(ACR TI-RADS)分级,观察其单独及联合使用鉴别诊断甲状腺良、恶性结节的效能,探讨联合使用能否弥补单独诊断的缺陷,降低患者过度治疗的风险。
1 资料与方法
1.1 研究对象 回顾性选取2020年11月—2021年12月在合肥市第二人民医院行甲状腺超声检查,并行超声引导下细针穿刺(fine-needle aspiration,FNA)或手术取得病理结果的77例患者共98个结节,男15例18个、女62例80个,年龄22~82岁,平均(48.85±10.46)岁。纳入标准:①接受常规超声、S-Detect和SWE,且图像清晰完整;②进行手术或FNA后明确病理诊断结果;③临床资料完整。排除标准:①穿刺病理结果细胞过少或病理诊断不明确;②心肺功能严重不全;③图像信息或临床资料不完整。本研究经本院医学伦理委员会批准(2022-科研-093),患者均签署知情同意书。
1.2 仪器和方法
1.2.1 仪器 使用Samsung Medison RS80A超声诊断仪,内置AI实时CAD系统软件(用于甲状腺的S-Detect),线性高频探头L3-12A,频率3~12 MHz。使用SuperSonic Imagine带有SWE系统的Aixplorer V超声诊断仪,线阵探头L15-4,频率7.5 MHz。
1.2.2 操作方法 常规超声:按照安徽省超声质量控制要求,对患者的甲状腺组织进行扫查,定位靶结节后记录甲状腺结节的大小、位置,及结节成分、回声、形态、边缘、强回声钙化等5项超声特征,并将声学特征按照美国放射学会2017年发布的ACR TI-RADS标准进行评分并分级[4-5]。当甲状腺结节ACR TI-RADS分级为5级时诊断为恶性,其余诊断为良性。
S-Detect:在常规超声扫查到甲状腺结节后冻结图像,将感兴趣区(ROI)框封装甲状腺结节,进行自动标记、处理、分析,自动沿着肿块的边界绘制出肿块的轮廓,当S-Detect自动绘制的结节边界评估不足时,可以手动重新调整轮廓直至得到满意的轮廓分割。完成满意的病灶分割后,系统自动量化识别出甲状腺结节的基本特征,并对结节做出可能良性或可能恶性的诊断结果(图1、2)。每个结节分别经过纵、横切面S-Detect评估,横、纵切面分析结果均为可能恶性时诊断为恶性,任一分析结果为可能良性时诊断为良性。
图2 男,25岁,甲状腺右叶下极背侧结节。A、B分别为S-Detect横切面和纵切面,识别并包络结节(箭)分析得到结果:可能恶性(蓝色方框区域),C为病理示甲状腺乳头状癌(HE,×100)
SWE:在常规超声扫查到甲状腺结节后,探头轻置于患者颈部,不施加压力,再使用甲状腺SWE模式,选择和调整ROI直径为结节的2~3倍,可以覆盖整个病变区及周围正常组织,嘱患者屏住呼吸3~5 s,待图像合格后,冻结图像,若ROI中无颜色,或仅显示杂色,则认为图像不合格。测量最硬处病灶的杨氏模量值,包括弹性模量最大值(Emax)和弹性模量平均值(Emean),测量3次取平均值,见图3。
图3 女,42岁,甲状腺左叶结节(箭)。A为SWE模式下示病灶处硬度杨氏模量;B为病理示甲状腺乳头状癌
联合诊断:构建联合诊断的Logistc回归模型,计算每个对象对应的预测概率,以预测概率进行受试者工作特征(ROC)曲线分析,计算曲线下面积(AUC),取最佳截断值,以截断值作为良恶性的诊断标准。
1.3 统计学分析 应用SPSS 20.0和MedCalc 19.3.1软件,符合正态分布的计量资料以±s表示,组间比较采用独立样本t检验;计数资料以例数或百分比表示,组间比较采用χ2检验。以病理结果为“金标准”,绘制S-Detect、ACR TI-RADS分级与SWE单独使用和联合诊断的ROC曲线。计算各诊断方法的敏感度、特异度、准确度、阳性预测值与阴性预测值,采用基于Kappa系数的一致性检验分别评估各诊断方法和病理结果的一致性。组间敏感度、特异度差异分析采用McNemar检验,组间AUC差异比较采用Z检验。P<0.05为差异有统计学意义。
2 结果
2.1 一般资料 病理良性结节共43个(47.53%)(滤泡及上皮细胞16例,滤泡性腺瘤18例,结节性甲状腺肿5例,桥本甲状腺炎1例,变性的纤维组织伴钙化1例,嗜酸性细胞腺瘤2例),病理恶性结节共55个(52.47%)(乳头状癌54例,髓样癌1例)。良、恶性结节最大径分别为4.0~36.7 mm、3.7~50.0 mm,平均(11.68±7.12)mm、(10.00±7.51)mm,差异无统计学意义(t=-1.127,P=0.263)。良、恶性结节组男性占比分别为6/43(13.95%)、12/55(21.82%),差异无统计学意义(χ2=0.996,P=0.318)。
2.2 SWE对甲状腺结节的诊断效能 甲状腺恶性结节的杨氏模量值Emax、Emean[(56.31±37.65)kPa、(37.32±24.47)kPa]较良性结节大[(29.36±13.81)kPa、(19.08±10.83)kPa],差异均有统计学意义(t=4.462、4.942,P均<0.001)。绘制ROC曲线,Emax和Emean良、恶性截断值分别为31.7 kPa、21.6 kPa,AUC分别为0.838、0.824,约登指数分别为0.580 5、0.539 1,甲状腺结节Emax约登指数较Emean高,取最佳截断值时,Emax的敏感度和特异度(83.64%、74.42%)略优于Emean(81.82%、72.09%)。
2.3 3种方法单独使用及联合诊断的效能 三者联合诊断后,除特异度外,各指标均有一定程度增加。联合诊断和应用ACR TI-RADS单独诊断的敏感度差异有统计学意义(P<0.001);与S-Detect单独诊断的特异度差异有统计学意义(P=0.022);联合诊断比单独应用ACR TI-RADS的特异度略低,但差异无统计学意义(P=1.000)。联合诊断高于单独应用S-Detect、SWE及ACR TI-RADS的AUC(0.956比0.783、0.838、0.821),差异均有统计学意义(P<0.000 1;P=0.000 6;P=0.000 1)。联合诊断的Kappa系数高于单独诊断,见图4和表1、2。
表1 3种方法单独诊断与联合诊断甲状腺结节良、恶性情况(个)
表2 各指标与联合诊断甲状腺结节良恶性的效能比较
图4 S-Detect、ACR TI-RADS、SWE和三者联合诊断甲状腺结节良恶性的ROC曲线
3 讨论
高频超声是筛查和鉴别甲状腺结节良恶性时优先选择的影像学方法,且有助于确定是否应使用FNA[6],但其高度依赖于操作者的经验,无法定量分析图像特征,存在重复性和客观性不足的问题。为解决这些限制,近年新的超声诊断技术已开发辅助应用于临床,如弹性成像、人工智能等[7-8]。
3.1 SWE诊断甲状腺结节良恶性 SWE通过捕获超声束在组织中传播产生的剪切波所受到的影响,通过杨氏模量值(Emax、Emean等)量化反映组织的硬度,组织越硬,杨氏模量值越高。甲状腺结节的硬度与结节性质有关,与良性结节相比,恶性结节更快地损坏并侵入正常组织滤泡结构,其组织的硬度值更高[9]。因此,恶性结节杨氏模量值通常较良性结节高,与本研究结果相符。本研究中,甲状腺良、恶性结节Emax和Emean截断值分别为31.7 kPa、21.6 kPa,与既往研究结果存在差异[10]。本研究55个恶性结节中9个Emax值<31.7 kPa被误诊为良性,可能是受到结节大小的影响[11-12]。由于结节较大,检查时探头放置颈部的受力不均;同时部分甲状腺结节比较大但ROI范围设置过小,达不到结节直径的2~3倍,结节周边也缺少足够的正常组织对比,导致杨氏模量值偏低,误判为良性。本研究43个良性结节中11个Emax值>31.7 kPa被误诊为恶性,可能是部分结节有钙化成分所致[13]。本研究误诊的11个结节中,7个带有强回声灶,其中5个伴有粗大或弧形钙化斑,对结节的硬度产生影响,导致杨氏模量值偏高。
3.2 AI与医师诊断甲状腺结节的现状比较 近年在AI发展的推动下,超声成像分析进入新时代。目前甲状腺AI既可用于超声诊断,也用于病理评估和分析[14],有利于推动精准诊疗。既往研究中,由于数据、诊断标准和设备存在差异,直接比较不同研究使用系统的诊断效率不合理,甚至可能得到完全相反的结论。Szczepanek-Parulska等[15]比较S-Detect和EU-TI-RADS系统诊断结节的性能,发现AI特异度更高。但Xia等[16]的研究结果显示S-Detect系统的特异度低于高年资医师。
本研究比较S-Detect与医师采用ACR TI-RADS分级诊断甲状腺结节良恶性的效能发现,S-Detect的敏感度和AUC较医师高,特异度较低,准确度相当。SDetect可能仅能分析目标病变的特征,而不考虑病变对其周围组织的影响。与医师相比,一些细微的结构异常,如甲状腺被膜不连续,通常被医师视为侵入性表现,但S-Detect却很难识别。其次,医师使用基于积分累计标准的ACR TI-RADS对甲状腺结节进行分级诊断,该标准综合甲状腺结节中包括钙化在内的五大超声特征,而使用S-Detect进行诊断时,与结节图像数据的质量密切相关,且缺失特征中的钙化。此外,医师的经验水平对S-Detect诊断结果也有部分影响。既往研究发现,比较S-Detect技术和不同年资的医师诊断甲状腺结节时具有一定差异,S-Detect诊断甲状腺结节敏感度高,两者联合可提高诊断效能,尤其低年资医师的诊断效能明显提高[3,17-18]。但本研究未分析高年资医师和低年资医师与S-Detect对甲状腺结节的诊断效能差异,这可能影响最终结果判断。
3.3 三者联合诊断与单独诊断的比较 本研究中,SDetect、SWE、ACR TI-RADS分级均作为甲状腺良、恶结节诊断的方法,联合诊断后鉴别诊断甲状腺结节良恶性的敏感度、准确度、阳性预测值、阴性预测值均优于三者单独诊断,联合诊断的AUC均高于三者单独诊断,表明联合诊断的整体诊断效能高于单独诊断。联合诊断与医师使用ACR TI-RADS分级单独诊断甲状腺结节的敏感度显著增高,56例原本甲状腺ACR TI-RADS分级诊断为良性的结节,与S-Detect和SWE联合后,其中15例改为恶性,此15例结节形态多规则、边界多光滑,但S-Detect和SWE均提示恶性可能,提高了诊断准确度。
既往鲜有S-Detect联合SWE诊断甲状腺结节良恶性的研究,但何子朋等[19]使用S-Detect辅助甲状腺结节进行TI-RADS再分级,与单独的常规超声诊断相比,活检率、特异度、阳性预测值均相应提高。本研究中三者联合诊断甲状腺结节,与何子朋等[19]的结果不同,特异度无明显提高,而敏感度明显提高,可能原因是甲状腺结节常规超声和S-Detect单独诊断甲状腺时敏感度较高;其次,甲状腺腺体前方覆盖有肌肉组织,周围有颈部血管而内侧有气管及甲状软骨组织,SWE弹性值可能受周围组织影响;本研究中SWE良、恶性最佳截断值Emax较既往研究低[9],也可能会影响联合诊断中恶性结节的诊断准确度。
3.4 本研究的局限性 部分甲状腺结节病理结果由FNA获得,无法完全排除由穿刺导致假阴性的可能;甲状腺结节的超声图像采集前,未更细致地规定采集图像的二维超声参数设置,如增益、动态范围等,可能会对S-Detect的最终结果判读有影响;SWE扫查时,存在结节内钙化,也会影响杨氏模量值的测量。
总之,S-Detect、SWE、ACR TI-RADS分级三者联合可以有效提高对甲状腺结节的诊断效能,联合诊断后较S-Detect单独诊断特异度增高,与ACR TIRADS单独诊断比较敏感度增高,与三者单独诊断比较AUC增高。联合诊断弥补了S-Detect特异性较低的缺陷,避免过度诊断,也减少了医师使用ACR TIRADS敏感度较低的影响和漏诊可能,诊断效能达到最佳。