三种甲状腺结节风险分层系统C-TIRADS、ACR-TIRADS和KTA/KSThR-TIRADS的比较研究
2024-05-09孙医学
隋 洋,王 兵,孙医学
(蚌埠医科大学第一附属医院 超声医学科,安徽 蚌埠 233004)
甲状腺癌是内分泌系统最常见的恶性肿瘤。随着体检普及、医学影像技术进步,全球范围内的甲状腺癌的检出率也在增加。据报道[1-2],美国每年1%~1.5%的病人被诊断为甲状腺恶性肿瘤。我国甲状腺癌的患病率每年也在持续增长[3]。高频超声已被公认为检测甲状腺结节的首选影像学方法。常规超声可获取结节的形态学信息,但是超声检查的主观性较强,使得超声诊断的一致性减低。为了将甲状腺超声诊断统一化,2009年HORVATH等[4]首次提出甲状腺成像报告数据系统(TI-RADS)。然而,它作为全球第一个TI-RADS并没有被很好地接受。随后,韩国、美国、中国等国家学者也相继在此基础上推陈出新。2016年韩国甲状腺协会及放射学会(KTA/KSThR)、2017年美国放射协会(ACR)及2020年中华医学会超声医学分会浅表器官组分别推出了不同版本的TI-RADS,简称KTA/KSThR-TIRADS、ACR-TIRADS和C-TIRADS[5-7]。然而,不同版本分层系统采用了不同的评估方法,其诊断结果存在差异[8-12]。目前,我国各大医院对不同版本TI-RADS的临床应用尚不统一。本研究通过分析比较KTA/KSThR-TIRADS、ACR-TIRADS和C-TIRADS三种甲状腺风险分层系统的诊断效能,旨为甲状腺肿物的后续穿刺和临床诊疗方式的选择提供依据。
1 对象与方法
1.1 研究对象
选取2020年1月至2022年8月我院接收的甲状腺肿瘤病人226例,其中男36例,女190例,年龄14~83岁。纳入标准:(1)病人超声数据完整;(2)在我院接受手术治疗,并且有明确的手术病理结果,病理资料完整;(3)病人术前无头颈部放射治疗史。排除标准:(1)病人既往有甲状腺手术治疗史;(2)超声及术后病理结果不完整;(3)病人同时伴有其他恶性肿瘤病史。对于多发结节,只纳入TI-RADS分类最高的结节,并且有明确的病理结果证实。本研究最终纳入226例病人共226枚甲状腺结节,结节最大径2.0~130.0 mm。本研究经我院伦理委员会审批通过。
1.2 仪器与方法
采用迈瑞Resona 7和三星HS60彩超仪,配用高频线阵探头。病人仰卧,全面扫查双侧颈部区域并存储图像。由2名中级超声医师分别按照KTA/KSThR-TIRADS、ACR-TIRADS和C-TIRADS标准对结节进行分类。当这两名医生的分类结果不一致时,则由另一名高年资超声医生进行最终评估。
1.3 评估标准
根据结节的声像图特征(外形、边缘、内部回声、结构及钙化等),不同指南进行了不同分类。(1)KTA/KSThR-TIRADS:基于结节具有可疑恶性征象个数,分为无结节、良性、低度可疑、中度可疑、高度可疑,即1、2、3、4、5类。(2)ACR-TIRADS:采用赋分法,根据总分将结节分为TR1、2、3、4、5类。(3)C-TIRADS:基于五个阳性指标和一个阴性指标进行赋分,根据总分分为C-TIRADS 1、2、3、4(A、B、C)、5类[7]。
1.4 统计学方法
采用χ2检验、Fisher′s确切概率法和ROC曲线分析。
2 结果
2.1 病理结果
所有病人共226枚甲状腺结节均成功进行了手术治疗,且获得完整的手术记录和病理资料。良性结节140枚:腺瘤49枚,结节性甲状腺肿31枚,结节性腺瘤性甲状腺肿20枚,淋巴细胞性甲状腺炎8枚,滤泡增生5枚,结节性增生3枚,淋巴细胞性甲状腺肿2枚,单纯性甲状腺肿2枚,其他良性病变20枚。恶性结节86枚,均为甲状腺乳头状癌。
2.2 3种TI-RADS评估甲状腺结节的恶性率
ACR-TIRADS TR3和TR4的恶性率为7.7%(2%~5%)和29.6%(2%~20%),C-TIRADS 3类结节的恶性率为2.5%(<2%),均高于推荐恶性率;除了ACR-TIRADS中的TR3和TR4及C-TIRADS 3类结节,其余所有结节的分类都在推荐的恶性肿瘤风险范围内很好地匹配;结节恶性率随着风险类别的增加而增加(P<0.01)(见表1)。
表1 3种TI-RADS指南对甲状腺结节恶性率的评估(n)
2.3 3种TI-RADS评估甲状腺恶性结节诊断效能ROC曲线分析显示,C-TIRADS的AUC最高(0.834,P<0.05);KTA/KSThR-TIRADS和ACR-TIRADS间AUC差异无统计学意义(0.778和0.760,P>0.05);此外,KTA/KSThR-TIRADS的诊断敏感性最高(82.6%),C-TIRADS的特异性和准确性最高(83.6%和79.3%)(见表2)。
表2 3种TI-RADS指南对甲状腺结节诊断效能比较
此外,本研究根据结节大小分为2组:≤10 mm结节与>10 mm结节。3种TI-RADS指南诊断≤10 mm结节与>10 mm结节的AUC差异均无统计学意义(P>0.05)(见表3)。
表3 3种TI-RADS指南诊断不同大小甲状腺结节的性能比较
3 讨论
甲状腺结节在临床实践中十分常见。灰阶超声成为检测甲状腺结节必不可少的影像学方法,尤其是对于无症状的甲状腺结节,但超声诊断的主观依从性仍然存在。尽管近几年不同国家的研究机构陆续推出了不同版本TI-RADS,甲状腺结节的分类在最新的文献中仍有争议[13-16]。目前各种分类系统和指南,其中许多代表了各个国家的地方医疗经验。如韩国KTA/KSThR-TIRADS是基于结节的内部结构、回声及是否具有可疑恶性征象(微钙化、直立生长、微分叶/针刺样边缘)对结节进行分类;美国ACR-TIRADS是通过对每个结节的形态特征赋分,通过计算总分进行分类,操作比较繁琐;C-TIRADS是基于阳性指标和阴性指标的加减分原则进行评估。对甲状腺结节进行声学评估的主要目的是确定可能的恶性结节,从而为临床后续治疗方式的选择提供可靠依据。然而,不同版本指南对结节的诊断结果可能存在差异,这些差异可能会影响病人管理、随访频率、穿刺活检工作量、病人焦虑,以及甲状腺结节恶性诊断不足或过度诊断的经济负担[17-20]。因此,笔者旨在找出最常用的甲状腺结节分类系统中准确度最高的指南,为后续的临床治疗提供可靠依据。
本研究中,我们分析并比较了KTA/KSThR-TIRADS、ACR-TIRADS和C-TIRADS 3种指南对甲状腺结节的诊断效能,结果表明,ACR-TIRADS TR3和TR4的恶性率为7.7%和29.6%,C-TIRADS 3类结节的恶性率为2.5%,均高于各自指南推荐的恶性范围,这种差异可能是由于几个恶性结节或亚厘米结节和不同观察者造成的偏差。除了ACR-TIRADS中的TR3和TR4以及C-TIRADS 3类外,其余所有结节的分类都可在推荐的恶性风险范围内很好地匹配,并且甲状腺结节的恶性率随着3种TI-RADS中的类别而增加,这与郑琳琳等[21]研究结果相似。
本研究ROC曲线分析表明,KTA/KSThR-TIRADS、ACR-TIRADS和C-TIRADS均具有较高的诊断性能,其中C-TIRADS的AUC最高,与CHEN等[11]分析的数据一致。显然,C-TIRADS的诊断效能最高,更适合评估中国人群的甲状腺结节。同时,通过ROC曲线分析还获取了KTA/KSThR-TIRADS、ACR-TIRADS和C-TIRADS的最佳截断值,分别为高度可疑、TR5和4C,并得到令人满意的敏感性和特异性,这与陈庆芳等[22]研究结果一致。然而,也有研究者提出不同的临界值:SCHENKE等[23]指出ACR-TIRADS的诊断临界值为TR4,丁思悦等[24]研究表明C-TIRADS的诊断临界值为4B,傅强等[25]研究结果显示KTA/KSThR-TIRADS的诊断临界值为中度可疑。这种不一致可能与数据选择的偏倚相关,因为本研究纳入的研究对象良性肿瘤相对较多。以往的研究对ACR-TIRADS指南的临床应用报道较多,但甚少报道过KTA/KSThR-TIRADS、ACR-TIRADS和C-TIRADS 3种指南诊断效能的比较,本研究发现,C-TIRADS的评估方案更简单、更清晰,与另外两种指南相比,C-TIRADS显示出更高的诊断特异性、准确性和AUC值(83.6%、79.3%和0.834),但其敏感性较低(70.2%),这与QI等[26-27]研究结果一致。分析C-TIRADS特异性较高而敏感性较低的原因可能是C-TIRADS评估甲状腺结节时,去除了甲状腺结节中的“低回声”和“实性为主”的这两个恶性征象,而KTA/KSThR-TIRADS和ACR-TIRADS均将低回声归于可疑恶性征象,ACR-TIRADS还将其赋予2分;另一方面,对于钙化而言,C-TIRADS将细点状钙化进行了详细分类,加入了“彗尾征”,并将“彗尾征”示为良性征象,对于伴有彗尾征的强回声钙化赋予-1分,而不伴彗尾征的钙化赋予1分,而KTA/KSThR-TIRADS和ACR-TIRADS并未对此做出详细区分,细点状微钙化在ACR-TIRADS中评分为3分,在KTA/KSThR-TIRADS中被划分为高度可疑恶性肿瘤的重要指标。其次,C-TIRADS和KTA/KSThR-TIRADS仅将<1 mm的点状强回声纳入恶性特征,未对粗大钙化和外周钙化赋予进行相应划分,而ACR-TIRADS对于不同大小的钙化分别赋予不同分值,这些特征可能会对结节的分类造成差异。然而,据相关文献[28]报道,伴有蛋壳样钙化及周边环状钙化的结节更倾向于良性结节。
然而,在我国筛查出的甲状腺恶性肿瘤中,部分结节的大小常在1 cm以下,将这类结节称为亚厘米级结节[29]。目前,很少有研究报道亚厘米级甲状腺结节的各种诊断性能。本研究根据结节的大小进行分组,比较三种指南对≤10 mm结节与>10 mm结节的诊断性能,结果显示,ACR-TIRADS指南对2组结节的诊断敏感性存在显著性差异,C-TIRADS指南对2组的诊断特异性存在差异,这与QI等[26]研究结果相似。有研究[30]表明,不同指南在识别>10 mm比≤10 mm结节具有更好的诊断效能。然而,也有研究[31]表明,恶性肿瘤的发生率随着可疑特征的增加而增加,而与结节的大小无关。目前,虽然不同指南对亚厘米级结节的诊断能力存在争议,但在本研究中能明确的是,KTA/KSThR-TIRADS、ACR-TIRADS和C-TIRADS 3种指南对≤10 mm结节的诊断效能并不逊色于>10 mm结节。
本研究也存在一些局限性:首先,本组所纳入的患者均为住院病人,高分类结节较多,可能存在选择偏差,降低诊断的一致性;此外,本研究样本量亦较少,仍需大样本进一步研究验证。
综上,KTA/KSThR-TIRADS、ACR-TIRADS和C-TIRADS在鉴别甲状腺结节方面均显示出较好的诊断性能,其中C-TIRADS诊断性能更佳,优于KTA/KSThR-TIRADS和ACR-TIRADS。而且,C-TIRADS采用的计数法简便易行,更适合中国人群的甲状腺结节。