ACR“3层系统”对偶发甲状腺结节的应用价值
2024-05-06陈柱典郑吟诗李依明郭茹菲
陈柱典,郑吟诗,李依明,郭茹菲
(河南省商丘市第一人民医院 1.CT室;2.病理科,河南 商丘 476000)
偶发甲状腺结节(incidental thyroid nodule,ITN)是最常见的偶发病变之一,其被定义为先前未被临床检测或怀疑的甲状腺结节,但在影像学检查中偶然发现[1]。在临床实践中,影像医师描述和报告ITN时有很大差异[2]。美国放射学会(American College of Radiology,ACR)甲状腺偶发病变委员会在2015年发布了《影像偶发甲状腺结节管理:ACR甲状腺偶发病变委员会白皮书》[1],推荐使用“3层系统(the 3-tiered system)”对ITN进行评价,以统一ITN报告的标准并减少不必要的后续甲状腺超声检查。根据ACR的建议,ITN如果被归为“ACR阴性”,则不要在报告中的印象/结论部分提及ITN及建议进行任何形式的进一步评估;如果ITN被评价为“ACR阳性”,建议进一步行甲状腺超声评估。同年,美国甲状腺学会(American Thyroid Association,ATA)颁布了《甲状腺结节和分化型甲状腺癌诊治指南》[3],推荐对≥10 mm的ITN行进一步超声评估。
我国学者刘如玉等[4]将ACR“3层系统”与ACR甲状腺影像报告及数据系统(Thyroid Imaging,Reporting and Data System,TI-RADS)一起进行翻译和解读,指出两者优越性和局限性有待在临床实践中验证和发现。已有学者对ACR TIRADS及其他甲状腺风险分层模型进行了验证[5-6],但目前国内尚未有机构进行包含多种影像检查方式的大规模ITN相关研究,因此本次研究希望利用本机构国人的ITN病例对ACR“3层系统”进行验证,评估其应用价值。
1 资料与方法
1.1 一般资料
回顾性分析商丘市第一人民医院2021年9月至2022年8月进行胸部CT平扫/增强、头颈部CTA,颈椎CT平扫、颈椎MRI平扫/增强检查的ITN病例。
纳入标准:在影像报告的结论中报告了甲状腺结节。排除标准:既往通过各种检查已知患有甲状腺相关疾病。
1.2 仪器与方法
本次研究中包含的设备有8台CT及4台MRI,其中飞利浦128排CT 1台、GE64排及256排CT各1台、东软16排CT 3台,联影32排CT 1台,西门子1.5T MRI 2台、飞利浦1.5T MRI 1台,GE3.0T MRI 1台。
影像学检查方法共6种,包括胸部CT平扫/增强、头颈部联合CTA、颈椎CT平扫及颈椎MRI平扫/增强检查。
1.3 影像及数据分析
由两名影像医师通过检索资料中影像检查所报告的ITN病例,同时对ITN病例进行观察,并测量ITN横断面最大直径(如果同一个患者有多个甲状腺结节,则测量最大的一个),测量结果不一致时协商得出一致结果。
两名影像医师回顾性地应用ACR“3层系统”、“ATA标准”及“20 mm阈值”对报告的ITN进行再评价,并且统计应用不同方法建议进一步超声检查的ITN数量和比例。
根据ACR“3层系统”,对CT、MRI中ITN的病例进行评估时,符合以下3组风险类别任意一组的,即为“ACR阳性”,均不符合者为“ACR阴性”,具体标准为:
第1组:甲状腺结节具有某些高危征象——可疑淋巴结或侵犯周围组织,可疑淋巴结征象包括:淋巴结肿大(颈内静脉二腹肌淋巴结短径≥15 mm,其他区域淋巴结短径≥10 mm)、囊变、钙化和(或)增强扫描异常强化。第2组:年龄<35岁的患者ITN最大直径≥10 mm。第3组:年龄≥35岁的患者ITN最大直径≥15 mm。
“ATA标准”是指ITN≥10 mm为“ATA阳性”,<10 mm为“ATA阴性”。
以20 mm为阈值建议ITN进一步超声检查是指:ITN横断面直径≥20 mm为“阳性”,建议进一步超声检查,ITN横断面直径<20 mm为“阴性”,不建议进一步超声检查。
1.4 统计学方法
利用SPSS 26.0统计学软件进行数据处理,符合正态分布的计量资料以均数±标准差()表示,偏态分布的计量资料以中位数(四分位数间距)[M(P25,P75)]表示。计数资料用百分率(%)表示。使用Fisher确切概率法对ACR“3层系统”与“ATA标准”及“20 mm阈值”建议ITN病例的进一步超声检查率进行比较。P<0.05为差异有统计学意义。
利用Kappa检验评价两名医师使用ACR“3层系统”、“ATA标准”及“20 mm阈值”对于ITN分类是否相同的一致性。Kappa统计量判断标准:Kappa≤0.4,一致性程度较差;0.4
2 结果
2.1 不同检查方式ITN病例报告情况
各种检查方式的总数量为74 021例,纳入的影像检查方式及其数量见表1。共报告ITN病例3 818(3 818/74 021,5.2%)例,其中男1 149例,女2 669例,年龄中位数(四分位数间距)为64(54~72)岁。各种检查方法分别报告ITN的例数及其占检查本身比例,见表1。
表1 纳入的影像检查方式、报告ITN数量及报告ITN数量占检查本身比例
2.2 不同方法评价ITN病例结果情况
通过不同方法对3 818例ITN病例评估后,其评价结果见表2。ACR“3层系统”建议ITN患者做进一步超声检查的占比(33.1%)低于“ATA标准”建议ITN患者做进一步超声检查的占比(65.0%),差异有统计学意义(P<0.05)。ACR“3层系统”建议ITN患者做进一步超声检查的占比(33.1%)高于“20 mm阈值”建议ITN患者做进一步超声检查的占比(15.7%),差异有统计学意义(P<0.05)。
表2 应用ACR“3层系统”、“ATA标准”及“20 mm阈值”对ITN评价结果 [n=3 818,n(%)]
2.3 “3层系统”对ITN分类一致性情况
两名医师使用ACR“3层系统”对ITN分类是否相同的一致性很好(Kappa=0.978,P<0.05)。典型病例见图1~3。
图1 病例1头颈部CTA图像
图2 病例2胸部CT、超声图像及病理结果
3 讨论
偶然发现(incidental findings)是指患者在健康体检或进行针对临床阳性指征的影像检查时,发现与检查目的无关的占位性病变[7]。在缺乏相应部位临床指南或共识的情况下,对这些被称为偶发瘤(incidentaloma)的组织器官占位性病变进行合理、规范的影像诊断报告有较大难度。本文旨在通过大规模ITN的初步研究,结合不同方法的处理结果,为影像医师在面对ITN时提供参考。
3.1 ITN在影像检查中的报告数量和报告率
本次研究发现胸部CT(含增强)是报告ITN最多的影像学检查方式。一项来自美国的研究中[8],其受检者包括30 339名退伍军人,其胸部CT检查中的ITN报告率约为4.8%。另一项在美国以长期吸烟的无症状人群为研究对象的文献[9]表明,17 309名受检者的低剂量胸部CT检查中的ITN报告率仅为0.7%。在本研究中,胸部CT中ITN的报告率为5.0%,受检者范围较上述研究更广泛,更接近整体就医人群,既有因呼吸道相关疾患前来就诊的患者,也包括普通体检者,还有其他原因进行胸部CT的患者。本研究的整体研究对象以老年患者为主,年龄中位数(四分位数间距)为64(54~72)岁。
在通过胸部CT观察甲状腺时,笔者发现绝大部分胸部CT检查可部分覆盖或完全覆盖甲状腺,仅有少量检查完全不覆盖甲状腺。BAHL等[9]以胸部CT图像为载体的ITN研究中发现了同样的问题。甲状腺通常位于肺尖以上,胸部CT检查的范围通常从肺尖至肺底,所以视野(field of view,FOV)不太可能完全覆盖甲状腺。CT操作技师为了完全覆盖肺底,考虑到呼吸运动的影响,可能会将扫描野向下延伸1~2 cm,但肺尖位置比较固定,所以向上延伸的可能不大。此外,胸部CT的扫描范围与CT操作技师扫描习惯有较大关系。虽然胸部CT无法稳定覆盖全部甲状腺,但介于其在我国基层医院的广泛应用,其依旧是发现ITN最为常见的影像检查方式。
头颈部CTA是报告ITN(13.7%,334/2 445)占其检查本身比例最高的检查方式。可能的原因在于:与胸部CT平扫/增强检查相比,每一次头颈部CTA检查的扫描范围均可以完全覆盖整个甲状腺,而甲状腺在胸部CT上可能无法完全显示,其显示完整程度取决于操作者的扫描习惯和甲状腺的大小,难以保持稳定;与非增强胸部CT平扫相比,具有造影剂增强的头颈部CTA源图像可以提供更有价值的信息,比如可疑淋巴结或者更为清晰的正常甲状腺组织和甲状腺结节之间的界限。头颈部CTA作为临床筛查和诊断头颈部血管病变的主要影像学方法,在临床工作中有广泛的应用,由于甲状腺和颈总动脉毗邻相近,影像医师相比其他检查方式更容易发现头颈部CTA中的ITN。
在本次研究中,颈椎MRI平扫/增强检查报告了105例ITN(105/4 320,2.4%)。TYLER等[10]的研究也纳入了FOV包含甲状腺的MRI检查,包括颈椎MRI以及颈部/眶部/面部MRI检查,ITN的报告率约为3.5%(239/6 926)。另外一项研究颈椎MRI中ITN的报告率为7.4%[11]。相对于CT检查,颈椎MRI检查可能由于应用预饱和技术以抑制吞咽运动伪影,导致部分图像甲状腺信号被抑制,对影像医师识别ITN有一定影响。并且,颈椎MRI横断位图像多扫描椎间盘层面,不能连续扫描颈部组织,可能无法显示横断位ITN的最大截面(图3)。
图3 病例3颈椎MRI、超声图像及病理结果
本研究在国内首次大范围统计了包含多种影像检查方式的ITN报告率,本机构国人的ITN的报告率是5.2%(3 818/74 021)。在一项单中心回顾性研究[12]中,对109 220项影像学检查进行了回顾,只报告了125例(0.1%)ITN。与这项研究相比,本研究未将颈部超声检查(如颈动脉超声检查)等检查纳入研究,但报告ITN的比率远远高于这项研究,可能是由于本机构影像医师担心遗漏有意义的甲状腺恶性肿瘤,倾向于在报告中体现出来。
3.2 应用ACR“3层系统”对ITN再评价
ACR甲状腺偶发病变委员会提出“3层系统”的主要目的是通过对ITN进行分类,实现ITN报告的一致性并减少后续的甲状腺超声检查。本研究中,通过使用ACR“3层系统”可以减少影像医师报告和建议进一步超声的ITN数量(2 556例),LIN等[13]也认为ACR“3层系统”可以减少对ITN的不必要的干预。ACR“3层系统”建议ITN进一步超声检查的主要依据有3个方面:结节大小,患者年龄及可疑风险特征。相比ACR,“ATA标准”仅基于结节大小,相对单一。在本研究中,经过ACR“3层系统”评价后建议ITN的后续超声检查率(33.1%)明显低于使用“ATA标准”建议ITN的后续超声检查率(65.0%),差异有统计学意义(P<0.05)。后续超声检查率的差异主要是由于ACR和ATA在≥35岁ITN患者中,结节进一步超声检查的阈值不同造成的。相比“ATA标准”,ACR“3层系统”主要减少了年龄≥35岁ITN患者中结节直径在10~15 mm这部分进一步超声检查的数量。有学者[14]指出,对年轻患者的ITN进行随访可能更具有成本效益。
有学者[9]应用20 mm作为ITN进一步超声检查的阈值,故本研究也引入“20 mm阈值”与ACR“3层系统”做为对比。这项研究表明,相比10 mm,把20 mm作为ITN进一步超声检查的阈值,其后续超声检查率可以降低近一半,并且不会遗漏甲状腺癌。有学者通过回顾性研究颈部MRI中的ITN,认为部分MRI参数可以鉴别ITN的良恶性[15]。但实际工作中,甲状腺CT和MRI都不优于甲状腺超声检查,一般起显示甲状腺结节和周围组织关系的辅助作用[16]。本研究中,ACR“3层系统”建议ITN患者的进一步超声检查率(33.1%)高于“20 mm阈值”建议ITN患者的进一步超声检查率(15.7%),差异有统计学意义(P<0.05)。应用“20 mm阈值”确实可以比ACR“3层系统”减少更多的ITN后续超声检查,但实际工作中,接近20 mm的甲状腺结节更有可能被关注到,或者有其他可疑征象,影像医师也很难放任如此“大尺寸”的结节而选择不在报告中体现。
两名医师应用ACR“3层系统”对于ITN分类是否相同的一致性程度很好。影像医师在评价偶发病变时需要一种相对简便的方法,既可以对偶发病变快速做出初步评价,也有利于提高评价的一致性。
3.3 过度报告ITN的弊端
如果影像医师大量报告ITN,并且建议进一步超声检查,会显著增加后续的诊疗成本。许多ITN超声检查后可能会建议细针穿刺活检(fine-needle aspiration,FNA)或手术治疗。如果影像医师没有ITN相关规范指导意见,建议ITN进一步超声的行为可能会导致大量无症状良性ITN患者接受甲状腺切除术,使患者面临手术及麻醉并发症的风险。甲状腺手术并发症包括出血、感染、淋巴漏等,还有概率损伤喉返神经、喉上神经及甲状旁腺[17]。即使没有手术并发症,甲状腺术后患者还需要终生甲状腺素替代治疗以及定期随访。
在社会层面,考虑到大量报告ITN导致的甲状腺手术会占用一定的社会医疗资源,并且患者在进行甲状腺检查、治疗及以后随访的过程中可能会感到精神焦虑和恐惧,更加凸显了ITN规范报告的必要性。
本研究尚存在一些局限性。一方面,此研究为一项在单中心进行的回顾性研究,可能与其他机构在影像学检查上报告ITN以及建议后续检查方面有差异。另一方面,ACR“3层系统”除在CT、MRI中应用外,还有关于超声及核医学的相关ITN指导意见,这些影像检查方式未纳入本次研究,其有待进一步验证。
目前,有研究人员[18]开发了针对ITN的自然语言处理(natural language processing,NLP)应用程序,可以准确识别符合ACR“3层系统”的胸部CT中的ITN,其他影像检查方式有待进一步开发。
总之,本研究在国内首次大范围统计了包含多种影像检查方式中的ITN报告率,胸部CT是报告ITN最多的影像学检查方式,头颈部CTA是报告ITN占其检查本身比例最高的检查方式。通过ACR“3层系统”对ITN进行评估,其可以降低ITN的后续超声检查率,并且相比“ATA标准”可以减少更多的ITN后续超声检查。影像医师应结合我国实际情况,合理、适度降低影像检查中ITN的报告率。