美国放射学会甲状腺影像报告和数据系统分类在甲状腺结节中的观察者一致性研究

2022-11-25姜艳项霞青通信作者周婉

医疗装备 2022年21期

姜艳，项霞青（通信作者），周婉

1 南京医科大学附属无锡市儿童医院超声医学科（江苏无锡 214023）；2 南京医科大学附属无锡市人民医院超声医学科（江苏无锡 214023）

流行病学调查显示，近年来甲状腺癌的发病率呈上升趋势[1]。而超声是检查甲状腺首选的影像学检查方法，可观察甲状腺的数目、位置、大小、结构、形状、内部回声、边缘、钙化及血流等方面。但是，不同的医师由于经验不同，对甲状腺结节的描述及诊断亦不尽相同。2009年Horvath 等[2]学者首次提出的甲状腺影像报告与数据系统（thyroid imaging reports and a data system，TI-RADS），之后又有许多学者陆续对TI-RADS 进行了修改与补充[3-4]，但种类较为繁多，未形成统一的诊断标准，同时由于不同等级的医院以及同一医院医师间的专业和经验水平不同，使得TI-RADS 分类方法的重复性减低。2017年美国放射学会（American College of Radiology，ACR）发表了《ACR 甲状腺影像报告和数据系统：ACR TI-RADS 委员会白皮书》，明确定义了甲状腺结节超声报告词典，包括结构、回声、形状、边缘和强回声灶5个征象[5]，并以此为基础，对各超声指标赋值累加后进行风险分类，不包含亚分类，简单易操作。本研究通过回顾性分析344个甲状腺结节的超声表现，从而评价ACR TI-RADS分类方法观察者间的一致性。

1 资料与方法

1.1 一般资料

回顾性分析2017 年1 月至2020 年8 月在南京医科大学附属无锡市人民医院甲乳外科行甲状腺结节切除手术或细针穿刺细胞学检查（fine-needle aspiration，FNA）的263 例甲状腺结节患者（344 个甲状腺结节）的二维超声资料（采用Philips Elite 彩色多普勒超声诊断仪及L12-5 高频线阵探头，患者取仰卧位，充分暴露颈部，嘱患者平静呼吸，常规超声检查甲状腺，存储图像，记录甲状腺结节的超声声像图特征），其中男83 例，女180 例；年龄18～78 岁，平均（46.67±13.77）岁。所有患者均签署知情同意书。

1.2 方法

由3组超声医师[A 组（2名初级医师）、B 组（2名中级医师）、C 组（2名高级医师）]在不知病理结果的前提下应用ACR TI-RADS 分类[5]对344个甲状腺结节进行赋值评分（图1）、记录数据资料。

图1 ACR TI-RADS 分类

1.3 统计学处理

2 结果

2.1 病理结果

344 个甲状腺结节中，恶性占46.2%（159/344），良性占53.8%（185/344），见表1。

表1 344个甲状腺结节的病理类型

2.2 ACR TI-RADS 分类结果

344 个甲状腺结节中，ACR TI-RADS 1 类6 个，ACR TI-RADS 2 类21 个，ACR TI-RADS 3 类71 个，ACR TI-RADS 4类97个，ACR TI-RADS 5类149个；ACR TI-RADS 1～5 类的实际恶性（病理结果）百分率分别为0.00%（0/6）、0.00%（0/21）、2.82%（2/71）、23.71%（23/97）、89.93%（134/149）。

2.3 ACR TI-RADS 分类的重复性及观察者间一致性

3组超声医师严格按照ACR TI-RADS 分类词典中各指标对344个甲状腺结节进行评价，采用可靠性分析比较3组医师所得结果，得出3组医师在评价甲状腺结节的结构、回声、形态、边缘及内部强回声灶5个方面可靠性均较好，结合ICC 值的评价原则，可认为应用 ACR TI-RADS 分类词典鉴别诊断甲状腺结节的一致性较高，见表2、图2～3。

图2 ACR TI-RADS 分类评分图

表2 3组超声医师评估甲状腺结节的结果比较（个）

3 讨论

超声是甲状腺结节首选的影像学检查方法，但由于超声声像图的表现复杂多变且有较多不确定性，导致诊断甲状腺结节难度提高。因此，统一甲状腺结节描述术语以及规范化诊断显得尤为迫切。

本研究结果显示，ACR TI-RADS 1～5 类的实际恶性（病理结果）百分率分别为0.00%（0/6）、0.00%（0/21）、2.82%（2/71）、23.71%（23/97）、89.93%（134/149）。ACR TI-RADS 分类预测TI-RADS 1～5 类恶性风险分别为≤2%、≤2%、<5%、5～20%、>20%，其中，ACR TI-RADS 1～3 类的实际恶性（病理结果）百分率与之相近，ACR TI-RADS 4 类的实际恶性（病理结果）百分率较其稍高，而ACR TIRADS 5 类的实际恶性（病理结果）百分率高达89.9%。此外，Middleton 等[6]研究得出ACR TIRADS 1～3 类的实际恶性（病理结果）百分率分别为0.3%、1.5%、4.8%、9.1%及35.0%，本研究结果与其不同，究其原因主要与研究对象不同有关，本研究病例为非随机性选择，大多数是手术或穿刺活检的病例，术前即高度怀疑恶性可能。ACR TIRADS 1 类及ACR TI-RADS 2 类结节一般无需临床处理，本组27 个（1 类6 个、2 类21 个）获得病理的结节是因为合并存在其他高分类结节，其中2 个海绵样结构的结节是因为患者高度紧张和焦虑而选择手术。本组病例ACR TI-RADS 3 类中有2 个病理证实为恶性，其中1 个病理为髓样癌，术前超声检查考虑为腺瘤伴囊性变可能，其最大径13 mm，没有FNA 指征，但是患者原因不明癌胚抗原（carcinoembryonic antigen，CEA）升高3 年，反复查胃镜、肠镜无异常发现，超声发现甲状腺结节至甲状腺乳腺外科就诊后发现血降钙素明显升高，手术病理证实为髓样癌；另外1 个病理为滤泡癌，术前超声检查也是诊断腺瘤囊性变可能，因结节最大直径大于30 mm 而选择手术治疗。滤泡性甲状腺癌和不典型髓样癌一直是超声诊断难点，这类结节倾向于良性特征，因而ACR TI-RADS 分类准确率较低。因此，ACR 对直径大于25 mm 的TI-RADS 3 类结节给予FNA 的建议是合理的。这就提示，体积较大的单发的良性结节还是必须警惕恶性的可能，必要时需结合基因检测等特殊检查辅助临床诊断[7]。

由于不同等级的医院以及同一医院的不同医师对甲状腺结节超声征象的描述术语亦不相同，导致医师与医师间及医师与患者间的沟通存在一定障碍[8]。既往已有许多学者及机构发表了各自的甲状腺超声分类系统，但分类方法种类繁多，并没有形成统一的标准，一致性较差，可重复性较低。以往有研究[9-10]对部分描述同进行过报道，本研究采用ICC 统计方法分析不同年资的超声医师应用ACR TI-RADS 分类的可重复性，结合ICC 值的评价原则，评价ACR TI-RADS 分类词典鉴别诊断甲状腺结节的一致性，结果显示，各指标一致性均较好，其中对结节内部回声的判断一致性最高，ICC 值高达0.998，体现了ACR TI-RADS 分类在区分结节囊实性中的优势。但其中在对“海绵样结构”的判断上5 名医师一致性较差。由于结节一旦被判断为“海绵样结构”，即可不必参考其他超声征象而被定义为ACR TI-RADS 1 类结节，因此对“海绵样结构”判断的不统一将会直接影响最终的分类结果。ACR TI-RADS 词典对于“海绵样结构”的定义是“结节内绝大部分（>50%）为多发小囊样结构”，对该定义执行的严格程度的不同直接导致了不同的分类结果，因此，薛恒等[11]学者的研究建议在作出“海绵样结构”的判断时应十分慎重，当判断不清时不应选择“海绵样结构”的诊断。虽然ACR TIRADS 将甲状腺实质和颈前肌群作为参考，且对回声有明确定义，但判断仍会存在主观性，在对甲状腺结节进行分类时仍会将等回声与低回声、低回声与极低回声相混淆。但由于其赋值分数的差距仅为1 分，因此对总分和ACR TI-RADS 分类的影响较小（ICC=0.998）。而且，即使不同医师对某1 个结节评分不一致，但是并不影响分类结果，所以各指标的组内相关系数比较理想。

综上所述，3组超声医师在评估甲状腺结节结构、回声、形状、边缘及强回声灶方面的可重复性均较高；ACR TI-RADS 分类方法在鉴别诊断甲状腺结节具有较高的一致性。