2017年美国放射学会甲状腺影像报告与数据系统鉴别甲状腺良恶性结节
2019-05-27陈泳愉黄伟俊钟敏莹
陈泳愉,黄伟俊*,钟敏莹
(1.佛山市第一人民医院超声诊疗中心,广东 佛山 528000;2.佛山市南海区人民医院超声科,广东 佛山 528000)
甲状腺结节是内分泌系统常见疾病,近年来, 随着超声技术的发展,甲状腺恶性结节的检出率逐年递增,但由于对甲状腺结节缺乏规范化管理,在判别良恶性结节方面存在较强的主观性。2017年美国放射学会(American College of Radiology, ACR)根据5项恶性征象提出了相对简单的甲状腺影像报告与数据系统(thyroid imaging reporting and data system, TI-RADS)[1],通过计算总分对结节分类,但并未提出鉴别良恶性结节的最佳临界值,且目前相关研究[2-3]报道较少。本研究回顾性分析甲状腺结节的超声资料,探讨2017年ACR TI-RADS分类在鉴别诊断甲状腺良恶性结节中的价值及最佳临界值。
1 资料与方法
1.1 一般资料 回顾性收集2015年10月—2017年10月在佛山市第一人民医院接受甲状腺超声检查并具有手术病理结果的495例患者(共497个结节)的声像图,男124例,女371例,年龄14~84岁,平均(44.0±12.5)岁;结节最大径3~57 mm,平均 (16.80±9.60)mm。
1.2 仪器与方法 采用Siemens S2000(9L4探头,频率5~14 MHz)、百盛Mylab 60(LA523探头,频率5~12 MHz)及GE Logiq E9(ML6-15探头,频率 6~15 MHz)彩色超声诊断仪。嘱患者仰卧,充分暴露颈部,全面扫查甲状腺,发现结节时留取完整声像图,描述并记录结节各项超声特征。
1.3 图像分析 由2名具有15年以上甲状腺诊断经验的医师在未知病理结果的情况下根据2017年ACR TI-RADS对结节进行分类,意见不同时共同商议得出一致结果。再由1名具有10年以上甲状腺诊断经验的高年资医师及1名具有2年甲状腺诊断经验的低年资医师在未知病理结果的情况下观察结节大小、形态、边缘、回声、内部结构及钙化等,对结节良恶性做出经验诊断;再分别于学习2017年ACR TI-RADS分类后各自对结节进行评分,做出TI-RADS诊断。
2017年ACR TI-RADS标准从甲状腺结节的成分、回声、形状、边缘及钙化5个方面进行评分与分类。分类标准:成分,包括囊性(0分)、海绵状结节(0分)、
混合结节(1分)、实性或几乎为实性(2分);回声,包括无回声(0分),高、等回声,即回声高于甲状腺腺体、与甲状腺腺体类似(1分),低回声,即回声低于甲状腺腺体(2分),极低回声,即回声低于邻近颈部肌肉、颈前肌群(3分);形状:非直立生长(0分)、直立生长(3分);边缘,包括光滑(0分)、欠清(0分)、不规则或分叶状(2分),甲状腺外侵袭(3分);钙化(可多选),包括无或伴彗星尾征(0分)、粗大钙化(1分)、周围(环状)钙化(2分)、点状强回声(3分)。总分0分归为TI-RADS 1类(当结节成分为海绵状结节时,回声、形状、边缘各项不再计分),2分归为TI-RADS 2类,3分归为TI-RADS 3类,4~6分归为TI-RADS 4类,≥7分归为TI-RADS 5类。
1.4 统计学分析 采用SPSS 20.0统计分析软件,计数资料以例表示,计量资料以±s表示。以组织病理学为金标准,根据2名具有15年以上甲状腺诊断经验的医师共同商议得出的TI-RADS总分构建ROC曲线获得最佳临界评分;采用χ2检验比较高、低年资医师经验诊断及TI-RADS诊断的效能。采用Kappa检验分析高、低年资医师诊断良恶性结节的一致性,Kappa值≤0.20为一致性差,>0.20~0.40为一致性一般,>0.40~0.60为一致性中等,>0.60~0.80为一致性好,>0.80为一致性非常好。以P<0.05为差异有统计学意义。
2 结果
497个结节中,良性结节272个,包括结节性甲状腺肿261个,滤泡性腺瘤11个;恶性结节225个,包括甲状腺乳头状癌220个,髓样癌4个,滤泡癌1个。TI-RADS 1~5类结节分别占14.08%(70/497)、10.87%(54/497)、10.46%(52/497)、23.54%(117/497)及41.05%(204/497),TI-RADS分类结果与病理结果比较差异有统计学意义(χ2=235.73,P<0.001)。不同TI-RADS分类结节的病理结果见表1。
以病理诊断结果为金标准,TI-RADS分类诊断甲状腺恶性结节的AUC为0.883[95%CI(0.854,0.912),P<0.001],最佳临界评分为5分,敏感度为86.22%(194/225),特异度为78.68%(214/272),约登指数为0.649,见图1。TI-RADS 3~5类甲状腺结节的声像图表现见图2。
表1 甲状腺结节TI-RADS分类标准及总分与病理结果比较
图1 2017年ACR TI-RADS鉴别甲状腺良恶性结节的ROC曲线
以>5分作为TI-RADS诊断甲状腺恶性结节的标准,高、低年资医师分别诊断良性结节208、202个,恶性结节176、174个,差异均有统计学意义(χ2=147.511、131.179,P<0.05)。高年资医师凭经验诊断的敏感度、特异度、准确率、阳性预测值、阴性预测值与TI-RADS诊断差异无统计学意义(P均>0.05);低年资医师TI-RADS诊断甲状腺恶性结节的敏感度、阴性预测值均较经验诊断更高(χ2=10.252、7.320,P=0.020、0.009),特异度、阳性预测值、准确率与经验诊断差异无统计学意义(P均>0.05);见表2。高年资医师凭经验诊断的敏感度、特异度、阳性预测值、阴性预测值、准确率均较低年资医师更高(χ2=9.565、11.333、11.314、9.521、10.345,P均<0.05),采用TI-RADS诊断的敏感度、特异度、阳性预测值、阴性预测值、准确率与低年资医师差异均无统计学意义(χ2=0.051、0.356、0.247、0.096、0.312,P均>0.05)。
以>5分作为TI-RADS鉴别良恶性结节的标准,不同年资医师诊断良恶性结节的差异有统计学意义(χ2=167.944,P<0.001;表3);一致性分析结果显示,二者具有中等一致性(Kappa=0.581)。
3 讨论
为使甲状腺结节的管理更加规范化,参照乳腺影像报告和数据系统(breast imaging reporting and data system, BI-RADS),国外学者[4-6]相继提出了TI-RADS,其临床诊断价值已得到认可[7-8],但因标准不统一,在临床应用中仍存在争议。国内学者[9]建立了TI-RADS超声评价体系,认为凭借对恶性征象的权重与组合更有利于诊断恶性结节,与2017年ACR TI-RADS分类将5项超声恶性征象赋予不同分值以评估结节的思路相当,目的是突出恶性征象及量化甲状腺结节的评估流程。
表2 TI-RADS分类及经验诊断甲状腺结节的诊断效能比较[%(个)]
图2 TI-RADS 3~5类甲状腺结节声像图 A.TI-RADS 3类结节(甲状腺滤泡腺瘤),实性(2分),高、等回声(1分),纵横比<1(0分),边缘光滑(0分),无钙化(0分),总分3分; B.TI-RADS 4类结节(甲状腺髓样癌),实性(2分),低回声(2分),纵横比<1(0分),边缘欠清(0分),粗大钙化(1分),总分5分; C.TI-RADS 5类结节(甲状腺乳头状癌),实性(2分),低回声(2分),纵横比<1(0分),外侵袭(3分),无钙化(0分),总分7分
表3 不同年资医师采用TI-RADS 鉴别诊断甲状腺良恶性结节的一致性检验(个)
本研究中,以2017年ACR TI-RADS分类构建ROC曲线下面积为0.883(P<0.001),提示其对鉴别甲状腺良恶性结节具有较高诊断价值;最佳临界评分为5分时,敏感度为86.22%(194/225),特异度为78.68%(214/272)。因此,本研究设定了≤5分为TI-RADS诊断良性结节标准、>5分为诊断恶性结节的标准。
低年资医师采用TI-RADS诊断甲状腺结节的敏感度较经验诊断有所提高(77.33% vs 63.55%),差异有统计学意义(χ2=10.252,P=0.020),提示TI-RADS分类可提高低年资医师的诊断水平。高年资医师凭借经验诊断的敏感度、特异度、阳性预测值、阴性预测值、准确率均较低年资医师更高(P均<0.05),但采用TI-RADS诊断后,二者敏感度、特异度、准确率、阳性预测值、阴性预测值差异均无统计学意义(P均>0.05),提示统一甲状腺超声报告术语的规范化管理及诊断标准对年轻医师具有很好的指导作用,可在一定程度上拉近高、低年资医师间的诊断水平。此外,本研究发现高、低年资医师的评估结果具有中等一致性(Kappa=0.581),提示以>5分作为TI-RADS鉴别良恶性结节的分界点具有普遍适用性;但本研究所见的一致性相比以往研究[10]稍低,考虑原因在于本研究中的高年资医师积累了一定的诊断经验,对TI-RADS超声描述术语的理解较低年资医师更加深入。
既往研究[11]报道,采用TI-RADS诊断甲状腺良恶性结节的敏感度、特异度及准确率分别为0.912、0.851、0.893;本研究中,高年资医师TI-RADS诊断的敏感度、特异度及准确率分别为78.22%(176/225)、76.47%(208/272)、77.26%(384/497),低年资医师则为77.33%(174/225)、74.26%(202/272)、75.65%(376/497)。本研究诊断效能偏低的原因可能在于属回顾性分析,诊断医师缺乏充足的诊断信息,包括病史、体征、病灶多个切面的动态扫查、彩色血流图以及颈部淋巴结情况等,在一定程度上降低了诊断准确率。
本研究的局限性:①未纳入具有桥本甲状腺炎背景的结节;②入选结节均选自手术患者而非普通人群,可能有选择性偏倚,从而影响验证结果;③疾病谱较窄,需进一步增加样本量并进行多中心研究;④未应用弹性成像和超声造影等新技术,今后将继续完善。
综上所述,2017年ACR TI-RADS分类标准可较准确地鉴别甲状腺良恶性结节,总分≤5分可归为良性结节,>5分可归为恶性结节,且高、低年资医师的诊断一致性较好,对于临床诊断和治疗具有重要提示作用。