APP下载

声触诊组织成像和定量技术联合ACR TI-RADS分类对不同直径甲状腺结节的诊断价值

2022-02-24李文朱绘绘刘海珍邰振玲

复旦学报(医学版) 2022年1期
关键词:良性恶性结节

李文 朱绘绘 刘海珍 邰振玲

(华东疗养院超声科 无锡 214065)

甲状腺影像报告和数据系统(thyroid imagingreporting and data system,TI-RADS)的提出,旨在标准化甲状腺超声术语,统一不同医疗机构间的诊断标准,在指导临床规范化治疗方面发挥了重要作用。但目前国内外尚无统一的TI-RADS标准,不同的协会、学者建立了自己的评价体系。其中,2017年,美 国 放 射 学 会(American College of Radiology,ACR)颁布的ACRTI-RADS[1]是目前临床较常用的甲状腺风险分层系统。

超声弹性成像通过获得组织弹性系数评估组织硬度,已逐渐应用于临床。已有研究[2-3]证实了超声弹性成像在甲状腺结节诊断中的应用价值。声触诊组织成像和定量(virtual touch tissue imaging quantification,VTIQ)技术属于较新型的超声弹性技术,可定量计算组织弹性,更为客观地反映组织软硬度,但目前尚无统一的诊断界值。

许多文献对甲状腺结节的多模态超声联合诊断效能进行了报道[4-7],主要方法是先将甲状腺结节进行TI-RADS分类,随后根据弹性成像的界值对甲状腺结节的恶性风险进行升级或降级,进而对比研究诊断效能。既往研究认为甲状腺癌存在过度诊疗的问题[8],特别是直径(diameter,D)≤10 mm的甲状腺微小癌常表现为惰性或非侵袭性行为[9],所以大部分研究对象多为D>10 mm的甲状腺结节;然而也有研究表明部分甲状腺微小癌易转移复发,严重影响患者的生存率及生活质量[10]。对于甲状腺癌,目前同时存在过度诊疗和诊疗不足的风险,D≤10 mm的结节同样需要准确的定性评估分析。本研究将纳入结节分为最大直径≤10 mm组和>10 mm组,通过二元Logistic回归分析生成ACR TI-RADS分类,联合VTIQ技术诊断甲状腺恶性结节的预测概率模型,并进行Hosmer和Lemeshow检验,旨在探讨VTIQ技术、ACR TI-RADS分类及两者联合在鉴别诊断不同直径甲状腺结节良恶性中的诊断效能。

资料和方法

研究对象回顾性分析2018年3月至2020年3月于华东疗养院行甲状腺超声检查并经术后病理证实的甲状腺结节患者。纳入标准:(1)各影像学和临床资料完整者;(2)结节经术后组织病理学证实者;(3)结节周围有正常的甲状腺组织者。排除标准:(1)完全囊性结节或几乎囊性结节、海绵状回声的结节;(2)合并甲状腺弥漫性病变者;(3)既往接受过手术或放射性碘治疗者,以及有颈部放疗史者;(4)位于峡部、靠近颈动脉搏动处的甲状腺结节。共纳入122例甲状腺结节患者共137个结节的常规超声和VTIQ图像资料,所有结节均行ACR TI-RADS分类。122例患者包括男性44例、女性78例,年龄19~63岁,平均年龄(44.6±10.1)岁;137个结节包括良性结节54个,恶性结节83个,所有结节最大直径平均(10.8±6.5)mm。本研究经华东疗养院医学伦理委员会批准[(2021)伦研批会第5号]。

仪器与方法采用德国Siemens S2000型彩色多普勒超声诊断仪,线阵探头9-L4,频率4.0~9.0 MHz。配备VTIQ成像软件。

患者仰卧位,充分暴露颈部,首先行甲状腺常规超声扫查,记录结节大小、内部结构、内部回声、纵横比、边缘、内部钙化等。所有结节进行ACR TI-RADS分类。评分标准[1]为:(1)内部结构,囊性或几乎完全囊性、海绵状计0分,囊实混合性计1分,实性或几乎完全实性计2分;(2)内部回声,无回声计0分,高或等回声计1分,低回声计2分,极低回声计3分;(3)形状,纵横比<1计0分,纵横比≥1计3分;(4)边缘,光整计0分,分叶状或不规则计2分,向甲状腺外生长计3分;(5)内部强回声,无或伴彗尾计0分,粗大钙化计1分,边缘钙化计2分,微小钙化计3分。依所得总分对结节恶性风险进行分类,TR1:0分,TR2:1~2分,TR3:3分,TR4:4~6分,TR5:≥7分。

VTIQ技术检查:首先采集质量模式图,获取色彩呈均匀分布的绿色区域作为有效的测量区,随后获取速度模式图,根据剪切波传导速度(shear wave velocity,SWV)地图的颜色比例梯度放置感兴趣区(regions of interest,ROI),包括结节最硬的区域(即红色区域)和结节最软的区域(即蓝色区域),余随机测量5~7组。测量时尽量避开液性区、钙化以及质量模式显示较差区域,获得SWV最大值(SWVmax)、最小值(SWVmin),平均值(SWVmean)和中位数(SWVmedian)。

ACR TI-RADS分类和VTIQ技术由两名对患者临床、病理资料不知情,具备5年以上超声工作经验的医师独立完成,意见不同时共同讨论达成一致后记录。

统计学分析应用SPSS 22.0统计软件,计量资料先行正态性分布检测,随后根据数据分布特点以平均数(±s)或中位数表示,组间比较采用t检验。性别、ACR TI-RADS分类等用计数资料表示,采用χ2检验或Mann-Whitney检验进行比较。Spearman相关性分析用于评估VTIQ技术与ACR TI-RADS分类之间的相关性。根据结节的不同直径(≥10 mm和<10 mm)分为两组,以手术病理结果为金标准,基于两个变量(ACR TI-RADS分类、VTIQ技术)的二元Logistic回归分析生成ACR TIRADS分类联合VTIQ技术诊断甲状腺恶性结节的预测概率模型:Logit(P)=α×ACR TI-RADS+β×VTIQ+constant(其 中α和β是 系 数),并 进 行Hosmer和Lemeshow检验。用MedCalc绘制受试者工作曲线(receiver operator characteristic,ROC)计算曲线下面积(areas under the curve,AUC)评估两组结节的ACR TI-RADS分类、VTIQ技术及两者联合应用的诊断效能,并采用Z检验评估差异。P<0.05为差异有统计学意义。

结 果

病理结果共纳入经病理学证实的137个甲状腺结节,其中结节直径(diameter,D)≤10 mm组64个,包括恶性43个(乳头状癌41个,髓样癌2个),良性21个(结节性甲状腺肿15个,滤泡型腺瘤2个,亚急性甲状腺炎结节4个);D>10 mm组73个,其中恶性40个(乳头状癌37个,滤泡型腺癌2个,髓样癌1个),良性33个(结节性甲状腺肿17个,滤泡型腺瘤10个,亚急性甲状腺炎结节6个)。

ACR TI-RADS分类结果结节D≤10 mm组64个,其中3类结节4个,包括恶性1个、良性3个;4类结节19个,包括恶性6个、良性13个;5类结节41个,包括恶性36个、良性5个;结节D>10 mm组73个,其中3类结节4个,均为良性;4类结节28个,包括恶性6个,良性22个;5类结节41个,包括恶性34个、良性7个。两组良恶性结节的诊断截断值均为TR>4,当TR=5时,ACR TI-RADS分类将结节诊断为恶性,当TR≤4时,ACR TI-RADS分类将结节诊断为良性。ACR TI-RADS分类对结节D>10 mm组的诊断效能稍具优势(D>10 mm组与D≤10 mm组的AUC分别为0.828和0.802),详见图1。

图1 D>10 mm(A)和D≤10 mm(B)甲状腺结节的ACR TI-RADS分类ROC曲线Fig 1 ROC analyses of ACR TI-RADS in the size intervals of D>10 mm(A)and D≤10 mm(B)

VTIQ技术检查结果D≤10 mm组中测得甲状腺恶性结节及良性结节的SWVmax、SWVmin、SWVmean、SWVmedian分别为(3.42±0.73)m/s、(2.64±0.44)m/s、(3.13±0.53)m/s、(3.09±0.67)m/s及(2.73±0.52)m/s、(2.14±0.49)m/s、(2.51±0.59)m/s、(2.46±0.51)m/s,差异具有统计学意义(P<0.001)。各组SWV指标中,SWVmean的诊断效能最佳,AUC为0.810,截 断 值 为2.67 m/s;结 节D>10 mm组中测得甲状腺恶性结节及良性结节的SWVmax、SWVmin、SWVmean、SWVmedian分 别为(3.86±0.87)m/s、(2.81±0.43)m/s、(3.52±0.78)m/s、(3.54±0.81)m/s及(3.07±0.53)m/s、(2.30±0.47)m/s、(2.66±0.50)m/s、(2.65±0.48)m/s,差异具有统 计 学 意 义(P<0.001)。各 组SWV指 标 中,SWVmean的诊断效能最佳,AUC为0.847,截断值为2.88 m/s。VTIQ技术对D>10 mm组的诊断效能稍具优势,详见表1、图2。

图2 良、恶性甲状腺结节各超声特征评估Fig 2 Evaluation of ultrasound features of benign and malignant thyroid nodules

表1 VTIQ技术对不同大小甲状腺结节良恶性鉴别的诊断效能Tab 1 Diagnostic performance of VTIQ in differentiating benign and malignant thyroid nodules of different sizes

ACR TI-RADS与VTIQ联合诊断结果D>10 mm组与D≤10 mm组二元Logistic回归分析生成甲状腺结节的恶性预测概率模型分别为:Logit(P1)=1.891×ACR TI-RADS+1.548×VTIQ-12.896;

Logit(P2)=1.148×ACR TI-RADS+1.565×VTIQ-8.751。

Hosmer和Lemeshow检验显示方程拟合良好(P值 分 别 为0.365、0.166),诊 断 截 断 值 分 别 为0.6765、0.6010,AUC分别为0.889、0.827。两组中,两者联合的AUC和准确性均优于单独应用ACR TI-RADS分类和VTIQ技术,且两者联合对D>10 mm组的诊断效能稍具优势,详见表2、3和图3。

表2 ACR TI-RADS分类、VTIQ及两者联合对不同大小甲状腺结节良恶性鉴别的诊断效能Tab 2 Diagnostic performance of ACR TI-RADS,VTIQ and ACR TI-RADS combined VTIQ in differentiating benign and malignant thyroid nodules of different sizes

表3 ACR TI-RADS分类及VTIQ对不同大小甲状腺结节良恶性鉴别的Logistic回归分析Tab 3 Logistic regression analysis of ACR TI-RADS and VTIQ in differentiating benign and malignant thyroid nodules of different sizes

图3 不同直径甲状腺结节ACR TI-RADS、VTIQ和两者联合鉴别诊断结节良恶性的ROC曲线Fig 3 ROC analyses of ACR TI-RADS,VTIQ and ACR TI-RADS combined VTIQ in the size intervals of D>10 mm(A)and D≤10 mm(B)

不同直径甲状腺结节区间内,ACR TI-RADS分类和VTIQ技术之间的相关性在鉴别诊断甲状腺结节良恶性上,VTIQ技术和ACR TI-RADS分类之间呈中等强度相关(D>10 mm组:r=0.656,P<0.001;D≤10 mm组:r=0.615,P<0.001)。

讨 论

现阶段,TI-RADS分类方法众多,各分类对甲状腺结节诊断效能也众说纷纭,有学者[11]对比分析了6种不同TI-RADS分类对细胞学可疑的甲状腺结节的诊断效能,提出不同指南优势不同,最终并没有指出哪一个分类标准显示出了特别的诊断效能。Middleton等[12]学 者 将ACR TI-RADS分 类 与韩国甲状腺放射学会颁布的TI-RADS分类及ATA颁布的指南的诊断性能进行比较发现,ACR TIRADS分类的诊断效能要优于其他两个被公认的指南,但其仅纳入最大直径>10 mm的结节。本研究采用ACR TI-RADS分类对纳入结节分D≤10 mm组和D>10 mm组进行赋分及分类,结果显示,两组结节诊断恶性截断值均为TR>4类,此时,ACR TI-RADS对两组结节的诊断效能最大,这与史宜鑫等[13]的研究结果相同,认为以T4为界值鉴别诊断甲状腺结节良恶性效能更佳。同时本研究结果显示,ACR TI-RADS诊断两组甲状腺恶性结节具有较高的敏感性(D≤10 mm组83.72%;D>10 mm组85.00%),而 特 异 性 相 对 较 低(D≤10 mm组76.19%;D>10 mm组78.19%)。通过比较发现,ACR TI-RADS分类在D>10 mm组诊断效能稍具优势,此与Gao等[14]研究结果相似,但D≤10 mm组具有较高的阳性预测值。

本研究采用了新型超声弹性技术—VTIQ技术,结果显示,D≤10 mm组诊断截断值为SWVmean=2.67 m/s,D>10 mm组 诊 断 截 断 值 为SWVmean=2.88 m/s,与Li等[4]的研究结果相近。本研究通过ROC曲线分析显示VTIQ在D>10 mm组中AUC稍高于D≤10 mm组,这表明VTIQ可能更适合应用于10 mm以上的结节。对于D≤10 mm的结节,虽然VTIQ的取样框很小,但可能由于结节直径过小,其与周围的正常甲状腺组织分界欠清,测量过程中 相互干扰,造成 误差,这与Sebag等[15]观点相同,即对于最大直径≤10 mm的微小癌,弹性的诊断效能并不令人满意。但并不能说明,结节直径越大、弹性成像诊断效能越好。Pei等[16]学者认为,弹性技术不太适用于D>30 mm的结节,结节直径过大时,内部容易出现缺血坏死区,也容易造成误差;另外随着组织深度的增加,VTIQ技术的准确性有待验证。

本研究结果还发现,对于D≤10 mm组,VTIQ技术联合ACR TI-RADS的诊断效能较两种手段的单独应用并没有表现出优势(P均>0.05);对于D>10 mm组,两者联合的诊断效能较单独应用ACR TI-RADS具有明显的提高(P=0.012)。本研究中,D≤10 mm组VTIQ出现假阳性的病例中共有4例亚急性甲状腺炎,而其中3例的ACR TI-RADS分类评分均计6分(实性2分、极低回声3分、边缘不规则1分)归为4类,究其原因,部分亚急性甲状腺炎可呈孤立结节状,随病情发展形成肉芽肿,后期成纤维细胞增生,导致硬度增加,从而导致VTIQ误诊,而ACR TI-RADS分类根据超声特征得出了正确的判断。在D>10 mm组VTIQ出现假阳性病例中共有5例结节性甲状腺肿伴有钙化,而其中3例ACR TI-RADS分类评分均计5分(实性2分,低回声2分,粗大钙化1分)归为4类,究其原因,由于结节伴有钙化使得组织硬度增加,VTIQ出现假阳性。故结节的弹性受内部成分、病程分期及病理类型影响[17],VTIQ的诊断 效能具有一定的局限性,结合ACR TI-RADS分类后,诊断效能有所提高。本研究结节直径≤10 mm组中,ACR TI-RADS分类有5例病例出现假阴性,评分为4分/5分(实性2分,低回声2分/极低回声3分,边缘光滑0分)归为4类,其病理结果计恶性,造成漏诊,而其中3例VTIQ技术测得SWVmean>2.67 m/s,诊断正确。故ACR TIRADS分类结合VTIQ技术获得硬度信息,能够在结节恶性特征不够典型的情况下,提高诊断准确性。

本研究存在以下不足:样本量较小,结节大小较集中,不够全面;纳入对象均为上海健康体检人群,缺乏多中心对比,和综合医院研究结果可能有所偏差。

本研究提示,VTIQ技术、ACR TI-RADS分类及两者联合对甲状腺结节诊断效能均和结节大小表现出了一定的相关性。另VTIQ技术可提髙ACR TI-RADS分类在评估直径>10 mm的甲状腺结节恶性风险评估中的诊断效能,两者联合可以互相发挥优势,提高诊断准确性,具有一定的临床应用价值。

作者贡献声明李文数据统计,论文构思、撰写和修订。朱绘绘项目监督和指导,论文修订。刘海珍图像分析,文献调研、整理和可行性分析。邰振玲数据采集,图像分析。

利益冲突声明所有作者均声明不存在利益冲突。

猜你喜欢

良性恶性结节
小剂量左甲状腺素对良性甲状腺结节的治疗效果及促甲状腺激素水平分析
体检发现的结节,离癌症有多远?
查出肺结节,先别慌
探讨促甲状腺激素与甲状腺球蛋白联合检测在甲状腺良恶性结节诊断中的效果
探讨超声检查在甲状腺肿块良恶性鉴别中的诊断价值
The arrow that saved my life救命之箭
了解这些,自己读懂甲状腺B超报告
甲状腺结节能 自己消失吗?
良性甲状腺结节需要治疗吗?
神回复