定量化评估甲状腺结节恶性风险的CT预测模型
2018-10-09何俊林蔡剑波王晨思王永胜
何俊林 蔡剑波 王晨思 洪 瑶 王永胜
甲状腺结节是颈部最常见的肿块型病变。体检未能触及,而在影像学检查偶然发现的结节称作“甲状腺意外结节”。随着临床各部位CT的广泛应用,甲状腺意外结节日趋常见。然而,甲状腺结节的CT影像诊断多为模糊性结论,且结果缺乏一致性和可比性,影响了甲状腺结节的临床决策和治疗方案的选择。基于超声的甲状腺影像报告和数据系统(thyroid imaging reporting and data system, TIRADS)[1]是甲状腺结节风险的主要评估方法,目前缺乏与TIRADS结果匹配的CT诊断系统。近年来,随着CT技术发展和分辨率的提高,多种特异性CT征象被证实对甲状腺恶性结节具有较好的诊断价值,并且显示出优于超声的独特价值如甲状腺包膜的破坏和钙化性质等,并且无操作者依赖性[2-4]。因此,本研究旨在通过回顾性分析良恶性甲状腺结节的CT影像特征,建立定量评估甲状腺结节恶性风险的CT预测模型,提高CT诊断甲状腺恶性结节的效度。
方 法
1.一般资料
回顾性分析我院2014年5月-2016年5月经组织学证实,临床及CT资料完整的甲状腺结节186名患者,309枚结节。其中女性138名,男性48名,年龄15~84岁,平均52岁。根据甲状腺手术病理结果分为良性结节和恶性结节。良性结节包括良性甲状腺肿或甲状腺腺瘤,恶性结节包括甲状腺癌。对于一个患者有多个结节的情况,保留最大的结节或病理检查为恶性的结节纳入最后的统计分析[5]。
2.CT检查方法
采用美国GE light speed 16排螺旋CT机,患者取仰卧位,颈部尽量仰伸,两肩尽量下垂,扫描范围从咽部至锁骨上缘,扫描螺距1.0,层厚3.75cm,层距3.75cm,所有检查均为平扫加增强,并对平扫及增强图像进行拆薄及冠状位、矢状位重建,对比剂为碘海醇100ml,高压注射器静肘部静脉静脉团注,注射流率2~3ml/s,延迟50~55秒进行扫描。
3.图像分析
由2名主治或主治以上影像科诊断医师在影像归档及通信系统工作终端独立阅片,对甲状腺结节的多发、性质(实性、囊性)、位置、规则、纵横比、咬饼征(狭义/广义)、晕圈、壁结节、钙化(微钙化/粗钙化)、增强后结节边缘(模糊/清晰)、甲状腺包膜(完整/中断)、强化均匀度,以2名医生得出一致结果为准。纵横比:前后径与横径的比值。咬饼征:又称甲状腺边缘中断症,狭义的"咬饼征"是指瘤体最大径位于瘤体与甲状腺交界区或者甲状腺外,广义的“咬饼征”泛指瘤体边缘与甲状腺边缘具有一定的接触面,接触面较平直,非杯口状表现。增强后结节边缘:分别测量平扫及增强后病灶边缘和其对应的正常甲状腺组织的CT值,比较平扫和增强后两者差值的绝对值。若增强后差值缩小,定义为增强后边界模糊,若增强后差值增大,定义为增强后边界清晰。微钙化直径≤2mm ,粗钙化直径>2mm。
4.统计分析方法
统计学分析采用SPSS 20软件,P<0.05被认为具有统计学意义。采用多因素回归检验进行甲状腺CT特征与甲状腺结节良恶性的独立相关性分析(纳入所有P<0.05的因素),并使用Forward方法对变量进行筛选,最终保留对结果有显著影响的因素,以这些因素建立预测甲状腺结节恶性风险预测模型,并以列线图的形式予以展示。以风险预测模型得到甲状腺结节恶性风险概率来预测恶性程度(金标准),建立ROC曲线分析模型的效度。
结 果
图1 甲状腺结节恶性风险的CT预测评分系统。咬饼征:0.无 1.狭义咬饼征2.广义咬饼征。钙化:0.无 1.微钙化 2.粗钙化。
图2 甲状腺结节恶性程度CT预测的受试者工作特征(ROC)曲线。
图3 女性,75岁,左侧结节性甲状腺肿。A.CT轴位平扫示左侧瘤体纵横比1.07(22分),内见粗钙化(7分),平扫瘤体密度稍高于甲状腺。B.增强扫描示病灶强化,与CT平扫相比,病灶边界CT变化值36(28~31分之间)。本病例总分57~60分,恶性风险为 0.2 ~ 0.3,小于界值0.372,考虑为良性结节。
图4 女性,49岁,右侧甲状腺乳头状癌。A.CT轴位平扫示右侧甲状腺正常高密度背景内可见低密度病灶,纵横比1.75(33~44分),微钙化(20分),甲状腺轮廓缺损,呈咬饼征(白箭)(34分)。B.增强扫描示病灶边界CT变化值21(34分)。本病例总分121~131分,恶性风险为0.95~0.99,考虑为恶性结节。
表1 甲状腺恶性结节单因素/多因素分析
病理及良恶性结节分类 186枚结节中,良性结节117枚,其中结节性甲状腺肿60枚,甲状腺腺瘤57例;恶性结节(甲状腺癌)69枚。良恶性甲状腺结节的CT征象分析结果(表1):根据单因素分析结果,甲状腺结节规则、咬饼征、钙化形态、钙化多发、纵横比、增强后边缘清晰程度与良恶性结节显著相关,其中不规则结节、纵横比增大、咬饼征、细点样钙化、单发/多发钙化、增强后结节边缘清晰程度均会增加恶性的风险。多因素分析结果显示咬饼征、钙化形态、纵横比、增强后结节边缘清晰程度是恶性甲状腺结节的独立预测因素。有咬饼征会增加恶性的风险,其中狭义咬饼征恶性的风险更高;细点样钙化会增加恶性的风险;纵横比越大,恶性的风险越高;增强后边缘清晰程度越高,恶性的风险越低。
根据咬饼征、钙化形态、纵横比、增强后结节边缘清晰程度四个因素建立甲状腺结节恶性风险预测模型,根据各项因素的权重进行评分,其中咬饼征共34分:狭义咬饼征34分,广义咬饼征21分;钙化共20分:微钙化20分,粗钙化7分;纵横比共100分:纵横比越大分值越高;增强前后结节边缘共40分:差值越大分值越小。总分160分,分别对应不同的百分比,根据四项相加总分对应的百分比估计恶性风险(图1)。以此风险预测模型得到恶性风险概率来预测按病理结果得到的良恶性结节(金标准),其中曲线下面积(AUC)为0.828,P<0.001,预测风险概率的界值为0.372,其预测的敏感性为71.0%,特异性为83.8%,准确度79%(图2)。
讨 论
随着CT检查技术的普及,甲状腺意外结节的发现率日趋增高。为了提高临床诊断效率,减少患者重复检查率,亟需建立可信的甲状腺结节恶性程度的CT评估方法。本研究以病理诊断作为甲状腺结节良恶性的金标准,根据咬饼征、钙化形态、纵横比、增强后边缘清晰程度四项与甲状腺恶性结节独立相关因素,建立定量化的甲状腺结节恶性风险CT预测模型。
本模型优势在于甲状腺恶性结节存在多种特异性征象,使用多因素分析模型可以弥补单一因素诊断的缺陷。临床中由于软组织分辨率低,CT对微钙化的识别率不如超声,容易漏诊,但是使用多因素模型后仍可通过其他征象对甲状腺结节的恶性程度进行评估。其次,本系统简易客观的量化评分方法便于临床应用,影像医生根据客观分值对特异性征象评分,判断甲状腺结节的恶性风险,而非仅提供模凌两可的描述性结论(图3,4)。
本预测模型AUC高达0.828,并且敏感度和特异度均较高,其中敏感性为71.0%,特异性为83.8%,预测准确度79%,模型对甲状腺恶性结节的预测风险概率界值0.372,即预测恶性的风险概率若大于37.2%则可考虑诊断为恶性。与以往研究结果一致[4,6-7],本研究结果提示咬饼征,微钙化,纵横比和增强后结节边缘清晰程度与甲状腺恶性结节独立相关。然而以往主要使用单因素回顾性研究的分析方法,如仅根据微钙化诊断甲状腺乳头状癌的特异度较高 91.5% ~ 94%,但是敏感度仅 14.5 ~ 18.7%[4,8-9]。单因素研究存在多种混杂因素,诊断过程中难以仅凭单因素结果对甲状腺结节的良恶性进行评估。因此,目前的研究趋向采用不同CT征象的联合应用,提高甲状腺恶性结节诊断的特异度,减少误诊的发生[8,10]。然而,这类研究的评估方法仅是多征象排列组合,并没有进行多因素分析,也未反映这些重要CT征象在甲状腺结节恶性风险评估中的不同权重。因此这些研究的特异度虽高达96.6%~100%,但敏感度仅19%~59.4%[4,10]。且随着联合应用的征象增多,敏感度逐渐下降,四种征象联合使用诊断的敏感度仅约9%[8]。近期有研究通过多因素分析筛选出有价值的CT征象并应用ROC曲线评价联合多种CT征象鉴别良恶性甲状腺结节的效度,结果显示上述方法诊断恶性结节的敏感度和特异度约为90%和89%[11],但是该研究均仅评价了联合CT征象的诊断价值,并未明确如何将多种CT特异性征象的联合评估方法应用于临床实践。
与以往研究相比,本研究根据CT特异性征象在甲状腺恶性结节诊断中的权重,建立定量化的评分标准,具有较高的准确度,临床应用简便有效。本研究选取的四项特征咬饼征、钙化形态、纵横比、增强后结节边缘清晰程度是甲状腺恶性结节的独立相关因素。咬饼征是诊断甲状腺恶性结节的重要CT征象,病理基础是甲状腺包膜的累及及破坏[12],包括狭义咬饼征和广义咬饼征,前者特异度更高,后者敏感度更高。在本模型中,咬饼征的OR值最高,狭义咬饼征OR值为14.973,广义咬饼征的OR值也高达5.39。因此,狭义咬饼征的分值高于广义咬饼征。钙化常用于甲状腺结节的超声诊断,其中微钙化对甲状腺恶性结节的诊断具有重要的价值[13],本研究中微钙化与甲状腺恶性结节独立相关(P<0.001),OR值为4.988。有研究显示钙化形态与甲状腺结节类型密切相关,弧形和环形钙化是甲状腺腺瘤的特征性表现[7],然而此类钙化均为粗大钙化,因此本研究仅选取钙化大小作为评价依据。增强后结节边缘清晰程度与结节甲状腺交界区血供有关,增强后边缘模糊与血供丰富、结节浸润性生长有关,是恶性结节的征象之一。本研究发现增强前后结节和正常甲状腺组织差值增大与结节恶性程度相关,并且随着差值增大,评分增加。
本研究的局限性主要为回顾性研究存在的偏倚。因此,今后需要进行前瞻性双盲的病例对照研究,并将CT预测模型与超声的TIRADS评分系统进行比较,建立更为可信并且与超声TIRADS评分系统匹配的CT预测评分系统。
总之,甲状腺结节恶性风险的CT预测模型可以对多种与甲状腺恶性结节独立相关的因素进行量化评分,不仅便于临床使用,而且能够有效提高CT诊断甲状腺结节恶性风险的敏感度和特异度,减少漏诊误诊。