CT影像组学对甲状腺乳头状癌与腺瘤的鉴别
2021-06-04赵泓博段绍峰石博文刘路路
赵泓博 叶 靖 段绍峰 刘 畅 石博文 刘路路
甲状腺疾病的检出率总体呈上升趋势[1],其肿瘤性病变以甲状腺乳头状癌(papillary thyroid carcinoma)与腺瘤(thyroid adenoma)最为常见。由于前者为恶性,是甲状腺癌中最常见的病理类型,后者为良性,治疗方式的选择和预后存在差别,因此鉴别诊断非常重要。甲状腺乳头状癌与腺瘤是临床常见的富血供甲状腺结节,两者的肿瘤实性部分均可明显强化,其动态增强曲线也存在一定的重叠[2]。甲状腺细胞穿刺活检在术前诊断甲状腺肿瘤的检查方法中最为准确,但穿刺结果会受到穿刺部位及取材的影响,并且该方法为有创检查。作为新兴的影像学研究领域的影像组学,通过运用大量自动化数据特征化算法,实现感兴趣区(region of interest,ROI)与可以进行发掘处理的特征空间数据之间的转化,联合机器学习,能够对肿瘤病变内在的异质性进行定量分析[3]。本研究旨在探究基于CT图像的影像组学联合机器学习在甲状腺乳头状癌与腺瘤鉴别诊断中的价值。
方 法
1. 研究对象
对2015年1月至2018年12月在江苏省苏北人民医院接受诊治且符合下列标准的患者进行回顾性分析。纳入标准:①经手术病理证实;②术前均接受甲状腺CT平扫;③术前未经任何治疗;④CT图像质量满足诊断要求及校准分析。共84例患者纳入本研究,其中男性21例,女性13例;年龄36~68岁,平均年龄为(51±9)岁。肿瘤病变均为单发。同时调阅超声和CT图像诊断报告,评估影像医师的诊断情况。
2.CT检查方法
选用美国GE Lightspeed VCT 64 CT扫描仪行常规甲状腺平扫。管电压为120 kV,管电流为360 mA,层间距为5 mm,层厚为5 mm,螺距为0.984。进行甲状腺CT平扫。
3. 图像处理
通过甲状腺CT扫描得到层厚为5 mm的原始CT图像,由1名具有5年颈部疾病影像诊断工作经验的医师在不知晓病理诊断的情况上使用ITK-SNAP软件(Version3.8.0,www.itksnap.org)选取病灶最大的层面,沿着病灶的边缘进行手动勾画(图1),ROI尽量避开正常组织及钙化灶;再由另1名从事颈部疾病诊断10年以上的主任医师确认分割结果,将其以NiFTI格式文件导出并保存。
图1 典型病例病灶边缘的手动勾画
4.数据预处理与特征提取
首先将患者的原始图像及ROI分别导入A.K.软件(Artificial Intelligent Kit,GE Health)进行图像预处理,包括重采样(resample)、降噪(denoising)和亮度标准化(intensity standarization);随后将预处理后的图像重新导入A.K.软件,软件自动获取包括直方图特征(histogram features)、形态学特征(form factor features)、灰度共生矩阵特征(GLCM features)、基于灰度共生矩阵的Haralick特征、游程矩阵特征(RLM features)、灰度连通区域矩阵特征(GLSAZM features)等在内的396个特征参数。
5.特征筛选与统计学方法
采用A.K.软件,由其内置的R语言算法自动完成特征筛选,经单因素方差分析、Spearman相关分析和最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)回归模型(交叉验证法)进行特征降维,选择最有鉴别意义的特征。随后运用SPSS 19.0统计软件进行统计学检验,符合正态分布且总体方差齐的2组行单样本t检验,不满足正态分布或方差齐的2组行秩和检验,以P<0.05为差异具有统计学意义。随后选取特征参数,分别构建随机森林(random forest,RF)、逻辑回归(logistic regression,LR)和支持向量机(support vector machine,SVM)模型进行分类训练测试,采用十折交叉验证方法结合受试者操作特征(ROC)法对上述模型的性能进行验证,计算得出ROC曲线下面积、准确度(accuracy)、灵敏度(sensitivity)、特异度(specificity)。
结 果
1.超声和CT平扫诊断甲状腺乳头状癌和腺瘤情况
回顾性调阅84例患者(甲状腺乳头状癌39例,腺瘤45例)的超声和CT图像诊断报告,超声和CT明确诊断的分别为47例和15例,得出超声和CT平扫诊断甲状腺乳头状癌和腺瘤的灵敏度分别为0.56和0.18。
2. 特征参数分析
采用A.K.软件内置的R语言算法对396个特征参数进行筛选后得出3个特征参数,即Short Run Emphasis_angle0_offset1、Short Run High Grey Level Emphasis_AllDirection_offset1和Grey Level Nonuniformity_AllDirection_offset1,并且它们都属于游程矩阵参数。随后运用SPSS 19.0统计软件对3个参数进行统计学检验,结果表明,3个特征参数在在甲状腺乳头状癌和甲状腺腺瘤之间的差异均有统计学意义(P<0.05,表1)。
表1 甲状腺乳头状癌和甲状腺腺瘤患者CT平扫显著特征统计结果±s
表1 甲状腺乳头状癌和甲状腺腺瘤患者CT平扫显著特征统计结果±s
SRE:Short Run Emphasis_angle0_offset1 SRHGKE:Short Run High Grey Level Emphasis_AllDirection_offset1 GLN:Grey Level Nonuniformity_All Direction_offset1。
分类甲状腺乳头状癌甲状腺腺瘤P值例数39 45<0.05 SRE(×10-2)79.82±86.45-36.39±102.08<0.05 SRHGLE(×10-2)78.27±92.91-16.05±86.67<0.05 GLN(×10-2)-55.59±58.33 87.02±165.43<0.05
以上述3个参数作为影像组学特征,分别构建RF、LR和SVM机器学习模型进行分类训练,采用十折交叉验证,计算得出ROC曲线下面积(AUC)分别为0.77、0.74和0.72(图2),最佳点的准确度分别为0.82、0.76和0.75,灵敏度分别为0.75、0.70和0.60(均高于单独应用超声或CT平扫对甲状腺乳头状癌和腺瘤进行诊断的灵敏度),特异度分别为0.70、0.65和0.69。,结果表明,影像组学联合机器学习能够区分甲状腺乳头状癌和腺瘤。
讨 论
1.CT影像组学联合机器学习在甲状腺肿瘤鉴别诊断中的价值
甲状腺乳头状癌和甲状腺腺瘤是临床上常见的甲状腺肿瘤,目前对两者的鉴别主要以常规超声、CT、MRI扫描等检查方法为主,这些方法在二者的鉴别诊断中均存在一定的局限性或弊端。超声诊断的可靠性取决于图像质量及操作者的临床经验等因素,而且对甲状腺肿瘤的评判也缺乏标准化及规范化,从而影响了超声的术前诊断符合率,而MRI扫描时间长,费用较高,并且存在一定禁忌证。而有研究[4]显示,CT是诊断甲状腺疾病重要的影像学手段之一,具有很高的密度分辨力,尤其是多层螺旋CT技术的应用,有效提高了其空间分辨率,使其图像更清晰,有利于提供更准确的诊断依据,故本研究探讨了CT影像组学结合机器学习在甲状腺乳头状癌和甲状腺腺瘤鉴别诊断中的价值。
影像组学作为新兴的检查手段,具有无创、方便等优点,能够将医学图像改变为可使用的高维数据,从而客观定量地描述肿瘤表型、区分良恶性肿瘤和预测治疗,使医学图像可以指导个性化治疗[5-7]。影像组学是将视觉影像信息通过分割、特征提取、模型建立等转为更深层次的特征进行量化,从而进行挖掘、预测来辅助医师进行临床诊疗工作[8]。目前,临床影像组学实施流程主要为数据收集、ROI分割、特征提取、特征降维及模型建立[9]。头颈癌的组织学类型等与特征纹理聚类相关,这一点Parmar等[10]进行了证明。Coroller等[11]评价放射组学预测肺腺癌远处转移,其中35个组学特征可以预测远处转移,而12个特征预测生存期。有研究表明超声结合影像组学对PTC和TA的鉴别具有一定价值,Abbasian等[12]应用超声CAD辅助技术来进行纹理分析,结果表明纹理分析对甲状腺良恶性结节鉴别具有较高的准确性和应用价值。张衡等[13]证实了T2WI图像纹理特征有助于鉴别诊断甲状腺腺瘤和甲状腺乳头状癌。但目前影像组学对甲状腺肿瘤的分析研究尚处于初步探索阶段,且基于CT平扫影像组学对甲状腺乳头状癌和甲状腺腺瘤的鉴别尚未见报道。
本文研究了CT影像组学联合机器学习对甲状腺乳头状癌与腺瘤鉴别诊断中的价值,首先分析了396个特征参数,并进行了特征选择。在数据挖掘中,特征选择是一种非常有用的策略。它可以简化模型,避免维数的困扰,减少过拟合。经过单因素方差分析、Spearman相关分析和LASSO回归,最终得出了3个最具特征的参数,即Short Run Emphasis_angle0_offset1、Short Run High Grey Level Emphasis_AllDirection_offset1和Grey Level Non-uniformity_AllDirection_offset1,以上均属于游程矩阵参数[14],其中前两者属于短游程。图像纹理的复杂性决定了短游程数值的大小,纹理越复杂,数值越大[15]。本研究发现甲状腺乳头状癌的2个短游程值明显高于甲状腺腺瘤,表明腺瘤较乳头状癌纹理更均匀、规则。这种差异可能是由于这2种病变病理特征存在差异,因为乳头状癌病灶内存在砂粒体、灶性鳞状上皮化生,肿瘤间质内的淋巴细胞浸润和肿瘤细胞细胞核的异常。灰度不均匀度(grey level No-nuniformity_AllDirection_offset1)表示图像中某种灰度出现的频率,如果图像中某种灰度出现较多,即灰度较均匀,则该值越大,因此结果表明甲状腺腺瘤组较乳头状癌组灰度更均匀。
随后分别采用RF、LR和SVM算法构建机器学习模型进行分类训练,结果表明3种模型均可用于鉴别甲状腺乳头状癌和腺瘤,且3种模型的灵敏度均高于单独应用超声或CT平扫对甲状腺乳头状癌和腺瘤诊断的灵敏度。王洪序[16]等采用MRI对甲状腺良恶性结节进行鉴别,得出MRI在鉴别甲状腺良恶性结节中的灵敏度为0.69,低于本文中RF和LR模型的灵敏度。其中RF模型的AUC、准确度、灵敏度及特异度数值均高于其他2种模型,因此RF模型相较其他模型有更为优秀的鉴别能力。李智慧等[17]也证实RF模型相较其他模型有更为优秀的直肠良恶性鉴别能力。
RF模型较其余模型有下列优点:首先,森林里的每棵基决策树都是随机的;其次,每棵树之间拥有高度不相关性。因此理论上讲,组成RF的树越多,越不容易发生过拟合。对特征维度高、样本量小的数据可以运用RF进行分析,且有文献表明RF对异常值也具有鲁棒性[18]。此外,RF对变量具有重要的衡量作用。基于影像组学技术,不仅规避了观察者本身对于影像特征解读的主观偏向,还能深度挖掘并整合CT图像中大量的肉眼无法识别和区分的数字化信息,从而提高对甲状腺肿瘤的术前诊断效能。
图2 针对3个影像组学特征参数构建的不同机器学习模型的ROC曲线
2. 本研究的局限性
首先,本研究为回顾性分析且样本量较小,仅对乳头状癌和腺瘤这2种病理类型的甲状腺肿瘤的影像组学特征进行了比较,而临床上甲状腺肿瘤的病理类型很多,缺乏普遍适用性。下一步,笔者将扩大研究样本量,同时纳入更多不同病理类型的甲状腺肿瘤,以期提高研究的临床实用价值。其次,本研究没有对基于超声及MRI图像进行影像组学的分析,后期笔者将纳入两者再作进一步的研究。最后,影像组学为肿瘤的术前病理分类提供了较好的应用结果,但其医学解释还有待进一步探讨。
综上,基于CT平扫的影像组学联合机器学习可以鉴别甲状腺乳头状癌与腺瘤,具有一定的临床价值。