结节性甲状腺肿与甲状腺乳头状癌DWI 多参数的支持向量机模型建立及其预测价值
2022-09-19梁志鹏何永胜
夏 亮,姚 刚,梁志鹏,何永胜,罗 潇
(1.南京医科大学附属逸夫医院影像科,江苏 南京 211100;2.安徽省马鞍山市人民医院影像科,安徽 马鞍山 243000)
甲状腺癌的发病率呈逐年上升趋势,预计该病将成为全球第四大主要癌症[1]。大部分甲状腺乳头状癌具备相对惰性的特征,预后良好,但甲状腺乳头状癌有10 余种亚型,其中侵袭性滤泡亚型甲状腺乳头状癌极易发生远处转移[2],因此对甲状腺癌的早期诊断仍十分必要。甲状腺结节主要在结节性甲状腺肿、腺瘤及甲状腺癌三者中鉴别:腺瘤多单发且血供丰富;结节性甲状腺肿多为多发且病程长,在多发结节中极易藏匿单个甲状腺乳头状癌,当结节性甲状腺肿结节周边间质内有纤维组织增生,此时包膜与乳头状癌一样可不完整[3],结节性甲状腺肿囊变出血导致MRI 信号混杂,与甲状腺乳头状癌易混淆[4]。
目前,DWI 单指数模型与双指数模型在甲状腺结节诊断中应用较多[5-6],而拉伸指数模型很少被纳入研究[7-8]。支持向量机(support vector machine,SVM)机器学习模型近期被广泛应用于乳腺癌[9]、前列腺癌[10]等肿瘤的诊断中。本研究将DWI 单指数模型、双指数模型、拉伸指数模型参数的直方图同时纳入研究,并建立SVM 模型,以提升临床鉴别结节性甲状腺肿与甲状腺乳头状癌的能力。
1 资料与方法
1.1 一般资料 回顾性分析马鞍山市人民医院2019 年6 月至2020 年11 月收治的100 例甲状腺结节患者。纳入标准:①检查前均未行穿刺活检及相关抗肿瘤治疗;②检查后30 d 内经手术或穿刺活检获得病理结果;③扫描参数和方法一致,符合本研究的技术要求,病灶与周围背景组织对比清晰,可行定量分析;④病灶最大径均>1 cm。排除标准:①病灶最大径≤1 cm;②病灶与周围各组织分界不清,部分层面ROI 边界难以勾画;③病灶过多,穿刺或手术病理结果与MRI 图像无法准确匹配;④病理结果中含有腺瘤等其他结节样病变。100 例患者中,7 例因ROI无法准确勾画、1 例因肿瘤最大径<1 cm、4 例因吞咽运动频繁无法配合且DWI 图像质量差而被排除。最终88 例患者纳入研究,男29 例,女59 例;年龄27~67 岁,平均51.08 岁。88 例共101 个甲状腺结节,其中51 个为恶性结节(乳头状癌),50 个为良性结节(结节性甲状腺肿)。
1.2 仪器与方法 采用Siemens Magnetom Prisma 3.0 T 超导MRI 扫描仪,颈部相控阵线圈。患者取仰卧位,头先进,扫描范围覆盖颈部,嘱患者避免大幅度吞咽动作。扫描序列及参数:横轴位Zoomit-DWI 序列,TR 3 000 ms,TE 57 ms,层厚4 mm,层距4.4 mm,b 值取0、40、80、120、160、200、400、600、800、1 000 s/mm2,视野61 mm×119 mm,翻转角160°,矩阵148×76。本研究获得医院伦理委员会批准。
1.3 图像处理及数据测定 将所有图像导入Fire Voxel 医学影像分析软件(Artem Mikheev and Henry Rusinek Department of Radiology,NYUMC)。在甲状腺癌性结节研究中,全容积ROI 较单层实性成分ROI勾画计算ADC 值具有较高的诊断效能[11],因此本研究ROI 勾画采用病灶全容积勾画的方式。在每层DWI 图像上勾画病灶的ROI,每层图像的ROI 组成感兴趣容积(vloume of interest,VOI),之后使用FireVoxel 软件分别选择单指数模型、双指数模型、拉伸指数模型,共计算得到6 种参数图:ADC 图、灌注分数(f)图、慢速表观扩散系数(D)图、快速表观扩散系数(D*)图、扩散异质性指数(α)图、扩散分布指数(DDC)图(图1)。采用直方图分析6 种参数图提取病变区域的图像特征,特征值包括平均值(mean)、最大值(max)、最小值(min)、偏度(skewness)、峰度(kurtosis)、方差(variance)、标准差(standard deviation,STDEV)、熵值(entropy)、不均匀度(inhomogeneity)、百分位数(10%、25%、75%、90%),每种参数图提取13 个特征,共提取78 个图像特征。所有图像均由2 位具有5 年以上头颈部病变诊断经验的放射科医师阅片,将DWI 图像配准至T2WI 图像上,以T2WI 图像为基准对病灶进行勾画,将勾画后的ROI 映射到DWI 图像上,尽量勾画病灶的边缘,但不超出病灶。
1.4 统计学分析 使用SPSS 19.0 软件进行数据分析,78 个图像特征在结节性甲状腺肿与甲状腺乳头状癌之间的比较行独立样本t 检验,以P<0.01 为存在明显差异,去除无明显差异的特征,共筛选出22 个特征。如果某纹理特征的均值在2 种肿瘤之间有明显差异,则表明该图像特征与2 种肿瘤存在较强相关性。采用因子分析,从22 个特征中筛选出16 个特征。通过计算组内相关系数(intraclass correlation coefficient,ICC)评价观察者间测量16 个特征的一致性,ICC>0.8 为一致性良好。
1.5 模型建立与评价 采用Python 的sklearn 第三方库实现模型建立与评价。用筛选出的16 个特征作为SVM 模型的输入字段。设置随机种子(random_state=77),按照7∶3 的比例将数据集分为训练集(71 个)和测试集(30 个)。SVM 模型通过网格搜索交叉验证法(GridSearchCV 函数)训练并选取合适的核函数、正则化参数C、degree(选用多项式核函数时生效)及gamma 值,采用十折交叉验证方法对训练集进行测试,以f1_micro 为标准最终确定最优的SVM参数,并检查该模型在测试集的表现。其中核函数包括RBF、多项式、线性及sigmoid 4 种,正则化参数C选项为0.1、1、10、100、1 000、10 000,degree 选项为1、3、5、7、9,gamma 值的选项为0.000 1、0.001、0.005、0.1、1、3、5、10、100。通过精准度、召回率、f1 值及AUC评价SVM 模型鉴别甲状腺乳头状癌与结节性甲状腺肿的性能。
在模型训练完毕后,采用sklearn 中的permutation importance 函数,即随机排序特征重要性,衡量各特征的重要性。
2 结果
图像特征筛选及观察者间一致性评价见表1。经独立样本t 检验与因子分析筛选出16 个特征,其中来自拉伸指数模型的特征最多,共10 个。2 位观察者测量16 个特征的ICC 为0.84~0.98,一致性良好。
经网格搜索交叉验证法测试选择多项式核函数、C=10、gamma=1、degree=5 得分最高,其在测试集中的诊断效能见表2,AUC=0.89(图2)。随机排序特征重要性前3 位分别是75%-α(0.23)、max-α(0.16)、STDEV-α(0.13),其余特征排名见图3。
表2 支持向量机模型在测试集中的结果
3 讨论
甲状腺是体积较小的内分泌器官,使用全视野单次激发EPI 技术行头颈部DWI 扫描时往往图像质量较差。EPI-DWI 的图像质量常由于磁敏感伪影及易出现相位误差累积而下降。DWI 扫描时使用FSE 序列可有效减少磁敏感伪影并增加SNR。但由于多个射频重聚焦脉冲和射频加热限制,以及特定吸收率的增加,该序列的扫描时间较长[12]。因此,临床上亟需一种磁敏感伪影小且甲状腺图像质量更高的技术代替EPI-DWI。本研究DWI 扫描使用Zoomit技术采集颈部图像,该技术采用靶向小视野二维空间选择性射频脉冲激发ROI 的方式进行成像,能够有效减少磁敏感伪影,并提供能与形态学图像(如T2TSE 图像)相匹配的图像。
在进行拟合SVM 模型之前,找到合适的超参数是十分必要的,如果超参数模型不合适,其模型精准度可与合适的超参数模型相差30%以上[13]。执行网络搜索时会列出一些值域较小的超参数,这些超参数的笛卡尔积(排列组合)为一组组超参数,通过循环遍历,尝试每一种可能性,表现最好的参数就是最终的结果。网格搜索算法使用每组超参数训练模型并挑选验证集误差最小的超参数组合。然而当原始数据集划分成训练集和测试集后,测试集除了用作调整参数,也用来衡量模型的优劣,以致测试集泄漏,最终评分结果比实际效果好。这种简洁的网格搜索方法,其最终表现与初始数据的划分有很大关系,为避免这种情况,本研究采用十折交叉验证的方式来减少偶然性[14]。此外,GridSearchCV 几乎不会陷入局部优化[15]。由于GridSearchCV 与每种监督学习算法都兼容,SVM 恰巧是一种非常有效的线性数据分类器,可通过使用非线性基函数处理非线性分类问题,其寻找支持向量建立模型的方式本身可防止过拟合。本研究选择4 种核函数建立SVM 模型,利用GridSearchCV 找到了SVM 模型的最佳超参数及最佳核函数,且最佳超参数的结果均位于对应值域的中间,因此并未陷入局部优化。在以后提高模型准确率及泛化能力的进一步研究中,可继续采用网格搜索算法寻找模型的最佳超参数和最佳核函数。
从特征选择结果的重要性排名看,双指数模型的大部分参数图均被过滤,仅max-f 被保留,尽管双指数模型的DWI 参数图在大多数肿瘤中都有良好的预测性能,但目前看仅f 图在结节性甲状腺肿与甲状腺乳头状癌之间差异较显著,有学者也发现f 图区分良恶性甲状腺结节有很好的价值[16-17],这一观点与本研究基本一致。单指数模型生成的ADC 图虽然是日常影像诊断中最常用的图,但实际诊断价值不高,其排名在双指数模型之后;拉伸指数模型对甲状腺乳头状癌与结节性甲状腺肿的预测至关重要,其中α 图的直方图相关参数排名靠前,表明甲状腺乳头状癌体素内扩散异质性比结节性甲状腺肿高。这是由于恶性肿瘤细胞增生活跃,血管渗透因子过度表达导致迂曲的新生肿瘤血管数量增加[18],与良性结节性甲状腺肿细胞相比,组织结构更复杂,体素内成分更多。刘尧[7]的研究也表明,拉伸指数模型较单指数模型对甲状腺结节良恶性鉴别价值更大,这与本研究结果一致。本研究中,SVM 模型在测试集的精准度、召回率、f1 值均在0.9 左右,但召回率与精准度相差略大,通过模型预测为甲状腺乳头状癌的样本中正确率仅为85%,表明该模型特异度稍差,但敏感度高。宏平均与微平均结果[19]表明,SVM 模型在性能方面对单个类别或在整个测试类别中预测准确率均较好。当α=1 时,DDC 实际等于ADC,然而ADC图在本研究中价值不高,说明对于甲状腺结节来说扩散异质性较高,甲状腺结节信号弥散更符合多指数模型衰减。
本研究的不足之处在于乳头状癌的不同亚型样本量较小,如滤泡亚型乳头状癌会影响ADC 值的分布[20],降低模型的鲁棒性。另外,由于DTI 及DKI 模型对扫描梯度方向数量要求较多,考虑患者长时间检查的耐受问题,因此未纳入DTI 及DKI 模型进行研究。
综上所述,DWI 单指数模型、双指数模型、拉伸指数模型对鉴别甲状腺乳头状癌与结节性甲状腺肿均有重要作用,其中拉伸指数模型在SVM 建模中占主导地位。本研究的SVM 模型可有效改善上述2 种甲状腺疾病的误判,减少盲目穿刺与手术,今后可继续扩大训练集进一步完善模型,为临床术前提供更精准的预测信息。