基于ADC序列影像组学鉴别T2、T3期直肠癌的应用价值研究
2020-12-25孙伯尧郑雪微管玉瑶于保婷
孙伯尧,姜 洋*,郑雪微,丁 军 ,刘 硕,管玉瑶,李 佟,于保婷,治 南
(吉林大学中日联谊医院 1.胃肠外科; 2.放射线科,吉林 长春130033)
近年来直肠癌发病率及死亡率呈逐年上升的趋势,其中T3期约占60%-80%。目前直肠癌的治疗主要包括手术治疗和新辅助治疗,对于T分期达T3或N+的患者,建议先进行新辅助放化疗。因此,患者术前准确分期,对于制定治疗方案及预后至关重要。高分辨率MRI无法准确鉴别患者术前肿瘤是否侵犯周围脂肪间隙,造成术前T2与T3期的过高或过低分期[1]。本研究通过对T2、T3期直肠癌ADC序列影像组学特征进行研究,包括提取病灶区域影像特征、特征筛选,进而通过分析比较建立高效稳定的诊断模型,对指导临床制定个体化的治疗方案具有重要指导意义。
1 资料与方法
1.1 一般资料
收集2019年1月-2020年1月于我院就诊的59例直肠癌患者的临床及影像资料,男39例,女20例,平均年龄(51.35±7.05)岁,其中T2期患者16例,T3期患者43例。纳入标准:①术后病理证实为T2、T3 期直肠腺癌;②具有完整的影像学资料;③术前未进行新辅助放化疗;④术后取得完整的病理结果。排除标准:①幽闭恐惧症患者;②特殊的病理类型,如黏液腺癌。③图像质量差,运动伪影明显,影响图像分割及影像组学特征提取。
1.2 仪器与方法
采用德国西门子公司1.5TMR扫描仪,8通道体部相控阵线圈,检查前进行肠道准备,患者取仰卧位,扫描序列和参数:DWI轴位扫描,TR/TE 采用 4 800 ms/66 ms,矩阵112×112,FOV 360×360 cm,层间距 0 mm,层数 30 层,层厚5 mm,b值取800 s/mm2。
1.3 影像组学分析
首先将59例直肠癌患者影像资料以DICOM形式导出,并将ADC图上传至多模态科研平台,由2名具有多年诊断经验的医生在ADC图上逐层手动勾画肿瘤的ROI,尽量避开正常肠壁及周围组织。利用PyRadiomics工具包对已标注的所有ROI提取影像特征,对原始MR图像进行小波变换和拉普拉斯高斯变换预处理后,针对影像数据提取高通量特征,主要包括以下7种:一阶特征(first-order feature)、形态特征(Shape Features)、灰度共生矩阵特征(GLCM)、灰度区域矩阵特征(GLSZM)、灰度游程矩阵(GLRLM)、灰度相依矩阵(GLDM)、邻域灰度差分矩阵特征(NGTDM)。运用L1 Based(L1正则)进行特征筛选,最终筛选出5个特征,最后利用筛选的特征构建诊断模型。本研究中选用逻辑回归(LR)、支持向量机(SVM)、决策树(decision tree)、随机森林(RF)、极限梯度增强(XGBoost)等多种算法进行建模,最后从中选取出诊断效能较高的两个预测模型。
1.4 统计分析
采用 SPSS 22.0和MedCalc 9.0 软件进行统计分析,P<0.05 为差异有统计学意义。绘制预测模型的ROC曲线,计算AUC、敏感度、特异度、准确率,以及F1值,以评估影像组学模型的可预测性。采用组内相关系数(ICC)评价2名医师测量数据的一致性。
2 结果
2.1 临床资料
本研究中共纳入经病理证实的直肠癌59例,男39例,女20例,其中T2期患者16例,T3期患者43例,临床症主要包括便血、大便性状改变以及里急后重等。
2.2 影像组学模型的构建
本研究共提取1132个影像组学特征,最终纳入5个特征用于构建影像组学模型,5个特征(表1)分别为wavelet-HLL_firstorder_Skewness、original_shape_Maximum2DDiameterColumn、log-sigma-3-0-mm-3D_glszm_LargeAreaLowGrayLevelEmphasis、wavelet-HLH_firstorder_Mean。应用5折交叉验证的方法建立组学模型,进而通过ROC曲线下面积、特异性、敏感性及准确性等进行模型评价,两名医生测量结果具有很好的一致性,ICC值(ICC值为0.85-0.90)。
表1 筛选出的5个组学特征
2.3 影像组学模型的诊断效能评价
采用多种分类器算法构建模型,其中以逻辑回归(图1A)及支持向量机(图1B)算法构建的模型诊断效能较高,两种模型ROC曲线结果显示基于影像组学特征的预测模型的AUC分别为0.836、0.828,曲线下面积差异无统计学意义,敏感性为81.4%、86.0%,特异性为81.3%、62.5%,准确度为0.814、0.797,F1值为0.864、0.861(表2)。两组预测模型的模型评分图中(图略),分值越大越倾向于T3期直肠癌。
图1 基于影像组学特征的预测模型诊断T2、T3期直肠癌的ROC曲线A 逻辑回归建模方法;B 支持向量机建模方法
表2 两种建模方法鉴别T2、T3期直肠癌的诊断效能分析
3 讨论
随着直肠癌发病率的逐年升高,MR检查对于直肠癌的定性定量分析也成为了目前研究热点之一。高分辨率T2WI成为术前分期较重要的成像序列,通常T3期术后局部复发及转移的风险较高,需要先行新辅助放化疗,较多文献对T2、T3期的鉴别诊断展开研究,以期帮助临床医师制定合理的个体化诊疗决策。影像组学(radiomics)应用大量的自动化数据特征化算法,将影像兴趣区(ROI)的影像数据转化为具有高分辨率的、可发掘的特征空间数据,具有数据维度高、定量分析等优点,可将传统影像学与分子生物学、分子病理学、信息科学相整合,从而实现对疾病的精准预测、诊断及预后评估等[2,3]。
本研究是基于ADC序列提取的影像组学特征,用于术前诊断T2、T3期直肠癌。对59例直肠癌病灶的ADC图进行特征提取,初始共包括1132个影像组学特征,利用L1 Based(L1正则)进行特征筛选,最终筛选出特征主要分为:①一阶特征:通过基本的一阶统计量来描述靶区内部的像素强度及其分布,如均值、方差等。②形态特征:描述靶区的形态和大小,如体积、直径、圆度等。③灰度区域矩阵特征:通过在图像上二维区域内记录相同元素相邻的情况出现的次数即灰度区域矩阵,来描述纹理。④灰度共生矩阵特征:通过统计图像上保持某距离的两像素分别具有某灰度的状况,即灰度的空间相关特性,来描述纹理。通过比较多种分类器算法鉴别T2、T3期直肠癌的曲线下面积AUC、敏感性及特异性等,最后得出应用LR、SVM两种分类器算法构建的预测模型对T2、T3期直肠癌鉴别诊断效能较高,机器学习结果显示LR、SVM分类器的AUC分别为0.836、0.828,敏感性为81.4%、86.0%,特异性为81.3%、62.5%。分类问题中LR及SVM是比较经典的构建模型的算法,LR是一种广义的线性回归分析模型,使用Sigmoid函数,将线性模型的结果压缩到0-1,使其拥有概率意义;SVM是一个有监督的学习模型,通常用来进行模型的识别、分类以及回归分析。与线性模型相比,几乎不会增加计算的复杂性,而且在某种程度上避免了“维数灾难”[4]。有文献报道两种模型可应用于肿瘤的不同组织分型和鉴别诊断良恶性肿瘤等[5-8],定量的影像组学分析已成为肿瘤特征的鉴别和预后评估的重要手段。
本研究只选择了ADC序列进行影像组学研究,样本量不够大,尚未纳入T2WI序列进行分析比较。总之,基于ADC序列构建的影像组学模型的建立,对鉴别T2、T3期直肠癌具有重要的临床应用价值。