基于多参数磁共振影像组学特征的脑垂体瘤质地术前评估方法
2022-01-18李德玉武春雪秦曾昌
万 涛 赵 辉 李德玉 马 军 武春雪 蒙 茗 秦曾昌
1(北京航空航天大学生物与医学工程学院,北京 100191)
2(北京航空航天大学生物医学工程高精尖创新中心,北京 100191)
3(首都医科大学附属北京天坛医院放射科,北京 100050)
4(北京航空航天大学自动化科学与电气工程学院,北京 100191)
引言
垂体瘤是颅内常见的良性肿瘤,居颅内肿瘤发病率的第3 位[1]。脑垂体瘤不仅会影响患者的生长发育和生殖,还会对其周围的结构造成损害,使患者视力减退、失明、偏瘫、头痛以及产生脑积水等。目前垂体瘤的治疗主要以开颅手术和经蝶窦入路两种手术方式。肿瘤质地是选择手术方式的重要考虑因素,并且会影响手术难度和全切率[2]。垂体瘤的质地通常较软,一般选择内窥镜经蝶窦吸除或者刮除,但大约有10%的腺瘤的质地表现较韧,不适合经蝶窦手术[3]。磁共振影像(magnetic resonance imaging,MRI)是诊断垂腺瘤的主要影像学检查方法,是术前判断肿瘤质地的理想方式[4]。
目前研究大多使用单一MRI 图像的信号强度来判断垂体瘤质地[5]。例如,T2 加权(T2-weighted,T2-w)图像高信号和低信号分别表示肿瘤质软和质韧[6]。然后,有临床研究显示,由于垂体瘤内部质地分布不均匀,纤维化程度不同,使得肿瘤呈现出不同的纹理分布,导致有部分质地韧的肿瘤表现为T2-w 高信号[7]。此外,MRI 的人工判读具有主观性强、效率低等缺点。因此,研究基于多参数磁共振图像(multi-parameter magnetic resonance imaging,MP-MRI) 的计算机辅助诊断(computer-aided diagnosis,CAD)方法,为评估垂体瘤质地提供了新思路。
结合影像组学的CAD 技术,是采用自动化算法高通量地提取大量影像信息,实现肿瘤分割、特征提取与模型建立[8-9]。凭借对海量影像数据信息进行更深层次的挖掘、预测和分析,以辅助医师做出最准确的诊断。该方法已经较广泛地应用于脑胶质瘤[10]、肺癌[11]、乳腺癌[12]、心血管病[13]等,实现对疾病的诊断、检测、分类和分级。然而,目前仍然缺乏对于垂体瘤质地术前评估的影像组学方法研究。
本研究提出一种基于MP-MRI 的影像组学方法,与以往利用单一序列MRI 图像的磁共振信号强度去判断垂体瘤质地不同,通过提取多种类的MPMRI 图像纹理特征,采用特征选择方法和合适的分类器,发现有效区分质软和质韧脑肿瘤的重要图像特征,从而为垂体瘤的术前评估提供影像学参考,有助于临床医师制定合理的手术方案,改善患者的疗效和预后。
1 材料和方法
1.1 实验数据
选取2012年1月—2015年7月间在首都医科大学附属北京天坛医院经手术切除的垂体腺瘤患者共106 例。数据均去隐私化。排除标准:1)术前接受化疗或者放疗(2 例);2)临床或影像资料不全(20 例)。最终入组的84 例,包括男性39 名,女性45 名,年龄为(42.8±11.5)岁。所有患者经MR 平扫及增强扫描,术后病理检查确诊。每位患者包括T1 加权(T1-weighted,T1-w)、T1 加权对比增强(T1-weighted contrast enhanced,T1-w-e)以及T2-w 等3种参数的MRI。将84 例患者按照质地分为了两组:质地软组(n=44)和质地韧组(n=40)。
1.2 MRI 参数
所有患者均使用超高场强3.0 T MRI 扫描仪(MAGNETOM TrioTim;Siemens,Berlin,Germany),常规行轴位T1-w(TR 2 000 ms,TE 9.8 ms)及T2-w(TR 4 500 ms,TE 84 ms)扫描,扫描层厚为5.0 mm,层间距为6.5 mm,FOV:240 mm×240 mm,矩阵为384×324。增强扫描采用T1WI 行轴位(参数同平扫),矩阵512×512。对比剂采用静脉注射钆喷酸葡胺,0.1 mol/kg。
1.3 数据标注
由一位具有10年以上经验的神经放射学医师在T2-w 图像上手动勾画出肿瘤区域(如图1所示的红色实线包围区域)。在标注过程中考虑到实质性垂体瘤侵袭性生长的情况,剔除了肿瘤内部出现出血、坏死及囊变的部分。
图1 图像标注示意(以T2-w 图像为例)Fig.1 Illustration of image annotation (in T2-w images)
1.4 实验方法
提出了一种基于MP-MRI 的影像组学方法,用来区分脑垂体瘤质软和质韧,辅助术前评估。
方法流程如图2所示,其中包括3 个主要部分:1)图像预处理,获得MP-MRI 的肿瘤区域;2)MPMRI 特征提取,识别重要的影像组学特征;3)垂体瘤质地分类,验证MP-MRI 特征的有效性。
图2 垂体瘤质地术前评估流程Fig.2 Flow chart of preoperative evaluation of pituitary macroadenomas
1.4.1 图像预处理
1)图像配准。由于常规扫描和增强扫描参数存在差异,因此需要将T1-w 和T1-w-e 与T2-w 进行配准,达到与T2-w 中标注的空间位置和解剖位置一致,便于后续特征提取。采用常用的基于互信息配准方法[13],使用Powell 算法作为优化方法。
2)图像灰度标准化。针对MRI 图像采集条件不同产生的图像灰度差异,采用了μ±3σ的灰度标准化方法[14],其中μ和σ分别表示肿瘤区域的灰度平均值和标准差。将灰度值在μ±3σ范围之外的像素点删除。该方法能够提高特征提取以及统计分析的可靠性[11]。
1.4.2 MP-MRI 特征提取
分别对T1-w、T2-w、T1-w-e 的肿瘤区域提取了6种纹理特征[12-13,15-16],包括局部二值模式(local binary patterns,LBP)、方向梯度直方图(histogram of oriented gradient,HOG)、灰度共生矩阵(gray-level co-occurrence matrix,GLCM)、灰度游程矩阵(graylevel run-length matrix,GLRLM)、Gabor 滤波器、非抽样双树复小波变换(undecimated dual-tree complex wavelet transforms,UDT-CWT),共296 维特征,具体如表1所示。
表1 所提取的MP-MRI 影像组学特征描述Tab.1 Description of radiomics features from MP-MRI
1)局部二值模式。LBP 特征通过对比邻域窗口内周围像素点的灰度值与中心像素点灰度值的大小获得8 位二进制序列,表示为
式中,W为邻域窗口,gp为邻域窗口内第p像素点的灰度值,gc为中心像素点的灰度值,S为符号函数。
本研究计算了等价局部二值模式(uniform LBP)[14],将二进制序列中1 到0 的变化定义为等价模式和非等价模式,将256 维的LBP 特征降低为59 维。
2)方向梯度直方图。HOG 是一种常用的局部纹理描述算子,用来描述垂体瘤软韧质地在梯度方向的分布变化特性。其具体计算过程包括:(1)获得原图像的梯度图像,计算像素的幅值和方向;(2)将梯度图像分为若干个图像块,每一图像块划分为大小均匀的单元;(3)统计单元内的所有像素的梯度方向和大小,获得每个单元的统计直方图,即特征向量;(4)通过归一化后得到图像块和增幅图的特征向量[13]。该特征向量作为图像的HOG 特征。
3)灰度共生矩阵。GLCM 是由图像中灰度对的联合概率密度构成的矩阵,能够捕捉细微的局部纹理变化。基于GLCM,在4 个方向上计算了4 种常用的纹理特征,包括能量、熵、对比度、同质性,分别反映肿瘤区域的灰度分布均匀程度、信息量大小、纹理强弱、纹理变化度等特性。除此以外,计算4 个纹理特征在4 个方向上的均值,共计20 维特征。
4)灰度游程矩阵。GLRLM 是灰度值行程的长度所组成的矩阵,反映了图像灰度关于方向,相邻间隔和变化幅度等综合信息[15]。基于GLRLM,在4个方向计算了11 种图像特征用来描述垂体瘤的局部纹理模式和灰度排列规则,包括短游程优势、长游程优势、灰度不均匀性、长游程不均匀性、游程百分比、低灰度级游程优势、高灰度级游程优势、短游程低灰度级优势、短游程高灰度级优势、长游程低灰度级优势、长游程高灰度级优势。
5)Gabor 滤波器。Gabor 变换通过改变方向和尺度参数获得多尺度纹理特征,其二维函数表示为
式中,u=xcosθ+ysinθ,v=-ycosθ+xsinθ,θ是方向角,1/λ是正弦函数的频率,δu和δv分别表示高斯包络在u轴(平行于θ)和v轴(垂直于θ)的标准差。
本研究选取了5 个尺度和8 个方向[18],从而构成40 个滤波通道。在每个通道计算均值和标准差,构成80 维的Gabor 特征向量。
6)非抽样双树复小波变换。与传统的小波变换相比较,UDT-CWT 变换具有平移不变性和良好的方向选择性[16]。对于大小为nw×nh的图像,每一个小波子带图像Wk,θ都包含复小波系数的实部和虚部,其中k∈{1,2,…,K},K的大小由图像大小决定[17],图像越大导致分解尺度越多。经过UDTCWT 变换之后,通过实部和虚部的小波子带系数计算2 种统计特征,包括均值和标准差,形成48 维UDT-CWT 特征。
1.4.3 垂体瘤质地分类
1)特征选择。本研究提取了296 维纹理特征,不仅计算量增加,而且导致后续的分类结果出现过拟合的现象。因此,采用最大相关最小冗余算法(maximal relevance-minimal redundancy,mRMR)[18],选取区分肿瘤质地软韧的最优特征组合,从而达到提高分类模型泛化能力以及降低过拟合的目的。mRMR 方法以互信息为选择准则,根据特征和标签之间的相关性最大和特征子集之间的冗余度最小原则对特征进行排序。
为了消除特征之间的量纲影响,将原始特征归一化至[-1,1]范围内。在训练集上采用mRMR 特征选择方法识别重要的图像特征,所选取的特征作为分类器的输入,用来识别质软和质韧的垂体瘤。
2)分类器设计。支持向量机(support vector machine,SVM)和随机森林(random forest,RF)是应用广泛的两种分类方法。因此,使用SVM 和RF 识别肿瘤的软韧质地,将实验数据划分为训练集(60%),验证集(10%),测试集(30%),使用十折交叉验证算法的有效性。针对SVM,采用径向基核函数的方法将训练样本从原始空间转换到一个线性可分的高维空间。在RF 算法中,决策树数目和树的最大深度是两个关键参数。
3)参数设置。采用自动搜索方法获得分类器的最优参数组合。图3显示了分类准确率随参数选择的变化情况。本研究中,SVM 分类器的核函数参数以及惩罚参数分别设置为0.01 和100,以及RF分类器的决策树数目和树的最大深度设置为500和30。
图3 分类准确率随分类器参数选择变化的三维图(特征数目为25)。(a)SVM;(b)RFFig.3 3D diagram of classification accuracy with the choice of parameters of classifiers (feature number is 25).(a) SVM;(b) RF
1.4.4 分类性能评价指标
分类性能使用准确率(accuracy,ACC)、敏感性(sensitivity,SN)、特异性(specificity,SP)、和受试者工作特征曲线下面积(area under the curve,AUC)等4 种指标进行量化。评价指标数值越接近1,表明分类器性能越好。
2 结果
2.1 特征选择结果
表2分别列出了基于不同MRI 图像组合的特征选择结果(排名前10 的图像特征)。此外,将从MP-MRI 组合中选取的4 种特征中排名最前的特征在不同质地的垂体瘤图像中进行可视化(如图4所示),便于更好的分析特征在不同图像中的表征差异。
表2 特征选择排名前10 的MP-MRI 图像特征Tab.2 Top 10 MP-MRI features after feature selection
图4 MP-MRI 特征可视化Fig.4 Illustration of the color encoded MP-MRI feature images
2.2 肿瘤质地分类结果
采用SVM 和RF 分类器对垂体瘤质地进行识别和分类。表3展示的结果为使用mRMR 方法选取的25 维最优特征作为输入。对比了单一MRI 图像与多参数MRI 图像组合的分类性能,发现与SVM比较,RF 取得了更好的分类准确率。因此,基于RF分类器,评估了不同数量的特征对垂体瘤质地分类的影响。通过选取不同数量的mRMR 最优特征组合对RF 分类器进行了分类实验,结果见表4。
表3 SVM 和RF 分类性能比较Tab.3 Comparison of classification performance between SVM and RF
表4 不同特征维数对应RF 分类指标Tab.4 RF classification index corresponding to different feature dimensions
使用自举法(bootstrap)方法,进行100 次重复抽样,计算性能指标的95%置信区间。所获分类结果与前期研究工作[6,19]中报道的3 位影像科医生基于单一MRI 序列影像的诊断结果进行比较,结果见表5。
表5 分类结果与影像科医生诊断结果的比较Tab.5 Comparison between classification results and radiologists′ diagnosis
3 讨论
本研究提出了一种基于多参数磁共振影像组学特征的脑垂体瘤质地术前评估方法,结合传统图像处理算法与机器学习技术,发现识别垂体瘤质地的重要MP-MRI 图像特征,从而较准确地早期判定质软与质韧肿瘤,有助于垂体瘤疗效和预后的改善。
以往研究发现,垂体瘤的质地与其胶原成分有关,胶原成分越高,其纤维化越严重,肿瘤质地越坚韧[2,20-21]。垂体瘤的纤维质地或是囊变组织内蛋白含量高的液体均可导致垂体瘤的T2-w 低信号。因此,T2-w 低信号可提示垂体瘤的纤维质地。本研究发现在不同的MRI 图像组合中,有更多的来自T2-w的图像特征被选取为最优特征,表明与T1-w 和T1-w-e 序列相比,T2-w 影像学表现能够更好地反映垂体瘤质地在图像表征的差异。
本研究发现,与质软肿瘤相比,质韧肿瘤的异质性更强,即肿瘤内部更加不均匀,说明质韧肿瘤纹理更加粗糙。主要原因是质韧垂体瘤纤维化程度较高,因此在肿瘤区域内表现出增强的结构变化。并且,对比不同MP-MRI 软韧肿瘤的特征可视化,发现T2-w 图像上的软韧垂体腺瘤特征的差异性更加显著,更具有鉴别性,这和前期的研究结果是一致的[2,22]。
相同的特征应用于不同MP-MRI 图像显示不同的特征表现,能够较好地区分不同质地的垂体瘤,但其在质软和质韧肿瘤的纹理结构表达上具有明显的差异性,说明MP-MRI 组合与单一MRI 相比可以提供更加全面的肿瘤质地信息。与影像科医生基于单一MRI 图像诊断结果对比[6,19],发现影像组学方法在分类准确率方面有明显提升,表明结合MP-MRI 图像特征有助于形成鉴别软韧垂体瘤的影像学标志物,为医生提供较准确的临床辅助参考。
此外,研究发现随着特征数量的增加分类准确率会逐渐提高,直到达到最高的分类指标,随后下降。主要原因是高维输入特征可能会使样本训练过拟合,导致分类的预测性能较差,该现象称为“维度灾难”[13]。本研究通过对MP-MRI 的多维特征进行分析,提取了一组影像组学特征,有助于形成一套有效的图像标记物,从而准确地识别脑垂体瘤的软韧质地。
本研究的局限之处主要体现在以下两个方面:一是所用的样本量偏少,来自同一医院,对图像特征的分类性能验证有一定的限制作用;二是由于采集的数据扫描层厚和层间距较大,所提取的特征没有考虑到肿瘤的空间结构信息。后续的工作考虑收集多来源数据,加入肿瘤的空间整体信息,进一步提高分类的准确率和鲁棒性。
4 结论
垂体瘤的治疗主要以手术为主,其中有开颅手术和经蝶窦入路两种手术方式,且经蝶窦入路手术已成为首要的手术方法。然而部分肿瘤质地坚韧,导致无法全部切除病灶。肿瘤残留不但无法有效解除肿瘤对周围神经的压迫,且残余肿瘤亦极易复发。因此,早期明确垂体瘤质地对手术方案制定和改善疗效具有重要临床意义。本研究提出了一种基于MP-MRI 的影像组学方法,实现垂体瘤质地的辅助术前评估。实验结果表明相较于单一MRI 图像,多参数磁共振图像的纹理特征组合能够有效和准确区分垂体瘤的软韧质地,从而为手术入路的选择提供影像学依据,有助于帮助医师制定合理的手术方案。