APP下载

DCE-MRI及DWI影像特征对乳腺癌病理组织学分级及Ki-67表达的预测研究

2019-05-14赵文芮许茂盛王世威厉力华

中国生物医学工程学报 2019年2期
关键词:特征选择分级乳腺癌

赵文芮 许茂盛 王世威 范 明* 厉力华

1(杭州电子科技大学生命信息与仪器工程学院,杭州 310018)2(浙江省中医院放射科,杭州 310006)

引言

乳腺癌是女性最常见的恶性肿瘤之一,其发病率位居女性恶性肿瘤之首,占全身各类恶性肿瘤的7%~10%,每年全球大约有130万人被诊断为乳腺癌,有约40万人死于该疾病[1]。目前,我国乳腺癌的发病率正以每年3%~4%的速度急剧增长,而且患者群体日渐年轻化[2]。因此,精准的乳腺癌的预后治疗对提高乳腺癌的整体疗效乃至降低死亡率十分关键[3]。为了实现该目标,除了采取积极有效的防治策略外,还需对乳腺癌的生物学指标进行准确判断和预测。

肿瘤的组织学分级与患者预后的关系已引起肿瘤学家的重视[4]。Elston和Ellis使用量化的分级标准,即Nottingham联合组织学分级[5]。肿瘤的分级由形态学特征决定,包括腺管形成的程度、细胞核的多形性以及核分裂计数[6]。根据评分规则将每项评分相加,得到3个等级[7]。乳腺癌的组织学等级越高,代表其恶性程度越高,预后越差[8],它可以对乳腺癌的临床诊断及预后评估提供参考,因此对乳腺癌的组织学分级进行预测判断具有极其重要的意义[9]。

Ki-67抗原是一类与细胞周期相关的增殖细胞核抗原,它的功能与有丝分裂密切有关,在细胞增殖过程中是不可缺少的[10-11]。Ki-67的评分体系一般是基于肿瘤细胞核着色的百分比。2011年,St.Gallen早期乳腺癌国际专家达成共识,提出将14%作为Ki-67阳性指数高低的界限值[12]。当Ki-67阳性细胞数小于14%时为低表达,大于14%为高表达[13]。Ki-67是一种肿瘤侵袭的重要指标[14],在乳腺癌诊断中是判断恶性肿瘤细胞增殖活性程度最可靠的指标之一[15]。已有大量研究表明,Ki-67在肿瘤的诊治与预后监测等方面均显示出重要的临床价值,其高表达反映了肿瘤的高增殖性、高恶性程度以及相对较差的预后。

由于组织学分级不同,或Ki-67表达状态不同的乳腺癌在影像学检查中有不同的表现,根据影像学检查所反映的信息来判断乳腺癌的组织学分级和Ki-67的表达成为一种可行的方式。目前,常用的乳腺癌影像学检查方法主要有乳腺钼靶X线摄影、乳腺超声、乳腺CT以及乳腺核磁共振(magnetic resonance imaging,MRI)等[16]。乳腺钼靶X线对发现微小钙化最具有优势,但该方法容易遗漏肿块;乳腺超声对结节、肿块的显示优于钼靶,但对于无肿块型病灶难以分辨;CT检查分辨率高,但具有放射损伤且价格昂贵[17-18]。与上述3种检查方式相比,MRI技术无放射损伤,具有较高的敏感性,所提供的信息丰富,可以无创性地显示血流动力学及功能改变,对乳腺癌肿瘤的定性诊断帮助较大[19]。MRI是多参数成像,其中动态增强磁共振(dynamic contrast enhancement MRI,DCE-MRI)通过静脉注射造影剂,获取一系列的连续动态增强图像,观察动态对比剂的进入、分布和流出组织状况,可以反映肿瘤内部的血流动力学情况;DCE-MRI不仅可以获得病变的形态学特征信息,还可以反映病变组织的生理性变化情况。扩散加权成像(diffusion weighted imaging,DWI)是一种能提供与常规SE序列完全不同的成像对比,可通过检测人体组织中水分子扩散运动和程度等信息,间接反映组织微观结构的变化[20-21]。这些技术逐渐成熟,并应于与临床研究,使得MRI检查更有利于癌症的诊断。DWI是唯一能够活体检测水分子扩散情况的无创影像检查技术[22],可根据弥散敏感系数(b值)计算出的表观扩散系数(apparent diffusion coefficient,ADC)对其定量分析[23]。

从MRI影像中提取各类影像特征,对乳腺癌的各类预后指标进行分类和预测,此类研究在国内发展得较为成熟。但研究者多数只用单一参数磁共振成像的影像做研究,而忽略了不同参数磁共振成像之间的信息互补关系。本研究的目的就是将不同参数的MRI影像联合起来运用,充分利用其各自的优势,获得更丰富、更可靠的特征信息,用来预测乳腺癌的组织学分级和Ki-67的表达。本研究分别从DCE-MRI和ADC影像的病灶区域提取了纹理特征、统计特征以及统计特征,进行单变量逻辑回归分析和多变量逻辑回归分析,最后进行多分类器模型融合。结果表明,相比单一参数磁共振成像的预测研究,多参数磁共振的联合应用(DCE-MRI和DWI)可以取得更优的预测结果,为乳腺癌的预后提供可靠的信息参考。

1 资料和方法

1.1 患者数据

本研究数据均采集自浙江省中医院,共计203例BI-RADS 3级及以上的乳腺癌病例。所采集的全部病例在MRI检查前均未进行过任何乳腺手术或化疗,根据研究需要筛选出病理报告及影像序列均完整的病例。所采集的病例中导管内癌、黏液癌、浸润性小叶癌等非浸润性导管癌共计26例,其病理报告均未说明乳腺癌的组织学分级情况;浸润性导管癌病理报告未说明分级情况的共计6例;病理报告完全缺失的共计3例;DCE序列数量异常的共计4例;DWI序列缺失或不完整的共计15例;ADC序列不完整的共计5例。经过以上数据筛选,最终采用144个病例作为本研究的数据集。对这144个病例进行统计分析,发现均为女性乳腺癌患者,年龄分布在28~83岁之间,平均年龄约为52岁,其中绝经前78例,绝经后66例。

1.2 影像数据

本研究所处理的医学影像(包括DCE-MRI,及DWI影像)均采自浙江省中医院放射科,所使用的设备为德国西门子3.0T超导型磁共振扫描设备。全部患者均取俯卧位,采用专用的8通道双乳房线圈进行扫描。在每次MRI检查中,先扫描和获取脂肪抑制T1加权图像和脂肪饱和T2加权前对比序列(记作S0序列)。所用顺磁性对比剂Gd-DTPA的剂量为0.2 mmol/kg,在以4 mL/s的速度静脉注射造影剂后,可以获得5个增强后(postcontrast)序列(分别记作S1~S5序列)。注射造影剂60 s后获得第一个序列,后续5个序列分别按时间间隔60 s的顺序进行采集。动态增强扫描的参数设置如下:重复时间TR为4.5 ms,回波时间TE为1.6 ms,翻转角度FA为10°,视野FOV为 340×340(mm2),层厚为1.0 mm,层间距为1.0 mm,空间分辨率为0.79 mm。采集的增强前序列以及5个增强后序列均具有相同的规格,每个序列均包含144张断层截面图,每张影像的采集矩阵均为448×448。DWI序列是在蒙片扫描前进行的,使用以下参数:b值有3个,分别为50、400、800 s/mm2,重复时间TR为8 400 ms,回波时间TE为84 ms,翻转角度FA为 90°,视野FOV为147×359(mm)2,层厚为4.0 mm,层间距为6.0 mm,像素带宽为1 263 Hz,空间分辨率为1.64 mm。每个b值对应24张DWI影像,故一个DWI序列共有72张断层截面图,每张影像的采集矩阵为220×90。在工作站通过对DWI数据后操作处理,可以形成灰阶ADC图。ADC序列共有24张影像,每张影像的采集矩阵与DWI影像相同,为220×90。

1.3 影像预处理

对于所采集的乳腺癌原始影像,需将病灶从区域分割出来进行研究;对于DCE-MRI影像,采用实验室前期基于空间模糊C均值和马尔科夫随机场的方法进行分割[24]。对DCE-MRI的每个序列都进行分割操作,各序列均会得到一个三维病灶。随后,将分割得到的一个序列的病灶区域与对应的ADC影像进行配准,最终在ADC影像上获取到与DCE-MRI病灶轮廓一致的病灶区域。

1.4 特征提取

在本研究中,对DCE-MRI的病灶区域的影像选取了蒙片,对第二增强序列以及第五增强序列进行分析,这两个增强序列在进行特征提取之前都分别在图像像素上减去了蒙片序列。共提取了97维特征,具体分为以下三大类特征:一是纹理特征,包括能量、相关性、平方和方差、同质性等19维特征;二是统计特征,包括均值、标准差、峰度、偏度等10维特征;三是形态特征,包括体积、离心率、表面积、紧致度等10维特征。ADC病灶影像同样提取了上述的三大类特征,共计39维特征。

1.5 表达统计

从浙江省中医院采集的病理报告中,可以得到每个病例的乳腺癌组织学分级情况,以及相应的Ki-67阳性细胞的百分比。经过统计,组织学分级为II级的病例共计68例,III级的病例共计76例;Ki-67 低表达的病例共计36例,Ki-67高表达病例共计108例(见表1)。对组织学分级进行卡方检验,P<0.001,说明Ki-67表达与组织学分级是有关联的;对PR表达、绝经情况以及年龄分别进行卡方检验,P值分别为0.074、0.334、0.605,说明Ki-67表达情况对PR表达、绝经情况以及年龄的分布没有显著影响。

表1 样本Ki-67表达特征统计Tab.1 Characteristics of Ki-67 expression for patients

注:a表示利用卡方检验计算P值,b表示利用方差分析计算P值,PR为孕激素受体。

Note:aData were tested using the chi-square test;bData were tested using the analysis of variance(ANOVA); PR, progesterone receptor.

1.6 统计分析

为了研究影像特征对组织学分级和Ki-67表达的预测能力,分别对提取的不同序列的影像特征进行单变量回归分析和多变量回归分析,最后利用模型融合,将DCE-MRI与DWI两个成像参数不同的影像联合起来预测肿瘤分级。

1.6.1回归分析

首先对基于DCE-MRI和DWI病灶影像提取的单个特征进行单变量逻辑回归分析。对于分级的预测任务,令II级为0、III级为1。随后依次按照特征提取的顺序取出一个特征值,使用留一法交叉验证法(LOOCV)进行训练和预测[25]。为了评价分类模型的性能,绘制了受试者工作特征曲线(receiver operating characteristic curve, ROC),并计算了ROC曲线下的面积(area under the ROC, AUC)。对于Ki-67的预测任务,令Ki-67低表达为0、Ki-67高表达为1。同样,采用上述的留一法交叉验证评价每个特征对Ki-67的预测能力。

1.6.2特征选择

单变量逻辑回归分析中,对提取的特征逐个进行了评价,但并没有分析各个特征之间的共同作用,故需要再进行多变量逻辑回归分析。对于DCE-MRI影像和DWI影像,在特征提取之后,特征的数量可能仍然很多,所以需要通过特征选择进行降维处理。

首先两两计算特征之间的皮尔逊相关系数,将相关系数大于0.9的特征删除。在此基础上,本研究分别选用无监督判别特征选择方法UDFS(unsupervised discriminative feature selection)和有监督学习的Fisher Score算法进一步对特征进行选择。UDFS算法对每个样本定义一个局部判别得分,然后通过解决L2,1归一化问题,寻找让所有样本局部判别得分之和最高的特征子集[26]。Fisher Score算法可以有效地区分数据,给最有效区分数据点(不同类的数据点尽可能分开,而同类的数据点尽可能聚在一起)的特征赋予最高的分值[27]。

通过删除相关性高的特征之后,后续的特征选择算法均在留一法的框架内进行。具体地说,通过留一法将特征集分为K个子样本集(样本数为K),每次不重复地取出一个作为测试,用其余的K-1个子样本集进行特征选择,得到特征排序,越重要的特征,排序越靠前;按照特征的重要性依次加特征,每加一个特征后都将得到的特征集进行十折交叉验证,计算得到AUC值,直到全部的特征加完停止;找出最大的AUC值对应的特征集,即为选择的最优特征集;将测试集样本的特征按照最优特征集的特征进行建模,用来预测测试样本;如此循环K次,即所有K个子样本集均轮到作为一次验证样本,每次均进行上述的特征选择。

1.6.3模型融合

在留一法特征选择的每次循环中,根据特征选择之后的最优特征子集进行逻辑回归,建立预测模型,并将训练好的模型对特征选择后产生的新测试样本进行预测,直至留一法循环结束,最终可以得到一个评价整体模型的AUC值。

对于研究的每个序列均进行了前述的多变量逻辑回归分析,每个序列都训练出各自的分类模型,而这些分类模型是各自独立互不影响的。为了分析它们之间的共同作用关系,采用模型融合的方式进行研究。选用多分类器融合方法,具体过程如下:在每个序列利用留一交叉验证法进行多变量逻辑回归分析时,每次迭代均会产生一个预测的条件概率,共有4个序列,故每次留一法迭代会产生4个条件概率,将这4个概率求均值,得到的新条件概率作为融合后模型的预测值,留一法循环结束后,可得到一列4个模型融合后产生的条件概率,根据此数据可计算出AUC等评价指标。此外,根据上述方法,将不同序列的模型进行两两融合或三三融合,可得到最佳的模型融合效果。

2 结果

2.1 单变量逻辑回归结果

通过单变量逻辑回归分析,分别比较了DCE-MRI和DWI的单个影像特征的性能。其中,纹理特征中的对比度特征为最佳性能特性,即对应S0、S2、S5、ADC的图像序列,预测分级任务分别生成了0.690、0.712、0.720和0.671的AUC值,预测Ki-67表达状态分别生成了的0.724、0.719、0.692和0.690的AUC值,图1是该特征的盒形图。

图1 最优单特征盒形图。(a) 分级任务;(b) Ki-67表达任务(统计学显著性表示为*P<0.05,**P<0.001)Fig.1 Boxplots of texture feature of dissimilarity. (a) Histopathologic grading; (b) Ki-67 expression(Statistical significance is represented as *P<0.05,**P<0.001)

2.2 单参数多变量逻辑回归结果

对DCE-MRI和DWI的各个序列都进行了多变量逻辑回归分析,同时比较了UDFS和Fisher Score两种特征选择方法的效果。预测分级任务的结果见表2,其中第二增强序列在采用UDFS特征选择算法时取得了0.780的最佳AUC,特异度为0.647,灵敏度为0.934。预测Ki-67表达任务的结果见表3,其中DWI序列在采用Fisher Score特征选择算法时取得了0.756的最佳AUC,特异度为0.806,灵敏度为0.695。

2.3 不同序列的模型融合结果

采用多分类器融合的方法,通过将不同序列影像特征数据训练的分类器进行不同组合的融合,比较并分析融合后的结果。预测分级任务的模型融合结果及预测Ki-67表达任务的模型融合结果分别见表4、5,不同序列的模型融合结果有所差异。

从表4可以看到,对于预测分级的任务,相比单参数多变量逻辑回归中0.780的最佳AUC,S2、S5和DWI 的融合达到了0.808的最佳AUC,特异度为0.706,灵敏度为0.895。采用UDFS特征选择算法时,只有S0+S5、S0+S2+DWI这两种融合方式的结果相对于0.780没有提高,其他的模型融合结果均比0.780有所提升;采用Fisher Score特征选择算法时,只有S2+DWI、S5+DWI、S2+S5+DWI这3种融合方式的结果相对于0.780有所提高。将表4和表2的灵敏度与特异度进行比较可以发现,虽然整体结果差异不大,但采用UDFS特征选择算法时,相比S5序列0.706的最高特异度,S0+S2+S5模型融合后的特异度达到了0.735;采用Fisher Score特征选择算法时,相比DWI序列0.829的最高灵敏度,S0+S2+S5模型融合后的灵敏度达到了0.882。

从表5可以看到,对于预测Ki-67表达的任务,相比单参数多变量逻辑回归中0.756的最佳AUC,S2和DWI 的融合达到了0.783的最佳AUC,特异度为0.778,灵敏度为0.722。采用UDFS特征选择算法时,只有S2+S5、S2+DWI这两种融合方式的结果相对于0.756没有提高,其他的模型融合结果均比0.756有提升;采用Fisher Score特征选择算法时,没有DWI序列融合的结果均低于0.756,其他加入DWI序列的融合结果除S5+DWI外相对于0.756均有提高。对表5和表3的灵敏度与特异度进行比较可以发现,采用UDFS特征选择算法时,相比0.722的最高特异度,S0+S2+DWI和S0+S5+DWI能将特异度提高到0.806;且S2+S5的模型融合,可将灵敏度从0.722提高到0.796。

表2 单参数多变量逻辑回归预测的分级结果Tab.2 Histopathologic classification prediction of multivariable Analysis for single parametric image

表3 单参数多变量逻辑回归预测的Ki-67结果Tab.3 Ki-67 expression prediction of multivariable Analysis for single parametric image

表4 预测分级任务模型的融合结果Tab.4 Classifier performance of histopathologic classification for DCE-MRI and DWI series

表5 预测Ki-67任务模型的融合结果Tab.5 Classifier performance of Ki-67 expression for DCE-MRI and DWI series

3 讨论

在本研究中,对采集的影像原始数据进行病灶分割,并从中提取各类特征数据。首先对每个特征通过逻辑回归建模进行评价,随后将特征集合经过皮尔逊相关系数进行筛选,再分别利用UDFS算法和Fisher Source算法进行特征选择,使用留一法交叉验证的方法进行逻辑回归建模,然后将所得的不同分类器进行多分类器模型融合,根据计算所得的AUC对分类器的性能进行评估。结果发现,不同影像序列特征训练的分类器经过模型融合之后,其性能大多数有所提高。下面对结果里的每个图表分别进行讨论。

在单变量逻辑回归分析中,利用所提取的影像特征,分析了单个特征建立模型的预测性能,选取了最优单特征,并通过t检验评估了最优单特征在预测标签之间的统计学差异。在图1的盒形图中,可以看出经过t检验计算得到的P值均小于0.05,结果表明,利用计算机分割病灶并提取得到的特征有显著的预测意义,而这些特征区别于放射科医生观测到的定性特征,提取的基于灰度共生矩阵的纹理特征、统计特征以及形态特征能定量地描述病灶的信息,具有更好的分类性能。故使用计算机将乳腺癌肿瘤分割出来并在上面进行计算,可以更充分利用医学影像所提供的信息,同时降低医生阅片的工作强度。

随后对每个序列都进行了单参数的多变量逻辑回归分析,其中运用了两种不同的特征选择方法。从表2中的结果可以看出,对于预测乳腺癌分级,UDFS算法得到的结果整体要优于Fisher Score算法的结果。而对于Ki-67表达状态的预测,两种算法在不同序列上的表现并无规律可循,可能是Ki-67样本分布不均衡导致的,这一点也是本研究的一个局限性。对于分级预测任务,S2序列达到了AUC为0.78的最佳分类效果;对于Ki-67预测任务,DWI序列达到了AUC为0.756的最佳分类效果。这两个最佳结果均比单变量逻辑回归的最优单特征的预测结果有所提高,表明多变量逻辑回归分析更能充分利用不同特征之间的信息,考虑不同特征之间的联系,利用多特征建立的模型更具有泛化能力。

为了研究不同参数磁共振图像之间的相互影响,将不同序列进行多分类器模型融合。从表4、5的模型融合结果来看,不同序列模型融合的效果也有所差异。对于分级任务,S0、S5和DWI 3个序列的融合达到了0.808的最佳AUC值,所用特征选择方法为UDFS算法;对于Ki-67任务,S2和DWI两个序列的融合达到了0.783的最佳AUC值,所用特征选择方法为Fisher Score算法。除了这两个最优结果外,其他不同组合的序列融合结果相比单序列多变量逻辑回归结果均有所提高。此外,还对预测模型进行了特异度与灵敏度的分析计算,虽然整体来看多分类器模型融合的方法对于模型的特异度与灵敏度的提升并不具有明显优势,但有些序列的融合结果明显提高了特异度和灵敏度。结果表明,与单一参数磁共振成像的预测研究相比较,多参数磁共振的联合应用(DCE-MRI和DWI)可以充分利用不同影像的优势,从而取得更优的预测结果,这对乳腺癌的前期诊断以及预后治疗提供更精准的指导,具有重要意义。

乳腺癌的病理组织学分级的研究是一个较新的探索领域,同类研究基本上很少对其进行预测判断。Shin等的研究表明,DCE-MRI灌注参数中的Ktrans参数与Ki-67状态显著相关[28],但未建立预测模型进行研究。在前期进行基于乳腺癌异质性区域特征的Ki-67表达预测研究[10]的基础上,本课题组首次尝试将多参数磁共振影像(DCE-MRI和DWI)应用于乳腺癌病理组织学分级及Ki-67表达预测的研究中,预测性能基本达到了预期效果,但由于数据的局限性,仍需进一步地优化提高。

本研究存在局限性:一是前述的Ki-67高表达和低表达样本不均衡,这可能对实验结果造成一定偏差,导致结果不稳定;二是本研究的多参数磁共振图像只有DCE-MRI和DWI两种参数,图像种类少,使研究范围较为单一。

4 结论

本研究主要利用多参数磁共振图像(DCE-MRI和DWI),对乳腺癌的组织学分级和Ki-67表达进行预测。采用了UDFS和Fisher Score算法进行特征选择,对于不同的序列影像,两种算法各有优势。为了防止过拟合,本研究中的预测模型都建立在留一法的框架上,每次留一迭代中的特征选择在选取最优子集时采用了十折交叉验证方法。实验结果显示,多参数磁共振的联合应用(DCE-MRI和DWI)可以提高分类器的性能。研究表明,多参数磁共振成像的联合应用对乳腺癌的前期诊断和预后治疗具有一定的研究参考价值,后续将增加更多不同的参数磁共振图像进行研究,从而进一步验证以及丰富实验研究结果。

猜你喜欢

特征选择分级乳腺癌
绝经了,是否就离乳腺癌越来越远呢?
正交基低冗余无监督特征选择法
网络入侵检测场景下的特征选择方法对比研究
乳腺癌是吃出来的吗
胸大更容易得乳腺癌吗
别逗了,乳腺癌可不分男女老少!
基于最大信息系数和近似马尔科夫毯的特征选择方法
Kmeans 应用与特征选择
分级诊疗的“分”与“整”
分级诊疗的强、引、合