APP下载

多参数MRI 影像基因组学对乳腺癌早期复发的预测研究

2024-04-21周素菊廖锦元

影像研究与医学应用 2024年5期
关键词:基因组学组学乳腺癌

周素菊,廖锦元

(1 桂林市中医医院放射科 广西 桂林 541002)

(2 广西医科大学第一附属医院医学影像科 广西 南宁 530021)

据2019 年中国癌症数据结果显示乳腺癌发病率占女性全部恶性肿瘤发病构成的首位,是严重威胁女性健康的第一大恶性肿瘤[1]。2020 年近350 万美国妇女患有乳腺癌[2]。在中国,女性发病概率约为42.55/10 万人[3]。乳腺癌是一种异质性非常高的恶性肿瘤,将影像组学与临床特征、基因和影像大数据融合有助于预测早期复发的高危因素。近几年来,随着医疗技术的发展,乳腺癌患者的生存率虽然提高了不少,但是仍有约40%的患者在接受手术治疗后出现复发[4]。因此有效预测乳腺癌的早期复发,对患者术后的生存率及生活质量非常重要,并可为临床实践提供重要参考价值。本研究从乳腺MRI图像中提取出有用的纹理特征,选择有价值的纹理特征建模,研究其对乳腺癌早期复发的预测价值。报道如下。

1 材料与方法

1.1 一般资料

回顾性分析2017 年1 月—2019 年4 月在广西医科大学第一附属医院及桂林市中医医院收治的行乳腺MRI检查的患者,各50 例,且术前病理均证实为乳腺癌。全部为女性,年龄在32~85岁之间,平均年龄(49±9.6)岁。包括浸润性导管癌55 例,浸润性导管癌伴导管原位癌32 例,浸润性导管癌伴小叶癌2 例,浸润性导管癌伴乳头佩吉特病1 例,黏液腺癌3 例,浸润性小叶癌3 例,导管原位癌3 例,髓样癌1 例。每位患者均进行乳腺MRI(包括DWI 和DCE-MRI 两个序列)检查,乳腺病灶经手术病理证实为乳腺癌,无远处转移;并对21 基因进行检测及免疫组化检测。所有患者行MR 检查前均未接受过组织活检及新辅助化疗患者。乳腺癌在2 年内复发的概率最大,按复发时间分为早期复发(术后≤2 年)和晚期复发(术后>2 年)。

1.2 方法

1.2.1 MRI 检查 广西医科大学第一附属医院患者采用德国西门子3.0T 超导MRI 扫描仪及16 通道乳腺专用相控阵表面线圈扫描。所有检查患者均取俯卧位,双侧乳房自然悬垂于线圈内,常规横轴位、冠状位及矢状位定位扫描后,先采集轴位T1WI 脂肪抑制序列,然后采集轴位T2WI 脂肪抑制序列,最后再采集多期动态扫描序列DCE-MRI,先采集多翻转角图像,包括3°、15°,以获得T1原始图。采集动态序列,先采集1 期平扫图像,然后注入0.1 mmol/kg 钆双胺注射液,速率3 mL/s,随后以同样速率注入20 mL 0.9%氯化钠溶液。动态增强共5 期图像,每期约28 s,扫描时间为140 s。桂林市中医医院患者采用GE 公司生产的Hd-xt1.5T 超导磁共振及8通道乳腺专用线圈扫描。常规横轴位、冠状位及矢状位定位扫描后,先采集Ax T1FSE,Ax STIR,AX DWI,然后SagVibrant+C。

1.2.2 基因检测方法 采用高通量实时逆转录聚合酶链反应对21 个基因进行分析,采用复发风险评分法依次评估旋转过程中乳腺癌组织中21 个基因的表达水平;根据评分将肿瘤患者的复发风险分为中高危组和低危组。

1.3 影像组学

影像组学的概念最早由美国学者Gillies 等[5]于2010 年提出,荷兰学者Lambin 等[6]对其进行了进一步改进,即“从高通量放射图像中提取图像特征并建立高维数据”,然后揭示某些成像特征与疾病之间的关系。Piak 等[7]于2004 年首次提出,21 基因(Oncotype DX 21-gene)检测的复发风险评分是一种检测21 个癌症相关基因的基因组检测。它已经被证明有能力预测ER+和腋窝淋巴结阴性乳腺癌患者的长期复发10 年。

1.4 图像处理及分析

1.4.1 一般资料分析 由两位5 ~8 年以上具有乳腺影像学诊断经验的医师在不知晓病理结果的情况下阅片,意见不一致时经讨论决定。两名医师在轴位或矢状位评估肿瘤大小,达成一致后选择同一成像方位进行测量,计算两位医师在病灶强化最显著时期DCE 图像上测量的肿瘤长径的平均值、边缘、形状、强化程度、强化曲线及有无腋窝淋巴结、复发等情况。

1.4.2 图像分割 将扫描第2 期DCE 图像及DWI 图像以DCOM 格式匿名存储并导入由影像组学平台,导入汇医慧影平台;在对患者的临床信息不知情的情况下,由一名放射科医师在DWI 及所选取DCE 图像上手动勾画病灶,然后由高年资放射科医师检查所有病灶轮廓勾画情况。如果面积差异≥5%,由副高及以上的放射科医师决定肿瘤边界,勾画时尽可能靠近肿瘤边缘但不超过肿瘤边缘。

1.4.3 组学特征提取 应用汇医慧影软件进行特征提取。共提取了2 818 个特征,DWI 及DCE 图像各1 049 个特征。

1.4.4 特征选择及模型建立 采用最小绝对收缩算子(LASSO)特征选择法降维及KNN 算法建模。共建立两个模型,分别是只采用MRI 图像特征的影像组学模型,同时采用影像组学特征和临床特征的组合模型。影像组学特征的影像组学模型,验证数据集和训练数据集采用3:7 的随机方法分离,验证集30 例,训练集70 例,随机种子数为222 个,提取最优化10 个特征;影像组学特征和临床特征的组合模型,验证数据集和训练数据集采用2:8 的随机分离方法,验证集20 例,训练集80 例,随机种子为917 个,提取最优化106 个特征。影像组学模型及组合模型先采用LASSO 法降维,然后用KNN 算法建模,比较两种模型的AUC、95%CI、灵敏度及特异度,用训练的最优模型去预测外部验证集。

1.5 统计学方法

采用汇医慧影软件处理数据。影像组学特征的提取与降维相关过程与统计分析详见本章“1.4.3、1.4.4 影像组学特征提取与降维、模型建立”部分。

2 结果

2.1 一般临床及影像学特征资料

本研究共纳入了100 例女性乳腺癌患者,年龄在32 ~85 岁之间,平均年龄(49±9.6)岁;其中绝经39 例,未绝经61 例;包括黏液腺癌3 例,浸润性小叶癌3 例,浸润性导管癌55 例,浸润性导管癌伴乳头佩吉特病1 例,浸润性导管癌伴导管原位癌32 例,浸润性导管癌伴小叶癌2 例,导管原位癌3 例,髓样癌1 例,其中复发5 例。

2.1.1 肿块特征 肿块形态规则72例,不规则38例;肿块边缘有毛刺及或分叶88 例,肿块边缘清晰12 例;肿块强化曲线Ⅰ型3 例,Ⅱ型43 例,Ⅲ型54 例,其中有淋巴结转移15 例。

2.1.2 免疫组化标志物表达状态 PR 阳性74 例,阴性26 例,ER 阳性78 例,阴性22 例;HER2 阳性58 例,阴性42 例;Ki-67 高表达59 例,低表达41 例。

2.2 模型结果及评价验证

2.2.1 影像基因组学模型 本研究从每位患者的DWI 和DCE 图像中共提取2 818 个特征,在训练集和验证集中进行数据降维和选择,最终筛选出最有价值的10 个特征,用KNN 算法建模,训练集和测试集患者的曲线下面积(area under the curve,AUC)、95%CI、特异度及灵敏度,见表1、表2。AUC 见图1、图2。

表1 影像基因组学模型训练集的AUC、95%CI、灵敏度和特异度

表2 影像基因组学模型测试集的AUC、95%CI、灵敏度和特异度

图1 影像基因组学模型训练集曲线下面积的AUC

图2 影像基因组学模型测试集的AUC

2.2.2 影像基因组学+临床特征组合模型 本研究从每位患者的DWI 和DCE 图像中共提取2 818 个特征,在训练集和验证集中进行数据降维和选择,最终筛选出最有价值的6 个特征,用KNN 算法建模,训练集和测试集患者的AUC、95%CI、特异度及灵敏度见表3、表4。AUC 见图3、图4。

表3 影像基因组学+临床特征组合模型训练集的AUC、95%CI、灵敏度和特异度

表4 影像基因组学+临床特征组合模型测试集的AUC、95%CI、灵敏度和特异度

图3 影像基因组学+临床特征组合模型训练集的AUC

图4 影像基因组学+临床特征组合模型测试集的AUC

3 讨论

3.1 影像基因组学模型

影像组学通过从MRI 图像中高通量地提取并分析大量高维、定量影像特征[8]。DCE-MRI 可以无创地获取反映病变组织血供的功能信息,因此可以从DCE-MRI 图像中提取不同期相肿瘤的形态学特征以反映肿瘤的异质性及纹理特征,这些特征可以预测肿瘤的复发和转移[9]。DCE-MRI 扫描后获得的肿瘤的血流动力学及形态学特征具有预测术后复发时间的价值[10]。

DWI 可以反映组织微观结构特征和细胞结构是一种无创的检测组织细胞和结构中水分子扩散信息的方法[11];细胞密度越高,水分子在细胞中的扩散受限越明显[12];而DWI 计算出来的表观弥散系数可以反映组织的水分子扩散能力和肿瘤的生物学、细胞结构等微观结构特征,且与肿瘤的侵袭性和预后密切联系[13-16]。而本研究利用了汇医慧影软件从DWI 和DCE 图像中提取了10 个影像特征与21 个基因建模,其AUC、灵敏度及特异度为在中高危险组为:训练集0.78、67%、73%,测试集:0.78、73%、67%;低危组:训练集0.59、69%、53%,测试集:0.59、53%、69%,影像组基因学模型可有效预测乳癌早期复发,为临床提供重要的参考价值;T2WI 瘤周水肿与乳腺癌早期复发密切相关,这与造成该征象的病理学基础是密切相关[17]。肿瘤组织的生长、发育和复发需要丰富的微血管网络供氧,肿瘤形状越不规则,异质性越强,越容易早期复发。Wu 等[18]研究了术前动态增强的预测价值乳腺癌患者的MRI 影像学特征术后复发时间。影像组学可以提取肿瘤的血管特征,预测乳腺癌术后复发时间,提示临床医生及时预防和治疗,从而提高患者的生存率。而目前大多数的研究是利用影像组学对乳腺肿瘤良恶性的鉴别诊断、乳腺癌的分子分型、新辅助化疗后疗效预测及腋窝淋巴结转移情况等[19-22];研究乳腺癌早期复发,准确地识别局部治疗范围,避免造成过度治疗或治疗不足,因此,本研究对乳腺癌早期复发的预测具有一定应用价值。

3.2 临床特征+影像基因组学组合模型

免疫组化标志物的表达与肿瘤细胞的分化、侵袭性和转移能力相关。本研究利用Ki-67+影像组学模型提取了6 个影像特征(包括3 个DWI 和3 个DCE-MRI),结合了临床特征、MRI 图像提取的特征和21 个基因建模,其AUC、灵敏度及特异度为中高危险组:训练集:0.91、86.00%、80.00%,测试集:0.91、80.00%、86.00%;低危组:训练集:0.68、62.00%、75.00%, 测试集:0.68、75.00%、62.00%。Ki-67 是检测肿瘤增殖活性的标记物,Ki-67 越高表明肿瘤的增殖越活跃,对乳腺癌治疗方案选择、预后以及复发风险的预测具有重要价值[23-24]。而Ki-67 值高低对乳腺癌早期复发转移及规范治疗起到非常重要的作用;马琴等[25]研究得出了Ki-67 是HR+/HER2-乳腺癌早期复发转移的独立影响因素,Ki-67 ≥20%的患者复发转移风险高,生存率低,并且随着Ki-67 表达水平的增高,患者复发转移风险增加。

本研究利用了临床特征、MRI 图像提取的特征和21 个基因建模,研究乳腺癌早期复发的价值,对乳腺癌术后生存具有指导意义。

3.3 两种模型诊断效能的比较

临床+影像基因组学特征联合模型无论在中高危组还是低危组,训练集还是测试集的ACU、95%CI、灵敏度、特异度都高于影像组学模型,影像组学+临床特征组合模型诊断效能优于影像基因组学模型,为临床预后决策提供了帮助,减少不必要的治疗。

本研究不足之处:(1)本研究样本量小,分组后样本量更少,特别是RS 评分高危组少之甚少;(2)本研究采用手动分割病灶,受人为因素影响比较大;(3)本研究未对临床信息进行详细研究;(4)本研究样本用的是两个中心的数据,不同的机器扫描,软组织分辨率不同,多种特征参数,尤其纹理参数可能会受到较大影响。

综上所述,基于磁共振DWI 及DCE 图像中提取的影像特征、21 基因及临床特征建立的临床+影像基因组学组合模型对乳腺癌早期复发具较好的预测价值。

猜你喜欢

基因组学组学乳腺癌
绝经了,是否就离乳腺癌越来越远呢?
基于基因组学数据分析构建肾上腺皮质癌预后模型
系统基因组学解码反刍动物的演化
乳腺癌是吃出来的吗
口腔代谢组学研究
胸大更容易得乳腺癌吗
别逗了,乳腺癌可不分男女老少!
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
代谢组学在多囊卵巢综合征中的应用
营养基因组学——我们可以吃得更健康