影像基因组学研究进展
2022-11-21贾宇珊吴慧
贾宇珊,吴慧
作者单位:内蒙古医科大学附属医院,呼和浩特010050
随着医学影像技术的发展,CT、MRI 以及正电子发射计算机断层显像(positron emission tomography,PET)在肿瘤的诊断、分期、治疗计划、预后预测和疗效评估等方面发挥了重要的作用,尽管这些常规方法提供了有关肿瘤表型的重要信息,但无法公开大量的遗传和分子信息[1]。随着高通量阵列和新一代测序技术的发展,基因组分析得到广泛应用。影像基因组学是结合了医学成像技术和基因组学技术的跨学科技术[2],通过研究病变影像特征与基因组、分子特征之间的关系,一方面可以推测疾病的生物学机制,促进对整体表型的深入理解,另一方面可以来确定用于预测基因组的宏观层面影像生物标记物,从而实现对复杂疾病的非侵入式诊断、预后评价和疗效评估,对人们理解基因对于疾病的影响提供了更为全面的评价方式。其具体流程如下[3]:首先获得患者的大量影像数据和基因表达谱信息,通过人工或自动/半自动的方法,将肿瘤区域勾画出来,然后提取其影像特征,包括形态学特征、一阶特征、二阶特征、高阶特征,对所提取的影像特征量化和降维。通过权重基因和共表达网络分析建立高度相关性的基因模块,将提取的影像特征去冗余后与某些基因或基因模块进行关联。经分析将选出来的基因或基因模块进行生物学功能注释,建立预测和分类模型来解释影像特征。最后,交叉验证以减少偏差,得出的结论用临床试验进行验证。目前影像基因组学主要应用于肿瘤学,在不同肿瘤的精准诊断、分层、指导治疗和预后预测等方面充满巨大的潜力。
1 影像基因组学的临床应用
1.1 胶质母细胞瘤
胶质母细胞瘤(glioblastoma,GBM)是一种高度浸润性和弥漫性原发性肿瘤,是最具致死性的中枢神经系统恶性肿瘤,表现出很强的表型差异,最近的研究试图通过影像基因组学分析,来揭示MRI 衍生的定量功能影像特征与分子基因之间的关联,并利用GBM 的高分子异质性来制订个性化的治疗策略。2016版世界卫生组织中枢神经系统肿瘤分类中首次在组织学的基础上使用分子学的特征来进行肿瘤分类, 其中根据异柠檬酸脱氢酶(isocitrate dehydrogenase,IDH)的状态可将GBM 分为IDH-野生型和IDH-突变型[4]。目前已有多项研究[5-9]发现了与GBM相关遗传分子[IDH突变、1p/19q编码缺失、O6-甲基鸟嘌呤-DNA 甲基转移酶(O6-methylguanine DNA methyltranferase,MGMT)甲基化、表皮生长因子变体Ⅲ(epidermal growth factor receptor variant Ⅲ,EGFRvⅢ)突变]的定性影像特征。Qi 等[10]认为IDH-突变型肿瘤在MRI上主要位于一侧脑叶,如额叶、颞叶或小脑,很少位于间脑或脑干中,且更倾向于单侧生长,肿瘤边缘较锐利,信号强度均匀,增强几乎无强化。Zhang 等[11]通过120 例Ⅲ级和Ⅳ级胶质瘤患者的术前MR 成像和临床特征生成的机器学习算法预测IDH的状态,在训练组和验证组中准确率分别为86%和89%,这些研究为胶质瘤IDH 状态提供更详细的影像学信息,表明影像基因组学可作为一种非侵入性工具,提供重要的预后信息,有助于指导个性化治疗。MGMT 是一种位于10q 染色体上的DNA修复酶,该启动子区域的甲基化导致DNA修复酶水平降低,进而导致肿瘤细胞的DNA 修复率降低,这可能与良好的预后生存相关。Kanas 等[12]通过MRI 3D 容积模型计算得出肿瘤的水肿/坏死容积比、肿瘤/坏死容积比、水肿容积、肿瘤分布及增强特点,来预测GBM的MGMT甲基化状态,进一步说明术前MRI影像特征与MTGT甲基化状态是存在关联的。有学者通过对MRI 影像组学特征来预测1p/19q 的状态,Han 等[13]及Zhou等[14]强调基于MRI影像组学特征可以有效预测1p/19q的状态,从而为促进胶质瘤非侵入性分子亚型预测提供了潜力。Gevaert 等[15]将从GBM 的磁共振图像中得出的定量特征和多种基因分子数据相结合,得到了可以预测胶质瘤生存率的影像基因组学图谱。他们从TCGA (the Cancer Genome Atlas)数据库中选取55 例胶质瘤患者,在肿瘤坏死区、强化区、肿瘤水肿区分别勾画兴趣区,并计算出各兴趣区的79 个影像组学定量特征,通过整合基因表达、DNA 甲基化及拷贝数,筛选得到35 个模块来预测生存期,将基因模块与影像组学定量特征进行相关性分析,制作可以预测预后的影像基因数据集。与以往其他研究相比,该方法首次利用定量影像组学特征实现了潜在驱动子突变的显示。
目前许多与胶质瘤诊断、预后、生存相关的基因或者分子遗传特征被相继发现并研究,将其与影像学相结合,对胶质瘤的遗传生物学进行更深入的研究,将为临床指导个性化治疗提供新方式。
1.2 肺癌
近年来,晚期非小细胞肺癌(non-small cell lung cancer,NSCLC)的治疗取得突破性进展,分子靶向药物的应用显著延长了患者的生存期。NSCLC 的驱动基因包括EGFR、KRAS、RAF、PIK3CA 及ALK 基因等,其中最为成熟的靶点为EGFR 突变和ALK 重排。利用无创的影像组学寻求其驱动基因的影像生物标记物并进行针对性的靶向治疗,在减少传统基因检查对患者伤害的同时,也可以进行早期受益患者的检出。因此,影像基因组学在NSCLC 的个性化治疗方面也具有很大的潜力。近年来,多项研究[16-19]通过传统的影像特征(包括小病灶、支气管充气征、胸膜凹陷征、空泡征、均匀强化、磨玻璃密度影、无肺气肿或肺纤维化等)或CT 的定量特征(CT 值均数、标准差和偏度、纹理特征)对NSCLC 的EGFR 突变进行预测,从而实现针对EGFR 靶点的酪氨酸激酶抑制剂治疗。Zhang 等[18]的研究纳入180 例NSCLC 患者,从训练组患者的CT 图像中提取485 个定量纹理特征,采用MRM、LASSO降维和十倍交叉验证,筛选出10个独立预测因子,然后应用多因素逻辑回归分析建立EGFR 突变预测模型并在验证组进行验证,结果表明基于影像组学特征建立的预测模型对于EGFR 突变状态具有出色的预测性能,AUC 在训练组中为0.862,在验证组中为0.873。Nair 等[20]则利用CT和18F-FDG PET-CT图像的纹理特征建立影像基因组学模型来识别有无EGFR 突变,研究发现基于FDG-PET 的模型能够区分野生型和突变型EGFR,AUC为0.87,由CT纹理分析得到的模型AUC 为0.83。进一步说明使用FGD-PET 和CT 图像进行非NSCLC 纹理分析,可以识别出EGFR 突变的肿瘤。上述研究表明传统影像特征及影像组学特征对EGFR 有较好的预测价值,虽然无法取代穿刺活检,但其具有无创性、可重复性,为临床治疗决策提供帮助。
由于ALK 重排与EGFR 突变的NSCLC 的临床特征相似,探寻二者之间影像组学特征的差异对于肿瘤治疗也具有重要的指导意义,Mendoza 等[21]应用Meta 分析研究NSCLC 的CT 特征及临床病理特征与ALK基因重排之间的相关性,结果表明ALK重排阳性的NSCLC 患者以年轻女性、不吸烟者多见,多表现为实性肿块,且较少出现空洞,与EGFR 突变型NSCLC 相比,在晚期阶段更容易发生淋巴结、纵隔及胸膜转移,但是较少发生肺内转移。Park 等[22]对256 名晚期肺腺癌的患者进行研究也发现,淋巴结肿大、肿瘤外浸润及淋巴管炎在ALK 重排阳性患者中更常见。虽然目前对AKL 重排的研究较少,但这些研究都表明影像组学特征可作为预测ALK 重排阳性的一种新工具,具有很好的研究前景。
1.3 乳腺癌
乳腺癌是女性常见的恶性肿瘤,其在基因水平被分为Luminal A、Luminal B、HER2 过表达型、基底样型及正常乳腺样型五种类型,目前主要使用免疫组化技术来进行乳腺癌分子分型,但其结果不能全面、客观地分析肿瘤的异质性,而利用影像组学则可以通过无创的方法对肿瘤的特征及瘤周情况进行连续、快速地评估,并通过与基因组的联合分析实现对乳腺癌基因表达情况的实时监测[23]。Mazurowski等[24]从48例患者提取出23个动态增强影像特征,结果表明Luminal B型乳腺癌与动态增强特征存在相关性,这量化了病变增强和背景实质增强之间的关系,病灶强化率与背景实质强化率(background parenchymal enhancement,BPE) 比值较高者更可能为Luminal B 亚型。Dilorenzo 等[25]探讨MRI 乳腺实质背景强化对不同乳腺癌亚型的鉴别诊断价值,结果表明轻度BPE 提示Luminal B (HER2 阴性)亚型,重度BPE则提示三阴性乳腺癌。分子亚型的分类需要对组织标本进行基因组分析,昂贵、费时且滞后,有研究表明[26-28]表观扩散系数(apparent diffusion coefficient,ADC)值因分子亚型而异,HER2 阳性者的肿瘤血流量较高,在富含HER2 肿瘤中ADC 值最高。Wang 等[29]利用影像基因组学对三阴性乳腺癌进行早期检出,通过乳腺DCE-MRI提取88 个影像学特征,结果表明,肿块大小、实质信号强化斜率及实质标准差对于三阴性乳腺癌检出具有鉴别诊断的意义,并且增加实质背景纹理强化的异质性也可提高其鉴别诊断效能。不同类型的乳腺癌在治疗和预后方面的表现不尽相同,通过影像基因组学可能在治疗前区分乳腺癌分子亚型。此外,通过影像表型可以评估乳腺癌的复发风险。常用方法有癌型检测(Oncotype Dx)和预测分析微阵列50 (PAM50)。Oncotype Dx 是美国国家综合癌症网络推荐的唯一适用于乳腺癌的基因检测工具,主要用于检测雌激素受体(estrogen receptor,ER)阳性的早期乳腺癌,已有研究证实该方法能更准确地预测ER 类型及腋窝淋巴结转移情况。Thakur 等[30]就测量ER 阳性和腋窝淋巴结阴性浸润性乳腺癌的ADC 值,结果发现Oncotype Dx复发评分低风险癌灶的ADC值显著高于中/高风险癌灶。Li等[31]通过分析了5种乳腺癌亚型,认为MRI影像组学特征与多基因检测分类的预测相关,尤其肿瘤大小、增强特征与多组基因检测复发分数相关,意味着较大、较不均质强化的肿瘤复发率更高。这些影像基因组学研究表明,影像组学特征有可能成为乳腺癌复发潜在的成像生物学标志物,而复发风险评估对术后治疗方案的选择以及生存评估具有重要意义。
1.4 结直肠癌
结直肠癌(colorectal cancer,CRC)是最常见的消化系统恶性肿瘤之一,近年来在全世界的发病率和死亡率不断升高。目前,KRAS、NRAS 和BRAF 基因的突变状态具有临床意义,这些基因是MAPK (丝裂原活化蛋白激酶)途径的效应因子,可作为预测预后的生物标志物[32]。目前关于CRC 患者的KRAS 突变状态在影像基因组学研究中受到广泛关注,Shin 等[33]在一组接受MRI检查的直肠癌患者中进行了研究,发现息肉形态、轴向长度增加、轴向与纵向比率增加和N2淋巴结状态与KRAS突变有关。Lubner等[34]的一项研究对77例CRC肝转移患者的肝脏增强CT进行纹理特征分析,发现纹理参数与肿瘤分级、血清癌胚抗原(carcinoembryonic antigen,CEA)和KRAS突变状态相关,其中偏度与KRAS突变呈负相关。Yang等[35]研究分析了117例CRC患者治疗前的CT增强门静脉期图像及KRAS/NRAS/BRAF基因的突变,采用RELIEF算法和支持向量机方法建立模型,评估基因突变与临床背景、肿瘤分期和组织学分化之间的相关性。最后发现影像组学特征与KRAS/NRAS/BRAF 突变有相关性,CT 可能有助于CRC肿瘤基因型的分析,从而有助于确定治疗策略。CT影像特征在CRC的预后预测方面也具有潜在价值,Badic等[36]通过结合增强CT影像学特征和基因表达数据,发现ABCC2的表达变化与某些影像学特征有相关性,并且ABCC2基因表达与N期和M期相关,临床分期及ABCC2可以预测CRC患者的无进展生存期(progression-free-survival,PFS),结果表明影像基因组学可提高影像学检查对CRC患者的预后判断能力。
1.6 肾癌
肾透明细胞癌(clear cell renal cell carcinoma,ccRCC)是最常见的肾癌病理类型,初步研究显示ccRCC的CT特征与通过聚合酶链式反应(Polymerase Chain Reaction,PCR)扩增和DNA 测序检测到体细胞基因突变之间具有的相关性[37]。已知这些基因(VHL、PBRM1、SETD2、KDM5C、BAP1 和MUC4)与晚期生存率降低有关,因此,多项研究试图寻求与这些基因表达有关的影像标记物,从而实现通过影像基因组学对ccRCC 的早期诊断、评估、个性化治疗以及预后预测。VHL是肿瘤抑制因子,影响ccRCC 的新血管生成,VHL 突变可增加肿瘤侵袭性,通过增强CT 上肿瘤内粗大血管分布及肿瘤结节增强等特征对其进行预测,从而实现对肿瘤恶性程度的评估。而KDM5C 和BAP1 的突变则与肾静脉血管受侵相关,肿瘤边界不清以及肿瘤钙化与BAP1 突变有关[38]。在治疗方面,BAP1 突变可能使ccRCC 对放疗更加敏感,也可增加ccRCC 对mTORC1 抑制剂的敏感度[39],因此,通过对BAP1突变特异性影像生物特征的探寻有助于推进个性化治疗。据报道[40],术后约30%的局部ccRCC 患者会复发和转移。这些患者预后不良,五年生存率仅12%,因此,急需要开发预测转移的生物标志物来选择最有可能从辅助治疗中受益的患者。Lee 等[41]发现从增强CT 中提取的四个影像组学特征可以预测T1 期ccRCC 患者的术后转移,并且这四种影像组学特征与表达肿瘤异质性的基因有关。现在人们普遍认为,几种生物标志物的联合分析是最有前途的方法,有可能改变临床管理。Jasmshidi等[42]利用临床数据、基因图谱及术前增强CT图像联合为ccRCC构建影像基因组学风险评分(radiogenomics risk score,RRS),结果表明,在训练组和验证组中,无论分期、分级及肿瘤状态如何,高RRS 组都检测到较低的生存期。其随后的一项研究[43]也证实了RRS的可靠性。
1.7 前列腺癌
前列腺癌(prostate cancer,PCa)是男性生殖系统中最常见的恶性肿瘤,是全球第二最常见癌症,也是导致男性癌症死亡的第六大原因,北美及欧洲发病率居全球最高。已有研究[44]探讨了利用ADC、动态对比增强(dynamic contrast enhanced)和Gleason 评分参数来确定PCa的侵袭性。2016 年McCann 等[45]首次发表了关于PCa的影像基因组学的研究。该研究为每一个ROI 确定了6 个定量参数[平均ADC、ADC 第十百分位、T2W 信号强度偏度、容量转移常数(volumetransfer constant,Ktrans)、血管外细胞外间隙容积比(extravascular extracellular volume fraction,Ve)、速 率 常 数(rate constant,Kep)],利用Spearman相关系数(r)分析定量图像特征与PTEN表达之间的关联。PTEN是PCa中变异率最高的一种抑癌基因,高达60%的局部晚期PCa 患者会出现PTEN 基因的缺失。该研究结果表明,在6 个特征中,只有Kep与PTEN 表达呈弱相关,尽管关系很微弱,但是他们仍认为这种模型可以提供PCa患者的风险评估。Bates 等[46]研究了PCa特异性膜抗原与影像组学特征的相关性,该抗原诊断前列腺癌的特异性比前列腺特异性抗原(prostate specific antigen,PSA)更高,结果表明PCa特异性膜抗原的表达水平与纹理参数中的峰度、正像素均值之间具有相关性。PI-RADS 评分促进了PCa诊断全球标准化,增加多参数MRI (mp-MRI)结果的解释和交流的一致性,它是基于全球最佳的现有证据和专家共识,检出临床有意义的癌并进行风险评估,可用于协助患者的治疗选择。一项研究[47]对106 例患者的MRI 影像特征与细胞周期进展评分进行相关性分析发现,PI-RADS 与细胞周期进展评分相关。Wibmer 等[48]也进行了类似的研究,结果表明包膜侵犯是PCa更具侵袭性的一种基因表型。迈阿密大学的学者[49]研究了mp-MRI 与前列腺活检组织中PCa风险基因表达谱的关系,从mp-MRI 引导靶向活检组织与正常组织中提取影像学特征,将49 个放射学特征与3个临床不良后果相关基因联系起来,该研究证明了与免疫/炎症反应、新陈代谢、细胞和生物粘附相关的基因表达与成像特征之间有强烈关联,其中ADC值与这些生物学过程的相关性最高。这是第一项通过MRI引导穿刺活检将影像基因组学特征参数与PCa基因相关联的研究。Kesch等[50]试图基于染色体拷贝数改变的基因索引病变,作为前列腺活检中肿瘤侵袭性的标志物,与mp-MRI及68Ga-PSMA-PET/CT影像特征相关联,结果表明,影像特征与基因索引病变之间存在很强的相关性,影像基因组学可能有助于区分惰性和侵袭性PCa。影像基因组学在PCa方面已进行多项研究,尤其是成像特征与单基因表达之间的研究,有较好的研究结果,但未来仍需要大数据、多中心的研究来验证。
2 不足与展望
综上所述,影像基因组学是一个新兴的交叉学科,通过整合医学图像和基因组数据的方法挖掘两者之间关系,发现可以反映基因特征的影像生物学标志物,并可作为一种非侵入式检测方法在疾病的诊断、个性化治疗、预后预测、疗效评估等方面发挥重要的作用。但目前影像基因组学尚处于早期研究阶段,仍存在较多问题:(1)大多数为回顾性、小样本研究[51],未来则需要获取更大的数据量以及开展更多前瞻性研究,随着更多基因组数据集和影像数据库的建立及开放,也将会加快影像基因组学的发展;(2)在影像特征提取的过程中缺乏标准化,即在图像类型、预处理、图像分割方法等方面存在差异,从而影响了某些特征的重复性,需制订一个标准化的工作流程和国际认可的方法指导,来消除这不一致性和不确定性;(3)影像基因组学研究容易出现数据过度拟合和(或)选择偏倚,更优算法(如深度学习、神经网络)不断涌现可能会优化数据。目前影像基因组学研究中的基因组数据大多来自微阵列数据,对microRNA 作用的研究缺乏。这些RNA 具有靶向大量基因和调控基因表达的潜力,将这些RNA 与成像数据相关联的研究可能是一个新的方向。
影像基因组学是当今精准医学发展趋势下的必然结果,比传统基因测序成本更低,与有限的活检标本相比可获得整个肿瘤信息,反映肿瘤内体素强度的空间变化和异质性,并阐述预测性和预后信息。随着人工智能技术、高通量技术和成像技术的进步,我们有可能进入“组学”研究的新时代,通过深度学习技术,在临床医生的帮助下建立基本事实,可能会提高来自基因组和成像数据库的大型数据集的性能。总之,影像基因组学是一个充满广阔前景的领域,它将影像学提升到一个新的水平,未来也将广泛地应用到更多临床领域。
作者利益冲突声明:全部作者均声明无利益冲突。