APP下载

基于MethylMix法探索结肠癌甲基化驱动基因

2020-03-08康争春朱良亮闫飞虎于恩达

海军医学杂志 2020年1期
关键词:癌基因表观甲基化

康争春,朱良亮,闫飞虎,于恩达

结肠癌是发病率逐年上升的我国乃至世界最常见的消化道恶性肿瘤之一[1]。随着经典的腺瘤-癌模型的提出,大量基因突变和转录组学标志物的发现,表观遗传学的提出、研究、应用,结肠癌的分子调控机制越来越趋于完善。但目前已知的分子标记只能部分解释结肠癌的发生、发展、转归、预后。因此,继续探索发现结肠癌分子标记,以提高对结肠癌的认识,对于结肠癌的研究是非常必要的。

表观遗传学在不改变DNA编码序列的情况下,对基因的表达与功能产生可遗传的表型,其应用于结肠癌的诊断、治疗的前景非常广阔。DNA甲基化是表观遗传修饰的一种重要形式,异常的DNA甲基化可改变染色质结构及癌基因和抑癌基因的表达,最终参与肿瘤的发生发展[2]。因此,通过对DNA甲基化的检测,筛选甲基化驱动基因,可加强对结肠癌表观遗传修饰的认识,为进一步探索结肠癌表观遗传学调控机制提供借鉴。

本研究利用来自肿瘤基因组图谱(the cancer genome atlas,TCGA)的甲基化及表达谱数据,确定了甲基化驱动基因并进行功能富集分析,分析了甲基化驱动基因富集的功能和通路。这些发现将有助于进一步提高对结肠癌的表观遗传修饰机制的认识。

表1 差异甲基化和与基因表达相关性Top20驱动基因

1 资料与方法

1.1 组织样本数据下载及预处理 从癌症基因组图谱(TCGA,https://cancergenome.nih.gov/)搜索并下载结肠腺癌450kIlluminaInfinium甲基化阵列、基因表达谱数据。去除表达谱或甲基化数据为0的基因。

1.2 甲基化驱动基因的筛选 在R.3.5.0环境下,使用程序包MethylMix[3]进行甲基化驱动基因筛选,驱动基因需要满足的条件为:(1)基因甲基化和基因表达具有显著相关性;(2)结肠癌组织样本和结肠正常组织样本的甲基化水平具有显著性差异。过滤条件为:矫正P<0.05,相关系数r<-0.3。MethylMix进行甲基化驱动基因筛选的基本原理如下:(1)通过对结肠癌组织样本基因甲基化水平和基因表达水平相关性的计算,筛选出具有显著相关性的基因;(2)对癌组织和正常样本的甲基化程度构建一个混合模型,利用Wilcoxon rank test发现癌组织样本和正常组织样本之间具有显著差异的甲基化基因;(3)对上述2者取交集,并对基因P值进行矫正,最后取矫正P<0.05的基因为甲基化驱动基因。

1.3 甲基化驱动基因可视化 在R.3.5.0环境下,使用程序包MethylMix,对符合筛选条件的上述甲基化驱动基因绘制差异甲基化和基因甲基化与基因表达相关性图形,并对甲基化驱动基因进行聚类分析。

1.4 甲基化驱动基因的功能通路富集分析 将甲基化驱动基因通过DAVID Bioinformatics Resources (https://david.ncifcrf.gov/,versionn 6.8)做GO富集分析,通过KOBAS3.0 (http://kobas.cbi.pku.edu.cn/)做KEGG通路富集分析。高度富集的GO功能或KEGG通路被认为是甲基化驱动基因的潜在功能。

2 结果

2.1 组织样本的一般情况 共有308个结肠癌组织样本纳入研究,均含有基因甲基化及表达谱数据;共有38个结肠正常组织样本纳入研究,均含有基因甲基化数据。对308个结肠癌组织样本的甲基化数据的gene symbol和表达谱数据的gene symbol取交集,共有21 091个gene symbol纳入研究。

2.2 基于MethylMix法的甲基化驱动基因筛选结果共发现323个甲基化驱动基因,其前显著性前20的甲基化驱动基因为ZNF43、FAM72B、CAHM、CTD-2245F17.3、AP000251.3、DPY19L2、RP11-710C12.1、AC005498.3、ZNF568、DMRTA1、FAM200A、CTC-444N24.13、ANKRD18B、ZNF614、GREB1L、HSPA1A、ZNF730、RP11-573G6.4、DOK5、CMTM3等。

2.3 甲基化驱动基因可视化结果 代表性的甲基化驱动基因的差异甲基化与表达相关性的代表性图例如图1~4所示。 AC009237.8基因在癌组织中相对于正常组织高甲基化,并且其甲基化程度与mRNA表达呈显著性负相关,揭示结肠癌该基因的高甲基化可能造成其表达降低,该基因可能为结肠癌的抑癌基因,由于其高甲基化造成抑癌基因被抑制或失活。AREG基因在癌组织中相对于正常组织低甲基化,并且甲基化程度与表达水平呈负相关,揭示该基因可能作为结肠癌的原癌基因,由于其低甲基化造成原癌基因活性增高,促进结肠癌的发生、发展。图5为甲基化驱动基因的聚类分析热图,从图中不难看出,结肠癌癌组织与正常组织甲基化驱动基因有着明显的表达水平差异,在CHL1、CD34、BNIP3、SUSD5等基因表现的尤为明显。

图1 AC009237.8基因在癌组织中相对于正常组织高甲基化

图2 AC009237.8基因甲基化程度与表达水平呈负相关

图3 AREG基因在癌组织中相对于正常组织低甲基化

图4 AREG基因甲基化程度与表达水平呈负相关

图5 甲基化驱动基因聚类分析热图

2.4 功能富集分析结果 为了了解甲基化驱动基因在结肠腺癌生物学中的作用,本研究通过功能通路富集分析对甲基化驱动基因功能进行了富集分析。通过对甲基化驱动基因筛选结果,对甲基化驱动基因GO和KEGG进行功能通路富集分析,推断差异甲基化基因潜在的生物学过程。笔者发现这些甲基化驱动基因可能与转录的调控、DNA模板、金属离子键结合、转录因子活性、结合DNA、核酸结合、代谢途径、癌症途径等信号有关(图6和图7)。这提示甲基化驱动基因在结肠腺癌的生物学过程中起着重要作用。

图6 GO功能富集结果

图7 KEGG通路富集结果

3 讨论

当今医学正在进入精准医学模式,个体化治疗可以使结肠癌患者最大可能的治疗获益,结肠癌是一种分子水平异质性很大的恶性肿瘤,分子分型的差异很大程度上决定了患者的个体化治疗方案[4-7],虽然目前对于结肠的分子机制研究日新月异,但由于结肠癌调控机制的复杂性,目前对于结肠癌的精细调控通路目前尚不完善。因此需要对结肠癌发生、发展过程中的关键分子做更加深入的挖掘,获得敏感性、特异性更高的生物标志物。

经大量研究与实验证实,表观遗传学的调控在恶性肿瘤的发生发展中发挥着重要作用,尤其是DNA甲基化、组蛋白修饰、染色质重塑、非编码RNA等表观遗传学的调控。而目前DNA甲基化是最重要,也是科研工作者研究的最为广泛的一种表观修饰方式。大量的DNA甲基化改变在结肠癌的发生、进展过程中出现,直接影响结肠癌的生物学行为,并且DNA甲基化是结肠癌能够最早分辨出的表观改变[8]。然而,目前对于在结肠癌发挥重要作用的甲基化驱动基因,肿瘤科研工作者的认识仍旧很少。

目前已经证实DNA甲基化异常在结直肠癌[9]、胃癌[10]、肝癌[11]、乳腺癌[12]、前列腺癌[13]、黑色素瘤[14]等恶性肿瘤的发生、发展中起着重要作用。CCNEI、CCNDBP1、PON3、DDX43、CHL1等目前已知的甲基化异常基因,经证实其在重要的细胞生命活动如增殖、分化、迁移、凋亡过程中发挥重要作用的同时,也直接影响结肠癌患者疾病的进展与预后[15-16]。但由于各种局限性,如技术水平不一致、研究分散等,所以目前对结肠腺癌整体的甲基化驱动基因认识尚未形成,因此要更全面地挖掘与整合结直肠癌甲基化驱动基因。

MethylMix[3]是2015年Gevaert发现的一种鉴定甲基化异常基因的算法,并在R语言中整合为R包,为鉴定甲基化异常提供了一种高效的工具。其基本原理为引入β混合模型区分甲基化水平差异,进而与正常组织的甲基化水平做差异比较,最后与基因的表达谱数据匹配,挖掘有显著差异的甲基化异常基因。本研究主要借助MethylMix的R包,利用TCGA公共数据库,对TCGA数据库结肠腺癌患者组织样本甲基化阵列及表达谱数据进行分析研究,筛选出了如ZNF43、FAM72B、CAHM、CTD-2245F17.3等323个甲基化驱动基因,其中高甲基化的基因共有283个,如ZNF43、FAM72B、CAHM、CTD-2245F17.3、AC009237.8等,其在癌组织中相对于正常组织高甲基化,并且其甲基化程度与mRNA表达呈显著性负相关,揭示结肠癌基因的高甲基化可能造成其表达降低,可能为结肠癌的抑癌基因,由于其高甲基化造成抑癌基因被抑制或失活;其中低甲基化的基因共有40个,如RP11-2C24.7、ZHX1-C8orf76、LINC00944、SLPI、AREG等,它们在癌组织中相对于正常组织低甲基化,并且甲基化程度与表达水平呈负相关,揭示该类基因可能作为结肠癌的原癌基因,由于其低甲基化造成原癌基因活性增高,促进结肠癌的发生、发展。对323个甲基化驱动基因进行GO功能和KEGG通路富集分析,揭示了甲基化驱动基因的潜在功能,如转录的调控、DNA模板、金属离子键结合、转录因子活性、结合DNA、核酸结合、代谢途径、癌症途径等。显示MethylMix法在甲基化驱动基因筛选上的科学性、高效性,挖掘的甲基化驱动基因对于以后的结肠癌甲基化驱动基因的基础研究起到参考意义。

综上所述,应用MethylMix法挖掘甲基化驱动基因并进行功能分析,这些发现有助于深入认识结肠癌表观遗传学调控机制,并有可能作为诊断的生物标志物和治疗靶点应用于临床。

猜你喜欢

癌基因表观甲基化
绿盲蝽为害与赤霞珠葡萄防御互作中的表观响应
钢结构表观裂纹监测技术对比与展望
例析对高中表观遗传学的认识
抑癌基因P53新解读:可保护端粒
探讨抑癌基因FHIT在皮肤血管瘤中的表达意义
抑癌基因WWOX在口腔肿瘤的研究进展
鼻咽癌组织中SYK基因启动子区的甲基化分析
胃癌DNA甲基化研究进展
表观遗传修饰在糖脂代谢中的作用
基因组DNA甲基化及组蛋白甲基化