基于生物信息学的胃癌核心miRNA筛选和调控网络分析*
2019-12-27孙丽萍
周 荃 孙丽萍
中国医科大学附属第一医院肿瘤病因与筛查研究室 辽宁省高校肿瘤病因与预防重点实验室(110001)
背景:MicroRNAs(miRNA)是多种真核生物基因表达的负调节因子,在RNA沉默和基因转录后调控中发挥作用。几乎所有类型的恶性肿瘤中均发生miRNA失调,可影响多种基因表达。目的:构建胃癌核心miRNA调控网络,为解析miRNA在胃癌发生、发展中的分子机制提供理论依据。方法:利用miRNA和mRNA表达谱芯片筛选差异表达miRNA和mRNA,应用miRWalk 2.0预测miRNA相互作用的基因,并与表达谱芯片筛选出的基因进行交叉匹配,确定核心差异表达miRNA,构建miRNA-mRNA调控网络。对靶基因进行GO分析和KEGG分析。结果:表达谱芯片筛选出21个上调miRNA和36个下调miRNA,交叉匹配后发现1 042个低表达基因和711个高表达基因,最终确定10个核心miRNA-mRNA调控网络。受核心miRNA调控的差异表达基因主要参与肿瘤相关通路,高表达基因主要富集于ECM-受体作用通路等9个信号通路,而低表达基因主要富集于神经活性配体-受体相互作用等5个信号通路。GO分析结果显示上调基因涉及315个功能、下调基因涉及88个功能,其中细胞外基质组织的相关性最高。结论:基于生物信息学的miRNA-mRNA调控网络分析为研究胃癌提供了新的视角,有助于系统性阐明miRNA在胃癌发生、发展中的分子作用机制,可为胃癌诊断标志物的筛选和药物治疗精准靶点的选择提供理论基础。
胃癌是全球五大高发肿瘤之一,死亡率居于恶性肿瘤前三位,东亚和东欧是胃癌最高发地区[1]。2012年统计数据显示,我国胃癌新发病例约为42.4万例,死亡病例约为29.8万例[2]。对胃癌发生、发展过程中分子机制的研究,有助于揭示胃癌的发病机制、筛选胃癌诊断标志物和选择药物治疗精准靶点,从而降低胃癌死亡率。
MicroRNAs(miRNA)是一种存在植物、动物和某些病毒中的非编码RNA分子,由较大的转录物加工成发夹前体,再由RNase Ⅲ酶家族成员Drosha和Dicer依次发挥作用,产生成熟、大小为20~22个核苷酸的miRNA。MiRNA是多种真核生物基因表达的负调节因子,通过碱基配对与mRNA分子内的互补序列相互作用,在RNA沉默和基因的转录后调控中发挥作用[3]。此外,miRNA在生物样品中具有高稳定性的特点,因此有望成为未来生物学标志物研究领域的热点[4-5]。研究表明,几乎所有类型的恶性肿瘤中均可发生miRNA失调[6-7],可影响多种基因的表达。
近年来,越来越多的研究涉及miRNA在胃癌中的调控作用,但尚缺乏从miRNA-mRNA调控网络全局的角度分析miRNA功能的报道。对胃癌相关miRNA-mRNA网络系统进行整合分析,有助于全面解析miRNA在胃癌发生、发展中的生物学功能。本研究拟利用miRNA和mRNA表达谱芯片公共数据库,筛选在胃癌中存在差异表达的miRNA和mRNA;进一步通过预测和交叉比对分析miRNA-mRNA内在联系,构建胃癌核心miRNA的分子调控网络,并通过富集分析阐明miRNA调控途径和预测其作用机制,进而为解析胃癌发病机制提供有价值的理论依据。
材料与方法
一、微阵列数据
本研究所使用的miRNA芯片(GSE23739)和mRNA表达谱芯片(GSE13911)均来自于美国国立生物技术信息中心(National Center for Biotechnology Information, NCBI)的基因表达数据库(Gene Expression Omnibus, GEO)(https://www.ncbi.nlm.nih.gov/geo/)。其中,miRNA芯片包括40对胃癌组织及其配对的癌旁正常组织,mRNA表达谱芯片包括38例胃癌组织和31例癌旁正常组织。
二、数据处理
使用R语言进行数据处理和统计学分析。利用GEOquery包中getGEO函数下载miRNA芯片(GSE23739)和mRNA表达谱芯片(GSE13911)的原始数据,然后以exprs函数提取表达数据。使用normalizeBetweenArrays函数对数据进行标准化处理。利用limma程序包中model.matrix函数定义分组,lmFit、contrasts.fit、eBayes等函数分析胃癌组织和正常胃黏膜组织中差异表达的miRNA和mRNA。以|logFC|>1且P<0.05作为阈值,筛选差异表达的miRNA和mRNA。ggplot2程序包中的ggplot和geompoint函数用于绘制表达火山图。
三、miRNA调控网络的构建
应用miRWalk 2.0数据库(http://zmf.umm.uni-heidelberg.de/apps/zmf/mirwalk2/)预测差异miRNA的靶基因。考虑到miRNA对于基因的负向调控性,本研究将高表达miRNA预测到的靶基因与胃癌差异表达中的低表达基因进行交叉匹配;反之,将低表达miRNA预测到的靶基因与高表达基因进行交叉匹配。结果采用Cytoscape 3.6.0软件进行呈现。
四、功能注释分析和富集分析
对胃癌中差异表达miRNA调控的靶基因行GO(Gene Ontology)分析和KEGG(Kyoto Encyclopedia of Genes and Genomes)富集分析。使用R语言ClusterProfiler程序包中的enrichGO和enrichKEGG函数,对差异表达基因进行GO分析和KEGG富集分析,设定参数“pAdjustMethod=“BH”,pvalueCutoff=0.05,qvalueCutoff=0.2”。Z值的P<0.05为差异有统计学意义。利用ggplot2程序包对差异显著的前12个结果进行可视化。
结 果
一、差异表达miRNA和mRNA的筛选
MiRNA芯片(GSE23739)中筛选出56个胃癌差异表达miRNA(上调20个,下调36个),mRNA表达谱芯片(GSE13911)中筛选出3 289个胃癌差异表达基因(上调994个,下调2 295个)(表1、图1)。
表1 胃癌差异表达miRNA
图1 胃癌差异表达miRNA和mRNA芯片筛选
二、核心miRNA调控网络的构建
通过miRWalk 2.0数据集筛选和交叉匹配,发现1 753个受胃癌差异表达miRNA调控的基因,包括1 042个低表达基因和711个高表达基因。将与差异基因相互作用数量位列前五位的miRNA定义为核心miRNA,高表达基因的核心miRNA分别为hsa-miR-17-5p(175个)、hsa-miR-20a-5p(100个)、hsa-miR-20b-5p(174个)、hsa-miR-7-5p(97个)、hsa-miR-96-3p(96个)(图2);低表达基因的核心miRNA分别为hsa-miR-650(82个)、hsa-miR-513b-3p(81个)、hsa-miR-603(74个)、hsa-miR-494-3p(67个)、hsa-miR-513c-3p(66个)(图3)。
三、miRNA调控基因的KEGG富集分析
对胃癌差异表达miRNA调控的差异基因进行KEGG通路富集分析。1 753个差异基因被富集到多个肿瘤相关的通路,其中高表达基因主要富集于下列9个通路:ECM受体作用通路(ECM-receptor interaction)、细胞周期(cell cycle)、PI3K-Akt信号通路(PI3K-Akt signaling pathway)、p53信号通路(p53 signaling pathway)、糖尿病并发症AGE-RAGE信号通路(AGE-RAGE signaling pathway in diabetic complications)、黏着斑(focal adhesion)、小细胞肺癌(small cell lung cancer)、人乳头瘤病毒感染(human papilloma virus infection)和蛋白质消化吸收(protein digestion and absorption)。而低表达基因主要富集在神经活性配体-受体相互作用(neuroactive ligand-receptor interaction)、胆汁分泌(bile secretion)、钙信号通路(calcium signaling pathway)、视黄醇代谢(retinol metabolism)、胃酸分泌(gastric acid secretion)等通路(表2)。
图2 胃癌高表达基因的核心miRNA调控网络
图3 胃癌低表达基因的核心miRNA调控网络
表2 胃癌差异miRNA调控基因的KEGG通路富集分析
上述通路中,与肿瘤细胞增殖相关的通路包括细胞周期和PI3K-Akt信号通路;参与肿瘤转移和侵袭的通路包括ECM-受体相互作用、黏着斑和钙信号通路;影响肿瘤细胞凋亡的通路为PI3K-Akt信号通路;p53信号通路涉及多种肿瘤细胞生物学行为。
四、miRNA调控基因的GO分析
对胃癌差异表达miRNA调控的差异基因进行GO分析,上调基因涉及315个功能、下调基因涉及88个功能,按P值由小到大排序,依次为细胞外基质组织(extracellular matrix organization)、细胞外结构组织(extracellular structure organization)、染色体分离(chromosome segregation)、姐妹染色单体分离(sister chromatid segregation)、胶原分解代谢过程(collagen catabolic process)、核染色体分离(nuclear chromosome segregation)、核分裂(nuclear division)、细胞器裂变(organelle fission)、纺锤体(spindle)、染色体着丝粒区域(chromosome centromeric region),以及调节激素水平(regulation of hormone levels)、胰岛素分泌(insulin secretion)、金属离子跨膜转运蛋白活性(metal ion transmembrane transporter activity)、肽激素分泌(peptide hormone secretion)、调节肽激素分泌(regulation of peptide hormone secretion)、调节胰岛素分泌(regulation of insulin secretion)、激素运输(hormone transport)、调节膜电位(regulation of mem-brane potential)、激素分泌(hormone secretion)、调节激素分泌(regulation of hormone secretion)(图4)。
讨 论
成熟的miRNA分子主要在细胞质中与mRNA的3’-UTR结合,少数可与启动子区、编码区或5’-UTR结合,通过募集AGO蛋白组装成沉默复合体(RISC)后,经由两种途径负向调控靶基因。其一,miRNA可与靶基因3’-UTR不完全互补结合,抑制靶基因mRNA翻译,但不影响其稳定性;其二,miRNA可与靶基因3’-UTR完全互补结合,引起靶基因mRNA的切割降解。本研究从miRNA作用机制入手,筛选以胃癌异常表达的miRNA为中心的mRNA调控网络,进一步通过功能和通路富集分析探讨miRNA在胃癌中的分子调控功能和信号通路,从而为解析miRNA在胃癌发生、发展中的分子机制提供有价值的理论基础。
通过生物信息学筛选,本研究确定了10个核心miRNA,包括5个上调miRNA(hsa-miR-17-5p、hsa-miR-20a-5p、hsa-miR-20b-5p、hsa-miR-7-5p、hsa-miR-96-3p)和5个下调miRNA(hsa-miR-650、hsa-miR-513b-3p、hsa-miR-603、hsa-miR-494-3p、hsa-miR-513c-3p),其中hsa-miR-17-5p调控的靶基因最多。目前研究发现,hsa-miR-17-5p、hsa-miR-20a-5p和hsa-miR-650与胃癌的发病风险相关[8-10],hsa-miR-17-5p和hsa-miR-20a-5p与胃癌的疗效和预后相关,而hsa-miR-20b-5p、hsa-miR-96-3p、hsa-miR-513b-3p,hsa-miR-603和hsa-miR-494-3p的作用尚不清楚,有待进一步研究。
研究报道,hsa-miR-17-5p通过调节细胞周期相关基因(包括GAB1、MAPK9、MYCN、PKD1、PKD2、RBL1、TSG101、NCOA3等)影响肿瘤细胞的增殖过程[11]。胃癌患者血液和胃癌组织中hsa-miR-20a-5p表达显著上调[9],血清hsa-miR-17-5p可作为胃癌的预警标志物[8]。本研究结果提示,hsa-miR-17-5p为影响胃癌细胞增殖的关键miRNA,可调控靶基因MYCN表达。此外,hsa-miR-17-5p和hsa-miR-20a分别通过靶向p21和NFKBIB基因诱导胃癌细胞对DDP的耐药性[12-13],hsa-miR-17-5p高表达的胃癌患者更易发生淋巴结转移[14],总体存活率较差[8]。上述研究结果提示hsa-miR-17-5p和hsa-miR-20a-5p可作为胃癌预后和疗效的靶点。
图4 miRNA调控基因GO功能注释
目前认为hsa-miR-650的生物学效应在多种肿瘤中的表现并不一致。非转移性结直肠癌中,hsa-miR-650通过靶向AKT2抑制AKT途径的激活,进而抑制肿瘤增殖和侵袭[15]。hsa-miR-650在前列腺癌中高表达,通过抑制CSR1促进前列腺癌细胞增殖[16]。另有研究[10,17]发现,hsa-miR-650通过靶向ING4促进胃癌和肝癌细胞增殖。Lario等[18]的报道显示,幽门螺杆菌(Hp)阳性患者胃黏膜组织中hsa-miR-650高表达,提示hsa-miR-650可能参与Hp感染导致的胃黏膜癌变过程。
研究发现,hsa-miR-7-5p可能作为肿瘤抑制因子在乳腺癌[19]、胶质瘤[20]、头颈部肿瘤[21]、肝癌[22]、结肠癌[23]等多种肿瘤中发挥作用,可通过靶向IRS2基因激活Akt信号通路[24],或通过抑制RelA/NF-κB通路减少肿瘤细胞增殖和转移[25]。但hsa-miR-7-5p在胃癌中的生物学功能尚不清楚。本研究结果显示hsa-miR-7-5p是一个原癌基因,提示其在胃癌中的调控作用异于其他肿瘤,这可能是因为miRNA作为非编码RNA,主要是通过调控不同的靶基因来影响肿瘤的发生、发展。
对于miRNA调控下游基因来影响胃癌发生的关键机制,目前尚不十分清楚,miRNA-mRNA调控网络可为解析miRNA在胃癌中的作用提供可参考的研究方向。
KEGG通路富集分析结果表明,胃癌差异表达miRNA富集的信号通路涉及胃癌发生、发展的全过程。细胞周期是肿瘤发生的核心过程,包括细胞增殖和细胞分裂。细胞周期和PI3K-Akt信号通路与细胞增殖密切相关,PI3K/AKT/mTOR通路可影响细胞周期,抑制多种原因引起的细胞凋亡,促进血管形成,参与胃癌侵袭和转移[26]。ECM-受体相互作用、黏着斑和钙信号通路是影响肿瘤细胞转移和侵袭的重要通路;肿瘤细胞与ECM组分,如层黏连蛋白、纤维连接蛋白和胶原蛋白的相互作用在肿瘤侵袭和转移中起关键作用,且黏附受体能促进这种相互作用[27]。P53信号通路与多种肿瘤细胞生物学行为相关,不仅可与PI3K-Akt信号通路相互作用影响胃癌细胞增殖,还可调控黏附力通路促进胃癌细胞转移[28]。胃酸分泌与胃癌发生密切相关,有文献报道小鼠体内低胃酸分泌会导致慢性炎症、胃壁萎缩、壁细胞功能丧失以及促进肿瘤生长等一系列过程[29],而Hp感染相关的低胃酸分泌在Hp致胃癌中亦起有关键作用[30]。由此可见,胃癌差异表达miRNA能通过调控多个信号通路的靶基因来影响胃癌的发生及其生物学行为。
GO功能注释分析结果提示,miRNA调控的基因主要与染色体调控功能、激素分泌功能等相关。流行病学调查显示男性胃癌的发病率为女性的两倍[31]。一项关于性激素与胃癌发病风险的meta分析显示雌激素可明显降低胃癌的发病风险[32]。提示miRNA能通过影响细胞周期和细胞分裂来调节人体激素水平,进而影响胃癌的发生。
综上所述,本研究利用生物信息学分析方法对胃癌中差异表达的miRNA进行系统筛选和归纳总结,构建了miRNA-mRNA共表达网络,并进一步对下游调控mRNA进行了功能分析和通路分析,全面解析了胃癌中miRNA的调控作用及其可能机制。本研究结果为阐明miRNA在胃癌发生、发展中的分子机制提供了有价值的参考,为胃癌诊断标志物的筛选和药物治疗精准靶点的选择提供了理论基础。