基于GEO数据库的环状RNA差异表达及其在膀胱癌中的功能和通路研究
2022-05-11陈浩宁胡建鹏江苏大学附属医院江苏镇江2200镇江市第一人民医院江苏镇江22002
陈浩宁,姚 敏,胡建鹏 (.江苏大学附属医院,江苏 镇江 2200 2.镇江市第一人民医院,江苏 镇江 22002)
膀胱癌是一种常见的泌尿生殖系统恶性肿瘤,发病率和死亡率较高,约75%的高危膀胱癌患者在术后10年内复发、进展或死亡[1-2]。在我国,膀胱癌发病率呈逐年上升趋势,严重威胁人类的健康和生命[3]。膀胱癌分为非肌浸润性膀胱癌(Ta和T1期)和肌肉浸润性膀胱癌(T2~T4期)[4]两类。膀胱癌生物学行为复杂,容易发生侵袭和转移,其发病机制涉及大量基因异常及多种信号通路的改变。
环状RNA(circularRNA,circRNA)是一类没有5′帽子结构和3′poly(A)结构但具有闭合环状结构的非编码RNA,主要位于细胞质或储存于外泌体中,不受RNA外切酶影响,表达稳定且不易降解,广泛存在于多种真核生物体内[5]。近年来,circRNA被发现与胃癌、肝癌、乳腺癌和膀胱癌等多种疾病相关,通过多种机制参与疾病的发生和发展[6-8]。但是目前与膀胱癌相关的circRNA研究尚不多见。本研究利用基因表达综合数据库(Gene Expression Omnibus,GEO)中的膀胱癌circRNA表达谱芯片,探讨膀胱癌差异表达circRNA及其富集的通路和参与的功能,为膀胱癌的circRNA潜在分子调控机制提供依据,并有可能作为生物标志物和治疗靶点应用于临床。
1 材料与方法
1.1 芯片数据下载及预处理
在NCBI GEO (https:∥www.ncbi.nlm.nih.gov/geo/)中使用以下关键词:(“bladdercancer”)AND(“circRNA”)搜索信息,共发现8个表达数据芯片,分别为GSE147985、GSE147984、GSE147983、GSE92675、GSE97239、GSE136919、GSE150142、GSE83955,选择符合条件的膀胱癌circRNA表达谱芯片GSE92675的原始数据进行相关生物信息学分析。该芯片包括为4例膀胱癌组织和4例配对的癌旁组织。根据芯片数据的平台文件将探针矩阵转换为circRNA矩阵;并且对circRNA矩阵进行命名统一和转换,统一使用circBank数据库命名规则。
1.2 基于Limma包的差异表达circRNA的筛选
在R.4.1.3环境下,对GSE92675膀胱癌circRNA表达谱芯片数据进行数据整理,使用Limma包[9]做差异表达分析,过滤条件为校正P<0.05,log2FC绝对值>2,得到107个差异表达的circRNA。并对差异表达circRNA进行聚类分析热图和火山图的可视化,根据可视化结果,挖掘在膀胱癌组织和正常组织中最显著差异分布的circRNA进行进一步分析。
1.3 肿瘤组织与正常组织中差异表达的circRNA调控基因的GO功能、KEGG通路富集分析
首先,利用circRNA数据库CSCD(http:∥gb.whu.edu.cn/CSCD/)预测circRNA调控的miRNA;其次,利用TargetScan数据库进行调控miRNA的靶基因预测;最后,应用Cytoscape软件构建circRNA-miRNA-mRNA调控网络,利用靶基因进行GO功能和KEGG通路富集分析,探索circRNA潜在影响的功能和通路。
2 结 果
2.1 膀胱癌中差异表达circRNA的筛选
将肿瘤组和正常组的芯片分析数据进行比较,从芯片数据中筛选出3379个差异表达的circRNA。首先对校正的P值进行筛选,筛选条件为P校正<0.05,log2FC绝对值>2,得到107个circRNA。其中表达上调的有79个circRNA,表达下调的circRNA有28个。然后对这些差异表达的circRNA进行聚类分析热图和火山图的可视化分析(图1)。通过研究上调和下调差异表达的circRNA聚类分析热图可发现,hsa_circ_0040039在肿瘤组织低表达,在正常组织高表达,区分度最佳;hsa_circ_0049547在肿瘤组织高表达,在正常组织低表达,区分度最佳。
图 1 膀胱癌差异表达的circRNA聚类分析热图(左)和火山图(右)
2.2 膀胱癌中差异表达miRNA以及mRNA的筛选
从GEO数据库中选择GSE40355芯片进行膀胱癌相关的miRNA和mRNA进行数据分析,从芯片数据中筛选出31个差异性表达的miRNA,筛选条件为P校正<0.05,log2FC绝对值>2。其中表达上调的miRNA有14个,表达下调的miRNA有17个。对这些差异表达的miRNA进行聚类分析热图和火山图的可视化分析(图2)。通过研究上调和下调差异表达的miRNA聚类分析热图可发现,hsa-miR-199a-5p在肿瘤组织低表达,在正常组织高表达,区分度最佳;hsa-miR-21在肿瘤组织高表达,在正常组织低表达,区分度最佳。同样的方法,在该芯片中分析得到了1519个差异表达的mRNA。其中975个mRNA在膀胱癌肿瘤组织中低表达,544个mRNA在肿瘤组织中高表达。对这些差异表达的miRNA进行聚类分析热图和火山图的可视化分析(图3)。通过分析上调和下调差异表达mRNA聚类分析热图可发现,CRH基因在肿瘤组织低表达,在正常组织高表达,区分度最佳;SLC2A4基因在肿瘤组织高表达,在正常组织低表达,区分度最佳。
随后,在CSCD数据库找到差异值排名前7的circRNA的互做miRNA,并与膀胱癌数据库中的差异miRNA取交集,得到11个在膀胱癌中具有差异且参与调控circRNA的miRNA。同样得到1144个膀胱癌中具有差异且参与调控circRNA的mRNA。
图 2 膀胱癌差异表达的miRNA的聚类分析热图(左)和火山图(右)
图 3 膀胱癌差异表达的mRNA聚类分析热图(左)和火山图(右)
2.3 circRNA-miRNA-mRNA调控网络的可视化及调控基因功能富集分析结果
在肿瘤细胞的circRNA中随机选取了4个高表达的结果:hsa_circ_0023642、hsa_circ_0002623、hsa_circ_0032821、hsa_circ_0072088,以及2个低表达的结果:hsa_circ_0002435、hsa_circ_0082582,利用Cytoscape.3.8.2软件对它们的circRNA-miRNA-mRNA调控网络进行可视化分析(图4)。把目前可在公共数据库比对到的这些circRNA作为分子海绵间接调控的基因,采用GO功能分析和KEGG通路富集分析对这些调控基因进行了富集分析。结果发现,这些调控基因在如下GO功能上存在富集:肌肉系统进程、肌肉发育、肌肉收缩、细胞外基质的胶原蛋白、肌动蛋白结合、DNA结合转录激活因子活性等(FDR<0.05,图5~7)。这与膀胱的组织器官结构紧密相关。这些调控基因在KEGG通路富集层面显示,P13K-AKT信号通路、MAPK信号通路以及Calcium通路中在调控基因中得到显著富集(FDR<0.05,图8)。
图 4 膀胱癌中差异表达的circRNA的调控网络图
图 5 膀胱癌中差异表达的circRNA的GO-BP功能富集结果(左边为柱状图,右边为气泡图)
图 6 膀胱癌中差异表达的circRNA的GO-CC功能富集结果(左边为柱状图,右边为气泡图)
图 7 膀胱癌中差异表达的circRNA的GO-MF功能富集结果(左边为柱状图,右边为气泡图)
图 8 胱癌中差异表达的circRNA的KEGG功能富集结果(左边为柱状图,右边为气泡图)
3 讨 论
随着社会年龄结构的变化,我国逐渐步入老龄化社会,膀胱癌的发病率也呈逐年上升的趋势。如何预防膀胱癌的发生发展是其治疗的关键问题。所以积极探究膀胱癌发生发展的具体分子机制并寻找新的治疗靶点对治疗该病具有十分重要的意义。
CircRNA在各种生物体内广泛存在,且在各个肿瘤组织中具有多种差异性表达,因此,其可能成为潜在的生物学标志[10]。CircRNA在诸如细胞增殖、分化、迁移、凋亡等重要的细胞生命进程中发挥着不可替代的作用[11]。CircRNA的生物学功能主要包括:①作为miRNA海绵体分子调控基因表达,例如circRNAMYLK可通过海绵吸附作用降低miR-558的活性,通过调节VEGFA/VEGFR2信号通路促进膀胱癌进展[12]。②与蛋白质相互作用,调控相关蛋白的表达和功能,例如circ-HuR可以抑制CCHC型锌指核酸结合蛋白介导的HuR的表达进而抑制胃癌的发生和发展,circ-HuR作为一个肿瘤抑制因子可能成为胃癌的潜在治疗靶点[13]。③能被翻译成蛋白质,例如circ-ZNF609包含一个开放阅读框,其可被编码成蛋白质发挥作用[14]。但是,由于肿瘤调控机制的复杂、样本的差异以及研究方法的不同,目前与膀胱癌相关的circRNA研究较为匮乏,认识尚不全面。因此,迫切需要深入地研究和探索膀胱癌的调控机制,发现与膀胱癌密切相关的circRNA。
本研究主要分析GEO数据库中circRNA在膀胱癌组织中的表达情况,对膀胱癌相关circRNA进行筛选,发现差异表达的circRNA共31个,其中表达上调的有14个,表达下调的有17个。提示这些circRNA可能参与了膀胱癌的发生发展。过去的研究发现circRNA可以通过circRNA-miRNA-mRNA轴促进或抑制肿瘤的发展[15],因此本研究对circRNA可能结合的miRNAs进行了预测,并进一步对这些miRNA可能结合的mRNA进行了筛选,构建了circRNA-miRNA-mRNA网络图。随后对这些差异表达的circRNA间接调控的靶基因进行了GO功能分析和KEGG通路富集分析,结果发现这些circRNA可能在肌肉发育、肌动蛋白结合、DNA结合转录激活因子活性等GO功能上富集,并且很可能通过P13K-AKT信号通路发挥作用。接下来可通过实时荧光定量实验对大量样本进行检测,进一步验证各circRNA在临床标本以及各细胞系中的表达情况,并通过在体外敲除或过表达相应circRNA,来探索膀胱癌细胞表型及其相应的信号通路的变化,使用qPCR、免疫印迹技术、荧光素酶报告基因实验等方法进一步验证各circRNA与相应的miRNA之间的海绵吸附关系,以及miRNA与mRNA的吸附关系,从而深入探讨circRNA与miRNA之间的联系以及与下游基因的协同作用。
综上所述,本研究构建了膀胱癌相关circRNA-miRNA-mRNA体系的互作网络,为揭示膀胱癌发生发展的分子水平机制提供一定的理论基础,有助于探寻新的膀胱癌候选诊断、治疗靶点,并揭示膀胱癌发生和发展过程中的生物学机制。