基于GEO数据库分析circRNAs在胃癌组织中的表达
2021-01-09姜林宏张鹤达钟山亮唐金海
姜林宏, 张鹤达, 钟山亮, 唐金海
胃癌是世界上大多数地区的一个重要的公共卫生问题[1-3],给世界各地带来了巨大的健康负担,尤其在中国[4]。据统计,2018年全球约有1 033 701例胃癌新发患者和782 685例胃癌死亡患者,在所有癌症中,胃癌的发病率和死亡率分别排在第五位和第三位[5]。目前尽管手术和辅助治疗方法都有所改进,但胃癌患者的临床治疗效果仍然很差,研究显示胃癌患者的5年总生存率一般低于30%[4],因此有必要进一步探索胃癌的发生发展机制,提供更积极、有效的治疗新思路。
环状RNA是一类结构稳定、组织特异性高的内源性RNA,它们将两个碱性末端以共价键的形式结合形成一个闭合的圆环,使其具有相对稳定的结构[6]。研究发现环状RNA在多种肿瘤中异常表达,包括乳腺癌[7]、肺癌[8]、肝癌[9]、结直肠癌[10]及胰腺癌[11]等。最新研究显示环状RNA富含miRNA结合位点,起到miRNA海绵的作用,从而在转录或转录后水平上调控基因的表达[12-17],如circRNA_001569过表达通过调控miR-145/NR4A2轴增强胃癌细胞活力,减少胃癌细胞凋亡[18];circRNA_100269通过靶向结合miR-630抑制胃癌细胞的增殖[19]。因此从环状RNA角度进一步筛选胃癌相关的新型靶点,并深入探讨其可能的分子机制,可能为胃癌的临床诊疗提供新的治疗方案。本研究通过从GEO数据库中下载微阵列数据,探索环状RNA在胃癌中的作用,以期为胃癌的生物学研究提供新的标志物。
1 材料与方法
1.1 微阵列数据 从GEO数据库(http://www.ncbi.nlm.nih.gov/geo)下载原始基因表达谱GSE78092(海南医科大学附属医院)、GSE89143(宁波大学医学院附属医院)和GSE83521(南方医科大学南方医院)。从上述3个数据库中共获得了12对胃癌组织和12对癌旁组织,通过GEO2R在线分析工具(https://www.ncbi.nlm.nih.gov/geo/geo2r/)进行数据分析,并利用维恩图在线工具(bioinformatics.psb.ugent.be/webtools/Venn/)鉴定数据的一致性。将调整后P<0.05和差异倍数(Fold change,FC)≥2作为标准进行差异筛选,再次利用维恩图在线工具筛选交集部分。
1.2 环状RNA/miRNAs的相互作用 利用miRanda软件和RNAhybrid软件预测环状RNA可能结合的miRNAs。采用Cytoscape软件构建环状RNA/miRNAs相互作用网络图。
1.3 亲本基因在胃癌中的表达 采用UALCAN在线软件(源于TCGA数据库)分析环状RNA的亲本基因在胃癌组织中的表达,预测该环状RNA与亲本基因的关系。
2 结果
2.1 筛选差异表达的共同环状RNA 通过对数据库GSE78092、GSE89143和GSE83521进行合并分析,发现共有1 708个环状RNA,至少2个数据库都存在的环状RNA有343个,其中15个环状RNA为3个数据库共同包含(图1A)。进行差异筛选后,发现共有508个差异表达的环状RNA,至少2个数据库都存在的环状RNA有31个,其中2个环状RNA为3个数据库共同包含(图1B)。但在差异表达的环状RNA中,有10个环状RNA在上述数据库中表达不一致,分别为hsa_circ_0092360、hsa_circ_0059369、hsa_circ_0032683、hsa_circ_0009594、hsa_circ_0007518、hsa_circ_0005927、hsa_circ_0005051、hsa_circ_0001789、hsa_circ_0000554和hsa_circ_0000519(图1C)。将上述10个环状RNA去除后再次分析,发现在胃癌组织中上调的环状RNA有125个,下调的373个,其中至少2个数据库都存在的环状RNA有21个,且只有hsa_circ_0050102表达上调,另外hsa_circ_0067934和hsa_circ_0013048是3个数据库中均包含的,且在胃癌组织中表达下调(图1D,表1)。
1A:对3个GEO数据中所有环状RNA进行整合分析;1B:所有差异表达的环状RNA在3个GEO数据中的分布;1C:10个环状RNA在上述数据库中表达不一致(蓝色椭圆形代表在GSE78092中上调;蓝色六边形代表在GSE89143中上调;黄绿色矩形代表在GSE83521中上调);1D:至少两个数据库都包含的在胃癌中差异表达的环状RNA(红色代表上调,蓝色代表下调)
表1 在胃癌组织中差异表达的环状RNA
2.2 预测差异表达的环状RNA与miRNA的相互作用 通过上述筛选得出hsa_circ_0013048和hsa_circ_0067934为3个数据库共同包含的环状RNA,因此特异性相对较高。在其他下调的环状RNA中,以差异倍数<0.4、长度小于500 bp作为筛选条件,再次选择hsa_circ_0000981、hsa_circ_0005273、hsa_circ_0018004和hsa_circ_0092337进行后续探究。根据种子区碱基互补配对,本研究预测环状RNA可能结合的miRNAs,并构建环状RNA/miRNAs之间的网络图(图2)。结果显示hsa_circ_0092337预测的miRNAs最多,达55个,且与hsa_circ_0018004有两个共同的miRNAs,分别是miR-6775-5p和miR-5090。其次是hsa_circ_0005273,可与46个miRNAs结合,其中与hsa_circ_0013048有一个共同的miRNA:miR-3187-5p。而共同上调的环状RNA为hsa_circ_0050102,其长度为7 604 bp,序列太长可能导致其功能单一性较差,因此本研究未预测其可能结合的miRNAs。
图2 预测胃癌组织中部分下调的环状RNA与miRNAs的相互作用
2.3 环状RNA与其亲本基因的关系 通过TCGA数据库分析发现,胃腺癌组织与其癌旁组织的RPL13、LPHN2和PGPEP1表达无明显差异(图3A);而PRKCI、LAPTM4A、PTK2和PDSS1在胃腺癌组织中的表达高于癌旁组织(图3B)。
3A:hsa_circ_0092337、hsa_circ_0013048和hsa_circ_0050102的亲本基因在胃癌组织和癌旁组织中的表达;3B:hsa_circ_0067934、hsa_circ_0000981、hsa_circ_0005273和hsa_circ_0018004的亲本基因在胃癌组织和癌旁组织中的表达
3 讨论
环状RNA在各种生物体内广泛存在,且在肿瘤组织中特异表达,因此其可能成为潜在的生物学标志[19]。环状RNA在肿瘤中广泛参与细胞的生物学功能,包括细胞增殖、分化、转移和凋亡[20],如hsa_circ_0072309通过海绵miR-492抑制乳腺癌细胞的增殖和侵袭[21];circRNA_100290通过竞争性海绵miR-516b上调了FZD4的表达,从而激活Wnt/β-catenin通路,进而促进结直肠癌细胞的增殖、侵袭,抑制结直肠癌细胞凋亡[22]。然而环状RNA在胃癌中的潜在作用机制仍需进一步研究。本研究主要分析GEO数据库中环状RNA在胃癌组织中的表达情况,并筛选出共同差异表达的环状RNA,通过对3个数据库进行合并分析,发现在胃癌组织中共有1 708个环状RNA,其中至少两个数据库都存在的环状RNA有343个,但只有15个环状RNA为3个数据库共同包含,说明环状RNA在不同的胃癌组织中分布差异较大,具有较高的人群差异性。进一步分析发现,在胃癌组织中,差异表达的环状RNA共有508个,其中至少两个数据库都存在的环状RNA有31个,其中2个环状RNA为3个数据库共同包含。但本研究发现同一环状RNA在不同胃癌组织中表达趋势相反,因此尚需在更多的胃癌组织中以及在相应的细胞层面上进行后续实验证实。将上述可疑表达的环状RNA剔除后,共有498个差异表达的环状RNA,其中上调的有125个,下调的373个。其中hsa_circ_0067934和hsa_circ_0013048是三个数据库中均包含的,暗示其在胃癌组织中表达特异性相对较高。有研究发现环状RNA主要通过竞争性结合miRNA影响下游靶基因的表达,进而调控细胞的功能[8,12]。因此本研究进一步对环状RNA可能结合的miRNAs进行了预测,并构建环状RNA/miRNAs网络图,结果提示hsa_circ_0092337和hsa_circ_0005273预测的miRNAs最多,且与其他环状RNA存在共同联系的miRNAs,但其与miRNAs之间的联系以及与环状RNA的协同作用仍需通过后续实验验证。
此外,还有研究发现外显子-内含子circRNAs(EIciRNAs)如circEIF3J和circPAIP2可以通过与U1 snRNP结合形成复合物,进而促进其亲本基因的表达[23]。然而本研究通过TCGA数据库分析发现,RPL13、LPHN2和PGPEP1在胃腺癌组织中的表达与癌旁组织无明显差异;而PRKCI、LAPTM4A、PTK2和PDSS1在胃腺癌组织中的表达却高于癌旁组织,暗示这些环状RNA可能与其亲本基因无明显关系,但仍需进一步实验鉴定他们之间的关系。