APP下载

circRNAs 对结直肠癌的抑制作用及其生物信息学分析

2020-12-15左海维周凤娟

吉林大学学报(医学版) 2020年6期
关键词:信号转导直肠癌通路

李 霞, 于 逸, 左海维, 周凤娟, 辛 勇

(1.徐州医科大学附属医院放疗科,江苏 徐州 221000;2.徐州医科大学生命科学学院,江苏 徐州 221000;3.徐州医科大学医学信息与工程学院,江苏 徐州 221000;4.徐州医科大学第二附属医院放疗科,江苏 徐州 221000)

结直肠癌是消化系统中最常见的恶性肿瘤之一, 其 发 病 率 在 多 种 癌 症 中 排 第4 位[1]。 环 状RNA (circular RNA, circRNA) 是一类广泛表达于真核细胞的环形RNA, 多起源于蛋白编码基因[2]。 近 年 研 究[3]显 示: circRNA 可 通 过 微 小RNA (microRNA,miRNA)“海绵” 等作用模式在基因表达中发挥重要的调控作用,且越来越多的证 据[4]表 明:circRNA 可 能 是 一 种 潜 在 的 疾 病 标志物和治疗靶点。高通量测序技术[5]发现:在结直肠癌患者肿瘤细胞和血浆中circRNA-VAPA 水平均明显升高,并且可以通过与miRNA-101 结合,呈现原癌基因活性,促进肿瘤发展。circFAT1 在结直肠癌组织中表达高于癌旁正常肠黏膜组织,体外细胞实验[5]显示:下调circFAT1 表达可明显降低肠癌细胞株迁移和侵袭能力。has_circ_0079656在结直肠癌组织中呈低表达,且随着结直肠癌病情的进展其表达水平逐步降低,其可能通过作用于HINFP 基因调控细胞周期中G1/S 期的转录过程,进而影响结直肠癌的进展[6]。与已经报道的研究不同,本课题组采用表达谱数据与生物信息分析方法发现:hsa_circ_0043278 的表达水平在结直肠癌样本中明显降低, 通过统计分析得到了与hsa_circ_0043278 结合的miRNA, 结合基因本体论(Gene Ontology,GO) 生物学功能富集分析与京都基因与基因组大百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG) 信号通路富集分析的方法,阐明hsa_circ_0043278 对Wnt 介导的细胞信号转导与PI3K-AKT 信号通路的影响, 为揭示hsa_circ_0043278 对结直肠癌发生发展的抑制作用提供依据。

1 材料与方法

1.1 GEO数据库数据筛选基因表达数据库(Gene Expression Omnibus,GEO) 由美国国立生物 技 术 信 息 中 心 (National Center for Biotechnology Information,NCBI) 创建并维护[7]。以“ 结直肠癌” 为关键词进行搜索, 可获得GSE126094 芯片数据,该芯片包含10 例结直肠癌组织样本与10 例癌旁组织样本。首先,采用Perl语言将circRNA 的名称转换为标准的circRNA ID,同时采用R 语言读取GSE126094 芯片的数据,对circRNA 的 表 达 值 进 行 以2 为 底 数 的 对 数 变 换[8],对相同的circRNA 有多个表达值数据,采用 “取平均值” 的方法合并; 使用R 语言对处理后的GSE126094 芯片数据进一步分析,得到结直肠癌组织样本与癌旁组织样本中差异表达的circRNA,界 定 条 件: |log2FC| >2 且P<0.05。 并 绘 制GSE126094 数据中差异表达circRNA 热图和GSE126094 芯片数据中差异表达circRNA 火山图。

1.2候选circRNA的生物信息学分析采用circBase 数据库(http://www.circbase.org) 确定差异表达circRNA 所在染色体的位置信息[9];采用癌症特异性circRNA 数据库(Cancer-Specific circRNA Database, CSCD) 得 到 与 差 异 表 达circRNA 结 合 的miRNA[10]; 采 用Perl 语 言 检 索miRDB 数据库(http://mirdb.org/)、miRTarBase数 据 库(http://mirtarbase.mbc.nctu.edu.tw/php/index.php) 与TargetScan 数 据 库(http://www.targetscan.org/vert_72/),得到miRNA 的靶基因,用于进一步研究。采用R 语言对预测的靶基因进行GO 富集分析与KEGG 富集分析。GO 富集分析包括分子功能(molecular function,MF)、生物学过程(biological process, BP) 与细胞成分(cellular component, CC)[11]。 KEGG 富集分析包括系统信息、 基因组信息、 化学信息和健康信息[12]。以P<0.05 判定为有统计学意义的富集。

1.3统计学分析采用RStudio 0.94.102 和ActivePerl v5.26 统计软件进行统计学分析。同一个circRNA 在结直肠癌组织与癌旁组织中表达水平的差异倍数以log2FC 表示,组间样本均数比较采用两独立样本t检验。以P<0.05 为差异有统计学意义。

2 结 果

2.1结直肠癌组织与癌旁组织中差异表达的circRNA 结直肠癌组织与癌旁组织均有10 个样本。差异表达circRNA 的认定条件:|log2FC|>2 且P<0.05,见图1 (插页八)。对GSE126094 中数据进行聚类分析, 结果表明存在差异表达的circRNAs (|log2FC|>2 且P<0.05), 见 图2 (插页八)。通过对比结直肠癌组织样本与癌旁组织样本,共筛选出59 个差异表达circRNAs (|log2FC|>2 且P<0.05)。与癌旁组织样本比较,在结直肠癌组织样本中, 表达水平升高的circRNAs 有23 个(logFC>2 且P<0.05), 表 达 水 平 下 降 的circRNAs 有36 个(logFC<-2 且P<0.05)。结直肠癌组织样本与癌旁组织样本表达差异倍数最大的是 hsa_circ_0043278 (logFC=-7.481 且P<0.05),见表1。

2.2靶基因的预测结果对hsa_circ_0043278 进一步分析。采用circBase 数据库,检索得到hsa_circ_0043278 所在染色体位置信息。利用CSCD 数据库确定与hsa_circ_0043278 结合的miRNA,结果得到66 个与hsa_circ_0043278 结合的miRNAs。具体包括hsa-miR-1207-3p、 hsa-miR-1197 和hsa-miR-561-5p 等。 编 写Perl 程 序, 对miRDB 数 据 库、miRTarBase 数据库和TargetScan 数据库分别检索,得到这66 个miRNAs 的靶基因。 10 个代表性miRNAs 与其对应的靶基因见表2。

2.3靶基因GO富集分析结果在生物学功能方面,靶基因主要参与Wnt 介导的细胞信号转导、脱磷与对肽的反应等(P<0.05);在细胞成分方面,靶基因主要定位于染色质与核染色体等(P<0.05);在分子功能方面,靶基因主要参与近端启动子序列特异性DNA 结合和染色质结合与转录辅调节活性等(P<0.05)。见图3 (封三)。

表1 结直肠癌组织和癌旁组织中部分circRNAs 表达水平差异倍数Tab.1 Difference multiples of some circRNAs expression levels in colorectal cancer tissue and adjacent cancer tissue

2.4靶基因KEGG富集分析结果利用R 语言对与hsa_circ_0043278 结合的miRNA 靶基因进行KEGG 富集分析。 共得到19 条KEGG 统计结果,靶基因主要与PI3K-AKT 信号通路、 MAPK 信号通路与调节干细胞多能性的信号通路等有关联(P<0.05)。见图4 (封三)。

表2 部分与hsa_circ_0043278 结合的miRNAs 和miRNAs 的靶基因Tab.2 Part of miRNAs combined with hsa_circ_0043278 and target genes of miRNAs

3 讨 论

结直肠癌的发病率和死亡率普遍较高。尽管许多学者与科研机构对结直肠癌的研究非常深入,但仍有超过50% 的结直肠癌患者最终死于该疾病[13]。因此, 研究结直肠癌发生发展的机制非常必要。circRNA 作为非编码RNA 的一种,因其高稳定性和组织特异性已成为近年的研究热点[14]。circRNA 作为内源性RNA 可以与其他内源性RNA 竞争结合miRNA 从而影响靶基因的表达[15]。本研究从circRNA 的角度研究结直肠癌发生发展的机制。

芯片技术具有高通量与高效率的特点,与传统生物学方法相比优势明显[16]。本研究选取了GEO数据库中结直肠癌基因芯片表达谱数据, 包括10 例结直肠癌组织样本与10 例癌旁组织样本。通过比较2 组circRNAs 表达水平,共发现59 个有统计学意义的差异表达circRNAs,其中表达水平上升的circRNAs 有23 个,表达水平下降的circRNAs有36 个。与癌旁组织样本比较,在结直肠癌组织样本中hsa_circ_0043278 表达水平降低最明显,提示hsa_circ_0043278 可能在结直肠癌中具有一定特异性。

采用Perl 语言分别检索miRDB 数据库、miRTarBase 数据库与TargetScan 数据库,得到与hsa_circ_0043278 结 合 的miRNA 的 靶 基 因。 使 用R 语言对miRNA 的靶基因进行GO 富集分析与KEGG 富集分析。GO 富集分析包括3 个层面:BP、CC 和MF[17]。GO 富 集 分 析 结 果 表 明:靶 基 因 主要参与Wnt 介导的细胞信号转导、脱磷与对肽的反应等BP。已有研究[18-19]表明:Wnt 蛋白是调节分泌的生长因子,在胚胎发育过程中能调节干细胞的增殖和分化,细胞间Wnt 信号转导表达异常与癌症的发生有密切关系。脱磷是与hsa_circ_0043278 结合的miRNA 的靶基因主要参与的BP。 因此,hsa_circ_0043278 在结直肠癌组织样本中表达水平的异常降低可能会间接影响Wnt 介导的细胞信号转导与脱磷过程, 进而减弱了对结直肠癌的抑制作用。

KEGG 富集分析表明:与Hsa_circ_0043278 结合的miRNA 的靶基因富集的通路有PI3K-AKT 信号通路、MAPK 信号通路与调节干细胞多能性的信号通路等。PI3K-AKT 信号通路作为细胞中重要的信号转导通路之一,通过影响下游多种效应分子的活化状态,发挥着促进细胞增殖和抑制凋亡的作用[20]。 已 有 研 究[21]表 明: 组 成 性 活 化 的PI3KAKT 信号通路在广泛的人类肿瘤谱中失调,原因是AKT 被过度活化以及PI3K-AKT 通路的部分调控成分突变。因此,hsa_circ_0043278 在结直肠癌组织样本中表达水平的异常降低可能会间接影响其对PI3K-AKT 信号通路的调控作用,进而减弱了对结直肠癌的抑制作用。

本研究采用生物信息学方法确定了hsa_circ_0043278 在结直肠癌组织样本中表达水平异常降低(logFC=-7.481 且 P<0.05), 提 示 hsa_circ_0043278 的正常表达或提升其表达水平可能会抑制结直肠癌的发生发展。通过GO 富集分析与KEGG富集分析阐明了hsa_circ_0043278 的作用机制:其间接影响靶基因UTP18、 CLIP4 与STC2 等的功能,进而影响对Wnt 介导的细胞信号转导与PI3KAKT 信号通路的调控作用,最终降低了对结直肠癌的抑制作用。由于样本的局限性,本研究并未对结直肠癌的发生发展机制进行进一步探索。未来,本课题组将整合更多临床样本数据,并开展相应的生物实验,进一步揭示circRNA 对结直肠癌的作用机制。

猜你喜欢

信号转导直肠癌通路
多晒太阳或可降低结直肠癌发病率
Wnt/β-catenin信号转导通路在瘢痕疙瘩形成中的作用机制研究
腹腔镜下直肠癌前侧切除术治疗直肠癌的效果观察
COXⅠ和COX Ⅲ在结直肠癌组织中的表达及其临床意义
Kisspeptin/GPR54信号通路促使性早熟形成的作用观察
益心解毒方对大鼠心肌细胞内活性氧水平及信号转导通路的影响
proBDNF-p75NTR通路抑制C6细胞增殖
GRP及GRPR在结直肠癌中的表达及意义
HGF/c—Met信号转导通路在结直肠癌肝转移中的作用
通路快建林翰:对重模式应有再认识