APP下载

基于TCGA数据对60岁以上不同分层急性髓系白血病患者相关lncRNA的基因信息学分析

2020-07-27徐焕铭

现代检验医学杂志 2020年3期
关键词:白血病高龄通路

李 悦,徐焕铭,樊 华

(中国医科大学附属第四医院血液内科,沈阳 110011)

急性髓系白血病(acute myeloid leukemia, AML)是造血系统的一种侵袭性恶性肿瘤,由造血干细胞或造血祖细胞恶性转化引起。AML 是老年人高发的一种恶性肿瘤性疾病,中位年龄为65~70 岁。但由于其具有独特的临床及生物学特点,化疗缓解率仅为 45%,5年生存率为10%左右,早期死亡率却高达30%[1]。近年来,虽然针对白血病的研究取得不断进展,但仍面临着严峻的挑战。随着测序技术的发展,白血病相关基因日益受到人们的关注,其中的长链非编码RNA(long non-coding RNA,IncRNA)成为白血病研究的热点[2]。lncRNA 可以在多种癌症中异常表达,并在促进和维持肿瘤的发生发展中发挥重要的作用,显示了其作为生物标志物和治疗靶点的临床潜力[3]。目前有证据表明lncRNA 的失调可能会导致白血病的发生和进展[4]。lncRNA 可以和microRNA(miRNA)相互作用,作为一种相互竞争的内源性RNA(competing endogenous RNA,ceRNA)来调节靶基因的表达,这在恶性血液病的起源和发展中扮演着重要的角色[5]。由美国政府发起的肿瘤基因组图谱数据库(the cancer genome atlas, TCGA)计划,通过应用基因测序技术,绘制人类全部癌症的基因组变异。本文下载了TCGA 数据库中的老年AML 患者数据,利用R 语言进行系统分析,并通过功能富集分析揭示其内在机制及其预后价值。

1 材料与方法

1.1 资料来源

1.1.1 数据的获得:通过TCGA 数据库网站(https://tcga-data.nci.nih.gov/tcga/) 获 取AML 患 者的RNA 测序数据(RNA- seq)及相对应的临床数据,用于mRNA 和lncRNA 的差异分析。同时获得AML miRNA-seq 数据进行miRNA 的差异分析。lncRNA,mRNA 和miRNA 序列数据均来源于Illumina HiSeqRNASeq 和Illumina HiSeqmiRNASeq平台。

1.1.2 纳入和排除标准:首先,筛选出年龄大于60岁的患者标本,其中mRNA 和lncRNA 数据各61 份,miRNA 数据40 份。然后,根据2019 版美国国立综合癌症网络(NCCN)指南[高危层次的分层标准为:①t(8;21)(q22;q22.1);②RUNX1-RUNX1T1 突 变;③inv(16)(p13.1q22)或t(16;16)(p13.1;q22);④CBFBMYH11,NPM1 突变,伴或不伴FLT3-ITD,CEBPA 双等位基因突变]将收集到的RNA-Seq 数据分为31 例高危老年AML 样本和30 例低中危老年AML 样本,同时获得15 例高危老年AML miRNAs 样本和25 例低中危老年AML miRNAs 样本。

1.2 方法

1.2.1 分析差异表达基因:根据Ensembl 数据库(http://www. Ensembl.org/index.html)中的注释对差异表达的lncRNA 和mRNA 进行定义和分类。利用R 平台上的“gplot”和“heatmap”包生成差异表达RNA 的热图及火山图。

1.2.3 构建ceRNA 网络:从miRcode (http://www.mircode.org/)下载实验验证的miRNA -靶基因信息,miRNA-lncRNA 互作数据。为了进一步研究lncRNA 的功能作用,本实验同时应用Diana tool (http://carolina.imis.athena-innovation.gr/diana_tools/)和TargetScan (http://www.targetscan.org)两种方法预测miRNA 的假设靶基因。通过这两种预测方法得到的靶基因的交集,以剩下尽可能少量的预测靶基因进行下一步分析。

1.2.4 构建PPI 网络及功能富集分析:通过DAVID (http://www.david.abcc.ncifcrf.gov/)进行基因本体论(GO)分析和京都基因与基因组百科全书(KEGG)分析并探讨了靶基因的功能作用。为了阐明DEmRNAs 的潜在关系,使用 String (v10.5, https://string-db.org/cgi/input.pl)构建蛋白-蛋白相互作用(PPI)网络,并用Cytoscape3.6.1 将其可视化。

1.3 统计学分析

1.3.1 差异表达基因分析:利用R 语言中的“edgeR”包进一步分析数据,得到差异表达的lncRNA(differently expression lncRNA, DElncRNA),差异表达的mRNA (differently expression mRNA,DEmRNA)和差异表达的miRNA (differently expression miRNA, DEmiRNA)。设置阈值为|log2 FC|> 2 和P< 0.05。

1.3.2 生存分析:为了确定高危高龄AML 和低中危高龄AML 患者中差异表达的lncRNA 的预后价值,本实验使用R 语言中的“survival”包对在差异lncRNAs 进行生存分析。使用“survival”进行log-rank 检验,绘制Kaplan-Meier 生存曲线。P<0.05 为差异有统计学意义。

2 结果

2.1 APL 和AML 中 的DElncRNA,DEmiRNA 和DEmRNA 利用R 软件中的“edgeR”软件包,设定阈值为|log2 (FC)|> 2 和调整P值< 0.05 后,在31例高危AML 组织和30 例中低危AML 组织中发现了明显存在差异表达的基因。共有108个DElncRNAs(77 个在高龄高危AML 样本中上调,31 个在高龄高危AML 样本中下调),468 个DEmRNAs(342 个在高龄高危AML 组织中上调和126 个在高龄高危AML 组织中下调),和16 个DEmiRNAs(9 个在高龄高危AML 组织中上调和7个在高龄高危AML 组织中下调)。

2.2 108个De lncRNAs 生存分析 见图1。以Kaplan- Meier 曲线分析方法来检测DElncRNA 与高龄AML 患者预后情况的相关性,设置P<0.01为筛选标准,最终发现与肝癌预后相关的10个lncRNA。在这10 个DElncRNAs 中,9 个 lncRNA(AC009154.1, AC011124.1, AC093627.2, AC144450.1, AL035691.1, AL355974.2, AL441943.2, LINC00703 和LINC01612)与预后呈负相关性。1个lncRNAs (AC103702.2)与预后呈正相关性。

图1 10 种DelncRNAs 与总生存率存在显著相关性的Kaplan- Meier 曲线

2.3 构建ceRNA网络 根据对108 个DElncRNAs在miRcode 数据库检索到的相关的miRNA信息,确定17对相互作用的lncRNAs 和miRNAs。使用DIANA工具和TargetScan数据库, 从17个miRNAs 寻找靶向mRNA。去除不包括在DEmRNAs 中的靶向mRNAs,并使用Cytoscape v3.5.1 进行可视化。最终筛选得出在两个数据集中均存在的目标基因,得出有22 个DEmRNAs 包含于ceRNA 网络。该ceRNA 网络中共识别了12 个lncRNA 节点(见表1),11 个miRNA 节点,22个mRNA 节点作为差异表达谱。

2.4 ceRNA 网络中DEmRNA 的功能分析 通过GO 和KEGG 分析进一步探讨22 个DEmRNAs 的生物学功能,见表2。这些DEmRNAs 在4 个GO通路分类中得到富集(P< 0.05)。生物学过程中富集量最大的是“胚胎骨骼系统”,分子功能中富集量最大的是“序列特异性DNA 结合蛋白”。

表1 ceRNA 网络中的差异lncRNA

图2 468 个DEmRNA KEGG 通路富集结果,A~V 为相对应得条目名称

表2 22 个DEmRNAs GO 富集结果

KEGG 通路分析获得出IL12B, COL11A1 显著富集于“阿米巴病”通路(P≈0.090 6)。同时,也进行了全部468 个DEmRNAs的GO 和KEGG富集分析。结果显示,这些DEmRNAs 可以在121条GO 通路分类中得到富集(P< 0.05),见表3。生物学过程中富集量排在前3 位的是“信号传导”、“细胞黏附”、“蛋白质水解”。分子功能中富集量排在前3 位的是“锌离子结合”、“序列特异性DNA 结合蛋白”、“钙离子结合”。而在细胞成分中富集量前3 位的为“膜的组成部分”,“胞外区”和“原生质膜的组成部分”。KEGG 通路分析获得22 条显著富集的通路,其中“慢性吗啡中毒”、“尼古丁上瘾”和“逆行神经的信号”排在前3 位,见图2。

表3 468 个DEmRNA 的GO 的富集分析结果

3 讨论

急性髓系白血病是成年人最常见的急性白血病,发病率为每年2 ~4/10 万人[6]。它主要是老年人的一种疾病,诊断时的中位年龄为72 岁。目前的高强度治疗方法下,在年龄相对较大的60 岁以上患者中,只有15%的患者可以达到长期缓解[7]。老年AML 患者的治疗相当具有挑战性,年龄越大,预后越差。

长链非编码RNA 是指长度超过200 个核苷酸,缺乏蛋白编码能力的RNA 转录本[8]。目前,越来越多的研究表明,lncRNA 可能在表观遗传学上,转录及转录后水平调控基因的表达,特别是在肿瘤的发生发展过程中很可能扮演着非常重要的角色[9-10]。毋庸置疑,若能深入研究lncRNA 在高龄高危AML 患者中的发生发展机制,找到适当的lncRNA 作为治疗靶点或作为新的个体化治疗的标志,对其预防、诊断及治疗都有着非常重要的意义。lncRNA 可以在多种癌症中异常表达,并在促进和维持肿瘤的发生发展中发挥重要的作用,显示了其作为生物标志物和治疗靶点的临床潜力[11-12]。

本研究获得了31 例高危老年AML 患者和30 例低中危老年AML 患者组织中的mRNA 和lncRNA差异表达情况,以及相对应的40 例AML 患者的miRNA 差异基因表达情况。然后又通过可视化的软件Cytoscape 建立了ceRNA 网络,揭示了三者之间相互作用的关系。生存分析的使用可以了解哪些基因与高龄白血病的生存和预后有关,为下一步的实验提供依据。目前有证据表明lncRNA 的失调可能会导致白血病的发生和进展[13]。如LEI 等[14]发现高表达lncRNA LOC285758 与AML 患者预后不良有关。LOC285758 可以通过增强致癌关键因子HDAC2 的表达来调控AML 细胞株的增殖,从而对AML 细胞株产生影响。而在本研究中参与构建ceRNA 网络 的12 个 差 异lncRNA 中,SOX21-AS1 是 一 种2 986 bp长的非编码RNA,与人类染色体13q32.1上的SOX21 具有双向启动子。此外,SOX21- as1和SOX21 上游有一个富含CpG 的区域,这意味着它们的转录活性可能通过DNA 甲基化来控制[15]。SOX21-AS1 在肝癌、宫颈癌等疾病中均有相关机制报道[16-17],在AML 领域的研究还有待进一步的深入。在ceRNA 网络中,lncRNA 可以作为miRNA“海绵”,对miRNA 的作用有抑制作用。在本研究得出的ceRNA 网络中,除lncRNA 外,与12 个lncRNA有较强相互作用关系的miRNA,如hsa-miR-1275, hsamir-139, hsa-mir-30a 等均有对AML 预后有影响的报道。其中OZDOGAN 等[18]的研究项目中证实hsamir-30a,hsa-miR-1275 等异常miRNA 的表达可使MDS 和AML 患者间充质干细胞中DICER1 基因表达减低。部分差异表达的miRNA 提示DICER1 可能参与了MDS 和AML 的发病机制。而mir-139 的异位表达抑制了正常CD34+造血干细胞和祖细胞的增殖,干扰了骨髓细胞的体外分化。在机制上,miR-139 通过抑制翻译起始因子EIF4G2 发挥其作用,从而降低整体蛋白合成,同时特异性诱导细胞周期抑制剂p27(Kip1)的翻译。此外,miR-139-5p 表达升高与165 例儿童AML 患者的良好预后相关[19]。而这些miRNA 具体是怎样受到lncRNA 的影响从而发挥作用,还需深入的研究,这也是下一步研究的方向。

总而言之,本次研究发现lncRNA 分子标签的预测模型具有较为良好的效能,可以对60 岁以上AML 患者的预后情况进行有效预测。而针对lncRNA 的AML 相关研究对AML 患者的随访、治疗及预后的判断有重要意义,这也进一步表明通过干预lncRNA 的表达可能成为高龄高危AML 患者病程发展的方法。

猜你喜欢

白血病高龄通路
白血病“造访”,人体会有哪些信号?
小檗碱治疗非酒精性脂肪肝病相关通路的研究进展
Wnt/β-catenin信号转导通路在瘢痕疙瘩形成中的作用机制研究
高龄孕妇妊娠中期产前诊断中唐氏筛查的应用
白芍总苷调控Sirt1/Foxo1通路对慢性心力衰竭大鼠的保护作用研究
走进儿童白血病的世界
石台行
SphK/S1P信号通路与肾脏炎症研究进展
阅读理解Ⅰ
白血病·患儿