长链非编码RNA IRAIN在肿瘤中的研究进展
2020-03-02吕逸竹王海娜高贝贝闫金松
吕逸竹,谢 芳,王海娜,黄 丹,高贝贝,闫金松
(大连医科大学附属第二医院 血液科,大连市血液病重点实验室,辽宁省造血干细胞移植医学中心,辽宁省造血干细胞移植临床转化医学研究重点实验室,辽宁 大连116027)
肿瘤是一种发生机制复杂的恶性疾病,遗传学的改变只反映了其发病机制的一部分。研究发现胰岛素样生长因子1受体(IGF1R)的失调与恶性肿瘤的进展和治疗耐药性有关。 在急性粒细胞白血病(AML)中,IGF1R是磷酸化受体酪氨酸激酶最丰富的一种,它通过PI3K/Akt信号通路促进细胞生长。IGF1R是目前公认的治疗肿瘤的靶基因之一。针对IGF1R的靶向治疗药物,包括那些使用单克隆抗体和小分子抑制IGF1R酪氨酸激酶的药物已经进行了许多临床试验,但是,关于肿瘤中IGF1R基因失调的分子机制知之甚少。新近研究发现长链非编码RNA(long noncoding RNAs,lncRNAs)可能通过调控肿瘤细胞的细胞生物学行为参与肿瘤的发生发展[1-2],但其对IGF1R的调控鲜见报道。 IGF1R反义基因内非编码RNA (IRAIN,又称RP11-35O15.1,Ensembl号: ENSG00000259424)是一种新发现的非编码RNA,由胰岛素样生长因子1受体(IGF1R)反义表达而成,通过直接与IGF1R启动子竞争性反义转录而抑制IGF1R的表达。近几年发现IRAIN在多种肿瘤中表达异常,并通过不同的作用机制参与肿瘤的发生发展,现将IRAIN在肿瘤中的作用及研究进展作一综述。
1 长链非编码概述及IRAIN简介
1.1 LncRNA概述
随着新一代测序技术的广泛应用,人们发现只有2%左右的基因组RNA具有编码蛋白的功能,而大部分基因组不具有翻译蛋白的功能。这些非编码RNA(ncRNA)根据其大小分为小非编码RNA(<200个核苷酸的ncRNA)和长链非编码RNA(超过200个核苷酸的ncRNA)。通过哺乳动物转录组测序发现,lncRNA基因的数量几乎是蛋白质编码基因的3倍[3]。根据lncRNA的基因组定位、作用方式和功能将其分为以下几类:内含子lncRNAs(intronic lncRNAs)来自蛋白质编码基因的内含子;基因间lncRNAs(intergenic lncRNAs,lincRNAs)起源于两个蛋白质编码基因之间的区域;增强子lncRNAs(enhancer lncRNAs,elncRNAs)来源于启动子增强子区域;双向lncRNAs(bidirectional lncRNAs)定位在相反链的编码转录本附近;有义重叠lncRNAs(sense overlapping lncRNAs)在DNA的有义链中与一个或多个不同蛋白质编码基因的内含子和外显子重叠[4]。在功能上,lncRNAs被分为信号传导、诱饵、向导和支架lncRNA。参与信号传导的lncRNAs与特定的信号传递通路相关,无论其在信号传递过程中的作用(直接/间接)如何,其表达表明一个活跃的信号传递事件。例如HOTAIR和LncRNA ROR,可以作为分子信号与特定信号通路整合。诱饵lncRNAs的作用就像转录因子和阻遏物的分子集。例如GAS5和TERRA,它们与转录因子相互作用,使其不与靶基因启动子结合,从而促进基因激活或沉默。向导lncRNAs,例如AIR、CCND1和lincRNA-p21等,与酶活性蛋白复合物结合,并将其引导至特定的靶基因启动子或调节下游信号传递事件和基因表达的基因组位点。支架lncRNAs,例如HOTAIR和TERC等,充当各种蛋白质复合物联系的枢纽,使其定向到特定的基因组位置或调节基因表达和染色体动力学的靶基因启动子[4]。LncRNAs还可以作为竞争性内源(ce)RNA,隔离特定的miRNAs远离其靶基因,从而抑制miRNA介导的功能。近年来,越来越多的证据表明lncRNAs在基因表达调控中发挥重要作用,并参与肿瘤发生和肿瘤进展。在多种恶性肿瘤中发现lncRNAs表达异常,例如,长链非编码RNA HOTAIR在原发性和转移性肿瘤,如肝癌和胃肠道肿瘤中的表达增加。一些lncRNAs在复发性肿瘤中发挥重要作用,如H19和HOTAIRM1在复发性胶质瘤中表达增加[5]。有荟萃分析报道lncRNA MALAT1的高表达对非小细胞肺癌和胰腺癌患者总体生存期和预后是不利因素。另外,lncRNA TUG1 和PANDAR也参与了非小细胞肺癌的进展[5]。因此,肿瘤相关lncRNAs的鉴定和研究可能成为肿瘤新的预后生物标志物或新的治疗靶点,并因此而完善一些肿瘤的新治疗策略。
1.2 IRAIN
长链非编码RNA IRAIN 为一种新发现的基因内长链非编码 RNA。它位于染色体15q26.3中,全长5.4 kb。在2014年末IRAIN被世界权威的美国国立生物信息中心基因库(Gene bank)验证通过并收录(Gene ID:104472848)[6]。IRAIN是胰岛素样生长因子1受体(IGF1R)反义表达的印迹基因,它是从IGF1R基因第一个内含子启动子区的父本等位基因转录而来,具有进化保守性。利用Genotype Tissue Expression (GTEx) 项目网站工具分析IRAIN组织表达特异性,发现在正常人垂体、卵巢及睾丸等组织中IRAIN呈高表达,肾、肌肉等组织中呈低表达(https://gtexportal.org/home/gene/ENSG00000259424)。研究发现IRAIN存在一个单核苷酸多态性(SNP)rs8034564,其单等位基因在两个亲本等位基因中表达不均衡,其中“A”等位基因较“G”等位基因优势表达。IRAIN能够与染色质、DNA相互作用,促进染色体内增强子-启动子环的形成,调节IGF1R的表达。IGF1/IGF1R信号通路是调控肿瘤细胞生长的重要通路之一,该通路的过度激活参与肿瘤细胞的增殖、凋亡和迁移。新近研究发现IRAIN在多个正常组织,例如人体乳腺、心脏、子宫等中呈单等位基因表达,而在正常人及白血病患者家族调查结果提示为父本等位基因表达,而母本等位基因沉默,进一步的研究数据提示IRAIN发挥作用与其启动子甲基化水平密切相关[6]。
2 肿瘤中的IRAIN与IGF1R
2.1 IGF1R
胰岛素样生长因子系统,包括I型IGF受体IGF1R和促有丝分裂配体IGF1和IGF2[7]。IGF1R位于15号染色体,是肿瘤中磷酸化最多的酪氨酸激酶受体之一。研究发现IGF1R在白血病、乳腺癌等多种肿瘤中过表达并被激活,这可能是由于配体和受体过度表达,肿瘤抑制因子丢失或IGF2杂合性所导致。此外,IGF1R的增强活化与抗表皮生长因子受体(EGFR)治疗的耐药和结直肠癌的预后不良有关[7]。IGF1R被认为是最常见的原癌基因之一。
2.2 IRAIN的作用机制
目前为止,已经针对IGF1R进行了大量的临床实验,如观察单克隆抗体和小分子抑制剂抑制IGF1R酪氨酸激酶的药物的疗效和安全性的研究,以发现新的治疗药物和治疗策略。然而,关于IGF1R在肿瘤中的调控机制知之甚少。Sun等[8]利用RNA引导的染色质构象捕获方法(R3C),证明了来自IGF1R启动子的长链非编码RNA IRAIN的存在。IRAIN的全长是5.4 kb,使用软件预测IRAIN没有开放阅读框架(open reading frame, ORF)[9-10]。IGF1R/IRAIN基因座的表达模式与小鼠的Igf2r/Airn印迹基因座非常相似,其中Airn被印记并且lncRNA Airn以顺式作用调节Igf2r编码RNA的等位基因表达。通过在白血病细胞系KG-1和KG-1a中的研究,发现IRAIN是遗传印记单等位基因表达。随后对1例正常人和2例白血病患者家族样本进行分析,发现IRAIN表达均来自于父本等位基因,而母本等位基因表达沉默。总之,这些数据表明IRAIN是一个印记基因,父本等位基因表达,母本等位基因被抑制。印迹基因通常由印迹控制区(ICR)中的差异甲基化区域(DMR)调节。IRAIN启动子富含CpG二核苷酸,利用重亚硫酸盐测序发现,在正常造血干细胞和KG-1细胞中,IRAIN的启动子区存在半甲基化;在K562细胞中存在完全甲基化。应用去甲基化药物5-氮杂胞苷处理K562细胞后,IRAIN的表达轻度升高;同样,在K562细胞中加入化疗药物阿糖胞苷也可以增加IRAIN的表达[8]。利用染色质免疫共沉淀(ChIP)技术检测IRAIN启动子中的组蛋白甲基化,用针对H3K4,H3K9和H3K27的甲基化抗体进行免疫沉淀后,使用PCR扩增染色质DNA,结果没有检测到两个等位基因之间组蛋白甲基化产物的等位基因差异,排除了启动子中的组蛋白甲基化对IRAIN等位基因表达的调控作用。这提示DNA甲基化可能是调控IRAIN遗传印记表达的机制。目前的研究显示lncRNAs调控基因表达的一种重要方式就是可以通过顺式作用抑制相邻基因的表达。Sun等[8]利用“核lncRNA逆转录相关诱捕(RAT)”测定法,发现在KG-1和K562细胞中,IRAIN能够与IGF1R的启动子区和内在增强子相互作用。IRAIN可作为支架连接这些远距离DNA区域形成一个染色体内的环,从而反向调控IGF1R的表达,因此敲减IRAIN会消除这种染色体内的相互作用[8]。然而,在IGF1R/IRAIN基因位点中,IRAIN是父本单等位基因表达,而IGF1R编码RNA是双等位基因表达的,因此目前,尚不清楚这两种RNA如何以不同的方式表达。
图1 IRAIN的基因信息[9-10]Fig 1 Genetic information of IRAIN[9-10]
3 IRAIN在肿瘤中表达与调控紊乱
3.1 白血病
白血病是以造血干细胞和祖细胞无限制增殖为特点的恶性克隆性疾病,是儿童和青年中常见的恶性肿瘤之一。根据白血病细胞的成熟程度和自然病程,分为急性和慢性白血病,而根据细胞来源又分为粒细胞白血病和淋巴细胞白血病。近年来,白血病的发病率逐年上升,但其具体发病机制至今尚不明确,越来越多的研究证据表明,lncRNAs可能与白血病分型相关,例如与急性粒细胞白血病(AML)相关的MEG3、RUNXOR、NEAT1、LLEST和UCA1;与急性淋巴细胞白血病(ALL)有关的如LUNAR1和T-ALL-R-LncR1;与慢性粒细胞白血病(CML)有关的如LncRNA-BGL3、H19和MEG3;慢性淋巴细胞白血病(CLL)涉及的长链非编码RNA包括lincRNA-p21、DLEU1/DLEU2和TRERNA1等[11]。总之,lncRNAs是白血病诊断、预后及治疗(提供新靶点)的潜在工具。
IGF1R经常在实体瘤和造血系统恶性肿瘤中过表达,参与肿瘤细胞增殖,存活,代谢和转移的调节。研究发现,与IGF1R相比IRAIN在白血病细胞系表达较低,在AML患者样本中,低危组IRAIN的表达高于高危组,比正常受试者更高[8]。与完全缓解患者相比,化疗难治的患者和随后复发的患者初始IRAIN表达较低。Pashaiefar等[13]利用IRAIN表达水平的中位数将非M3 AML患者分为IRAIN低表达组和IRAIN高表达组,发现其表达水平与年龄、性别、红细胞计数、血小板计数、核型分类以及FLT3/NPM1基因突变无相关性,但是与FAB分型具有相关性,其在M2和M4型AML中表达最高[12]。此外,IRAIN低表达组具有更高的白细胞数和骨髓原始细胞数,并且他们的总生存期(OS)和无复发生存期(RFS)时间也明显缩短。多变量分析进一步确定IRAIN转录水平可以作为评估RFS和OS的独立预后因素[12]。综合上述研究数据,提示IRAIN在AML中发挥抑癌基因的作用。
3.2 乳腺癌
乳腺癌是女性最常见的恶性肿瘤,使用抗人表皮生长因子受体2(HER2)抗体赫赛汀能够成功治疗HER2阳性的早期和转移性乳腺癌。然而,在治疗过程中,仍有一部分HER2阳性乳腺癌患者对赫赛汀产生耐药[7]。一些报告表明lncRNAs是乳腺癌进展的关键调节因子,如HOTAIR、lncRNA ROR、lncRNA 00617、CCAT2、lncRNA SOX2OT、GAS5和MALAT[13]。长链非编码RNA IRAIN是单等位基因表达,它的启动子区富含CpG岛,在MCF7和MDA-MB-231两株乳腺癌细胞系中,IRAIN的启动子区未完全甲基化[7]。IRAIN在乳腺癌细胞中低表达,而IGF1R过度表达,导致IGF1R/IRAIN比率异常,促进肿瘤生长[14]。使用CRISPR-Cas9基因编辑来靶向IRAIN的启动子,发现在靶向克隆中,IRAIN可以与IGF1R正义链mRNA的启动子顺式竞争。IGF1R/IRAIN转录的正常化抑制了乳腺癌细胞中的IGF1R信号通路,降低了细胞增殖,使细胞周期停滞在S期,抑制肿瘤球形成以及肿瘤转移和侵袭[14]。Pian 等[13]利用RAT方法来鉴定与IRAIN相关的基因网络,筛选出一些与肿瘤发生发展相关的基因。然后利用qPCR来检测靶细胞中几种IRAIN靶基因的mRNA丰度,包括NM23、RHOG、PID1、IGF2R和FKBP2。发现在MDA-MB-231细胞中过表达IRAIN可以上调NM23和FKBP2[14],提示IRAIN可能通过调控其下游的靶基因来发挥调控肿瘤生长的作用。
3.3 肺 癌
肺癌是全世界肿瘤患者最常见的死亡原因之一,中国城市和农村地区肺癌的发病率也显著增加[5]。科学家发现一些lncRNAs参与了肺癌的进展,例如ZXF1 、GHSROS 、MVIH 和MEG3等[2]。研究发现长链非编码RNA IRAIN在非小细胞肺癌(NSCLC)组织中显著增加,在NSCLC细胞系A549中敲减IRAIN,可以通过阻断G1期来抑制细胞增殖。然而IRAIN对细胞凋亡和细胞迁移没有影响[5],这提示IRAIN在NSCLC的发生和进展中发挥重要作用。Feng等[5]通过评估IRAIN的表达与临床病理参数(即年龄,性别,吸烟状况,肿瘤大小,组织学类型,肿瘤分期,肿瘤分级和淋巴结转移)之间的相关性来评估其临床意义,发现NSCLC中的IRAIN表达水平与吸烟状态和肿瘤大小显著正相关,与其他临床特征如年龄、性别、组织学类型、肿瘤分期、分级和淋巴结转移无关。这些结果表明IRAIN作为一种新的促癌基因在NSCLC的肿瘤发生中起着至关重要的作用。
3.4 胰腺癌
胰腺癌是癌症死亡的第四大常见原因,其5年相对存活率目前仅为7%,且胰腺癌的研究进展十分缓慢。胰腺癌预后不良的原因包括胰腺肿瘤复杂的生物学特性、早期发生转移、诊断时已为晚期、以及现有疗法的疗效有限[14]。最近,一些lncRNAs如MALAT1和AFAP1AS1已证实在胰腺癌的进展中发挥重要促进作用。研究发现IRAIN在胰腺癌中表达显著增加,并且在肿瘤较大,病理分期较高和淋巴结转移的患者中IRAIN表达明显升高。Lian等[14]在胰腺癌细胞系BxPC-3和PANC-1中敲减IRAIN,可以诱导细胞凋亡并抑制细胞增殖。有趣的是,在BxPC-3细胞中敲减IRAIN,使BxPC-3细胞在G2/M期大量积累;而在PANC-1细胞中敲减IRAIN,则使细胞停滞在G0/G1期,因此IRAIN对BxPC-3和PANC-1细胞系中细胞周期调节不一致可能是由于其差异性表型的表达[14]。此外,在胰腺癌中,IRAIN还可以与LSD1和EZH2的复合物直接结合,抑制其下游靶标KLF2和P15的表达[14]。这提示IRAIN可能对EZH2和LSD1介导的胰腺癌细胞中肿瘤抑制因子的抑制作用起关键调节作用。
3.5 肝 癌
肝癌是最具侵袭性的恶性肿瘤之一,其预后不良主要与肿瘤转移率高有关,因此,提前识别高风险患者及开发新的治疗靶点,将为治疗肝癌提供有效措施。已有研究证实,lncRNAs的失调与肝癌的发病率和进展相关,例如,lncRNA CUDR,lncTCF7和DILC[2]。因此,确定不同lncRNAs对肝癌肿瘤生物学行为的影响将为肝癌的诊断和治疗提供理论依据。研究发现,与正常肝组织和癌旁组织相比,长链非编码RNA IRAIN的表达在肝癌组织中显著下降。IRAIN表达与患者性别、年龄及有无肝炎病史无关,而与肝癌肿瘤大小、分化程度以及临床分期呈负相关,肝癌的恶性程度越高,IRAIN的表达越低[15]。这些结果提示IRAIN可以作为抑癌基因抑制肝癌的发生发展,深入研究IRAIN的作用机制将为肝癌的治疗提供新的治疗靶点。
3.6 喉 癌
喉癌是头颈癌中最常见的肿瘤类型,占所有病例的25%~30%。在临床上,早期喉癌的治愈率为80%~90%,而晚期的肿瘤患者治愈率仅有60%。然而,由于缺乏有效的生物标志物用来诊断,大多数喉癌患者被诊断时已为晚期转移阶段,总的来说,喉癌的5年总生存率低于60%。因此,迫切需要确定启动喉癌发生发展的关键分子和生物标志物,以为早期发现和治疗喉癌提供依据。LncRNAs调控的异常基因印记在肿瘤发生中发挥着重要作用。研究发现长链非编码RNA IRAIN在正常人咽部黏膜、喉癌组织及癌旁组织中呈A/G双等位基因表达,为非印记表达,这与之前报道的IRAIN在白血病、乳腺癌及非小细胞肺癌等肿瘤中呈印记表达结果不一致,提示IRAIN存在组织特异性表达。李靖[16]在喉鳞癌患者中检测IRAIN的表达,发现与癌旁组织相比,IRAIN在喉鳞癌组织中的表达明显降低。此外,IRAIN的表达在低分化喉癌、淋巴结受累及声门上型喉癌的患者中表达明显降低,提示IRAIN可能作为抑制因素参与喉癌的侵袭和转移过程。王健燕[17]在喉癌患者的癌及癌旁组织中检测IGF1R及IRAIN的表达发现,与癌旁组织相比,IGF1R在喉癌组织中表达较高,而IRAIN在喉癌组织中表达较低,且IRAIN的表达与患者年龄、临床分型、TNM分期、淋巴结受累情况无相关性,提示IRAIN可能作为抑癌基因参与喉癌的发生。
3.7 肾细胞癌
肾癌每十年发病率增加2%。约90%患者为肾细胞癌(RCC)。根治性肾切除术是RCC治疗的最有效选择,特别是对于早期患者。然而,手术后仍有20%~40%的RCC患者发生器官转移,导致更差的预后。因此,深入研究RCC发病的分子机制和致病基础将有助于为该病的治疗提供理论依据。已发现多种lncRNAs参与RCC的肿瘤发生、疾病进展和转移,例如lncRNA TUG1和MEG3,它们作为致癌基因或肿瘤抑制基因起作用[18]。研究发现长链非编码RNA IRAIN在RCC临床标本和培养的细胞系中表达下调,在786-O细胞中过表达IRAIN能够显著抑制细胞增殖并促进细胞凋亡,同时使细胞周期蛋白D1(Cyclin D1)减少,而细胞凋亡促进蛋白Bax升高。此外,利用裸鼠移植瘤模型发现,IRAIN过表达可以抑制RCC的体内肿瘤发生,提示在RCC中,IRAIN能通过抑制细胞增殖,诱导细胞凋亡来发挥抑癌基因的作用[19]。
4 结论与展望
随着高通量测序的发展,人类基因组计划提供了lncRNAs参与各种信号通路的证据。长链非编码RNA IRAIN在多种肿瘤中表达异常,我们总结了IRAIN在不同肿瘤中表达情况,如在白血病、乳腺癌、肝癌、喉癌、肾细胞癌等肿瘤中表达降低,在非小细胞肺癌和胰腺癌中表达升高,IRAIN在不同肿瘤中的表达异常可能与组织特异性有关(表1)。在白血病、乳腺癌中IRAIN是遗传印记单等位基因表达,而在喉癌中,IRAIN为非印记表达,提示IRAIN的印记表达存在组织特异性。DNA甲基化是基因遗传印记的常见作用机制。IRAIN的启动子区富含CpG岛,利用去甲基化药物5-氮杂胞苷处理白血病细胞K562后,IRAIN的表达升高,提示IRAIN启动子甲基化可能影响它的功能。在胰腺癌中,IRAIN可以与LSD1和EZH2的复合物直接结合,并且抑制其下游靶标KLF2和P15的表达。可见,IRAIN在多种肿瘤中具有作为肿瘤生物标记的潜能。
表1 长链非编码RNA IRAIN在肿瘤中的功能及分子机制
细胞的恶性增殖、凋亡障碍等是白血病发病的重要机制,也是白血病治疗的潜在靶点。IRAIN在肿瘤中的异常表达能够调控细胞增殖和细胞凋亡,并参与多种肿瘤的发生发展,它极有可能成为白血病治疗的关键分子。目前为止,我们对IRAIN的具体功能知之甚少。研究显示IRAIN在白血病细胞系中表达下调。在正常受试者、低危组和高危组AML患者中,IRAIN的表达在低危组最高。需要注意的是,低危组患者仍然表现出恶性白血病特征,并且易于转变为高风险的AML。因此,需要在肿瘤中进一步研究IRAIN的具体作用,其异常表达的原因,印记状态形成与改变因素。同时研究IRAIN与下游靶基因的关联及调控网络等分子机制,以期为有效治疗肿瘤提供理论基础与治疗靶点。