APP下载

长链非编码RNA及其生物学功能概述

2017-02-18李法君

生物学教学 2017年2期
关键词:染色质反义基因组

李法君

(山东省潍坊科技学院 262700)

真核生物基因组由数量众多的DNA序列组成,DNA转录成RNA并翻译成蛋白质,以此进行生物信息的传递。研究表明,人类基因组中仅有1.5%的DNA序列用于蛋白质的编码。然而,有趣的是研究人员发现至少有90%的基因组DNA被转录成RNA。进一步的研究确认,这些序列被转录成非编码RNA(non-coding RNA, ncRNA),其中tRNA和rRNA已为人熟知,其余的ncRNA则被视为转录过程中的“暗物质”未被重视。依据片段大小,ncRNA又分为短链非编码RNA和长链非编码RNA(long non-coding RNA, lncRNA)。人们最初认为lncRNA是转录过程中产生的“噪音”[1],是基因组在进化过程中产生的“垃圾序列”。但是近来的研究证实,lncRNA参与了染色质重塑、组蛋白修饰和RNA代谢等多个重要的生物学过程,已成为基因组功能研究的热点领域。

1 lncRNA的序列特征、分类及来源

lncRNA最早于2002年发现于小鼠的全长cDNA文库中[2],其后科研人员将转录本长度超过 200 个核苷酸的非编码 RNA命名为lncRNA[3]。目前发现的多数lncRNA由RNA聚合酶II转录生成,虽然lncRNA缺乏开放阅读框,没有编码蛋白质的能力,但部分lncRNA具有与mRNA相似的序列特征:5′端帽子、 3′端多聚腺苷酸尾、外显子、内含子和剪接位点等序列特征[4]。

根据 lncRNA 编码序列与蛋白质编码基因的相对位置,可将lncRNA分为5类[5]:①正义lncRNA 转录于编码蛋白质基因的正义链;②反义lncRNA 转录于编码蛋白质基因的反义链;③双向lncRNA 转录于编码蛋白质基因的两条反向互补链;④内含子lncRNA 转录于编码蛋白质基因的内含子序列;⑤基因间lncRNA 转录于两条编码蛋白质基因的间隔区域。

现有的研究表明,lncRNA主要有5种来源[6]:①编码蛋白质的基因由于某种原因发生断裂而产生lncRNA;②染色质重组的结果,即两个未被转录的基因与另一独立基因重组而产生具有多个外显子的lncRNA;③非编码蛋白质基因复制过程中发生反移位而产生lncRNA;④由邻近的复制子串联而产生lncRNA;⑤基因中插入一个全新的转座因子而产生有功能的lncRNA。

2 lncRNA的生物学功能及作用机制

2.1 生物学功能 研究表明,lncRNA以顺式或反式作用的方式与核酸分子(DNA或RNA)和蛋白分子相互作用,参与细胞内的多种生物学过程。具体而言,lncRNA通过染色质重塑、组蛋白修饰和RNA代谢等多种生化途径在表观遗传水平、转录水平和转录后水平对基因的表达进行调控。

2.1.1 表观遗传水平的调控 表观遗传学是指在不改变生物体DNA序列的前提下,通过对基因的修饰(如甲基化)来调控基因的表达。这些修饰包括染色体重塑、基因组印记和X染色体失活等。lncRNA一方面可以直接与染色质结合并与其相互作用,从而沉默或激活目标基因;另一方面也可以通过修饰组蛋白来沉默目标基因,同时还可以募集染色质修饰抑制因子来参与等位基因的特异性沉默[7]。动物体肝脏中的辅酶II依赖性视黄醇脱氢/还原酶(DHRS4)基因可以编码重要的代谢酶,DHRS4基因的反义转录lncRNA(AS1DHRS4)可以募集DNA 甲基化转移酶(DNMT3a),使DHRS4基因的第二个拷贝(DHRS4L2)基因启动子序列中的 CpG 岛甲基化,令DHRS4L2基因的转录失活[8]。研究表明,失活X染色体特定转录(Xist)基因和Xist的反义序列(Tsix)在X染色体失活过程中发挥重要作用,被活化的X染色体生成Tsix,它可以募集DNMT3a到Xist基因的启动子区域,并使其发生甲基化,从而使染色体完成活化[9]。

2.1.2 转录水平的调控 RNA的转录是一个严谨而复杂的过程,具有严格的时序性和空间特异性,受多种转录因子的调控。lncRNA也在其中发挥重要的作用。现在公认的观点为,lncRNA的转录可以干扰相关基因的表达。原因在于,lncRNA可以与跟启动子相结合的抑制性复合物结合,“占领”启动子区域,使得RNA聚合酶II无法正常与启动子序列结合,从而干扰基因表达。例如,人类二氢叶酸还原酶(DHFR)基因的上游次级启动子可转录产生lncRNA,该 lncRNA可以与DHFR 基因的主要启动子结合形成 RNA-DNA 复合物,进而使转录辅助因子TFIID无法与启动子结合,从而阻断DHFR基因的表达[10]。此外,转录水平的调控的还体现在转录干扰方面[11]。

2.1.3 转录后水平的调控 转录后水平的调控主要是通过lncRNA与靶mRNA序列的互补配对来实现的。具体而言,lncRNA可以与靶mRNA形成RNA-RNA二聚体,掩蔽mRNA序列中的相关顺式作用元件,从而调控转录后水平的剪切、拼接、翻译等过程。如人急性粒细胞白血病细胞HL-60细胞系中PU.1的mRNA水平很高,但是蛋白质水平却不高。主要是由于PU.1转录的反义lncRNA(ASRNA)与其mRNA序列结合导致翻译受到抑制所致[12]。

2.2 作用机制 lncRNA在生物体内的作用机制非常复杂,具体的作用机制至今尚不完全清晰。已经确认的lncRNA作用机制主要有8种[6]:①在编码蛋白质基因上游启动子区域转录,从而影响下游基因的表达;②通过抑制RNA聚合酶II的活性或参与染色质重组和组蛋白修饰,影响下游基因的表达;③与编码蛋白质的mRNA形成双链杂交体,干预mRNA的剪切,从而形成不同的剪切体;④与编码蛋白质的mRNA形成双链杂交体,通过Dicer酶剪切产生内源性的小干扰RNA(small interfering RNA, siRNA);⑤与特定蛋白质结合,调节相应蛋白的活性;⑥作为结构组分,与蛋白质形成核酸蛋白质复合体;⑦与目标蛋白质结合,改变其细胞定位;⑧作为某些小分子RNA的前体分子。

3 lncRNA与癌症

现在最新的观点认为,癌症所涉及的特征包括:不可控的生长信号、抵抗细胞死亡、细胞无限生长、逃避生长抑制、激活侵染与转移及免疫逃避等[13]。上述过程包括了最基本的几个生物学过程:细胞周期、细胞凋亡与坏死、免疫反应及肿瘤代谢等。无一例外,lncRNA均参与了上述过程。因此,与癌症相关的lncRNA研究也成为进展最快、获得成果最多的新兴领域。

业已证明与癌症相关的lncRNA包括:基因组印记基因H19、 HOX 基因的反义基因间的RNA(HOTAIR)、母系表达基因3(MEG3)、肺腺癌转移相关转录因子1(MALAT1)以及细胞周期激酶抑制因子4b(INK4b) 位点的反义非编码RNA(ANRIL)等。

现有的研究结果表明,如果细胞中具有非常显著的癌症类型特异性的lncRNA出现异常过表达就会促进细胞周期进展,导致癌症发生。例如,最新的前列腺癌研究发现,两种lncRNAs在许多侵袭性前列腺癌中高水平表达,增强了雄激素受体相关转录程序,促进了癌细胞生长[14]。但是,lncRNA在癌症发生、发展过程中的具体作用机制尚需进一步探索。

4 展望

lncRNA的出现给“中心法则”带来了极大的补充,使人们重新认识了RNA。现阶段人们对lncRNA的认识还只是冰山一角,但是其功能涉及范围之广已远远超出人们最初的设想,尚有许多问题亟待解决:

①最基本的lncRNA分类。目前针对lncRNA的定义也仅仅是根据其核酸序列的长度,但是这种分类明显具有程序化。随着测序技术的发展,必将会有多个物种的lncRNA被陆续发现。如何准确地对数量庞大的lncRNA进行分类,从而更好地研究其功能,显得越来越重要。②lncRNA的数量尚未明了。以人类为例,人类的基因组中有多少lncRNA?其序列又是怎样的?这些问题的解决是深入研究lncRNA的基础。③研究lncRNA最重要的是阐明其功能。因此,揭示lncRNA与其它生物分子(如DNA、RNA、microRNA和蛋白质)相互作用机制就成为研究lncRNA生物学功能的关键所在。癌症至今仍被视为“不可治愈”的顽疾,多年来人们虽然苦苦探索,但迄今还没有从根本上找到有效的治疗方法,癌症的发病机理尚不明确是造成这种状况的主要因素。因此,从新的视角探索癌症的分子机制势在必行。lncRNA的发现为我们带来了新的希望,可以极大推进癌症的发病机理研究,进而为以lncRNA为靶点进行新的抗肿瘤药物的开发提供理论依据。

(基金项目:国家自然科学基金,No. 31572617)

猜你喜欢

染色质反义基因组
染色质开放性与动物胚胎发育关系的研究进展
哺乳动物合子基因组激活过程中的染色质重塑
认识反义词
反义疑问句小练
牛参考基因组中发现被忽视基因
科学家找到母爱改变基因组的证据
血清HBV前基因组RNA的研究进展
“哺乳动物卵母细胞生发泡染色质构型的研究进展”一文附图
哺乳动物卵母细胞生发泡染色质构型的研究进展*
这山望着那山高