APP下载

基于分子结构的lncRNA分子功能的研究进展

2014-03-22杨华樊红

东南大学学报(医学版) 2014年1期
关键词:染色质结构域染色体

杨华, 樊红

(东南大学 医学院,江苏 南京 210009)

非编码RNA(non-coding RNA, ncRNA)是指不编码蛋白质,但在生物体生命活动中具有功能的RNA分子。ncRNA按其长度可分为短链非编码RNA和长链非编码RNA(long non-coding RNA,lncRNA)[1-2]。短链非编码RNA是一类大小约22个核苷酸的RNA分子,一般来源于染色体的非编码区;lncRNA长度一般超过200个核苷酸,大多数由RNA聚合酶Ⅱ转录,缺乏有意开放阅读框架。最初lncRNA被认为是基因转录的“噪音”,近年越来越多的证据表明,这种“暗物质”能够广泛地参与基因组调节,调控个体的生长发育以及细胞凋亡、增殖、分化等生命活动[3-4]。lncRNA的异常表达与包括肿瘤在内的多种疾病相关[5-7]。lncRNA的研究目前尚处于初期阶段,如何对lncRNA进行基因鉴定、功能分析、靶标研究成为基因组研究的关键问题。

1 lncRNA的结构及作用

RNA作为输出与输入信号促使其成为一个调控路径之间和信号内部转换的标准媒介,组成了复杂的、多层的并模块化的调控网络系统。除了4个核心核苷酸外,RNA序列可能包括100种以上化学修饰的核苷酸,它们调节并稳定着RNA的结构。lncRNAs倾向于折叠成热力学稳定的二级或更高级结构而行使其功能。例如,lncRNA MEG3二级结构维持了其肿瘤抑制作用[8]。

1.1 RNA结构域

lncRNAs的RNA结构域因能与其他的RNAs形成碱基互补,成为mRNA、微小RNA及其他lncRNA表达的高特异性传感器[9];反义lncRNAs与核苷酸不完全的互补性允许不同解离常量的多样性RNA竞争性结合,从而识别细胞内不同RNA的表达,例如,UCHL1的翻译是由一种lncRNA所调控的[10]。lncRNAs中的Alu元件和编码mRNAs的3′UTR不完全碱基配对引起Staufen1识别并限制dsRNA结构,随后达到靶向降解。lncRNA MALAT1的3′末端裂解可产生小的tRNA样序列,从细胞核向细胞质移动[11]。延伸的RNA双链在Dicer酶的作用下产生多样且小的调控RNAs,这些RNAs具有级联调节下游表观遗传学改变的能力[12]。

1.2 蛋白结构域

RNA结合蛋白是人类蛋白种类最丰富的蛋白之一,由几个相关的RNA连接模块组装,这些结构域与连接区域的模块组合调节RNA结构的多样性[13]。蛋白质倾向于与形成复杂二级结构的RNA相互作用,使蛋白结构定位在RNA茎环螺旋的凹槽或为不成对的RNA核苷酸在β面处提供结合袋[14]。

1.3 DNA结构域

RNA-DNA直接相互作用可能会有效并选择性地将RNA信号靶定在基因座上,而此作用会让基因组处于去氨基及损伤中[15]。尽管lncRNAs与DNA有直接相互作用的证据尚少,但研究发现与启动子相关的lncRNA pRNA可以阻止转录终止因子1(TTF1)的结合,同时募集DNMT3b抑制rRNA基因的表达。体外实验中发现lncRNA与TTF1结合形成三重子,支持了基因组中基因座间的直接相互作用。RNA折叠形成与DNA结合域类似的DNA结合袋。例如,Xist并不直接与DNA相互作用,而是借助于YY1转录因子的特定序列将其绑定在X染色体上的位点[16]。

1.4 lncRNA的模块结构

lncRNAs可以通过变构和异位结合结构域激活或抑制连接的功能域。当一个分子结构域特异改变蛋白相互作用时,lncRNA可以为许多不同的蛋白做支架形成单个核糖核蛋白。到目前为止至少12个核染色质修饰蛋白与lncRNAs相关。VEGF 3′UTR的一个蛋白依赖的核糖开关被GAIT或多相核核糖蛋白L(hnRNPL)蛋白复合物限制[17]。lncRNA CDKN2B-AS1(ANRIL)使Suz12、 CBX7与 H3K27结合,抑制CDKN2A/CDKN2B(IFNK4a/IFNK4b)[18]。小鼠中lncRNA Kcnq1ot1可以招募PRC2和G9a,使H3K4三甲基化和H3K9甲基化[19]。

转座子的传动可能会导致一个稳定功能结构域插入靶定的lncRNAs。转座子重复,如SINEs元件和Alu元件,也可以整合到lncRNAs中,作为识别结构域翻译或降解互补的mRNA。与蛋白结构域相似,对lncRNAs相似重复序列的确定可能会反映lncRNAs中的潜在功能结构域。Xist结构包括超过9个重复元件组成的A-区域和C-重复区域,这9个重复元素折叠成两个茎环结构为H3K27甲基化而招募PRC1。C-重复区域同时结合了hnRNP U和YY1,负责将Xist定位于X染色体上[20]。A-和C-重复区域结构也出现在有同样功能的lncRNA Rsx,调节有袋哺乳动物中X染色体的失活[21]。

2 lncRNAs的功能研究策略

长链非编码RNA引起关注应归功于基因组和基因芯片[22]的研究。基因芯片可以高密度检测所有的RNA,发现更多被遗漏的非编码RNA,包括长链非编码RNA。除了基因芯片可以高通量检测非编码RNA的差异表达水平,Northern 杂交、实时定量PCR、RNA荧光原位杂交等方法均能检测非编码RNA的表达。基于lncRNA结构特征及其作用方式,相应发展了新的研究手段,包括RNA结合蛋白免疫沉淀技术(RNA binding protein immunoprecipitation,RIP)、非编码RNA沉默和定位分析(combined knockdown and localization analysis of noncoding RNAs,c-KLAN)、环状染色质构象捕获(circular chromosome conformation capture,4C)、三维DNA的筛选和交联(three-dimensional DNA selection and ligation,3D-DSL)、RNA反义纯化(RNA antisense purification,RAP)、捕获杂交分析RNA靶点(capture hybridization analysis of RNA targets,CHART)、全局持续测序(global run-on sequencing,GRO-seq)等。本文集中描述新近常用lncRNA分子研究的方法。

2.1 染色体构象捕获

染色体构象捕获(chromosome conformation capture,3C)技术原本应用于酵母中研究基因表达,染色质的空间构象分析,继而发展为在动物中研究细胞内染色质间的相互作用。基于染色质构象捕获而衍生的环状染色质构象捕获(circular chromosome conformation capture,4C)、3C碳拷贝(3C-carbon copy,5C)和ChIP-loop assay等技术,为研究染色质间长距离相互作用提供了可能。为了证实ncRNAs与Mediator蛋白质复合物共同形成了DNA环这一观点,Lai等[23]利用3C技术,深入分析了染色体的三维结构,结果显示,Meditor定位在编码ncRNA-a的DNA区域上,扭曲DNA成环。

HI-C是一种3C衍生技术,基于交联DNA与生物素的邻近链接能够拉下片段,进行高通量测序。为了研究染色质3D排列是如何发挥作用的,Pennisi[24]采用HI-C的方法建立一个X染色卷曲和转角的三维图谱,然后与XIST沉淀的结合位点图谱进行比较,发现二者之间紧密的相关性,即XIST基因与卷曲和转角共定位。

2.2 三维DNA的筛选和交联

三维DNA的筛选和交联(three-dimensional DNA selection and ligation,3D-DSL)是一种类似于5C的技术,主要用来研究基因组的空间组织。Harismendy等[25]开发并完善了这个研究全基因组范围内短程和长程基因组交互作用的的低噪音高分辨率的新方法。应用这一项新技术成功发现了与人类疾病密切相关的基因增强子,远距离地与多个基因位点相互作用并对其起调节作用。这一发现给遗传毒性激活的SIRT1基因的表达调控及其与心肌梗死的预防、治疗研究提供了方案。

研究人员[26]在检测人类乳腺癌细胞中的雌激素受体结合,以及它对增强子转录的影响过程中,采用3D-DSL证实雌激素能够诱导启动子及增强子成环。雌激素受体通过结合增强子来激活基因表达;雌激素受体结合被证实与雌激素诱导基因附近的增强子控制 eRNAs 增高相关,并且雌激素受体结合发挥了激活编码靶基因的作用。研究人员表示,许多广泛表达的基因在基本细胞功能中起着重要作用,由于它们都处于细胞特异性增强子的控制下,通过抑制eRNAs来影响增强子功能,有可能成为体内以细胞特异性方式改变基因表达的一种新策略。

2.3 RNA反义纯化

RNA反义纯化(RNA antisense purification,RAP)主要用于绘制lncRNA在基因组中的位置。采用120个单核苷酸的反义RNA探针与目标RNA形成稳定的杂交,从而避免非特异性RNA与蛋白质的相互作用以及非特异性与RNAs及基因组DNA杂交的干扰;采用脱氧核糖核苷酸酶降解基因组DNA至150个碱基对的片段,提供高分辨率的绘制结合位点;采用覆盖靶RNA全长的生物素标记的探针,以保证即使存在RNA二级结构、RNA部分降解以及RNA与蛋白质相互作用的情况下,仍能通过高通量DNA测序,高分辨率描绘lncRNA结合位点,来绘制不同lncRNAs的确切位置。

关于Xist沉默的生物学意义,研究人员仍不清楚在分子水平上Xist是如何找到它的靶标并影响整体X染色体的。为了了解这一过程,Engreitz等[27]采用RAP的新方法研究Xist在X染色体失活(X-chromosome inactivation,XCI)的启动和维持过程中的位置,发现lncRNA并没有到处去寻找它的靶标,而是利用它的位置信息,找到远距离的基因。过去已知Xist的A重复结构域对lncRNA沉默X染色体基因至关重要,这一区域是拉动所有沉默基因的必要条件。去除这一结构域,X染色体不会失活。

3 展 望

随着高通量检测技术的成熟和应用以及生物信息学的迅猛发展,lncRNA具有的基因表达调控功能相继被发现。尽管如此,lncRNA 研究仍处于起步阶段,其功能和调控机制有待进一步阐明。识别RNA结构对研究其调控和功能很重要,但目前用于研究RNA结构的方法相对较少,而且也没有对RNA结构进行高通量测量的实验方法。Kertesz等[28]利用一种平行分析RNA结构(parallel analysis of RNA structure,PARS)的新技术,对经过结构特异性酶处理过的RNA片段进行深度测序,确定酵母RNA的二级结构。他们获得的结果为二级结构在翻译中的作用提供了有趣的提示,也许这项新技术经过改进后可以在高等真核生物中进行类似的分析。

lncRNA在转录水平以及转录后水平广泛参与调节基因的表达,从而形成极其复杂的调控网络,为进一步研究其调控机制打下基础。通过研究lncRNA的生物学功能及其在疾病中的调控机制,能够更全面地理解疾病的发生机制,寻找新的疾病诊断标志物以及治疗靶点,为维护人类健康和治疗疾病提供新的思路和方法。我们期望面向研究lncRNA的创新技术不断涌现,以支持该领域的迅速发展。

[1] KROL J,LOEDIGE I,FILIPOWICZ W.The widespread regulation of micro-RNA biogenesis,functionand decay[J].Nat Rev Genet,2010,9(11):597-610.

[2] YANG F,YIN Y,WANG Y,et al.miR-17-5p promotes migration of human hepatocellular carcinoma cells through th p38 mitogen-activated protein kinase-heat shock protein 27 pathway[J].Hepatology,2010,51(5):1614-1623.

[3] van BAKET H,NISLOW C,BIENCOWE B J,et al.Most ”dark matter”transcripts are associated with known genes[J].PLoS Biol,2010,8(5):e1000371.

[4] MERCER T R,OINGER M E,MATTICK J S.Long non-coding RNAs:insights into functions[J].Nat Rev Genet,2009,10(3):155-159.

[5] TAFT R J,PANG K C,MERCER T R.Non-coding RNAs:regulators of disease [J].Pathol,2010,220(2):126-139.

[6] MARUYAMA R,SHIPITSIN M,CHOUDHUY S,et al.Breast cancer special feature:altered antisense-to-sense transcript ratios in breast cancer[J].Proc Natl Acad Sci USA,2012,109(8):2820-2824.

[7] SILVA J M,PEREZ D S,PRITCHETT J R,et al.Identification of long stress induced non-coding transcripts that have altered expression in cancer[J].Genomics,2010,95(6):355-362.

[8] ZHANG X,RICE K,WANG Y,et al.Maternally expressed gene 3(MEG3) noncoding ribonucleic acid:isoform structure,expression,and functions[J].Endocrinology,2010,151(3):939-947.

[9] LIANG J C,BLOOM R J,SMOLKE C D.Engineering biological systems with synthetic RNA molecules[J].Mol Cell,2011,43(6):915-926.

[10] CARRIERI C,CIMATTI L,BIAGIOLI M,et al.Long non-coding antisense RNA controls Uchl1 translation through an embedded SINEB2 repeat[J].Nature,2012,491(7424):454-457.

[11] WILUSZ J E,FREIER S M,SPECTOR D L.3’end processing of a long nuclear-retained noncoding RNA yields a tRNA-like cytoplasmic RNA [J].Cell,2008,135(5):919-932.

[12] DJUPEDAL I,EKWALL K.Epigenetics:heterochromatin meets RNAi[J].Cell Res,2009,19(3):282-295.

[13] LUNDEM B M,MOORE C,VARANI G.RNA-binding proteins:modular design for efficient function[J].Nat Rev Mol Cell Biol,2007,8(6):479-490.

[14] REITER N J,CHAN C W,MONDRAGON A.Emerging structural themes in large RNA molecules[J].Curr Opin Struct Biol,2011,21(3):319-326.

[15] BUSKE F A,MATTICK J S,BAILEY T L.Potential in vivo roles of nucleic acid triple-helices[J].RNA Biol,2011,8(3):427-439.

[16] JEON Y,LEE J T.YY1 tethers Xist RNA to the inactive X nucleation center[J].Cell,2011,146(1):119-133.

[17] RAY P S,JIA J,YAO P,et al.A stress-responsive RNA switch regulates VEGFA expression[J].Nature,2009,457(7231):915-919.

[18] YAP K L,LI S,MUNOZ-CABELLO A M,et al.Molecular interplay of the noncoding RNA ANRIL and methylated histone H3 lysine 27 by polycomb CBX7 in transcriptional silencing of INK4a[J].Mol Cell,2010,38(5):662-674.

[19] PANDEY R R,MONDAL T,MOHAMMAD F,et al.Kcnq1ot1 antisense noncoding RNA mediates lineage-specific transcriptional silencing through chromatin-level regulation[J].Mol Cell,2008,32(2):232-246.

[20] HASEGAWA Y,BROCKDORFF N,KAWANO S,et al.The matrix protein hnRNP U is required for chromosomal localization of Xist RNA[J].Dev Cell,2010,19(3):469-476.

[21] GRANT J,MAHADEVAIAH S K,KHIL P,et al.Rsx is a metatherian RNA with Xist-like properties in X-chromosome inactivation[J].Nature,2012,487(7406):254-258.

[22] 王立伟,周东蕊,房汝敬,等.乳腺癌中NDRG-1基因甲基化状态研究[J].现代医学,2008,36(2):79-83.

[23] LAI F,OROM U A,CESARONI M,et al.Activating RNAs associate with Mediator to enhance chromatin architecture and transcription[J].Nature,2013,494(7438):497-501.

[24] PENNISI E.Long noncoidng RNAs may alter chromosome’s 3D structure [J].Science,2013,340(6135):910.

[25] HARISMENDY O,NOTANI D,SONG X,et al.9p21 DNA variants associated with coronary artery disease impair interferon-γsignalling response[J].Nature,2011,470(7333):264-268.

[26] LI W,NOTANI D,MA Q,et al.Functinal roles of enhancer RNAs for oestrogen-dependent transcriptional activation[J].Nature,2013,498(7455):516-520.

[27] ENGREITZ J M,PANDYAJONES A,MCDONEL P,et al.The Xist lncRNA exploits three-dimensional genome architecture to spread across the X chromosome[J].Science,2013,341(6147):12379-12373.

[28] KERTESZ M,WAN Y,MAZOR E,et al.Genome-wide measurement of RNA secondary structure in yeast[J].Nature,2010,467(7311):103-107.

猜你喜欢

染色质结构域染色体
染色质开放性与动物胚胎发育关系的研究进展
哺乳动物合子基因组激活过程中的染色质重塑
革兰氏阳性菌蛋白结构域特征分析
染色质可接近性在前列腺癌研究中的作用
“哺乳动物卵母细胞生发泡染色质构型的研究进展”一文附图
蛋白质结构域划分方法及在线服务综述
多一条X染色体,寿命会更长
为什么男性要有一条X染色体?
能忍的人寿命长
重组绿豆BBI(6-33)结构域的抗肿瘤作用分析