LncRNA在多能干细胞早期谱系分化中的作用与机制研究进展
2021-12-04张晓宇
张晓宇, 张 赫
(1. 同济大学附属东方医院再生医学研究所,上海 200123; 2. 同济大学教育部细胞干性与命运编辑前沿科学中心,上海 200092;3. 同济大学附属东方医院干细胞转化医学产业基地,上海 200123)
多能干细胞(pluripotent stem cells, PSCs)是一类具有自我更新、自我复制能力的多潜能细胞,包括胚胎干细胞(embryonic stem cell, ESC)和诱导多能干细胞induced pluripotent stem cells, iPSC),是组织、器官修复再生的重要细胞来源[1]。根据发育生物学原理和体外诱导优化试验,目前已经建立了PSCs向外胚层、中胚层和内胚层等3个胚层以及各种功能性细胞分化的体系[2-3]。PSCs的早期分化状态决定了细胞的终端分化潜力,因此调节和监测干细胞分化为特定功能性的末端分化细胞,是干细胞领域的重要科学问题,探索PSCs的早期分化机制将有利于更高效产生末端功能性细胞。由于干细胞分化调控研究的局限性,PSCs的末端分化效率和成功率始终是阻碍干细胞应用的难题。因此,进一步探索调控干细胞早期谱系分化的新因素,将有利于阐明PSCs的早期谱系分化调控机制。
长链非编码RNA(long non-coding RNA, lncRNA)是长度大于200 nt的非编码RNA。根据lncRNA的转录来源,可分为基因间lncRNA、内含子区lncRNA、双向启动子lncRNA、反义lncRNA、增强子lncRNA、正义链或反义链lncRNA[4-5];按作用机制可以分为信号分子、诱饵分子、引导或支架分子[6-7]。研究表明,lncRNA广泛参与基因表达调控、通路激活、染色质构象改变进而调控肿瘤发生、免疫调节等众多生物学过程。PSCs的早期分化机制复杂,常受到染色质状态、多能性因子、非编码RNA等多种因素的调控。近年来,随着高通量测序技术的发展,人们发现80%的人类基因组序列只能转录,而不能翻译成蛋白质[4,8]。由此,产生了大量的lncRNA。PSCs具有明显的lncRNA标记,这些lncRNA在PSCs谱系分化中如何发挥作用尚不明确。因此,本文将着重讨论lncRNA在PSCs谱系分化中的作用与机制。
通过研究人和小鼠的ESCs和iPSCs,研究人员发现大多数lncRNA位于基因附近,约65%的lncRNA转录起始于基因启动子区[9]。LncRNA因广泛存在于细胞发育的各个阶段,在PSCs的分化和自我更新中也发挥重要作用,通过多种调控模式参与PSCs早期谱系分化过程[10]。本文将早期谱系分化过程中lncRNA的作用模式归结为以下3点: (1) 染色质环调控;(2) ceRNA模式;(3) 顺式调控。
1 LncRNA介导染色质环调控多能干细胞早期谱系分化
染色质环(chromatin loop),可以将远端调控元件带到目的基因附近,引起远距离染色质相互作用,调控基因表达。在上述过程中,lncRNA能招募染色质重构和修饰复合体到特定位点,改变DNA/RNA甲基化状态、染色体结构和修饰状态,进而调控染色质环的形成,控制早期谱系分化相关基因表达,精确调控PSCs早期谱系分化状态。
在PSCs的早期谱系分化中,增强子广泛参与基因表达调控。LncRNA通过介导远距离染色质环的形成,调控远端增强子和启动子的相互作用,间接参与早期谱系分化基因的转录调控[11]。Eomes是中内胚层分化的标志性基因。Eomes增强子结构域转录出一个lncRNAMeteor,参与Eomes启动子-增强子染色质环的形成,调控Eomes转录状态。当Meteor缺失时,启动子和增强子的染色质状态发生表观遗传重构,染色质环消失,Eomes转录被抑制,ESCs被重定向往神经外胚层分化。因此,Eomes基因座与转录增强子及MeteorlncRNA在拓扑结构上相关联,形成控制多潜能谱系分化的调控元件,在心源性中胚层分化过程中不可或缺[12]。HOXA基因簇是调控PSCs分化的关键中介[13],位于HOXA基因簇上游40 kb位点转录的lncRNAHaunt和其基因座共同构成调控HOXA表达的调节器。Haunt的基因组位点是HOXA基因簇的转录增强子,但HauntlncRNA能重塑HOXA位点的H3K27me3状态,直接与染色质结合,竞争性阻碍增强子和HOXA启动子之间的染色质环的形成,抑制HOXA的转录激活。因此,与HauntDNA序列的激活作用相反,HauntRNA可作为基因转录“制动器”来防止HOXA基因的异常激活。HauntDNA和RNA作为基因表达的“开关”,精确控制HOXA基因簇适当表达,调控PSCs早期3胚层分化[14]。HoxBlinc是与HOXB基因座相关的lncRNA,通过募集SET1/MLL1复合物,介导长距离染色质相互作用而激活HOXB基因转录。HoxBlinc遗传缺失降低HOXB基因表达,且伴随SET1/MLL1和H3K4me3修饰减少,减少染色质环的形成。因此,HoxBlinc通过调节局部染色质状态控制HOXB转录网络活性,调控胚胎干细胞的心源性/血源性中胚层分化[15]。LncRNAEvx1as是EVX1位点反向转录的lncRNA,表达早于EVX1。Evx1as能与EVX1转录起始域结合,整合各种信号和转录蛋白酶,招募转录激活辅助因子Mediator,形成染色质环,促进EVX1启动子与增强子相互作用,激活EVX1基因转录,诱导ESCs中胚层分化[16]。EVX1基因在Evx1as缺失的ESCs中的表达失调,严重影响中胚层细胞及内胚层早期谱系分化[17]。
以上研究表明,受lncRNA调控的染色质动态变化在调控PSCs早期发育基因的转录中,发挥重要作用。LncRNA通过充当诱饵分子、支架分子、排斥分子等调控染色质长距离相互作用。一方面,lncRNA可以在PSCs谱系分化的早期调控增强子等调控原件与靶基因的长距离相互结合,促进基因表达。另一方面,lncRNA也可通过形成空间位阻结构阻碍调控元件与靶基因互相作用,破坏染色质环形成,导致基因沉默。综上所述,lncRNA调控的染色质环在干细胞早期谱系分化中发挥中间媒介作用,为PSCs早期谱系分化理论提供了染色质环调控模型,揭示了多能性退出和分化启动的新机制[17]。
2 LncRNA作为ceRNA调控多能干细胞早期谱系分化
MicroRNA可以通过结合mRNA导致基因沉默,竞争性内源RNA(competing endogenous RNA, ceRNA)通过竞争性地结合microRNA来调节基因表达。ceRNA可以通过应答元件(microRNA response elements,MREs)与microRNA结合导致基因沉默,这是一种RNA-RNA的调节通路,具有重要的生物学意义。LncRNA长度可达数千nt,为吸附结合miRNA提供了良好的物质基础,竞争占有细胞内大量的miRNA,像海绵一样缓冲并削减其干涉靶基因mRNA编码蛋白的能力,这种lncRNA与miRNA互为ceRNA关系的调控模式对PSCs的早期多谱系分化至关重要,决定了PSCs的早期谱系分化方向和早期功能性细胞的生成。
Lnc1281是正确启动mESCs早期谱系分化必需的lncRNA。缺乏lnc1281的mESCs向神经外胚层和心源性中胚层的早期谱系分化水平显著降低。lnc1281主要通过内部m6A修饰发挥ceRNA作用,隔离与mESCs多能性相关的let-7家族miRNAs,激活mESCs早期谱系分化基因Gata4、Mesp1、Sox1和Cxcr4转录,启动mESCs早期心源性中胚层和神经外胚层谱系分化[18]。LncRNAC130071C03-Riken变体Riken-201和Riken-203是大脑中高表达的lncRNA,共同参与调控mESCs外胚层早期谱系分化。miR-96和miR-467a-3p是表皮和神经外胚层中表达差异最大的miRNA,可调控hESCs的神经诱导,也能调控mESCs的神经分化。Rik-201和Rik-203作为ceRNA,分别抑制mESCs中miR-96和miR-467a-3p的功能,调节Sox6、Sox1的表达以激活mESCs的神经外胚层分化[19]。
人心脏特异性lncRNAHBL1,在未分化的hPSCs中高表达,是调节人诱导多能干细胞(human induced pluripotent stem cells, hiPSCs)向早期心肌细胞分化的关键。HBL1过表达维持了hiPSCs的多能状态,抑制其向心肌细胞发育。受SOX2调控的HBL1在AGO2复合物中作为ceRNA与miR1竞争性结合,抑制CTNT、GATA4、NKX2.5、MEF2C、TBX5,TBX20心源性分化关键基因的表达,调控hiPSCs心肌细胞发育能力。因此,HBL1与SOX2和miR1形成的调控网络,在hiPSCs向早期心肌细胞的分化过程中至关重要[20]。Gm10451lncRNA定位于细胞质,是细胞分化和功能调节因子。Gm10451作为miR-338-3p的ceRNA,调控组蛋白H3K4甲基转移酶复合物PTIP活性,促进iPSCs向胰岛素+/Nkx6.1+Akt样细胞分化。Gm10451可作为提高iPSCs分化效率和细胞功能的表观遗传靶点,为iPSCs产生成熟的功能性衍生β样细胞提供有效靶标[21]。
ceRNA是一种经典的基因表达调控模型,比起miRNA调控网络,ceRNA调控更为精细复杂。lncRNA中有miRNA响应元件(miRNA responsive elements,MRE),控制与它们的靶向mRNAs结合,减少对mRNAs的抑制。ceRNA形成的大规模转录调控网络,广泛参与了基因组中的功能性基因的调控。尤其是在PSCs的早期谱系分化中,基因转录激活状态发生了重大变化,lncRNA参与的ceRNA为早期谱系分化相关基因转录调控提供了更多模式。此外,lncRNA作为ceRNA发挥作用也受到RNA修饰(如m6A)的调控,这种模式是干细胞精确分化模型的一种有益补充。
3 LncRNA以顺式作用模式调控多能干细胞早期谱系分化
LncRNA在小鼠和人类基因组中非随机定位,常参与邻域基因组表达调控[17]。在常见的lncRNA中,较大比例具有顺式作用功能,顺式调控(cis acting)主要依赖顺式作用元件(cis-acting element)发挥作用。lncRNA常位于基因旁侧,作为启动子、增强子、调控序列和可诱导元件参与基因表达调控[22-23]。通过全基因组分析,发现lncRNA在PSCs的早期谱系分化中也能调节邻域基因的表达[17]。
YylncRNA是一类与蛋白编码基因表达模式几乎相同的伴随性lncRNA,是PSCs命运转变的关键调控因子。yylncT转录自中胚层调节剂BRACHYURY(T)位点,调控T位点的转录激活,其功能缺失不影响PSCs向外胚层或内胚层分化,但会诱导中胚层凋亡。在PSCs的早期谱系分化中,DNA甲基化会造成表观遗传障碍,限制分化潜能,yylncT调节DNA甲基转移酶DNMT3B依赖的DNA甲基化,激活T位点,调控PSCs的中胚层分化[24]。Hand2是mESCs早期心源性中胚层发育关键调控基因,Hand2过度激活会导致先天性心脏畸形。Handsdown(Hdn)是Hand2下游转录的序列保守的lncRNA,活跃于早期心脏细胞,严格控制Hand2适量表达。Hdn与Hand2上游调控位点相互作用,决定Hand2启动子是否与调控元件结合,调控胚胎干细胞的心源性中胚层发育[25]。DIGIT是从GSC(Goosecoid)位点转录出的保守反义lncRNA,在PSCs的内胚层分化过程中表达。在小鼠和人ESCs内胚层分化过程中,DIGIT会富集在H3K18ac标记的染色质区域与BRD3相互作用形成相分离液滴,精确调控GSC转录[13]。这个调控作用主要是依赖激活素SMAD3结合在DIGIT的增强子区域,激活DIGIT的转录,调控GSC转录,调节中胚层和内胚层转录调节因子包括EOMES、MIXL1、SOX17和FOXA2的产生,进而调控PSCs的内胚层分化[26-27]。
在PSCs的早期谱系分化中,lncRNA可直接与转录元件结合,精密控制这些早期谱系分化多样性基因位点的时空表达,参与PSCs的早期谱系分化和其他生物学过程。LncRNA可以序列互补原理结合在未解链的染色质大沟中,或者和解链的DNA链结合;也可招募调控因子到位点附近的DNA上,调控基因表达。同时,lncRNA 的参与也会改变邻近基因上的DNA甲基化和组蛋白修饰,作为分化相关拓扑结构域的“开关”,调控PSCs的谱系分化。以上研究也进一步证明lncRNA的cis调控在PSCs的早期谱系分化中发挥重要作用,为PSCs的早期分化研究提供了更多的模式。
4 展 望
综上所述,lncRNA在PSCs的早期谱系分化调控中发挥着重要的作用,通过反式和顺式等多种作用方式,广泛参与早期谱系分化中关键基因表达调控。既可以作为基因转录激活的直接调控元件发挥作用,也可作为染色质调控因子,调控染色质的远程相互作用(染色质环的形成),或作为miRNA的调控元件,间接调节PSCs谱系分化过程中基因表达和相关通路的激活或抑制。因此,将现有的lncRNA作为调控多能干细胞早期谱系分化的调控靶点,开发小分子化合物或生物制剂,精确调控PSCs早期谱系分化,可作为下一阶段研究的重要问题。由于lncRNA数量庞大,作用范围广,作用机制复杂,目前的研究只是冰山一角,lncRNA在PSCs早期谱系分化相关基因转录调控中的更多作用模式尚待发掘;lncRNA是否也广泛参与早期谱系分化相关基因的转录后修饰,尚不完全清楚,是一个值得高度关注和探索的领域。随着高通量测序技术的发展,lncRNA的研究已不再局限在点对点的研究上,已经可以从更精细的全基因组调控网络图谱中,全面了解PSCs早期谱系分化的调控机制。