长链非编码RNAs在扩张型心肌病中的研究进展
2020-02-16赵增任澎
赵增,任澎
(1.新疆医科大学研究生学院,乌鲁木齐 830001; 2.新疆维吾尔自治区人民医院心血管内科,乌鲁木齐 830001)
扩张型心肌病(dilated cardiomyopathy,DCM)是一种以心室扩大和心肌功能下降为特征的异质性心肌病,主要临床表现为心脏扩大、心室收缩功能降低、心力衰竭、室性及室上性心律失常、心脏传导系统异常、血栓栓塞和猝死,除外高血压、先天性心脏病、心脏瓣膜病、缺血性心脏病等;多数DCM病因不清,致病因素可分为遗传性因素、非遗传性因素和获得性因素,其中25%~50%的DCM与基因突变或家族遗传密切相关,目前已发现超过60个基因的相关突变与家族遗传性或散发的DCM有关[1];非遗传性因素包括病毒、细菌、立克次体和寄生虫感染等,可引起心肌炎并发展为DCM;部分获得性因素包括酒精、化疗药物等心肌毒性物质及内分泌和代谢异常,也可导致心肌损伤并逐渐发展为DCM。DCM的主要病理改变是心腔扩大,肉眼可见心室扩张、室壁变薄、心肌纤维瘢痕,常伴有附壁血栓形成;组织学表现为不同程度的心肌间质和血管周围纤维化,心肌纤维增粗、变性、断裂或坏死,如有炎症过程参与,则可见多种炎症细胞浸润。
近年来,对于DCM的研究仍主要集中于基因突变方面,TTN、LMNA、LVRR基因均与DCM左心室重构有关。有研究证实,二代测序技术在DCM患者中具有较高的遗传诊断率[2]。随着对非编码RNA的深入研究,长链非编码RNAs(long non-coding RNAs,lncRNAs)在心脏疾病中的作用逐渐成为研究热点。最初,lncRNAs被认为是RNA聚合酶Ⅱ转录的副产物,是基因组转录的“遗传垃圾”,并没有功能意义[3]。然而,研究发现,lncRNAs在心血管疾病、代谢性疾病以及恶性肿瘤的发生与发展等方面均发挥重要作用[4]。现对lncRNAs在DCM的心脏发育和心肌纤维化方面的研究进展予以综述。
1 LncRNAs概述
在人类基因组30亿个DNA碱基对中,5%~10%转录序列能被稳定转录,但仅约2%的RNA有编码蛋白质功能,其他3%~8%的序列中大多数是非编码RNA[5-7]。非编码RNA可分为lncRNAs和调控RNA。现已鉴定出27 919个人类lncRNAs基因及其表达谱,其中1 829个样本来自主要的人类原始细胞和组织,且其中约70%的lncRNAs具有潜在功能[8]。LncRNAs是含200个以上核苷酸的内源性RNA,存在于细胞质或细胞核内,以RNA形式在多个水平调节基因表达,但缺乏有效的开放读码框架,不具有编码蛋白质的功能[9-11]。
目前尚无统一的lncRNAs标准分类方法,根据lncRNAs基因组及其邻近编码区域的位置和相对方向,可将lncRNAs分为7类[12-13]:①正义lncRNAs,由包含外显子的蛋白质编码基因的有义链转录。②反义lncRNAs,通过反义蛋白质编码基因转录形成,与相反链上的转录产物部分或完全互补。③内含子区lncRNAs,由拦截基因序列的DNA序列转录,通过各种转录机制调节基因表达。④双向lncRNAs,与蛋白质编码基因共享相同的启动子,间隔大约1 kb,并以彼此相反方向转录。⑤基因间lncRNAs,是蛋白质编码基因间独立转录的序列。⑥增强子RNA,是蛋白质编码基因的增强子区产生。⑦环状lncRNAs,通过剪接转录产物形成的共价闭合环状RNA。
LncRNAs的主要作用机制包括:①指导lncRNAs与转录因子或蛋白质相互作用,并将它们募集到基因靶标或调节下游信号传导和基因表达的基因组位点。②诱导lncRNAs模仿并与其共有的DNA竞争结合核受体或细胞核中的转录因子,促进基因激活或沉默;还可以像“海绵”一样[14],吸附并带走多种转录及修饰因子等,增加额外水平的转录组调节,以改变其效应。③信号传导lncRNAs与信号传导途径相关,以响应各种刺激,实时调节转录基因的表达。④支架lncRNAs作为一个中心平台,许多蛋白质复合物与特定基因组位点或靶基因启动子结合,可选择性地利用特定信号成分和输出的重新定向和重塑细胞构成具有转录抑制或转录激活功能的复合体。
2 LncRNAs参与DCM发病的相关研究
2.1LncRNAs与心脏发育 lncRNAs的差异表达与心脏发育分化过程密切相关[15]。LncRNAs可与多个核酸形成复合物或作为共同激活剂通过直接干扰邻近基因等方式调节心脏发育基因在转录与转录后调控、表观遗传等层面的表达[16-17]。DCM发病与家族性遗传或基因突变密切相关,心脏发育的生理过程受到时间和空间等因素的精细调控。研究表明,lncRNAs广泛参与调节机体的病理生理过程,在调控心脏发育与维持心肌功能方面具有重要作用[18-19]。
2.1.1LncRNA Braveheart(Bvht) Bvht是一种与小鼠心脏发育相关的lncRNA,它是胚胎由新生中胚层向心脏分化过程中所必需的RNA。Kiattenhoff等[20]发现,Bvht是激活心血管核心基因网络的必需物质,在心血管发育的中胚层相关蛋白1上游起作用,并证明了Bvht在心脏发育过程中具有诱导调节心脏核心基因激活的关键作用;该研究同时证实,Bvht在心肌细胞分化期间与多梳抑制复合物2(polycomb repressive complex 2,PRC2)的核心成分多梳蛋白Zeste基因抑制子12相互作用,表明Bvht介导了心脏的表观遗传调节。Xue等[21]测定Bvht二级结构显示,Bvht由12个螺旋、8个终端回路、5个较大的(>5 nts)内部回路和5路结(5 WJ)组成,其可能包含3个外显子[5′结构域(H1~H2)、中央域(H3~H8)、3′结构域(H9~H12)],其中5′结构域包含一个不对称的富含G的内部环结构(AGIL);进一步研究表明Bvht AGIL可以与具有抑制心肌细胞分化功能的锌指转录因子细胞核酸结合蛋白相互作用,并证实细胞核酸结合蛋白是Bvht的心血管谱系定向作用方式的关键组成部分,同时显示Bvht和细胞核酸结合蛋白可能通过控制G-四链体结构共同调节心脏基因表达,与Bvht AGIL相互作用蛋白的功能成为未来研究的重点。然而,lncRNA Bvht在小鼠与人类基因组之间的保守性很低,目前并未发现两者相同来源的基因,Bvht在DCM中调节心脏发育中的作用需要进一步研究的阐明。
2.1.2LncRNA Fendrr Fendrr是一种长3 099 nt的lncRNA,定位于染色体3q13.31位点,包含4个外显子。目前对Fendrr基因的研究多集中于肿瘤方面,其在心脏发育方面的相关研究较少。研究显示,小鼠侧向中胚层特异性Fendrr是小鼠的心脏和体壁发展的基础,敲除小鼠胚胎Fendrr可上调控制侧板或心脏中胚层分化的几种转录因子,随着PRC2的急剧减少以及组蛋白H3的第27位赖氨酸三甲基化的减少和(或)启动子处组蛋白H3的第4位赖氨酸三甲基化的增加,Fendrr与PRC2和TrxG/MLL复合物结合,互相作用并调节心脏发育相关转录因子(GATA-6等)的表达,从而调控小鼠胚胎干细胞的分化,表明Fendrr可作为心脏基因活性的染色体信号调节器而发挥作用[22]。可见,Fendrr在心脏发育过程中具有重要作用,亦存在人类基因组中,但其在DCM心脏发育过程中作用尚缺少相关研究,需要进一步探讨研究。
2.1.3LncRNA CARMEN CARMEN是与活性心脏增强子和超级增强子相关的lncRNAs。Ounzain等[23]研究首次发现,增强子RNA与胚胎干细胞分化为心肌细胞期间的表达相关。进一步的研究证实,CARMEN通过与PRC2两种组分(Zeste基因抑制子12和Zeste基因增强子同源物2)的相互作用,起到了心脏内环境平衡调节因子的关键作用;同时还证实,CARMEN组合式抑制心脏规格和心脏前体细胞的分化独立于微RNA(microRNA,miRNA/miR)-143和miR-145的表达,两种miRNA位于增强子序列的近端,CARMEN的表达在心脏病理重塑过程中被激活,是维持心肌细胞分化的必需物质[24]。另有研究显示,Fendrr和CARMEN的表达水平与左心室质量指数呈正相关[25]。以上研究表明,CARMEN参与了心脏发育的调节,可能作为DCM病因诊断的生物标志物。
2.1.4其他 在脊椎动物和人类心血管发育过程中,Alien、Punisher、Terminator是起差异性作用调节关键步骤的lncRNAs,分别在心血管祖细胞、分化的内皮细胞中以及未分化的多能干细胞中特异性表达;敲除其中任何一种均可导致胚胎期小鼠心血管发育不良,表明它们在心脏发育中起重要作用[26]。研究表明,三重域查找器(TDF)具有识别形成新型三链体lncRNA及其靶基因的能力,为lncRNA与心脏发育分化研究提供了新的工具,下调长链非编码反义转录本(GATA6-AS)会损害GATA6的表达和心脏发育,GATA6-AS在人多能干细胞(hPSCs)分化成心肌细胞过程中具有调节心脏发育的作用[27]。
2.2LncRNAs与心肌纤维化 心肌纤维化是以心肌间质成纤维细胞过度增殖、胶原纤维过量聚集及异常分布为特征的心肌间质重塑。心肌纤维化主要包括6个途径:①转化生长因子-β1;②结缔组织生长因子;③肾素-血管紧张素-醛固酮系统;④炎症因子;⑤缝隙连接蛋白;⑥基质金属蛋白酶(matrix metalloproteinase,MMP)。多项研究显示,lncRNAs在心肌病中的作用多与调控心肌纤维化相关,而心肌纤维化是DCM的重要病理过程,常伴有心室增大、心律失常、心肌梗死及心力衰竭的发生,防止和逆转心肌纤维化对治疗多种心脏疾病的意义重大,特别是DCM[4,28-29]。
2.2.1LncRNA MIAT MIAT位于染色体22q12.1位点,仅分布在细胞核中,其表达水平与心肌纤维化的程度明显相关。Frade等[30]研究发现,在小鼠纤维化模型中,心肌组织中的MIAT表达明显增加;敲减MIAT质粒后,其心肌组织的纤维化水平显著下降,且相关纤维化调节因子及蛋白表达水平均下调。随后的研究发现,MIAT可通过序列互补性竞争内源性RNA海绵样作用吸收miR-24,而miR-24是转化生长因子-β1激活因子,能促进心肌纤维化的形成,MIAT表达增加会导致miR-24下调,最终导致心肌纤维化;该研究同时表明,MIAT是控制心肌纤维化并调节心肌梗死患者心脏功能的促纤维化因子,可被视为其他与纤维化相关的心脏病的治疗目标[31]。Zhou等[32]研究表明,MIAT可负调控miR-29a的表达,与肥厚型心肌病心肌纤维化的发展有关。
2.2.2LncRNA H19 H19是一种长度为2.3 kb的lncRNA,位于人类染色体端粒区11p15.5位点,属于H19/IGF2印迹位点,该基因在胚胎的发育过程中呈高表达,出生后表达被抑制,与心肌、肺、肝的纤维化病变相关。Huang等[33]研究发现,在心肌纤维化的过程中H19可通过吸附miR-455来调节结缔组织生长因子的表达。敲低H19水平可提高miR-455的抗纤维化作用,使结缔组织生长因子的表达水平降低,进一步减少Ⅰ型胶原蛋白、Ⅲ型胶原蛋白、α-平滑肌肌动蛋白(α-smooth muscle actin,α-SMA)等纤维化标志基因的表达。Tao等[11]研究发现,H19可通过负向调控双特异性磷酸酶5基因的表达影响心肌纤维化;进一步研究发现,纤维化模型中的胞外信号调节激酶1/2的磷酸化水平升高,该过程受双特异性磷酸酶5的调控,表明H19可通过抑制双特异性磷酸酶5的表达促进p-胞外信号调节激酶1/2表达,进而促进心肌纤维化的形成。
2.2.3LncRNA GAS5 GAS5是一种长度为630 nt的lncRNA,位于人类染色体1q25.1位点,可作为调控细胞生长和增殖的关键因子,与心肌细胞凋亡和心室重塑的调节密切相关。Tao等[34]研究显示,GAS5过表达可抑制心肌成纤维细胞增殖,并减少miR-21的表达。GAS5通过作用于miR-21调节人第10号染色体缺失的磷酸酶及张力蛋白同源基因的表达,以调控心肌成纤维细胞增殖和心肌纤维化。Liu等[35]研究表明,GAS5在纤维化心肌中的表达显著下调,注射pcDNA-GAS5可使过表达GAS5通过增加人第10号染色体缺失的磷酸酶及张力蛋白同源基因的表达来降低MMP-2、α-SMA和Ⅰ型胶原蛋白的表达,从而减轻心肌纤维化程度,改善心功能。
2.2.4LncRNA MEG3 MEG3长度为35 kb,定位于人类染色体14q32.3位点,MEG3表达水平与心肌纤维化程度相关。Piccoli等[36]通过对主动脉缩窄与假手术小鼠的心肌成纤维细胞的全lncRNA测序分析发现,心肌成纤维细胞中存在高表达且差异表达的MEG3;并通过体内外实验显示,沉默心脏成纤维细胞中的MEG3基因可以抑制p53与MMP-2启动子的结合,抑制心脏MMP-2的诱导表达,改善心脏纤维化和舒张性能。Zha等[37]研究发现,MEG3可在体内外通过miR-181a/Egr-1/Toll样受体4轴促进纤维化和炎症反应。另有研究证实,MEG3过表达不仅可明显抑制细胞增殖,增加细胞凋亡,下调α-SMA和Ⅰ型胶原蛋白α1链基因和蛋白的表达,还可减少纤维化相关基因的表达。
2.2.5LncRNA TUG1 TUG1是由7 598个碱基组成的lncRNA,位于染色体22q12.2位点。有研究显示,TUG1可参与多器官纤维化过程的调控,并与导致纤维化的相关蛋白有关[38]。Zhu等[39]研究发现,lncRNA TUG1表达与心肌纤维化程度呈正相关,但与脉搏氧饱和度呈负相关。随着缺氧时间的延长,心肌成纤维细胞的肌成纤维细胞标志物、Ⅰ型胶原蛋白和α-SMA的表达增加。TUG1敲低改善了缺氧诱导的心肌成纤维细胞-肌成纤维细胞转化。miR-29c是心肌纤维化的关键调节剂,而TUG1的3′非翻译区具有miR-29c结合位点,表明TUG1与miR-29c共同作用可能促进心脏心肌成纤维细胞-肌成纤维细胞转化的活化和慢性缺氧时的心肌纤维化。此外,慢性缺血性心肌病的发病过程亦与TUG1密切相关。Wu等[40]研究发现,TUG1与miR-145-5p结合可激活BNIP3蛋白的功能,进而激活Wnt/β联蛋白信号转导通路,从而介导慢性缺血性心肌病的发生与发展。Su等[41]研究表明,TUG1通过靶向miR-142-3p上调高迁移率族蛋白B1和Rac1蛋白的表达,在刺激缺血/缺氧心肌细胞自噬细胞凋亡中发挥核心作用,下调TUG1或上调miR-142-3p可改善心肌损伤和心肌纤维化。由此可见,lncRNA-TUG1与心血管疾病的发生发展密切相关,但其与DCM的关系以及是否能够作为DCM预后判断的预测因子尚未明确。
2.2.6其他 Ras相关结构域家族(RAS association domain family,RASSF)1是Rassf抑癌家族的成员,在心脏成纤维细胞中,其亚型的主要剪接变体RASSF1A凋亡,对心脏肥大和纤维化具有保护作用。RASSF1-AS1是RASSF1基因的反义转录。Guo等[42]研究表明,野生型RASSF1-AS1对核因子κB活化和心肌纤维化具有促进作用,但突变的RASSF1-AS1(结合区域被删除)无上述作用;同时RASSF1-AS1抑制RASSF1A翻译加剧了小鼠心肌纤维化,表明RASSF1-AS1可能是心肌纤维化的治疗靶点。随着lncRNAs研究的进展与相关技术不断的发展,Qu等[43]使用lncRNAs芯片技术筛选出多个在心肌纤维化组织中差异表达的lncRNAs,并使用实时荧光定量聚合酶链反应技术随机选择9个上调的和5个下调的差异表达lncRNAs进行验证,通过基因本体论和途径分析揭示了57个差异表达的lncRNAs和20对与心肌纤维化发展相关差异表达基因的lncRNAs信使RNA,首次在心肌纤维化的体内模型中证明了lncRNAs具有调节心肌纤维化的潜力,揭示了失调lncRNAs可能参与了心肌纤维化及相关病理过程,并提供了多个可能调控心肌纤维化的lncRNAs,为DCM的心肌纤维化调控机制研究提供了新思路。
3 小 结
lncRNAs可以从不同层面参与调控DCM,但与蛋白编码基因不同,lncRNAs无法通过序列推测其功能,且研究中存在较多难点,现有临床研究数据极少,目前lncRNAs在DCM乃至整个心血管领域的研究尚处于起步阶段,还存在许多认识空白,且对于lncRNAs在DCM的发生发展过程中的作用机制及治疗作用还有待进一步研究。随着生物信息学、高通量测序技术及基因芯片等技术的不断发展,lncRNAs基因数据库将不断得到完善,新的数据分析方法亦能够不断被应用,将有助于lncRNAs的深入研究,并为DCM潜在生物标志物和治疗靶点的研究提供帮助,为人类认识和诊治心血管疾病提供更确切可靠的证据。