基于多维组学的冠心病遗传研究进展
2022-11-24张炜林蒋立虹
张炜林,曹 宇,蒋立虹
(1昆明理工大学医学院,云南 昆明 650500; 2云南省第一人民医院心外科,云南 昆明 650032)
冠心病(coronary heart disease,CHD)的病因受控于多种危险因素,其传统危险因素有高血压、吸烟、血脂异常、肥胖、性格和阳性家族史。早在20世纪50年代的临床观察研究就支持CHD风险是可遗传的观点[1]。根据最新全球疾病负担研究专题报告,在中老年群体中,缺血性心脏病居十大病因之首[2]。CHD是心血管疾病导致死亡的主要原因,约占所有病例的45%[3]。多组学关联分析在国内外心血管领域相关研究中已有报道,本文从基因组学、表观组学、转录组学、蛋白质组学、代谢组学、空间组学等不同维度对CHD遗传学研究进展及其风险预测进行深入探讨,将进一步明确CHD疾病遗传机制,并提供风险评估。
1 基因组学与CHD
基因组学是有关人类基因组构成、基因结构与功能关系及表达调控的研究。人类基因组的遗传变异是常见的(等位基因频率>1%),即常见变异为常见病遗传风险的主要来源[4]。基于高通量分析和检测技术,可对数千个靶点和通路筛选得到CHD常见基因变异位点,对CHD进行预测并干预,可避免严重的不良心血管事件发生。既往研究中已发现包含CHD在内的7种常见病基因,建立了相关的基因信息数据库[5]。近年来,全基因组关联性研究发现的CHD易感基因已超过160个易感位点[6],极大地促进了CHD遗传研究进程。
1.1 CHD基因组学方法
基因组学方法有连锁分析法、候选基因关联分析法、全基因组关联性研究以及直接测序法(包括全外显子和全基因组测序)。此外,罕见变异关联研究在测序技术日臻成熟的背景下,将发现CHD中更多的罕见遗传变异(1%~5%)。
1.2 CHD相关生物学通路基因表达
基因组学研究揭示CHD基因表达的生物学信号通路。此外,基因组非编码区突变可能改变基因产物的转录、翻译或稳定性,促进CHD的发生和进展。当前,低密度脂蛋白胆固醇和脂蛋白(a)、甘油三酯的脂蛋白、炎症、细胞增殖、血管重塑、血管张力及一氧化氮(nitric oxide,NO)信号为CHD基因组学中研究的热点方向。
1.2.1 低密度脂蛋白胆固醇和脂蛋白(a) ZHAO等[7]构建Ldlr突变引起的家族性高胆固醇血症小鼠模型,高脂喂养诱发小鼠产生严重的动脉粥样硬化,通过AAV-CRISPR/Cas9治疗后实验组小鼠动脉粥样硬化相关血清标志物减低、斑块维持稳定,将来可能成为家族性高脂血症治疗的方向。最近研究表明,个体ABCG5/8转运蛋白序列变异降低,循环中非高密度脂蛋白胆固醇、植物甾醇含量升高,可促进动脉粥样硬化形成并伴随CHD风险增加[8]。
1.2.2 甘油三酯的脂蛋白 20世纪80年代,NAMBOODIRI等[9]证实血液中脂蛋白和脂质的浓度是由遗传所致。此后的研究表明,甘油三酯浓度与CHD风险之间存在较强的相关性[10]。一项全基因组关联研究报道,载脂蛋白A5基因多态性是甘油三酯浓度最强的遗传决定因素[11]。同时,最近的一项荟萃分析表明,循环中低密度脂蛋白胆固醇水平降低,主要血管事件持续减少且无副作用[12]。因此,血浆总胆固醇、低密度脂蛋白胆固醇和甘油三酯浓度是冠状动脉疾病(coronary artery disease,CAD)的危险因素。脂质常见变异基因组研究提示,全基因组与脂质性状显著关联,血脂相关基因位点与CHD发病相关[13]。
1.2.3 炎症 CHD与冠状动脉粥样硬化关联密切,而动脉粥样硬化形成的不同阶段皆有炎症细胞及炎性介质参与,表明慢性炎症反应在CHD中是重要促发因素。研究认为促进冠状动脉血管炎症发生发展的炎性因子包括白细胞介素(interleukin,IL)-1、肿瘤坏死因子(tumor necrosis factor,TNF)-α、干扰素-γ、TH1细胞因子(INF-γ)、IL-6、TNF相关蛋白1等,亦包括有抗炎作用的基质金属蛋白酶产物、IL-37等物质。
1.2.4 细胞增殖和血管重塑COL4A1/COL4A2属于IV型胶原基因家族,IV型胶原是基底膜的主要结构组成,转化生长因子β信号通路激活下游SMAD通路在转录和蛋白水平上调COL4A1和COL4A2基因的表达,促使IV型胶原抑制平滑肌细胞生长,减少炎症基因表达,限制对低密度脂蛋白的摄取,进而抑制冠状动脉粥样硬化形成[14],而YANG等[15]在全基因组关联研究中也印证了COL4A1/2与动脉粥样硬化相关。
1.2.5 血管张力和NO信号 NO以L-精氨酸为合成底物,在血管内皮细胞内经NO合成酶(nitric oxide synthase, NOS)的催化作用生成。NO信号通路是血管内皮细胞调节血管舒张/收缩的关键。NO脂溶性好,易透过血管内膜,发挥抑制血小板聚集、白细胞黏附、舒张血管等功能。主要研究基因包括GUCY1A3、EDNRA、NOS3等。进一步荟萃分析显示,内皮型NOS基因多态性与急性冠状动脉综合征或急性心肌梗死的风险有关[16]。
2 CHD表观组学
表观遗传调控不改变原遗传序列,影响转录及转录后调控达到对基因结构和表达产物的调节。表观遗传学修饰主要包括DNA甲基化与组蛋白修饰及非编码RNA,个体表观遗传识别有助于心血管疾病诊断、预测和预后生物标志物及药物靶点选择[17-18]。基于基因表达的CHD严重程度评分测试[19-21]已经证明了其在评估CHD风险、诊断和未来心脏事件方面的潜力。
2.1 DNA甲基化
DNA甲基化是由DNA甲基转移酶催化胞嘧啶转化为5-甲基胞嘧啶的过程,对DNA进行直接化学修饰且不改变DNA序列,与基因表达调控密切相关[22-23]。心肌组织对表观遗传改变是最直接的证据,但获取困难,可通过血液来观察其变化。研究报道,通过5项队列研究对40多万血液DNA甲基化位点进行研究,发现505个表观遗传位点在不同队列中的重叠,证实表观遗传生物学通路存在相互关联,其中有19个差异甲基化磷酸鸟嘌呤位点与CHD正相关[24]。近期另一研究也发现,在欧美国家的人群中血液源性DNA的甲基化与未来CHD的风险相关[25]。通过外周血细胞进行RNA提取及转录组测序分析,可预测CHD风险,为治疗提供决策、评估预后。
2.2 组蛋白修饰
组蛋白修饰包括组蛋白甲基化、乙酰化和泛素化、磷酸化途径,在转录水平对CHD基因进行靶向转录调控而影响CHD发生发展。有研究证实,组蛋白去乙酰化酶9和沉默信息调节因子2相关酶1进行调节表达,与环境因素共同作用可调控CAD基因,使得CAD风险增加,组蛋白和非组蛋白的乙酰化已成为心血管疾病风险共识[26-27]。
2.3 非编码RNA调控
非编码RNA参与基因调控和疾病发病机制。非编码RNA中转录后的基因表达调控、突变和单核苷酸多态性是心血管领域的研究前沿。动脉粥样硬化是大部分CHD的基础病变这一观点已经受到广泛认可。有研究表明,Nexilin F-肌动蛋白结合蛋白(nexilin F-actin binding protein,NEXN)是一种具有细胞黏附和迁移作用的肌动蛋白结合蛋白的编码基因,其中长链非编码RNA(long non-coding RNA,lncRNA)NEXN-AS1通过TLR4/NF-κB介导途径上调NEXN的表达,通过过表达负反馈抑制TLR4和NF-κB信号通路而实现减少内皮细胞炎症分子表达,抑制单核细胞募集,减缓动脉粥样硬化发生[28]。
综上所述,识别表观遗传有助于临床应用,可作为检测表观遗传生物标志物,为CHD高危人群进行筛查诊断;其表观遗传可通过其修饰靶点进行相关药物干预。
3 转录组学与CHD
转录组是由某个物种或特定细胞类型所产生的全部RNA的集合。关注转录后的总RNA,利用高通量测序技术,可揭示CHD的基因表达、结构差异,阐明分子机制。2006年KURIMOTO等[29]从单细胞中全局扩增mRNA,再到TANG等[30]的单细胞转录组测序技术mRNA-seq,单细胞转录组测序已得到广泛开展。scRNA-seq已应用于动脉粥样硬化研究,可识别以前未被识别的细胞群[31-32]。目前单细胞水平分子研究已从单细胞转录组分析扩展到单细胞基因组研究。miRNAs在血液和尿液等生物液体中稳定表达、lncRNA覆盖的RNA分子超过200个核苷酸,在许多组织中均可表达[33]。lncRNA、miRNA转录调控与CAD发生发展有关。lncRNA ANRIL、miR-181b介导NF-κB信号通路,ANRIL通过靶向miR-181b控制CAD细胞的增殖和凋亡,从而诱导NF-κB信号通路的激活释放多种炎性因子,促进CAD的产生及发展[34]。先前全基因组关联研究发现易致CHD发生的9p21染色体上的遗传变异,也是由lncRNA ANRIL介导的,其基因与9p21基因组具有共同作用位点[35]。MORADI等[36]经过人群病例对照研究验证miR-10a调控NF-κB信号通路参与动脉粥样硬化形成。同时,临床研究表明RNA表达在CHD组冠状动脉及体循环中高于非CHD组[37]。
4 蛋白质组学与CHD
随着心血管蛋白质组学研究突破及质谱技术的进展,无标记蛋白质组定量已广泛应用于CHD的蛋白质生物标志物研究[38]。在分子机制水平,数百种细胞内、外蛋白的集合导致动脉粥样硬化,共同改变细胞过程并特征性地重塑局部血管环境。最终,这些蛋白质组水平上的改变导致了大多数缺血性心血管事件的发生[39]。
脂联素是一种从脂肪细胞中释放的激素,具有胰岛素增敏和抗动脉粥样硬化特性[40]。进一步研究证实,吸烟者可引起血液中单个核细胞中的脂联素mRNA水平降低[41],从而导致动脉粥样硬化的发生发展。转录因子与CHD关联密切,TCF21编码一种碱性螺旋-环-螺旋转录因子,该因子可促成冠状动脉平滑肌细胞(smooth muscle cell,SMC)的前体细胞迁移到血管病变中,并促进纤维帽的形成,维持斑块稳定[42]。众所周知,SMC可促进动脉粥样硬化斑块的形成。人类遗传和基因组数据表明,TCF21表达可降低CAD风险,心肌素-血清反应因子[myocardin(MYOCD)-serum response factor(SRF)]是TCF21的下游通路,阻断该通路起到抑制SMC分化的作用,其保护路径在于TCF21与心肌蛋白直接互作,破坏MYOCD-SRF复合物,抑制SMC基因表达,以及与SRF在相同的位点上结合抑制SRF表达[43]。
5 代谢组学与CHD
代谢组即基因组下游参与机体新陈代谢、维持机体正常功能及生长发育,Mr常在1 000以内。虽然代谢组学在不断发展,CAD生物标志物也相继出现,但其功能机制尚未明确。功能代谢组学可将代谢组学衍生的生物标志物转化为疾病机制[44]。在一项临床研究中,以神经氨酸酶-1对心肌损伤起到保护作用为切入口,其在心脏的异常激活可导致血浆Neu5Ac升高,Neu5Ac在CAD患者血浆中的表达显著增加[44]。另一项研究显示,通过新型基因、代谢网络IPA,可揭示炎症、胰岛素和脂质通路的基因与动脉粥样硬化代谢标志物的关系,表明动脉粥样硬化中存在代谢紊乱,包括甘露糖、对乙酰氨基酚-葡萄糖醛酸、乳酸和载脂蛋白B等在内的代谢物[45]。
6 空间组学与CHD
传统转录组学、蛋白质组学并不能了解细胞间相互作用、细胞外基质、生物力学等对于细胞乃至信号转导模式的影响。基于时间与空间的组学研究,联合生物信息学,可明确以上心血管疾病分子调控的功能与作用。虽然不同于基因组学、转录组学、蛋白质组学等得到普遍的开展,但空间组学在主动脉瓣钙化病的研究中已得到验证[46]。
DBiT-seq高分辨空间组学技术,可获取单细胞测序技术无法涉及的细胞空间分布信息[47]。空间组学捕获细胞空间特异性信息,还原组织中细胞相对位置关系,揭示细胞空间分布关系对疾病的影响。该技术的短板在于无法从组织切片上进行空间表观基因组测序,而高空间分辨率染色质修饰状态分析测序则提供了解决方案,这项空间表观基因组测序技术,揭示了组织类型特异性的表观遗传调控,可进行组织全基因组轮廓解读[48]。以心血管疾病实验常用动物(鼠)为例,明确实验对象心肌细胞的位置关系。通过糅合空间多组学技术进行组学深度挖掘,空间定位组学从基因表达、转录、翻译等不同层面收集组织或细胞结构的分子、细胞、微环境信息,揭示心血管疾病的关联发病机制。目前针对新衍生出的空间组学在心血管领域的研究面尚未普及,但今后将有更大的研究前景。
7 多组学联合分析
基因组学亟待解决的问题是明确基因组DNA序列,测序可明确编码序列的异同。此外,RNA表达量、蛋白结构与活性并不能通过基因序列来明确。遗传学库与阳性病理样本不足也是掣肘基因及表型的关联。此外,存在dsRNA介导RNAi由特定酶参与的特异性基因沉默现象,可在转录层面、转录后和翻译水平上阻断基因的表达。目前转录组学技术存在的不足之处:BINGHAM等[49]研究指出,经过转录、降解、翻译和翻译后修饰等过程,RNA与蛋白质并非以1∶1的比例表达,因此,需通过蛋白质组学进一步明确转录后蛋白质表达量、蛋白质之间的相互作用及定位等,从而获取转录后翻译层面的生物学信息。蛋白质组学中蛋白浓度、活性、同类蛋白补偿效应,均可能影响到研究结果,而代谢组学中小分子物质则可弥补这种不足。
随着各组学技术日臻成熟,CHD研究将趋向多组学联合分析、多维度揭秘疾病机制,弥补各个组学之间的不足。当前国内外研究学者所开展的研究已经体现多组学相互融合所发挥的作用[43,50-51]。多组学实验研究的一项结果显示,构建CHD患者中颈动脉斑块的mRNA表达谱,可识别出与易损斑块相关的关键上调基因,并通过加权基因共表达网络分析(weighted gene coexpression network analysis,WGCNA)回归构建广泛的成员基因共表达网络。再通过WGCNA与蛋白相互作用网络分析相结合分析易损斑块相关基因表达谱,从而识别斑块内巨噬细胞中促使易损斑块形成的功能基因模块,进而明确基于miRNA调节导致动脉粥样硬化的上游机制[52]。基于CHD疾病的多因素性,单一研究并不能很好解释遗传效应及现象。因此,整合多组学对于CHD显得尤为重要。
8 风险预测
CHD基因组风险评分将为CHD患病风险提供评估与预测。随着各组学技术的快速发展,联合多组学评估分析,将极大地协助CHD临床诊疗。以往CHD大型研究表明,多基因高风险和疾病风险之间联系紧密。近年来研究表明,早发性CHD多基因风险评分优于临床风险评分[53]。另一方面,有研究指出多基因风险评分与CHD发病率显著相关,但多基因风险评分与临床风险评分对CHD事件的预测准确性差异不大[54]。未来随着遗传研究的深入,基因风险预测评估作用将更加显著。已有的大型基因组研究提出,疾病风险预测前瞻研究有益于早期预测发现患病的风险,进行超前性疾病筛查与干预[5,55]。基因测序在医学遗传学领域的普遍开展,以及疾病基因筛查,将进一步降低CHD风险。在不远的将来,CHD风险预测及预防将成为精准个体化治疗的关键。