早发性冠心病的基因学研究进展
2021-12-05葛均波
苏 雅, 姚 康, 葛均波
复旦大学附属中山医院心内科,上海 200032
冠状动脉粥样硬化性心脏病(冠心病)已成为人类第一大死因[1]。目前,冠心病的部分发病危险因素已明确,包括吸烟、肥胖、糖尿病、高血压、血脂异常、冠心病家族史、年龄及性别等。临床发现,冠心病家族史可显著增加个体患冠心病的概率[1],这提示冠心病发病可能与遗传因素有关。在家系及双胞胎研究[2]中,冠心病的遗传率为40%~60%。
遗传因素对冠心病发病的影响在年轻患者中更加显著,这表明基因变异在早发性冠心病(premature coronary artery disease,PCAD;男性在55岁以前、女性在65岁以前发生冠心病[3])的发病机制中占有重要地位[2]。罕见突变及常见突变都能通过影响脂质代谢、血栓形成、血管内皮再生及修复等不同代谢通路导致PCAD。本文将综述PCAD发病机制中基因学研究成果及最新进展,并探讨其在中国人群中的适用性。
1 符合孟德尔遗传规律的PCAD
1.1 PCAD与脂质代谢通路异常 在冠心病的基因学研究中,对脂质代谢通路相关基因的罕见突变研究最为充分。低密度脂蛋白(low density lipoprotein, LDL)相关基因与PCAD关系最为密切;此外,部分高密度脂蛋白(high density lipoprotein, HDL)单基因突变的罕见疾病也会导致PCAD[4]。
1.1.1 LDLR、载脂蛋白B(APOB)、前蛋白转化酶枯草杆菌蛋白酶kexin-9(PCSK9)、低密度脂蛋白受体衔接蛋白1(LDLRAP1)与家族性高胆固醇血症 家族性高胆固醇血症通常被认为是一种常染色体显性遗传病[5]。以血浆高水平低密度脂蛋白胆固醇(LDL-cholesterol, LDL-C)为特征,患者易患PCAD、早发脑血管病及外周血管病。其发病机制与LDL颗粒由受体介导的摄取功能障碍有关。该通路的功能障碍可由编码以下4个蛋白的基因罕见突变引起[6]。(1)LDLR: 超过90%的分子诊断病例中[7],家族性高胆固醇血症由编码低密度脂蛋白受体(LDLR)的基因突变引起。目前该基因共有1 700个突变被描述。LDLR基因突变导致肝细胞表面的LDLR缺失或失活,肝细胞摄取LDL-C减少,从而使血浆LDL-C水平升高[5-6]。(2)APOB: 约5%的分子诊断家族性高胆固醇血症病例中,致病突变位于编码APOB的基因[8]。携带APOB突变的患者LDL颗粒与LDLR结合障碍导致循环LDL-C浓度升高。(3)PCSK9: 2003年编码PCSK9基因的获得性功能突变被确认是家族性高脂血症的另一个致病原因[9]。突变的PCSK9在与LDLR形成复合物时,可干扰LDLR的回收,由此导致LDLR降解,从而减少肝细胞表面可与循环中的LDL颗粒结合的受体数量。(4)LDLRAP1: 在家族性高脂血症中,一种罕见的常染色体隐性遗传亚型,LDLRAP1基因在1p36.11位点的纯合和复合杂合突变产生。LDLRAP1在LDL的内化过程中通过内吞作用与LDL受体相互作用。当该过程存在缺陷时,导致LDL分解代谢缺陷和血浆LDL-C水平升高,产生高胆固醇血症表型[10]。
由于LDL清除途径受损,LDL颗粒积聚在血管壁,导致炎症反应,从而使内皮组织损伤、动脉粥样硬化斑块形成[11]。这一过程开始于患者年轻时,Jongh等[12]的研究表明,在9~18岁的无临床症状杂合型家族性高脂血症患者中,血管内皮功能已明显受损。因此该病患者易发生PCAD。有研究[13]表明,在前他汀时代,家族性高胆固醇血症患者在20~39岁死于冠心病的概率是普通人群的100倍。
1.1.2 载脂蛋白E(APOE)与家族性高脂血症Ⅲ型(FHⅢ) FHⅢ是一种常染色体隐性遗传病。其典型特征包括血浆高中间密度脂蛋白血症、掌部微黄色斑块、富胆固醇的炎性黄色瘤。该病患者易发生PCAD及周期性胰腺炎[14]。
APOE基因突变是导致家族性高脂血症Ⅲ型的病因[14]。APOE是肝细胞上LDL受体的配体,负责摄取乳糜微粒(chylomicrons,CM)、中间密度脂蛋白(intermediate density lipoproteins,IDL)和极低密度脂蛋白(very low-density lipoproteins,VLDL)颗粒。APOE是一种多形态的蛋白质,主要有3个亚型——E2、E3、E4。其中E3是野生型,而E2和E4则与疾病相关[14]。FHⅢ患者主要是APOE2亚型纯合子。在FHⅢ患者中,APOE基因突变导致上述脂蛋白颗粒的分解代谢延迟,同时增加血浆中的胆固醇和三酰甘油(triacylglycerol, TG),导致一系列临床症状发生[14]。
1.1.3 载脂蛋白A-Ⅰ(APOA-Ⅰ)与APOA-Ⅰ缺乏性低脂蛋白A血症 APOA-Ⅰ是HDL颗粒的主要蛋白质成分。编码该蛋白的基因仅在肝脏和小肠中表达。在血浆中分泌后,APOA-Ⅰ通过ABCA1介导的游离胆固醇和磷脂从外周血细胞中排出并脂化。这种脂化作用可促进新生圆盘状HDL颗粒形成[15]。APOA-Ⅰ基因突变导致的APOA-Ⅰ缺乏是家族性低脂蛋白A血症的发病基础之一[16]。
大量前瞻性流行病学研究[17]证实,APOA-Ⅰ水平是冠心病发病风险的有力预测因素。然而,APOA-Ⅰ缺陷携带者对冠心病的易感性却有显著差异性。Yokota等[18]、Pisciotta等[19]、Ikewaki等[20]共报道25例APOA-Ⅰ完全缺乏患者,虽然所有病例血浆HDL-C水平均显著降低,但只有11例患者表现出PCAD。而在另外一项以颈动脉内膜中层厚度(intima-media thickness, IMT)为测量指标的研究[21]中,APOA-Ⅰ缺乏患者则表现出与PCAD的高相关性。在Hovingh等[21]的研究中,测量33例APOA-Ⅰ(L178P)突变携带者及40例家庭对照组的IMT结果发现,与对照组相比,携带者的动脉壁厚度进展明显增加。值得注意的是,该研究指出APOA-Ⅰ(L178P)缺陷携带者的动脉粥样硬化进展速度与家族性高胆固醇血症患者没有区别。这提示导致HDL代谢障碍的单基因疾病可能具有与LDL代谢缺陷相似的致心血管损害作用。
1.1.4 APOA-Ⅴ与APOA-Ⅴ缺乏性高三酰甘油血症 全基因组关联研究一致确认APOA-Ⅴ是血浆三酰甘油(TG)水平的一个调节因素[22]。APOA5基因位点的单核苷酸多态性与血浆TG升高相关。
APOA-Ⅴ是一种较小的血浆载脂蛋白,已被证实在TG代谢中通过增强VLDL脂解和清除发挥重要作用[22]。升高的TG与心血管疾病的风险增加密切相关。有研究[23]表明,APOA-Ⅴ基因罕见非同义突变的携带者发生早发性心肌梗死的风险是普通人群的2.2倍。
1.1.5 ABCG5,ABCG8与谷固醇血症 谷固醇血症是一种罕见的儿童常染色体隐性遗传疾病,其特点是血浆植物甾醇水平显著升高(30倍)[24-26]。导致谷固醇血症的分子缺陷由编码转运蛋白ABCG5和ABCG8的2个基因突变引起。
谷固醇血症患者的心血管疾病可出现在0~20岁,但通常要推迟到中年。与纯合子家族性高胆固醇血症患者相似,谷固醇血症患者同样可出现主动脉狭窄、溶血及血小板减少症[27]。
1.1.6 三磷酸腺苷结合盒转运子A1(ABCA1)与丹吉尔病 丹吉尔病在家族性HDL缺乏疾病中最为严重[28]。患者体内胆固醇酯类物质可在全身多器官系统堆积,如扁桃体、周围神经、肠黏膜、肝、脾、骨髓、淋巴结、胸腺、皮肤、角膜等,引起多器官系统病变。自该病发现至今,在全球确诊的100多例患者中,约30%伴随早发性心肌梗死[28-29]。
丹吉尔病是由ABCA1基因突变引起的常染色体隐性遗传病[28, 30]。ABCA1基因编码的转运体在胆固醇逆向转运的第1步中起关键作用。ABCA1的缺乏削弱了自由胆固醇从外周细胞中的排出,导致胆固醇酯在细胞中积累,从而引起血浆中HDL及总胆固醇水平降低及多器官系统的胆固醇积累[31-32]。
多项研究[21]表明,血浆高APOA-Ⅰ及HDL水平是人类动脉粥样硬化的保护因素,流行病学资料也表明APOA-Ⅰ水平是冠心病强有力的预测因素之一。除了调节胆固醇外排功能,HDL还能通过调节炎症反应、抗氧化及调节血管舒缩功能实现对心脏血管的保护[33]。此外,HDL还可减缓LDL的氧化,从而预防动脉粥样硬化[34]。当血浆中HDL及APOA-Ⅰ水平下降时,LDL氧化增加,动脉粥样硬化进程加快,导致丹吉尔病患者中PCAD患病率高达30%,明显高于普通人群。
1.1.7 PCAD与先天性高同型半胱氨酸血症(HHcy) 同型半胱氨酸是蛋氨酸和半胱氨酸正常生物合成的中间产物[35]。多种原因可导致HHcy,如饮食中缺乏叶酸、维生素B6和维生素B12,参与同型半胱氨酸代谢的酶的基因缺陷等[36]。其中,饮食等环境因素及参与同型半胱氨酸代谢的5,10-亚甲基四氢叶酸还原酶的常见突变往往导致轻至中度HHcy[36-37]。而某些酶的罕见基因突变则会导致重度HHcy(血同型半胱氨酸大于100 μmol/L),即先天性HHcy。这些罕见突变包括胱硫醚-β-合酶(CβS)的纯合突变、亚甲基四氢叶酸还原酶(MTHFR)的纯合突变、甲硫氨酸合酶突变及某些维生素B12代谢基因的紊乱[37]。
研究[38]表明,HHcy与心肌梗死和脑卒中存在显著相关性。其中,MTHER纯合突变的先天性HHcy患者常患PCAD[35]。然而,一项大型荟萃分析[35]显示,MTHFR突变与冠心病发病率升高的相关性仅在中东和日本被证实,在其他地区两者则无显著相关性。但更多研究[39]证实,HHcy与冠心病存在确切联系。据目前已有研究[40],HHcy患者患冠心病风险增加主要是由于同型半胱氨酸导致血管内皮顺应性改变及血小板聚集,从而导致血管内皮功能障碍,促发动脉粥样硬化。此外,还能通过增加HMG-CoA还原酶的活性促进胆固醇合成[40],并通过血管平滑肌细胞刺激产生C-反应蛋白,启动血管内皮炎症反应[41]。
总之,虽然大多数研究表明HHcy与PCAD存在联系,但似乎还有其他证据阻止将其作为冠心病的生物标志物[39]。家族性HHcy与PCAD是否存在确切关系还需要进一步研究。
2 多基因发病的PCAD
冠心病是一种典型的由遗传和环境因素共同决定发病的复杂疾病。虽然有小部分冠心病是由单基因罕见突变引起,但这部分罕见突变在冠心病的发病机制中仅占2%[2,42]。具体到PCAD,尽管遗传因素在发病机制中占更重要的地位[2],但有研究[43]证明,在临床诊断早发性心肌梗死的人群中不具备罕见突变的病例是具有罕见突变病例的10倍。另外,在临床诊断家族性高胆固醇血症患者中,也有20%左右并没有经典的LDLR、APOB、PCSK9突变[44]。这说明,在PCAD的发病机制中,具有较小效应的常见突变的积累仍是主要遗传模式。
2.1 PCAD与常见变异关联研究(CVAS) 常见CVAS也称为全基因组关联研究(genome-wide association studies,GWASs),采用包含100万个由单核苷酸多态性(single-nucleotide polymorphisms,SNPs)DNA标记芯片的高通量DNA微阵列技术[2]。
到目前为止,大型CVAS[1,45]共识别超过150个与冠心病有关的基因座,由这些基因识别的冠心病危险因素包括LDC-L、富含TG的脂蛋白、胰岛素抵抗、血栓形成、炎症、细胞黏附/跨内皮迁移、血管重构、血管张力等。例如,通过CVAS[46]发现凝血酶原G20210A(rs1799963)多态性与早发性心肌梗死存在关联。凝血酶原(又称凝血因子Ⅱ)是凝血酶的前体,是一种起促凝作用的关键酶,通过促进血小板活化和纤维蛋白及Ⅴa、Ⅷa、ⅩⅢ等因子生成发挥作用[46]。凝血酶原基因内的G20210A多态性(rs1799963)与凝血酶原的较高循环水平相关,因此增加发生心肌梗死的可能性。一项meta分析研究[47]表明,该基因多态性增加心肌梗死的风险与年龄有关,在年龄小于55岁的人群中发现更显著的相关性。Butt等[48]研究发现,50岁以上的凝血酶原G20210A携带者发生心肌梗死的风险没有升高,而50岁以下的携带者发生心肌梗死的风险是年龄匹配的非携带者对照组的5.6倍。但需要注意的是,只在高加索人种中发现G20210A (rs1799963)多态性与早发心肌梗死有关[47]。
当进行CVAS时,由于识别的SNPs绝大多数位于染色体非编码区,因此具有这些使患病风险升高SNPs的人群往往缺乏可检测的生物学标志[1]。为了对这部分人群进行风险分层,发明全基因组多基因评分(genome-wide polygenic score,GPS)[49]。GPS为根据个体效应大小进行加权的风险等位基因数量计算的评分[2]。一项基于英国Biobank的冠心病GPS研究[49]认为,家族性高胆固醇血症患者患冠心病风险是普通人群的3倍,而通过GPS同样能识别患冠心病风险是普通人群3倍的潜在患者。更引人注目的是,通过GPS发现的高风险人群数量是相同风险人群的20倍[50-51]。
冠心病GPS的优势在于,可从出生时开始评估,早于其他风险因素的鉴别能力[49]。有研究[52-54]表明,冠心病的高多基因风险可能被2种干预措施,即坚持健康的生活方式或使用他汀类药物进行降胆固醇治疗之一抵消。GPS的这些特性可为公共卫生领域制定冠心病的一级预防策略提供帮助。然而,创建准确预测冠心病风险的GPS需要依托大型原始CVAS,还需要精确的算法及建立足够大的数据库以检验其准确性[49]。这对国家卫生系统而言是不小的挑战,因此还需要较长时间才能真正将GPS常规运用到医疗中。
2.2 PCAD与基因调控网络(GRN) 尽管现在CVAS研究如火如荼,但通过现有研究发现的SNPs依然只能解释冠心病20%左右的遗传效应[2]。关于缺失的80%,有如下几种可能的解释:(1)这种缺失的遗传性可能是由于基因环境的相互作用[55],其中一个特定遗传变异的影响只在一个特定影响因素的存在下表现出来,如肥胖或吸烟[2];(2)可能许多更常见的变异与冠心病有关,但由于效应量小或等位基因频率低及样本量不足,在CVAS中没有统计学意义[2];(3)CVAS研究只检查SNPs,忽略了许多其他形式的基因组变异,如缺失、插入、反转、复制、拷贝数变异、印记表观遗传学等,并且缺乏评估罕见变异的统计学方法[56]。
鉴于目前的罕见变异研究与常见变异研究成果仍不能充分解释PCAD的遗传性,GRN被提出[57]。GRN这一概念兴起于高维组学技术的发展[58]。通过测量海量全基因组生物学参数,包括DNA变异和表观遗传修饰、RNA和蛋白质浓度及各种代谢物等,并将这些多维网状数据用大型计算机和复杂的算法加以处理,从中识别患病个体发病机制中的关键驱动因素[58]。这一技术的进展为理解多基因复杂疾病的遗传背景提供了新的思路。
具体到冠心病的遗传背景研究,运用组学的方法引进了基因遗传表达研究。这种研究可看作是CVAS的延伸,其特点是在中间层中引入RNA表达,捕获遗传变异和环境扰动对疾病表型的影响。这种互补的、数据驱动的方法不仅可识别疾病基因,还可识别以GRN形式存在的冠心病致病相关通路[57]。例如,一项基于斯德哥尔摩动脉粥样硬化基因网络研究[59]的冠心病基因遗传表达研究识别了28个独立的、在心血管疾病中活跃的GRN。这些网络中的遗传变异对冠心病遗传性的贡献率为10%,高于由CVAS识别的风险基因座[57]。然而,目前并未将组学方法运用至PCAD的遗传背景研究中。这意味着PCAD的遗传背景尚有很大的探索空间。
综上所述,虽然PCAD的遗传背景研究已取得许多重大成果,但现有成果基于的研究对象绝大部分是高加索人群。在2009年,只有约4%的全基因组基因分型样本来自非欧洲人群;2014年,这一比例上升至19%[60]。我国目前并没有多中心、大样本的PCAD遗传背景研究项目成果发表。尽管大多数在欧洲人身上发现的与疾病相关的CVAs位点已在东亚人群中被复制[2, 61],但尽早开展大规模中国人群PCAD遗传背景研究依然具有重要意义,确认基于高加索人群的研究成果能否完全适用于中国人,甚至寻找到中国人特有的致病基因位点,对我国PCAD患者的预防和治疗均有重要意义。
利益冲突:所有作者声明不存在利益冲突。