孟德尔随机化研究及其在脑卒中病因探索中应用进展
2022-01-01张晓宇刘天一朱文豪王海峰
张晓宇 刘天一 朱文豪 王海峰
(吉林大学第一医院神经外科,吉林 长春 130021)
脑卒中按照脑血管突然发生的病变可分为缺血性脑卒中和出血性脑卒中。缺血性脑卒中最常见的是脑梗死,其亚型包括大动脉粥样硬化、小血管闭塞和心源性脑卒中等〔1,2〕;出血性脑卒中分为脑出血和蛛网膜下腔出血两大类〔3〕。脑卒中在目前中老年人群中有着较高的发病率、致残率和死亡率〔4〕,所以探索脑卒中的病因和高危因素非常重要。近期,基于全基因组关联研究的大样本的孟德尔随机化研究方法广泛应用在脑卒中的病因探索中,它是使用与风险因素相关的遗传变异作为工具变量,推测风险因素和疾病之间的因果关系。近年来,孟德尔随机化研究在疾病的高危因素探索中的应用越来越广泛。本文将围绕目前孟德尔随机化的研究方法及其在脑卒中的病因探索进行综述。
1 孟德尔随机化研究的介绍
流行病学研究的主要目的是明确疾病的高危因素或者暴露于特定风险因素是否会改变疾病的严重程度的可能性〔5〕。传统的观察性研究由于无法排除环境中产生的混杂因素影响,即使在暴露和结果之间测量出了强大的统计关联时,也无法证明暴露和结局之间存在明确的因果关系。与传统的观察性研究相比,孟德尔随机化研究使用长时间暴露产生的遗传变异作为工具变量(通常是单核苷酸多态性)来模拟暴露因素对疾病易感性的影响,有效避免了反向因果和混杂因素干扰,继而更为准确地推测出暴露和结局之间的因果关系〔6~8〕。
孟德尔随机化是由Katan在1986年首次提出,它是以孟德尔分离定律为理论基础,即“对亲本性状的等位基因形成配子时产生的影响,随减数分裂随机分配给子代”,利用全基因组关联研究通过测试数百万个遗传变异与疾病或者风险因素结果的关联,发现了大量与人类疾病或风险因素相关的遗传变异,在一些大型生物库中(如英国生物银行UK Biobank,FINNGEN等)可以获取这些疾病和风险因素相关的单核苷酸多态性信息,然后利用这些单核苷酸多态性作为工具变量,进行有目的性的孟德尔随机化研究。
孟德尔随机化研究在确立暴露和结局的因果关系前,必须满足3个基本假设:(1)工具变量与暴露因素强相关;(2)工具变量与任何潜在的混杂因素无关;(3)工具变量与结局不直接相关,它对结局的作用只通过暴露来体现〔9〕。第一个假设通过选择与暴露因素强烈相关的遗传变异来解决;后两个假设通常被遗传多效应所违反,即一个基因位点通常影响一个以上的性状,这就意味着遗传变异位点可能通过暴露以外的途径去影响结局。目前已经开发了很多方法去检验多效性,例如,在加权中位数作为孟德尔随机化的主要分析方法评估暴露和结局的因果关系时,MR-Egger、加权中值、加权模式和多效性残差和异常值(MR-PRESSO)经常作为加权中位数的补充方法,进行孟德尔随机化研究结果的敏感性分析来检验结果是否有因所选择的工具变量的多效性而产生的偏倚〔10~14〕。
孟德尔随机化研究过程中,通常暴露和结局的遗传变异信息通常来自不同的人群,这也就是孟德尔随机化最基本的研究方法,即两样本孟德尔随机化〔15〕。这就需要考虑群体分层所产生的异质性问题,这会使结果产生偏倚,所以在进行孟德尔随机化研究过程中通常尽可能地选择有相同遗传背景的人群。在此基础上,还发现了其他的孟德尔随机化的研究形式。例如:(1)双向孟德尔随机化评估了暴露和结局之间正向和反向因果关系,即暴露和结局是否互为因果,这就需要暴露和结局之间正反进行两次的孟德尔随机化研究〔15〕;(2)两步孟德尔随机化探讨了中介变量是否能介导暴露对结局的影响,这一般适用于寻找从暴露到结局的潜在发生机制〔15,16〕。在中介效应的探究过程中,会产生3个参数:假设暴露对结局的直接效应为A;暴露对中介变量的效应为B;中介变量对结局的效应为C。若A、B、C均显著,说明暴露到结局存在因果关系,且这种关联有一部分是由中介变量介导的;若A不显著,B、C都显著,则说明暴露到结局完全由中介变量介导;若A显著,但B、C中至少有一个不显著,说明从暴露到结局的因果关联中不存在由该中介变量介导的中介效应;(3)多变量孟德尔随机化研究时,通常使用两个以上彼此之间存在一定关联的暴露因素,比如高密度脂蛋白,低密度脂蛋白,三酰甘油和载脂蛋白B等,结果会展现出在考虑多种暴露因素时,其中的单个暴露因素在矫正其他因素影响后是否对结局存在因果关系〔15,16〕。不同形式研究方法,使得孟德尔随机化在疾病高危因素探究中的应用越来越广泛。
2 孟德尔随机化在脑卒中病因的探索
2.1生活方式因素和脑卒中 在过去的观察性研究中,发现了许多生活方式因素和脑卒中风险相关,但是这些生活方式是否与脑卒中之间有明确的因果关系及改变这些因素是否会降低脑卒中的患病风险尚不清楚。Harshfield等〔17〕通过两样本孟德尔随机化和多变量孟德尔随机化研究发现了抽烟和肥胖比会增加缺血性脑卒中及其亚型(大动脉粥样硬化和小血管闭塞)的风险,而受教育年限和脑出血、缺血性脑卒中及其亚型呈负相关。Titova等〔18〕利用前瞻性队列研究和孟德尔随机化研究分析了睡眠时间和脑卒中的关系,在前瞻性研究中发现睡眠时间长与缺血性脑卒中的风险增加有关,睡眠时间段与脑出血风险增加有关,然而孟德尔随机化研究并不支持这些发现,但表明了基因预测的短睡眠时间仅和缺血性脑卒中的亚型大动脉脑卒中的风险增加有关,Ma等〔19〕应用两样本孟德尔随机化研究发现白天嗜睡是与大动脉脑卒中风险增加有明确的因果关系。之前有队列研究发现单独或联合饮用咖啡和茶与脑卒中的风险降低有关〔20〕。Wang等〔21〕的孟德尔随机化研究发现了每天饮用一杯茶,可以降低小血管卒中风险,但与缺血性脑卒中及其他亚型无关。然而Qian等〔22〕利用两样本孟德尔随机化却没有发现喝咖啡和缺血性脑卒中及其亚型之间存在明确的因果关系。此外, Karhunen等〔23〕还发现了吸烟和失眠的遗传易感性与颅内动脉瘤和动脉瘤性蛛网膜下腔出血的风险增加相关。这些研究明确和排除了多种生活方式因素与脑卒中之间的因果关系,这可能提示了对脑卒中进行一级预防的日常行为方式。
2.2循环脂质代谢和脑卒中 循环脂质代谢物与脑卒中之间的关系一直是研究的热点,Fatumo等〔24〕利用非洲个体脂质循环的遗传特征、英国生物银行和百万退伍军人计划的荟萃分析,进行了循环脂质代谢物和脑卒中的孟德尔随机化研究,研究发现较高遗传性的低密度脂蛋白胆固醇、总胆固醇和较低遗传性的高密度脂蛋白胆固醇与非洲遗传个体的缺血性脑卒中风险增加有关,在欧洲个体进行分析时,也得到了类似的结果,并没有出现明显的群体差异。然而,在Yuan等〔25〕关于循环脂质和缺血性脑卒中的研究中却发现,在使用单变量孟德尔随机化研究时,载脂蛋白B、低密度脂蛋白胆固醇和三酰甘油水平升高与缺血性脑卒中及其亚型的风险增加有关,但在进行多变量孟德尔随机化研究时,载脂蛋白B保留了与缺血性脑卒中稳健的因果关系,但是低密度脂蛋白胆固醇却在矫正载脂蛋白B和三酰甘油的影响后却显示出可能降低缺血性脑卒中的患病风险;在载脂蛋白A-I和高密度脂蛋白胆固醇的单变量分析中均表现出与缺血性脑卒中和其亚型的负相关性,但在相互调整后,便失去了与缺血性脑卒中的因果关系。此外,有临床试验和观察性研究指出,低密度脂蛋白胆固醇水平可能与脑出血风险呈负相关〔26~28〕,Falcone等〔29〕和Acosta等〔30〕的孟德尔随机化研究分别表明了基因升高的低密度脂蛋白胆固醇水平与脑出血和蛛网膜下腔出血的风险降低有关。
2.3非脂质循环物和脑卒中 目前,B族维生素治疗降低血液中总同型半胱氨酸水平以预防脑卒中的临床试验尚无明确的结论,Yuan等〔31〕利用两样本孟德尔随机化研究发现遗传预测的总同型半胱氨酸水平的升高与缺血性脑卒中和蛛网膜下腔出血的风险增高有关,基因预测的维生素B6水平升高和缺血性脑卒中的风险增加相关,而维生素B12与脑卒中无相关性。高浓度的血清胆红素一直被认为是有毒的,而轻中度升高的胆红素可作为一种有效的内源性抗氧化剂,可对抗脑卒中病情发展过程中产生的氧化应激,Choi等〔32〕利用韩国的生物数据库中获取了高达1 784个与血清胆红素水平高度相关的单核苷酸多态性作为工具变量,研究发现在韩国人群中,高胆红素与脑卒中风险降低之间存在因果关系。此外,血清镁浓度与调节血压和血管内皮的功能有关〔33,34〕,Larsson等〔35〕仅利用6个与血清镁浓度高度相关的单核苷酸多态性,明确了较高的血清镁浓度可以降低颅内动脉瘤和动脉瘤性蛛网膜下腔出血的风险。
2.4病理状况和脑卒中 孟德尔随机化在脑卒中病因的探索中,还确定和排除了一些病理状况和脑卒中的因果关系。例如,2型糖尿病会引起各种微血管和大血管变化,最终导致的主要临床并发症之一便是脑卒中〔36〕,Larsson等〔37〕利用孟德尔随机化研究确定了2型糖尿病和大动脉脑卒中之间的因果关系;神经质描述了一种焦虑、抑郁和其他负面情绪的倾向,Liu等〔38〕利用孟德尔随机化研究确定了神经质会增加缺血性脑卒中的风险;非酒精性脂肪肝会导致葡萄糖和脂蛋白代谢受到干扰、氧化应激增加和血液高凝状态而增加脑卒中风险,Wu等〔39〕的孟德尔随机化研究并没有发现它与缺血性脑卒中之间存在因果关系,而是与其亚型(大动脉粥样硬化和小血管闭塞)之间存在明确的因果关系;之前有观察性研究发现偏头痛患者的脑卒中风险增加〔40〕,而Shu等〔41〕的孟德尔随机化研究否认了偏头痛和脑卒中之间存在因果关系,作者认为可能是由于脑血管脑卒中引发的偏头痛样发作与偏头痛之间的混淆,导致了之前误以为偏头痛与脑卒中之间存在关联。
3 孟德尔随机化研究的局限性
孟德尔随机化在进行因果关系的论证过程中也存在着一些局限性。①孟德尔随机化的研究结论可能因为暴露和结果的全基因组关联研究人群的不匹配而导致假阴性或者假阳性的结果,随着未来各大数据库变得更大更多样化时,这将是一个更令人担忧的问题;②孟德尔随机化经常推测的是长时间暴露对结局的影响,但是单核苷酸多态性的信息是由一个或一组个体在某一时刻被获取的,这意味着所获取的遗传变异信息可能与个体长时间的暴露信息存在差异;③遗传变异不可避免的存在多效性问题,很难证明遗传变异只是通过暴露来影响结局,所以在研究过程中需要应用不同的孟德尔随机化研究方法检验多效性问题,尽量去减少多效性对研究结论引起的偏差〔42〕。
综上,孟德尔随机化是一个非常强大的流行病学研究方法,随着大数据和基因技术的发展,在众多医学领域已经有了广泛的应用。在脑卒中病因探索过程中,它能解决之前限制脑卒中风险因素研究的混杂因素,可以更加清楚地认识脑卒中及其高危因素之间的因果关系。例如单变量因素和多变量因素孟德尔随机化研究的对比分析可对脂质循环物和脑卒中之间因果关系的认识更进一步。希望在今后的关于脑卒中的孟德尔随机化分析中可以有更多的中介变量分析,探究风险因素和脑卒中之间可能存在的中介效应,发现更多的风险因素和脑卒中之间可能存在的作用机制。
尽管孟德尔随机化研究存在一些局限性,但是在今天及可预见的未来,随着数据生成成本的不断降低及孟德尔随机化分析方法的不断完善,它未来将成为一种更为主流的流行病学研究方法在脑卒中和其他疾病的研究中发挥更多更强大的作用。