过敏性鼻炎与过敏性哮喘及非过敏性哮喘的因果关系分析
2023-12-01林俊涛曹昉欣杨盖王欣童林娜
林俊涛,曹昉欣,杨盖,王欣童,林娜
1 右江民族医学院研究生学院,广西百色533000;2 右江民族医学院附属医院儿科
哮喘是一种发生于呼吸道的过敏性炎症,也是一种非传染性慢性疾病[1]。哮喘可分为过敏性哮喘和非过敏性哮喘两大表型,过敏性哮喘的临床表现与非过敏性哮喘既有相似性又存在明显差异[2]。现有研究表明,过敏性鼻炎(AR)与过敏性哮喘及非过敏性哮喘之间关系密切[3-4],深入探究三者之间的因果关系对AR所导致哮喘表型的预防和治疗具有重要意义。观察性研究并不能明确AR与过敏性哮喘及非过敏性哮喘之间的因果关系,且难以避免反向因果关系、样本量少及难以剔除的混杂因素,导致AR与过敏性哮喘及非过敏性哮喘之间的因果关系难以明确。孟德尔随机化(MR)研究利用与暴露因素具有强相关的遗传变异作为工具变量,借此推断暴露因素与研究结局之间的因果效应。MR遵循随机分配原则,混杂因素的影响在很大程度上是可控的,且遗传变异工具变量发生于疾病及表型发生之前,可有效避免反向因果关系。2023年1—7月,本研究利用全基因组关联研究(GWAS)数据进行两样本MR研究,以阐明AR与过敏性哮喘及非过敏性哮喘之间的因果关系,现报告如下。
1 资料与方法
1.1 病例数据来源 通过GWAS汇总数据集的遗传关联数据库IEU OpenGWAS project(https://gwas.mrcieu.ac.uk)[5],筛选并提取与AR、过敏性哮喘、非过敏性哮喘相关的GWAS数据集,将具有代表性的相关GWAS数据进行分析。GWAS数据来自欧洲人群,能有效避免人群异质性偏倚,其中AR包含112 583例受试者(GWAS ID ukb-b-7178,AR病例组25 486例、健康对照组87 097例),过敏性哮喘包含135 910例受试者(GWAS ID finn-b-ALLERG_ASTHMA_EXMORE,过敏性哮喘病例组4 859例、健康对照组131 051例),非过敏性哮喘包含134 760例受试者(GWAS ID finn-b-NONALLERG_ASTHMA_EXMORE,非过敏性哮喘病例组3 709例、健康对照组131 051例)。
1.2 疾病显著相关单核苷酸多态性(SNP)位点筛选 MR所选取的工具变量SNP需满足三大假设:相关性假设,即SNP与AR强相关;排他性假设,即SNP与过敏性哮喘及非过敏性哮喘无关,SNP只能通过AR对过敏性哮喘或非过敏性哮喘发生作用;独立性假设,即SNP与混淆因素无关。从所筛选AR相关GWAS数据集中提取与AR显著相关的SNP进行后续分析,其中相关性满足P<5E-08。
1.3 工具变量选择 为确保所筛选的AR显著相关SNP是独立的,设置连锁不平衡参数阈值(r2<0.001,kb>10 000),排除连锁不平衡对结果的影响。工具变量若纳入两个高度相关位点,相当于对结果重复加权,会造成结果发生偏倚。计算F统计量,计算公式为F=R2×(n-k-1)÷[k×(1-R2)],其中n表示样本数量,k表示所选取的工具变量SNP的数量,R2表示工具变量解释暴露的程度。R2=[2×(1-MAF)×MAF×β2]/[2×(1-MAF)×MAF×β2+(SE)2×2×N×(1-MAF)×MAF],其中MAF为最小等位基因频率,在计算R2时MAF可以和效应等位基因频率等价,β为等位基因效应值,SE为β的标准误。F统计量用于评估是否为弱工具变量偏倚,F<10表明该SNP为弱工具变量或工具变量仅能解释小部分表型变异,需剔除这部分SNP,避免对结果造成影响。通过数据库Pheno Scanner(V2)(http://www.phenoscanner.medschl.cam.ac.uk/)[6-7],检验所选择工具变量是否与混杂因素相关,排除其对应表型与结局变量具有强相关意义的SNP,即排除混杂因素对结局变量的影响。通过harmonise_data函数将所筛选的SNP效应等位基因对齐,即把暴露和结局的SNP进行协同,剔除具有中等频率等位基因回文序列的SNP,避免因为这些位点变化导致结果不稳定。通过孟德尔随机多态性残差和离群值(MR-PRESSO)检验,将离群值剔除,并重新进行分析。最终选取的SNP位点即为研究AR与过敏性哮喘或非过敏性哮喘因果关系的工具变量。
1.4 AR与过敏性哮喘、非过敏性哮喘因果关系的MR分析方法 MR遵循孟德尔第二定律随机分配实现随机分组,借助工具变量SNP进行随机化,模拟随机对照研究。采用逆方差加权法(IVW)、加权中位数法(WME)和MR-Egger回归模型进行MR分析。IVW特点是回归时不考虑截距项存在并且用结局方差的倒数作为权重来进行拟合,P<0.05提示MR分析存在潜在的因果关系。WME定义为比率估计值的加权中位数,若分析中至少有一半的信息来自有效工具,则可以评价因果关系。MR-Egger回归法在回归时考虑截距项存在,使用结局方差的倒数作为权重来进行拟合。
1.5 统计学方法 采用异质性检验、水平多效性检验、漏斗图及留一法评估结果的可靠性。使用R软件(version 4.2.1)的TwoSampleMR包[8]。采用Cochran′sQ检验和漏斗图进行异质性分析,Cochran′sQ检验P<0.05表示分析结果具有显著异质性,漏斗散点图呈对称状提示无偏倚。采用MREgger截距测试进行水平多效性分析,若MR-Egger截距测试分析中的截距项有统计学意义,则表明MR分析具有明显水平多效性。采用留一法敏感性检验进行敏感性分析,通过逐一排除SNP来判断MR结果的稳定性。
2 结果
2.1 AR与过敏性哮喘因果关系分析结果 将AR数据与过敏性哮喘数据匹配后,剔除具有中等频率等位基因回文序列的SNP位点rs7774620,剔除离群值rs2066362,最终纳入28个SNP作为工具变量进行MR分析。IVW结果显示,AR与过敏性哮喘患病风险有显著因果关系(OR=69.348,95%CI28.768 ~167.169,P=3.62E-21)。WME和MR-Egger回归结果也显示AR与过敏性哮喘患病风险有显著因果关系(P均<0.05)。见图1。
图1 AR与过敏性哮喘及非过敏性哮喘因果关系的两样本MR森林图
2.2 AR与非过敏性哮喘因果关系分析结果 将AR数据与非过敏性哮喘数据匹配后,最终纳入31个SNP作为工具变量进行MR分析。IVW结果显示,AR与非过敏性哮喘不存在显著因果关系(OR=2.593,95%CI0.996 ~ 6.752,P=0.051)。WME和MR-Egger回归结果也显示AR与非过敏性哮喘患病风险不存在显著因果关系(P均>0.05)。见图1。
2.3 MR分析可靠性评价结果 AR与过敏性哮喘及非过敏性哮喘MR分析过程中,经Cochran′sQ检验,各工具变量之间有显著异质性(P<0.05);但MR-Egger截距测试显示各组截距接近0,且P>0.05,表明MR分析结果不存在水平多效性,工具变量没有通过AR以外的其他因素影响过敏性哮喘或非过敏性哮喘的发生,独立性和排他性假设成立。漏斗图结果显示,SNP位点分布基本对称,表明结果均无明显异质性,见OSID码图1、OSID码图2。留一法敏感性分析显示,无论剔除哪个SNP都不会对分析结果产生根本影响,表明AR与过敏性哮喘及非过敏性哮喘MR分析结果是稳健的,见OSID码图3、OSID码图4。
3 讨论
哮喘是一种常见疾病,哮喘的治疗耗费巨大的人力和经济成本[9-11]。既往研究对AR与哮喘的因果关系尚不明确。本研究中应用两样本MR研究方法较为准确地证明AR与过敏性哮喘存在显著的因果关系,而与非过敏性哮喘不存在显著的因果关系。通过MR研究方法探讨AR与过敏性哮喘及非过敏性哮喘之间的因果关系,可为不同表型哮喘的预防和治疗提供更加清晰的理论支撑,是进一步探究不同表型哮喘病理生理机制的关键。鼻炎与哮喘是相互关联的临床表型[12],观察性研究表明,AR与哮喘发病关系密切,AR是哮喘的危险因素,但无法推断出AR是哮喘的原因还是后果。如果AR只与部分表型哮喘有因果关系,则需要深入研究评估这部分表型哮喘发生发展过程中AR所发挥的作用,并且需要进一步探讨解决AR与不同表型哮喘之间的因果关系与内在机理,为不同表型哮喘的病理生理学机制研究提供方向。
AR是世界上患病率最高的疾病之一,带来巨大的医疗和社会经济负担[13-14],严重影响患者的生活质量[15]。AR是哮喘控制不佳的主要风险因素,多项流行病学和临床研究表明,AR和哮喘之间存在密切关系,但对他们的内在机制联系仍不明确[1,16-17]。过敏性哮喘与非过敏性哮喘是哮喘的主要表型,过敏性哮喘的特征包括嗜酸性气道炎症、对各种过敏原特异性致敏、总IgE水平和特异性IgE水平升高、血液嗜酸性粒细胞计数增加、呼出一氧化氮水平升高,而非过敏性哮喘没有这些特征表现,但两者的共同点都是可逆性气道阻塞[18]。哮喘合并AR的情况较为常见,应重视哮喘患者过敏原的筛查与AR的防治[19]。AR与哮喘属于“同一气道,同一疾病”,是2001年世界卫生组织提出的观念,与本研究MR分析结果AR与过敏性哮喘有显著的因果关系相互印证,也与世界变态反应组织提出的过敏性鼻炎—哮喘综合征这一诊断术语相互印证,但本研究MR分析结果还提示AR与非过敏性哮喘不存在显著的因果关系,需进一步探讨不同表型哮喘与AR之间的潜在联系和病理生理学机制。
本研究利用MR研究方法探讨AR与过敏性哮喘及非过敏性哮喘之间的因果关系,具有许多传统流行病学研究方法所不具备的优势。MR是基于全基因组测序数据、类似于随机对照研究、能有效减少偏倚、用于揭露因果关系的统计学方法。传统流行病学研究方法对病因研究存在许多弊端,其中观察性研究不能人为施加干预措施,只能在自然状态下判断想要研究的因素和发生疾病之间的关联,存在反向因果关系、潜在混杂因素等问题,而实验性研究如随机对照试验需先在动物身上进行实施,通过动物毒理学测试,再逐步开展人体试验,实施起来困难较大,且须考虑医学伦理等问题,难以探究疾病的病因。运用MR研究方法从基因学角度探讨和判断AR与过敏性哮喘及非过敏性哮喘之间的因果关系,具有独特的优势。MR分析基因与基因之间的作用,是在基因层面进行研究,不会受到外界环境因素干扰。MR研究基于孟德尔遗传规律,亲代的等位基因随机分配给子代,此过程相当于随机对照试验中的随机分组过程,不受传统混杂因素如环境暴露、社会地位、行为等影响,且满足时间顺序的合理性,即遗传变异继承来自父母,且保持相对不变。
本研究也存在一定的局限性,异质性检验过程中,Cochran′sQ检验结果表明有显著异质性,可能是由于双样本的数据存在差异,即来自不同分析平台、不同实验及不同人群的SNP可能存在异质性,但这不影响MR分析结果的可靠性。MR分析中利用随机效应的IVW作为主要结局,存在异质性是可以接受的,且本研究MR分析结果不存在水平多效性,不违背MR核心假设,不影响最终的MR分析结果[20]。另外,GWAS数据年龄跨度可能比较大,疾病严重程度也未能有效分层,只能笼统分析,不能进行更加细致的分层分析。因此该研究无法验证不同性别或年龄层中AR与过敏性哮喘及非过敏性哮喘之间的因果关系是否是一致的,也不能验证不同AR严重程度与不同表型哮喘之间的因果关系。当后续分层GWAS汇总数据可得时,可进行更加细致的因果关系分析,进一步验证研究成果。