全基因组关联分析大数据为基础的孟德尔随机化方法探究类风湿性关节炎与牙周炎发病风险的因果关联
2023-07-15许立硕葛翠翠刘晨光
许立硕,葛翠翠,刘晨光
(1. 吉林大学口腔医院急诊与黏膜病科,长春 130021;2. 吉林省人民医院口腔科,长春 130021)
牙周炎(periodontal disease,PD)是口腔最常见的慢性炎症性疾病,是造成牙齿脱落的主要原因[1]。牙周炎主要受龈下菌斑生物膜的影响,诱导宿主促进炎症介质的释放,从而引发慢性炎症反应,导致牙槽骨的吸收及牙齿的脱落[2]。类风湿性关节炎(rheumatoid arthritis,RA)是一种系统性自身免疫性疾病,以慢性、对称性、炎症性和关节外病变为主要临床表现,其特征是发病率及致残率较高、早期症状不典型,常可导致渐进性残疾,引发多种长期并发症[3]。据报道,牙周炎可能会影响全身的健康,大量的研究已经证明牙周炎与类风湿性关节炎[4],动脉粥样硬化[5],阿尔兹海默症[6],慢性阻塞性肺炎[7]等某些全身性疾病关系密切。
有研究[8]表明,尽管类风湿性关节炎和牙周炎的病因不同,但两者在发病机制方面相似。其表现的慢性炎症在适应性免疫表型、促炎细胞因子和抗炎细胞因子之间的不平衡方面以及在吸烟和遗传方面的作用相似,PGE2、IL-1、TNF-α 等这些细胞因子能使组织发生破坏,释放炎症细胞因子,进而导致这两种疾病在骨骼破坏方面具有相似性[9-10]。因此,类风湿性关节炎和牙周炎之间可能存在双向相互关系。
已经有研究[11-12]表明牙周炎是类风湿性关节炎的危险因素,其中的联系首先表现在牙龈卟啉单胞菌(P. gingivalis)中,P. gingivalis 是牙周炎的致病菌之一,是一种革兰氏阴性厌氧菌,特征是存在肽酰精氨酸脱氨酶(PAD),这种酶通过催化瓜氨酸化来促进类风湿性关节炎的发育,瓜氨酸化是一种翻译后修饰,在生产抗环瓜氨酸肽抗体(ACPA)方面发挥着关键作用,而ACPA 则被广泛认为是类风湿性关节炎患者的诊断和预后的生物标志物。此外,大量的回顾性研究证明了牙周炎与类风湿性关节炎之间存在着密不可分的关系。Pischon 等发现,与健康患者相比,牙周炎患者的类风湿性关节炎患病率更高[13]。一项Meta 分析表明,与健康对照组相比,牙周炎患者患类风湿性关节炎的风险更高[14]。
但值得注意的是,在过去的研究中,对于类风湿性关节炎是否影响牙周炎疾病的报道并不是很多,SHAILESH[15]曾经研究得出印度人中类风湿性关节炎患者患牙周炎的几率更高。在尼泊尔三级医院中,类风湿性关节炎患者的牙周炎患病率为86.04%[16]。然而这些结论主要来自病例对照或队列研究,随机对照等高质量研究却很少,因此效果估计容易产生偏差。由于传统观察设计的内在弱点,依旧无法确定类风湿性关节炎与牙周炎发病之间是否存在因果关系。
传统的回顾性流行病学调查方式,往往易引起反向因果关系和潜在混杂因素的影响,从而降低了其论证病因假说的能力。孟德尔随机化(Mendelian randomization,MR)利用遗传变异的自然随机分配,避免了潜在的混杂因素,为判断暴露因素与结局之间的因果关系提供了新的思路[17]。在本研究中,设计了一项两样本MR 研究来分析全部遗传数据,以调查东亚人群中类风湿性关节炎和牙周炎疾病之间的潜在因果关系。
1 资料与方法
1.1 研究设计
本研究是一项两样本MR 研究,使用GWAS公开汇总统计数据来分析类风湿性关节炎与牙周炎是否存在因果关系。以GWAS 公开发布的人类基因组信息为参照基础,筛选出了与类风湿性关节炎有关具有重要统计价值的单核苷酸多态性(single nucleotide polymorphism,SNP)信息,作为基因工具变量;然后,再借助另一项GWAS 调查获得了有关牙周炎的相关信息,从而确定了相关SNP 的存在;最后通过筛查出的SNP,采用多种MR 方法来推测类风湿性关节炎与牙周炎疾病风险之间的关系[18-21]。
1.2 相关数据来源
类风湿性关节炎与牙周炎的关联GWAS 数据分别来源于英国数据库MRC-IEU(https://github.com/MRCIEU)和日本数据库BioBank Japan Project(BBJ)数据集(https://biobankjp.org/english/index.html)。MRC-IEU 数据集中类风湿性关节炎的样本量为22 515 名东亚人,包括4 873 例类风湿性关节炎患者和17 642 例对照人群。BBJ 数据集中牙周炎的样本量为212 453 名东亚人,包括3 219 例牙周炎患者和209 234 例对照人群。
1.3 相关SNP 筛选
在MR 分析中,暴露数据集中的(Single nucleotide polymorphisms,SNPs)被用作工具变量(Instrumental variable,IV)。IV 应满足以下三个基本假设:1)IV 与暴露密切相关;2)IV 与任何潜在的混杂因素无关; 3)除了通过暴露方式外,IV 与结果无关。从GWAS 公开汇总数据中选择的SNP 应该具有全基因组显著性(GWAS P value < 5×108)且次要等位基因频率>0.01。 为了从GWAS中识别独立变异,去除了这些SNP 中的连锁不平衡(R2< 0.001 and distance > 10 000 kb),聚集剩余的SNP[22]。使用F 统计值评估每个SNP 的强度(F-statistic= R² ×(N-2)/(1-R²),R² = 2×(Beta)2× EAF×(1-EAF)/[2 ×(Beta)2× EAF ×(1-EAF)+ 2 ×(SE)2× N × EAF ×(1-EAF)],N 代表暴露GWAS 研究的样本数,R2是IV 解释暴露的程度(回归方程的决定系数),Beta 代表每个SNP 和表型关联的每个等位基因效应大小,SE 代表Beta的标准差,EAF 代表效应等位基因频率)[23]。F 统计值<10 的SNP 将被删除[24]。本MR 研究中只研究了暴露和结果GWAS 数据集中都存在的SNPs,不包括代理SNPs[25-26]。最终筛选出13 个SNP:分别为rs10821944、rs10946216、rs11889341、rs17427599、rs2240339、rs2244020、rs2856821、rs3734708、rs3819720、rs449635、rs58667488、rs909267、rs9494892,纳入SNP 的具体信息见表1。
表1 与类风湿性关节炎和牙周炎相关的SNP 的基本特征
1.4 统计学方法
使用Wald 比率来估计每个IV 的因果效应,然后采用逆方差加权(inverse variance weighted,IVW)方法整合每个IV 的效应大小来估计暴露对结果的总体因果效应(P<0.05)[24]。采用敏感性分析作为IVW方法的补充,包括多效性检验、异质性检验、逐个剔除检验。多效性检验主要检验多个IV 是否存在水平多效性,常用MR-Egger 法的截距项表示,如果该截距项与0 差异很大,说明存在水平多效性(P<0.05)[23,27]。异质性检验主要是检验各个IV 之间的差异,IVW 方法中的Cochran's Q 值用于评估异质性(P<0.05),如果不同IV 之间的差异很大,则异质性就越大,低异质性为因果效应提供了更高的可靠性[28-29]。逐个剔除检验主要是计算逐个剔除某一个IV 后剩下IV 的MR 结果,若剔除某个IV 后其它IV 估计出来的MR 结果和总结果差异很大,那么说明MR 结果对该IV 是敏感的[30]。若不存在水平多效性和异质性则采用IVW 方法的效应估计作为主要效应量;若存在异质性,则采用加权中值方法的效应估计作为主要效应量,加权中值法是利用大部分SNP来判断因果关系的有无[31];若存在水平多效性,则采用MR-Egger 方法的效应估计作为主要效应量[24]。
所有统计分析和数据可视化均在R 软件(version 4.0.0)中进行。使用“Two Sample MR” package 进行单变量MR 分析(version 0.5.6)。
2 结果
2.1 效应分析
森林图(图1)显示,IVW 分析结果显示两种疾病存在因果关系,类风湿性关节炎是牙周炎发病风险的危险因素(OR = 0.931,95%CI 0.886 - 0.978,P= 0.005);为排除混在因素的影响,使用MRegger 回归方法评估水平多效性,发现不存在水平多 效 性(egger-intercept= -0.005,P= 0.821)。 然后进行了异质性分析,结果显示不存在异质性(P=0.168),由此说明遗传多效性不会对本研究结果造成偏倚,结果可靠稳定。
图1 MR-Egger 回归法以及IVW 法估计SNP 相关类风湿性关节炎与牙周炎森林图
加权中值法和MR-Egger 回归法的结果见表2。为观察每种评估方法结果的一致性,通过散点图(图2)来表示,根据直线斜率判断,IVW 法、MREgger 法和加权中值法的因果关联估计相近,说明MR 结果是准确的。
表2 IVW、MR-Egger、WME 回归的OR 估计值及其95%CI
图2 类风湿性关节炎与牙周炎的遗传相关性的散点图
2.2 敏感性分析
在本次研究中,通过留一法来进行敏感性分析。在每次去除1 个SNP 后,将剩余的12 个SNP 作为基因工具变量再进行IVW 效应分析,进而判断单独的SNP 是否会对分析结果产生影响。分析结果发现OR 值均>1,即本次研究中没有对因果估计结果产生较大影响的SNP。见图3。
图3 留一法敏感性分析结果
3 讨论
本研究利用大规模的GWAS 汇总数据及IEU 和BBJ 汇总数据,通过两样本孟德尔随机化的方法探究了类风湿性关节炎与牙周炎发病风险的因果关联,是首次且最大量的研究来评估东亚人群类风湿性关节炎与牙周炎发病风险之间关系的研究。使用三种不同的估计方法(IVW、Weighted median 法、MREgger 回归法)进行MR 分析。研究显示,类风湿性关节炎是牙周炎发病风险的危险因素。
在2012 年之前,有学者已经发表了一些队列研究来调查类风湿性关节炎与牙周炎之间的关系。在2000-2012 年间发表的8 篇横断面研究中,只有一项研究[32]显示两者是负面关系,其余7 项报告均显示类风湿性关节炎患者患牙周炎的风险和流行率较高,反之亦然。另一项研究评估了美国退伍军人中,与骨关节炎患者相比,类风湿性关节炎患者的牙周炎更常见且更严重[33]。但有一项孟德尔随机化研究的结果与本研究的结果存在矛盾,其研究发现欧洲人群中类风湿性关节炎与牙周炎无明显因果关系,反向亦之,分析这可能是由于研究人群种族的不同而导致的差异[34]。本研究结果可能不适于其他种族,因此未来的研究需要更大规模的GWAS 汇总数据和更多不同种族的分析。
大量研究也从不同方面对类风湿性关节炎和牙周炎之间的联系进行分析。在遗传生物标志物方面,高多态性HLA-DRB1 位点(所谓的共享表位-SE)是参与两种疾病发展的最强遗传因素[4],携带rs2237892T 等位基因的人可能同时患有这两种疾病[35]。在炎症生物标志物方面,类风湿性关节炎和牙周炎患者都表现出高水平的IL1β,IL6,MMPs和TNF-α。这种促炎细胞因子表达的增加可以刺激STAT3 激活,在类风湿性关节炎和牙周炎的病理生理学中发挥关键作用[36]。在自身抗体方面,有证据表明,牙周病原菌P. gingivalis 和伴放线放线杆菌(A.actinomycetemcomitans)是目前参与类风湿性关节炎和牙周炎发病机制的两种最重要的微生物,与类风湿性关节炎的诊断和预后生物标志物-抗环瓜氨酸肽抗体(ACPA)增加有关[8,11-12]。
本研究通过两样本法孟德尔随机化分析,探究了类风湿性关节炎与牙周炎发病风险的因果关联,本研究成果具备以下一些优势:1)本研究成果所纳入的数据集总共包含超过23 万样本例数,大样本数据使得统计学的效果更强;2)本研究成果采用了多种MR 统计学方法以及其他敏感性分析方法,其准确的数据结果提高了数据的可靠性;3)与传统的回顾性研究成果比较,本研究成果更有效地消除了反向因果关系及混杂因子的影响。不过,本研究结果还具有一定的特殊性:1)使用来自IEU 及BBJ 数据库研究的大量公共数据,所纳入的群体大多为东亚国家,实验结果能否应用到其他种族上,待进一步证实;2)两样本MR 分析结果未能对性别进行分组,也未能了解不同性别之间致病力是否有区别;3)类风湿性关节炎与牙周炎可能的生物学机理目前仍未充分清楚,通过本分析仅能对两者的因果关系做出初步判断。