脂联素与前列腺癌因果关联:两样本孟德尔随机化分析
2022-05-11颜赟坤柳建军许志坚李建昌叶木石
颜赟坤,柳建军,许志坚,李建昌,叶木石
(广东医科大学附属医院泌尿外科,广东湛江 524001)
前列腺癌是人类第二常见的癌症,也是男性癌症死亡的第五大原因[1]。脂联素是脂肪细胞的特异性因子,它在脂肪组织中大量表达和分泌[2]。目前关于脂联素与前列腺癌风险关系的研究结果并不一致[3-7]。因观察性流行病学的研究易出现因果关系逆转和各种偏倚[8],而两样本孟德尔随机化(MR)研究是一种利用影响暴露因素的遗传变异数据来估计暴露因素与结局指标之间因果关系的分析方法[9]。它的分析策略是从不同的全基因组关联研究(GWAS)数据集中获得遗传危险因素与遗传结局之间关联的证据[10]。本实验利用脂联素和前列腺癌的大规模GWAS 数据集进行两样本的MR 分析,旨在探讨脂联素与前列腺癌间的关系。
1 资料和方法
1.1 一般资料
两样本MR 研究的数据来源于目前已公开发表的GWAS 汇总数据集[11-12],包括前列腺癌和脂联素的GWAS数据集。所有参与者均签署了知情同意书。
1.2 方法
1.2.1 前列腺癌GWAS 数据集的选取 结局数据集包括来自GWAS 数据集的荟萃分析数据。我们通过PRACTICAL 联盟获得46 939 名前列腺癌患者和27 910 名欧洲后裔对照者的基因型荟萃分析数据[13]。PRACTICAL 联盟样本的基因分型均通过OncoArray-500K平台获得[14]。
1.2.2 脂联素GWAS 数据集的选取 通过ADIPOGen 联盟获取与脂联素浓度密切相关的遗传变异数据(SNPs)(P<5×10-8)构建工具变量(Ⅳ)。ADIPOGen 联盟的研究对象主要是欧洲人(n=45 891),可以提供荟萃分析的数据用于科研和随访[15]。该联盟可以提供的有效预测脂联素的潜在Ⅳ包括162 个SNPs[16]。汇总数据中每个遗传变异对脂联素的效应值和标准误差数据也从ADIPOGen 联盟之前发表的GWAS研究中获取[16]。
1.2.3 MR 分析 采用R(4.0.2 版本)中的“TwoSampleMR”进行分析,P<0.05 认为差异有统计学意义。使用来自两个不同研究的汇总数据作为Ⅳ评估脂联素与前列腺癌风险的因果关系。使用3种MR分析方法(逆方差加权法、加权中值法和MR-Egger 法)分析脂联素与前列腺癌风险间是否存在因果关系。其中逆方差加权法(ⅣW)和加权中值法主要用于MR 分析。MR-Egger截距检验主要用于潜在多效性效应的统计检验。采用随机效应的ⅣW 分析方法对脂联素和前列腺癌风险的SNPs 相关性进行回归分析,计算Ⅳ比值估计的方差加权平均值的反比。由于随机效应的ⅣW 允许每个SNPs 产生不同的平均效应,我们采用随机效应的ⅣW 方法[17]。为确保选择的Ⅳ不会通过除脂联素以外的生物途径影响前列腺癌风险的这一结局变量,采用MR-Egger 截距检测评估Ⅳ与其他潜在混杂因素间的多效性关系[18]。这种回归方法的斜率代表了因果效应的评估,截距代表遗传变异的平均水平多效性效应的评估[19]。加权中值法分析提供了一致的因果影响评估[20]。使用网站LDlink 寻找高连锁不平衡的SNPs 作为代理的SNPs(https://ldlink.nci.nih.gov/)[21]。对于每个遗传变异,P值=5.00E-08对应于F统计量>30[22]。
1.2.4 异质性和敏感性分析 采用Cochran的Q检验和漏斗图评估SNPs 间的异质性[23-24]。为了评估未知的多效性,我们采用了多种分析方法:(1)敏感性分析使用了“leave one out”探讨单个SNPs 驱动这种因果关联的可能性;(2)MR-Egger 截距检验评估基因变异与其他潜在混杂因素的多效性关联。在排除已知的多效性SNPs 后我们重复上述的孟德尔随机分析。Phenoscanner 网站用于检索SNPs 可能的多效性效应(http://www.phenoscanner.medschl.cam.ac.uk/)[25]。
2 结果
2.1 孟德尔随机化Ⅳ的确定
在全基因组水平上能有效预测脂联素的162 个SNPs 可以用作潜在的Ⅳ。考虑到一些SNPs 彼此处于连锁不平衡(LD)中,进一步使用MRBase(https://mrcieu.github.io/TwoSampleMR/)估计SNPs 间的LD(LDr2<0.05)。在经过“LD clumped”步骤后,得到21个独立的、不处于连锁不平衡的SNPs(表1)。汇总数据中仅有rs1108842、rs3001032 和rs731839 在PRACTICAL 的OncoArray 数据中,均未找到与暴露和结局的汇总数据匹配的代理SNPs。最终选定3个SNPs作为Ⅳ进行后续的MR 分析(表2)。由于F<10 用于定义“弱Ⅳ”,所以作为Ⅳ的偏倚达到了最小。
表1 21个潜在的可作为预测脂联素的Ⅳ
表2 3个可作为预测脂联素的Ⅳ
2.2 孟德尔随机化分析结果
ⅣW、加权中值法和MR-Egger 分析均显示脂联素与前列腺癌风险间没有因果关系(P>0.05)。MREgger分析显示结果中的定向多效效应不太可能导致偏倚(截距=0.038,P=0.418)。见表3。
表3 3 种MR 分析方法来评估脂联素对前列腺癌风险的因果影响
2.3 异质性和敏感性分析结果
基于个体变异的Ⅳ间不存在异质性(ⅣW 的Cochran Q 检验值=2.815,异质性的P值=0.244;MR-Egger 的Cochran Q检验值=1.047,异质性的P值=0.306),见图1。没有单一的SNPs 可以影响结果的估计,见图2。
图1 评估异质性的漏斗图
图2 MR“leave-one-out”分析脂联素对前列腺癌风险的敏感性
3 讨论
近年来,越来越多的证据表明肥胖与前列腺癌风险间存在着重要关联[26]。脂联素来源于脂肪组织,目前有研究报道它与各种癌症的癌变密切相关,包括乳腺癌、结肠癌、肝癌和前列腺癌[27]。一项Meta 分析结果显示,瘦素、脂联素及其受体在前列腺癌的发展和进展中起着至关重要的作用[28],但Li 等[7,29]研究发现脂联素的浓度与前列腺癌的发生风险无关。为了进一步确定脂联素是否与前列腺癌存在因果关系,我们采用了3 种不同的分析方法(ⅣW、加权中值法和MR-Egger 法)进行MR 分析,结果显示3 种方法分析得到的结果一致,它们均不支持脂联素与前列腺癌风险之间存在因果关系;在排除了潜在的多效性SNPs后,3 种MR 分析方法的结果仍然是一致的。我们的研究具有以下几方面优势:(1)研究采用的MR 分析方法可以避免混杂因素、反向因果关系、报告偏倚、低估表型和行为变异引起的风险关联所产生的影响[30];(2)研究中选择了大规模的脂联素GWAS数据集和前列腺癌GWAS 数据集,而在两样本MR 分析中使用GWAS 汇总数据的优点是可以增强统计分析结果的强度,特别是在分析对疾病结局的影响方面[31];(3)研究选择了3种MR法评估各种分析方法的稳健性;(4)研究所需的汇总数据可以从网络中获得,能够节省更多的成本和时间。
MR分析结果容易受到多效性的影响[32]。多效性是指作为Ⅳ的遗传变异可能与多种表型相关,可导致MR 分析所得到的因果预测结果产生偏倚[33]。因此,我们需要进一步使用灵敏度分析检验MR 分析所得结论的正确性。首先,我们使用“leave one out”分析单个SNPs驱动因果关系结果的可能性;其次,我们使用加权中值法减少多效性的影响,因为即使有50%的SNPs 不是有效的Ⅳ,但该方法仍然可以提供准确的MR 估计结果[20]。此外,MR-Egger法可用于评估不平衡的多效性效应和暴露对结果的因果效应[19]。本研究中加权中值法的计算结果与ⅣW 法的计算结果一致。我们推测先前报道的脂联素与前列腺癌之间的观察性研究中可能有混杂的因素或偏倚。虽然我们使用了MR 分析,但是研究仍有一定的局限性:(1)研究包括相对较少的SNPs 作为Ⅳ,检测因果关联的能力有限;(2)不能完全排除一些包括文献尚未报道的未知的混杂因素;(3)研究纳入的人群主要是欧洲人,由于因果关联的分析结果可能也会受到种族的影响,所以我们可能需要进一步在其他种族中进行同样的MR 研究以验证该结论;(4)研究无法获得每个患者的数据,因此无法在本研究中进一步进行亚组分析。
综上所述,孟德尔随机化研究结果显示脂联素与前列腺癌风险之间不存在因果关系。