趋化因子CCL2与肺癌的因果关系:两样本孟德尔随机化研究
2024-03-13刘梓燊郑瑛瑛袁梦琪张甘霖杨国旺
刘梓燊 郑瑛瑛 袁梦琪 张甘霖 杨国旺
首都医科大学附属北京中医医院 (北京 100010)
肺癌(lung cancer)是世界范围内最常见的恶性肿瘤之一,严重危害人类健康。根据统计,肺癌在全球发病率为11.4%位列第二,死亡率为18.0%位列第一[1]。尽管肺癌与吸烟、空气污染、烹饪油烟等危险因素有关[2-4],但导致肺癌发病的机制至今仍不清楚。晚期肺癌的主要治疗手段化疗、放疗、靶向治疗和免疫治疗,但多数患者对目前的治疗方法易产生耐药性,疾病发生进展,最终导致死亡[5]。鉴于肺癌的高发病率和高死亡率,潜在危险因素的筛查和治疗靶点的开发对于肺癌的诊断和治疗尤为重要。
趋化因子是一种小分子蛋白质,通过与细胞表面的G蛋白偶联趋化因子受体结合发挥功能[6]。趋化因子CCL2又称单核细胞趋化蛋白1(MCP-1),是C-C趋化因子家族的成员,能够趋化单核细胞、巨噬细胞和T淋巴细胞[7]。研究[8]发现,不同病理类型肺癌微环境中CCL2的表达量不同,CCL2过表达与肺腺癌的不良预后相关,却与肺鳞癌的良好预后相关,呈现出相反的结果。观察性研究往往受到多种混杂因素的影响,趋化因子CCL2与肺癌直接因果关系暂不明确。
孟德尔随机化研究(Mendelian randomization study,MR)是利用遗传变异的单核苷酸多态性(SNP)作为工具变量,探索暴露因素对结局因素的因果关系。由于使用遗传因素,首先能够避免观察性研究中由于环境因素、研究者因素、行为因素、社会因素和其他原因产生的偏移;其次,观察性研究容易受到反向因果关系的影响,而孟德尔研究中因果关系的方向是确定的。
鉴于既往发现肺癌和趋化因子CCL2呈现相关性,但研究结果受到复杂因素干扰和存在反向因果的可能;本研究采用孟德尔随机化的研究方法,依据肺癌的不同病理分型进行亚组分析,探究趋化因子CCL2与肺癌之间直接因果关系。
1 资料与方法
1.1 研究设计首先选用趋化因子CCL2作为暴露因素,提取与趋化因子CCL2显著相关的SNP作为工具变量,将肺癌作为结局因素,采用MR分析,使用Cochran Q检验进行异质性检验,使用MR-Egger截距和留一法进行敏感性分析。
研究设计见图1,孟德尔随机化应满足以下3个假设[9]:(1)工具变量与暴露因素相关;(2)工具变量不会受到混杂因素的影响;(3)工具变量只能通过暴露因素影响结局因素。
图1 研究设计Fig.1 Research design
1.2 资料来源通过GWAS数据库(https://gwas.mrcieu.ac.uk/)获得趋化因子CCL2[10]和肺癌[11]资料,所使用的资料均来源于已发表的论文研究,论文研究已获得伦理批件,故本次研究无需再次进行伦理审查,数据具体见表1。趋化因子CCL2的资料来自对超30 000例的85种循环蛋白的分析。肺癌的资料来自国外大型分析,对14 803例欧洲肺癌病例和12 262例对照组病理进行了基因分型,并结合现有数据对29 266例患者和56 450例对照进行了肺癌GWAS分析,该资料根据病理分型对肺癌进行亚组分析。
表1 数据来源与信息Tab.1 Data sources and information
1.3 研究方法
1.3.1 工具变量的筛选工具变量SNP应满足“与暴露因素相关”的假设。首先,通过设定阈值为P<5 × 10-8进行筛选,获得的SNP数量较少,为了后续的分析,调整为P<1 × 10-5,同时还需满足连锁不平衡条件r2<0.001以及kb>10 000,获得SNP。接着,计算F统计量,公式为F=[R2/(1-R2)]×(NK-1)/K,R2=2×MAF×(1-MAF)×(β/sd)2,若F<10考虑为弱工具变量,应剔除[12]。然后,应用Pheno Scanner网站(http://www.phenoscanner.medschl.cam.ac.uk/)查询SNP的潜在因素,剔除与结局因素有关的SNP。提取结局因素SNP,协调暴露因素和结局因素的等位基因数据,剔除回文SNP。其余SNP用于后续MR分析。
1.3.2 MR分析使用R软件4.3.1版本的“Two Sample MR”包进行MR分析,选择逆方差加权法为主要分析,另选用加权中位数法、简单模式法、MR-Egger回归法、加权模式法进行补充。通过Cochran Q检验计算P值,用来评估是否存在异质性,P≥ 0.05使用逆方差加权法随机效应模型,P<0.05则使用逆方差加权法固定效应模型。
1.3.3 敏感性分析使用MR-Egger回归法评估多效性,若MR-Egger回归截距的P>0.05,则不存在水平多效性。留一法检验进行敏感性分析,评估单个SNP是否显著影响结局因素,若显著影响,则应剔除后重新进行MR分析。
2 结果
2.1 趋化因子CCL2对肺腺癌的因果关系工具变量:根据本文“1.3.1工具变量筛选”原则,最终纳入23个SNP进行后续孟德尔随机化法分析。
MR分析与敏感性分析:Cochran Q检验计算P= 0.019,故选择逆方差加权法固定效应模型,IVW分析结果为OR= 1.065,95%CI(0.919~1.234),P= 0.401。MR-Egger回归法、加权中位数法、简单模式法、加权模式法的结果与IVW一致,均P>0.05(图2A、3A)。MR-Egger回归截距P= 0.340,不存在水平多效性。留一法进行敏感性分析,未存在单个SNP显著影响结局的情况。综上,趋化因子CCL2对肺腺癌无因果效应。
图2 孟德尔随机化分析结果的森林图Fig.2 Forest plot of the results of the Mendelian randomization analysis
图3 孟德尔随机化分析结果的散点图Fig.3 Scatterplot of the results of Mendelian randomization analysis
2.2 趋化因子CCL2对肺鳞癌的因果关系工具变量:根据本文“1.3.1工具变量筛选”原则,最终纳入23个SNP进行后续孟德尔随机化法分析。
MR分析与敏感性分析:Cochran Q检验计算P= 0.694,故选择逆方差加权法随机效应模型,IVW分析结果为OR= 1.059,95%CI(0.931~1.205),P= 0.381。MR-Egger回归法、加权中位数法、简单模式法、加权模式法的结果与IVW一致,均P>0.05(图2B、3B)。MR-Egger回归截距P= 0.174,不存在水平多效性。留一法进行敏感性分析,未存在单个SNP显著影响结局的情况。综上,趋化因子CCL2对肺鳞癌无因果效应。
2.3 趋化因子CCL2对小细胞肺癌的因果关系工具变量:根据本文“1.3.1工具变量筛选”原则,最终纳入25个SNP进行后续孟德尔随机化法分析。
MR分析与敏感性分析:Cochran Q检验计算P= 0.093,故选择逆方差加权法随机效应模型,IVW分析结果为OR= 0.959,95%CI(0.760~1.208),P= 0.720。MR-Egger回归法、加权中位数法、简单模式法、加权模式法的结果与IVW一致,均P>0.05(图2C、3C)。MR-Egger回归截距P= 0.207,不存在水平多效性。留一法进行敏感性分析,去除单个SNP后,OR值和P值未见明显改变。综上,趋化因子CCL2对小细胞肺癌无因果效应。
3 讨论
本研究通过双样本孟德尔随机化的方法,根据病理类型亚组分析了趋化因子CCL2与肺癌的因果关系。MR分析结果显示趋化因子CCL2暴露与肺癌结局无直接因果关系。
根据本研究结果,考虑趋化因子CCL2可能通过其他途径间接影响肺癌结局。CCL2的主要受体是CCR2[13],CCL2-CCR2轴在恶性肿瘤、动脉粥样硬化、类风湿性关节炎等多种疾病中发挥作用[14-16]。既往研究发现多种癌症患者中CCL2的表达增高[17-22]。肺癌荷瘤小鼠CCL2的表达与正常小鼠相比,显著增高[23],CCL2表达会增加裸鼠的肺癌转移[24],考虑CCL2表达与肺癌的不良预后相关。研究证实,CCL2通过MAPK/ERK信号通路、PI3K/AKT信号通路促进肿瘤的增殖和迁移[24-25]。CCL2还能增加化疗耐药性,放疗耐药性[26-27],导致疾病进展。CCL2通过直接和间接途径促进肿瘤血管生成,CCL2与血管内皮细胞上的CCR2受体结合,可以直接促进血管生成[28]。CCL2通过趋化单核细胞到肿瘤微环境中,导致大量IL-6释放,促进血管生成[29],增强循环肿瘤细胞的迁移和侵袭[30]。CCL2通过PI3K/Akt/mTOR信号通路、AKT/β-catenin信号通路促进上皮-间充质转化[24,31]。CCL2通过增加肿瘤相关巨噬细胞的募集、减少CD8+T细胞浸润等[30,32-37]调节肿瘤微环境中的免疫细胞。阻断CCL2通路在抗肿瘤治疗中发挥关键作用[37-40]。综上所述,趋化因子CCL2通过间接途径参与肿瘤发生发展过程,与本研究结果相符。
本研究的优势在于:(1)从基因层面分析趋化因子CCL2对肺癌的影响,能够避免受到环境因素、研究者因素、社会因素等混杂因素的影响,同时排除了反向因果关系影响。(2)资料来源于公共数据库,样本量大,人群统一,根据病理分型进行了亚组分析,避免不同人群异质性和病理类型造成的混杂影响。(3)使用逆方差加权法、加权中位数法、简单模式法、MR-Egger回归法、加权模式法进行分析,较为全面,数据结果可靠性高。
本研究的局限性在于:(1)工具变量筛选时,因获得SNP数量较少,将阈值调整为P<1 × 10-5,扩大了SNP的纳入范围,可能会导致混杂因素影响。(2)公共数据库缺少其他血统的趋化因子CCL2和肺癌资料,最终选用了欧洲血统进行分析,限制结果外推。(3)受到研究资料的限制,未对性别、年龄、吸烟与否等条件进行亚组分析。
综上所述,基于孟德尔随机化分析,趋化因子CCL2与肺癌没有直接因果关系。趋化因子CCL2可能通过其他途径间接影响肺癌结局,仍需后续临床、基础研究补充证明。