原发性肺癌与结直肠癌的孟德尔随机化研究*
2023-05-29肖志寒王子辰赵啸宇司铭轩张同禹陈锡儒曹靖戴俊程陈亮许晶
肖志寒,王子辰,赵啸宇,司铭轩,张同禹,陈锡儒,曹靖,戴俊程,陈亮,许晶
210029 南京,南京医科大学第一附属医院 胸外科(肖志寒、王子辰、司铭轩、张同禹、陈锡儒、曹靖、陈亮、许晶),病案统计科(赵啸宇);211166 南京,南京医科大学 公共卫生学院(赵啸宇、戴俊程)
原发性肺癌(primary lung cancer, PLC)是最常见的癌症之一,也是全球癌症相关死亡的主要原因[1-3]。非小细胞肺癌(non-small cell lung cancer,NSCLC)是PLC的主要病理学类型,包括肺腺癌(lung adenocarcinoma, LUAD)和肺鳞癌(lung squamous cell carcinoma, LUSC)两种优势亚型[4]。随着低剂量胸部CT技术的发展和广泛应用,PLC的诊断率显著提升,大量早期肺癌(lung cancer, LC)的患者得以诊断,日本LC登记联合委员会的统计数据显示,2010年共18 973例患者在日本接受PLC手术治疗,其中I期为12 701例,占总体的78.9%,研究表明,随着高危人群中低剂量胸部CT筛查的普及,早期LC将成为PLC的主要人群[5-6]。
手术是早期NSCLC患者的首选治疗方案[7-8],以往以肺叶切除术为标准术式。近年来日本临床肿瘤学协会针对早期LC的手术治疗策略展开了一系列的前瞻性临床研究,其中影响力最大的JCOG0802研究针对直径小于2 cm,但实性成分大于50%的IA期LC患者进行探索,结果表明,肺段切除术与肺叶切除术同样有效,术后5年生存率均可达到90%以上(肺段切除术为94.3%,肺叶切除为91.1%)。进一步死因分析发现,第二原发癌(second primary cancer, SPC)的发生是仅次于LC本身的第二位死因,也是肺段切除术患者5年生存率优于肺叶切除术的主要原因之一,其中结直肠癌(colorectal cancer, CRC)的发生居于所有 SPC 的首位[9]。此外,美国国立癌症研究所设计了NSCLC多中心组间试验,发现I期患者中约15%罹患SPC,CRC作为死亡率第二位的SPC,在早期NSCLC术后患者中受到广泛关注[10]。以上研究表明,随着PLC的早期诊断和治疗体系的逐步完善,患者术后可以获得长期生存,SPC的发生是患者术后生存的重大威胁。观察性研究提示CRC作为PLC术后主要的SPC类型之一,与PLC的发生可能存在关联,由于观察性研究存在混杂因素等固有局限性,在基因层面PLC与CRC的发生是否存在关联仍未明确[11]。
孟德尔随机化(Mendelian randomization, MR)作为一种病因推断方法在遗传流行病学领域广泛应用[12]。近年来,随着MR研究方法的深入挖掘,其作为一种较为理想的基因层面研究方法,逐渐被应用于两种复杂疾病之间发病关联的推断。2021年Li等[13]基于大样本的全基因组关联研究(genome-wide association study, GWAS),使用两样本的 MR 分析方法,探索了类风湿关节炎和帕金森氏病之间的相关性,研究发现类风湿关节炎与帕金森氏病之间存在基因层面的显著负相关。同年,Zhu等[14]应用MR的研究方法探讨多囊卵巢综合征和乳腺癌之间的发病关联,研究发现多囊卵巢综合征与乳腺癌三种亚型的发生紧密关联。本研究中,我们拟利用PLC及CRC的全基因组关联研究数据,通过两样本MR的研究方法揭示在遗传水平上PLC和CRC之间的发病关联,为临床工作中原发性早期LC术后SPCCRC的预防策略的制定奠定基础。
1 材料与方法
1.1 研究设计
MR研究的具体设计见图1。遗传工具变量来自于Mckay等[15]发表的目前样本量最大的PLC GWAS,该研究包含14 803例LC病例和12 262例对照,并将其结果与之前发表的29 266例LC病例和56 450例对照的GWAS研究结果进行汇总分析获得最终数据集。CRC的汇总数据来自Gene ATLAS。Gene ATLAS (http://geneatlas.roslin.ed.ac.uk/)是一个拥有452 264名英国人群生物样本(UK Biobank)的开放数据库,已开展数百个性状和数百万个遗传变异之间的关联研究[16]。本研究经南京医科大学第一附属医院伦理委员会批准(伦理号:2022-SR-046)。
1.2 遗传工具变量筛选
根据以下标准构建肺癌总体 (lung cancer overall,LCO), LUAD, LUSC 的遗传工具变量:(1) 遗传工具变量与LC发生的关联强度达到全基因组显著关联水平(P < 5×10-8);(2) 遗传工具变量之间无连锁不平衡(linkage disequilibrium, LD) (r2< 0.001,windows = 500 kb);(3) 遗传工具变量的最小等位基因频率(minor allele frequency, MAF) > 0.01;(4) 排除位于回文序列中的工具变量;(5) 使用PhenoScanner数据库剔除与混杂因素相关的遗传工具变量;(6) 使用MR多效残差和离群值(pleiotropy residual sum and outlier,MR-PRESSO)模型中的 Outlier-corrected方法剔除工具变量中离群值(图1)。
1.3 MR分析
两样本MR分析采用了多种方法:(1)逆方差加 权 法(inverse variance weighted, IVW)[17]。IVW是基于基因型的汇总数据,将每个遗传工具变量的Wald估计值合并,获得总体估计值; (2)遗传风险评分法(genetic risk score, GRS)。GRS 可代表所研究的暴露因素,进而探讨与结局之间的关联。本研究使用R(版本4.2.1)中的 “gtx”包 (Windows版本0.0.8版) 进行分析,包中的grs.summary模块具有基于汇总数据的GRS分析功能[18];(3)加权中位数法(weighted median, WM)、简单中位数法(simple median, SM)。WM法与SM法两者类似,对遗传工具变量的容忍度比较高,仅需50%以上的工具变量是有效工具变量,即可获得稳定的效应值[19];(4)MR稳健调整评分法(robust adjusted profile score, RAPS)。RAPS法重点考量了工具变量暴露效应中的测量误差,即使存在较多弱工具变量也不会产生总体效应的偏倚,尤其是用于暴露因素和结局都较为复杂的MR研究;(5)MR-PRESSO。MR-PRESSO强调水平多效性在MR研究中的作用,建议存在水平多效性时剔除离群值,矫正水平多效性后再进行效应评估;(6)使用Cochran’s Q检验进行异质性分析及MR-Egger检验进行水平多效性测试。
1.4 统计分析工具
本研究采用双侧统计分析,以P < 0.05为差异具有统计学意义。使用R 4.1.2软件中的“Two-Sample MR”“Mendelian Randomization”“gtx”“RAPS”“PRESSO”软件包进行MR分析。
2 结 果
2.1 遗传工具变量筛选
PLC的GWAS研究中LCO、LUAD和LUSC达到显著性差异的工具变量分别为3 910、1 121和2 755个。根据工具变量之间的LD情况,筛选出无LD关联的73个独立工具变量(r2< 0.001, window = 500 kb)。剔除存在回文序列中的5个工具变量(rs2010752、rs4468572、rs11571833、rs9259927、rs149543464)。使用PhenoScanner数据库剔除与混杂因素相关的工具变量[BMI:rs34517439、rs-71658797、rs34517439、rs71658797;吸烟:rs28580532、rs55781567、rs56113850、rs56113850、rs8040868、rs55781567、rs56113850;糖尿病:rs3129063、rs3132556、rs116667074、rs144447022、rs148696809、rs148696809,rs144447022、rs116667074、rs2853999;炎症性肠病:rs239935、rs501942、rs501942;体力活动(中等强度10分钟以上的天数或周数):rs13201782、rs149866169]。最终47个独立的单核苷酸多态性(single nucleotide polymorphisms,SNP)被纳入为PLC的工具变量,其中LCO、LUAD和LUSC分别23个、12个和12个工具变量(图1)。
2.2 MR主分析
IVW法分析发现PLC与CRC在基因层面上不存在显著关联(结肠癌:OR = 1.0003,95% CI:0.9995~1.0011,P = 0.52;直肠癌:OR = 0.9999,95% CI:0.9994~1.0005,P = 0.88)。 亚 组 分 析同样未发现LUAD(结肠癌: OR = 0.9998,95% CI:0.9990~1.0005,P = 0.51;直肠癌:OR = 0.9998,95% CI:0.9993~1.0004,P = 0.54)及 LUSC(结肠癌:OR = 0.9997,95% CI:0.9991~1.0004,P = 0.39;直肠癌:OR = 0.9996,95% CI:0.9991~1.00001,P =0.054)与CRC存在关联。GRS法的分析结果与IVW法一致,即PLC与CRC无关(表1,图2、3)。
表1 原发性肺癌和结直肠癌发病关联的孟德尔随机化研究Table 1.Mendelian Randomization Study of Association between PLC and CRC
图2 两样本孟德尔随机化森林图Figure 2. Forest Plots of Two-Sample MR Analysis
图3 两样本孟德尔随机化散点图Figure 3.Scatter Plot of Two-Sample MR Analysis
2.3 水平多效性及异质性检验
MR-Egger方法显示LCO、LUAD及LUSC组均未见显著水平多效性。MR-PRESSO模型中的Outlier-corrected在LCO、LUAD及LUSC均未发现离群SNP。Cochran’s Q检验发现在研究LCO与直肠癌关联时存在异质性(Cochran’s Q值 = 35.284,P =0.04),我们采用了IVW方法中的随机模型进行评估,其余各组均未见显著异质性(表2)。
表2 两样本孟德尔随机化异质性和水平多效性评估。Table 2.Heterogeneity and Horizontal Pleiotropy of Two-Sample MR Analysis
2.4 敏感性分析
SM、WM、RAPS和PRESSO四种敏感性分析方法进一步验证主分析的结论,四种方法均显示PLC与CRC不存在关联,验证了主分析的正确性及稳健性(表 1,图 2、3)。
3 讨 论
SPC是指个体在罹患原发性癌症一段时间后再次诊断出另一种原发性的癌症。近年来,随着癌症在预防、诊断以及治疗方面的进步,海量的早期癌症患者得到及时有效的治疗,治疗后患者生存期显著延长,美国仅2014年一年就有1 450万的早期癌症患者获得长期生存[20]。既往研究显示,癌症人群中SPC的患病比例较正常人群显著增高,且随着存活时间的推移呈上升趋势,随访时间达到20年以上的,超过19%的患者可能罹患SPC[21]。在PLC方面,早期患者罹患SPC的风险是正常人群的1.7倍[22],约13.4%~22%的患者将罹患SPC[3]。随着早期LC术后SPC发生比例的逐渐增高,SPC的发病、治疗及预后引起了研究者们的广泛关注,CRC作为发病率及死亡率位居前列的SPC,研究PLC与CRC之间的发病关联,有助于早期LC术后CRC高危患者的筛查,及时开展有效的治疗,从而提高患者的生存率。
SPC发病的病因目前仍不明确,观察性研究提示遗传因素,环境因素,生活习惯等均可能与SPC的发生相关。以往的观察性研究发现,PLC和CRC之间可能存在关联[23],但由于混杂因素多样、大样本病例对照研究和队列研究难以开展等原因,PLC和CRC之间是否存在关联,存在何种水平的关联仍然是一个有待探索的临床问题。Zhou等[24]发表的基于SEER数据库的研究发现,PLC治疗后CRC的患病风险较正常人群增加19%。Giopanou等[25]进行的PLC与CRC基因对比实验表明,6%~8%的NSCLC和13%的CRC患者存在BRAF基因突变,且15%的NSCLC和34%的CRC患者存在KRAS突变。然而Su等[26]进行的回顾性研究揭示,PLC存活者中CRC的患病风险并未增加[27]。本研究创新性地利用两样本MR的研究方法进行PLC与CRC发病关联的探索,研究证实PLC与CRC不存在基因水平上的关联。
本研究首次采用两样本MR的研究方法探讨两种肿瘤类型之间的潜在关联,与观察性研究相比,该方法具有明显优势。首先,我们利用PhenoScanner数据库系统性地筛选了与PLC以及CRC发生相关的混杂因素,并剔除与混杂因素有关联的工具变量,避免遗传工具变量存在潜在的水平多效性,并采用MR-Egger及MR-PRESSO (outlier-corrected)离群SNP评估法进一步检验多效性的影响,保证了结果的可靠性[27-28]。此外,我们采用 Cochran’s Q 方法进行工具变量的异质性检验,若Cochran’s Q检验不存在显著异质性,通过IVW线性回归进行无偏倚的关联估计;若存在显著异质性,则采用随机效应的IVW模型进行分析[29-30],保证了分析结果的正确性。第二,本研究除了应用IVW法及GRS法作为主分析方法外,还应用了多种敏感性分析法,包括WM方法、SM方法、RAPS方法及MR-PRESSO方法来验证结果的准确性。第三,我们首次对PLC采用分层分析的方法,鉴定了CRC与LUAD和LUSC的发生均无明显关联。
综上所述,本研究鉴定了PLC与CRC不存在基因层面的关联。本研究的结果将为早期PLC术后SPC-CRC精准防治策略的制定奠定基础。
作者声明:本文全部作者对于研究和撰写的论文出现的不端行为承担相应责任;并承诺论文中涉及的原始图片、数据资料等已按照有关规定保存,可接受核查。
学术不端:本文在初审、返修及出版前均通过中国知网(CNKI)科技期刊学术不端文献检测系统的学术不端检测。
同行评议:经同行专家双盲外审,达到刊发要求。
利益冲突:所有作者均声明不存在利益冲突。
文章版权:本文出版前已与全体作者签署了论文授权书等协议。