基于TCGA数据库的肺腺癌组织中CDT1表达及相关信号通路分析
2020-10-13柳家翠黄奔许培培
柳家翠,黄奔,许培培
1 武汉大学中南医院,武汉 430071;2 郑州大学第三附属医院
肺癌是世界上最常见肿瘤,由于该病早期症状不特异,大多数确诊时已是中晚期,伴全身多处转移,失去了最佳治疗时机[1]。研究[2]表明,肺癌患者的5年生存率只有10%~20%。近年,随着基因测序技术的发展,人们对肺癌分子发病机制的认识逐渐深入,促进了新型分子标志物的产生及靶向治疗的发展,改善了晚期或转移性疾病患者的总体生存期[3]。因此,确定与肺癌密切相关的新型分子靶点具有重大意义,能够为肺癌的分子靶向治疗提供理论及实践依据。
染色质许可和DNA复制因子1(CDT1)基因编码的蛋白质参与了DNA复制所需的复制前复合物的形成,是启动DNA复制的关键因子[4,5]。正常情况下,CDT1确保每个细胞周期只复制一次,对维持基因组的稳定性至关重要[6,7]。研究[8]表明CDT1在体内的过表达容易导致DNA复制异常,同时可激活DNA损伤检查点,在细胞系或动物体内诱发恶性转化。CDT1在乳腺癌[9]、肝癌[10]、结肠癌[11]等癌症中异常表达,并且与癌症患者的预后相关,提示CDT1可作为潜在的预后预测因子。然而,关于CDT1在肺腺癌中的表达变化及意义目前仍缺乏研究报道。本研究通过下载整理癌症基因组图谱(TCGA) 数据库中2019年11月20日之前纳入的肺腺癌表达谱数据及患者临床信息,分析CDT1在肺腺癌中的表达变化,探讨CDT1与临床病理特征及预后的相关性,并分析CDT1作用相关信号通路。
1 材料与方法
1.1 原始数据的下载及预处理 从TCGA官方网站(https://portal.gdc.cancer.gov/)检索并下载肺腺癌的表达谱数据及相应临床信息。其中,基因表达谱数据包括肺腺癌组织样本535例份,肺组织样本59例份。使用Strawberry Perl 5.30.1软件将原始基因表达谱数据整理成基因表达矩阵文件,利用R 3.6.1软件提取CDT1在肺腺癌组织样本和正常肺组织样本中的表达量数据。利用Strawberry Perl 5.30.1软件和R 3.6.1软件整理下载的肺腺癌患者临床资料,仅保留生存时间、生存状态、年龄、性别、Stage分期、T分期、N分期、M分期信息均完整的患者数据。
1.2 CDT1表达与肺腺癌患者临床病理特征及预后的相关性分析及验证 以CDT1在肺腺癌患者中表达水平的中位值(4.409)为界限,将肺腺癌患者分为CDT1高表达组和CDT1低表达组。通过χ2检验比较两组临床病理特征的差异。并根据在TCGA下载整理的肺腺癌患者的临床信息,结合CDT1表达量,利用单因素及多因素COX分析CDT1表达与肺腺癌患者临床病理特征相关性。
利用R 3.6.1软件“survival”包分析CDT1高、低表达组总体生存率(OS)的差异,并使用GEPIA在线数据库(http://gepia.cancer-pku.cn/)、UALCAN在线数据库(http://ualcan.path.uab.edu/)及Kaplan Meier-plotter在线数据库(https://kmplot.com/analysis/)对CDT1表达及生存分析结果进行验证。具体操作方法如下:①GEPIA分析CDT1表达及预后情况设置参数:i)表达参数:Gene:“CDT1”;Dataset: “LUAD”;Matched Normal data:“Match TCGA normal and GTEx data”,其他设为数据库默认条件;ii)预后参数:Gene:“CDT1”;Methods:“overall survival”;Group Cutoff: “Median”;Dataset:“LUAD”,其他为数据库默认条件。②Kaplan Meier-plotter数据库分析CDT1表达与肺腺癌患者OS的关系详细参数如下: Gene symbol: “CDT1”; survival: “OS”; Probe set options: “only JetSet best probe set”; COX regression: “multivariate”;其他条件选择数据库默认条件。③UALCAN在线数据库分析CDT1表达与肺腺癌患者预后关系的设置条件:选择“TCGA analysis”进行分析;Enter gene symbol(s)框内填入“CDT1”;数据集选择“lung adenocarcinoma”;点击“survival”。
1.3 CDT1基因相关信号通路富集分析 使用GSEA3.0软件对CDT1进行基因富集分析。以Molecular Signature Database(MsigDB)数据库中的c2.cp.kegg.v7.0.symbols.gmt 数据集作为功能基因集进行富集分析。将CDT1的表达水平分为高、低表达两组。采用缺省加权富集统计的方法,随机组合次数设1 000次,其他参数设为默认值。
1.4 统计学方法 采用SPSS25.0软件。用Mann-WhitneyU检验分析CDT1在肺腺癌组织和肺正常组织样本中的表达差异;对CDT1表达水平与肺腺癌患者临床病理特征的相关性进行χ2检验;单因素及多因素COX比例风险回归模型用于评价CDT1与肺腺癌预后的关系;生存分析使用Kaplan-Meier法,生存曲线比较采用Log-rank检验。P<0.05为差异有统计学意义。
2 结果
2.1 肺腺癌组织、正常肺组织CDT1基因的表达水平比较 CDT1在肺腺癌组织表达水平(CDT1Mean=5.414)高于正常肺组织(CDT1Mean=0.734)(P<0.001)(图 1A)。在57对配对的肺腺癌组织(CDT1Mean=5.005)与癌旁正常组织(CDT1Mean=0.726)样本中,肿瘤组织CDT1表达水平较癌旁正常肺组织也显著上调(P<0.001)(图 1B)。
注:A图为TCGA-LUAD数据集中,CDT1在正常肺组织和肺腺癌组织中的表达比较;B为在TCGA-LUAD数据集中,57对配对的肺癌组织和癌旁组织中CDT1的表达比较。
2.2 肺腺癌组织CDT1基因表达与患者临床病理特征及预后的关系 肺腺癌组织中CDT1基因表达与患者临床病理特征的关系见表1。肺腺癌组织中CDT1表达量与年龄(P=0.019)、性别(P=0.049)、Stage分期(P=0.007)、M分期(P=0.042)显著相关。单因素COX分析结果显示,Stage分期、T分期、N分期和CDT1均可以作为肺腺癌潜在的预后因素(P均<0.001);多因素COX回归分析结果提示,Stage分期(HR=1.97, 95%CI: 1.22-3.17,P=0.005)和CDT1(HR=1.43, 95%CI: 1.14~1.79,P=0.002)可以作为肺腺癌的独立预后影响因素(见表2)。
2.3 CDT1与肺腺癌预后的关系以及在线工具验证结果 CDT1高表达与肺腺癌患者不良预后有关 (P=0.029)(见图2A)。GEPIA数据库在线验证结果显示CDT1在肺腺癌组织中高表达且CDT1低表达组OS高于高表达组(P=0.001 9)(图2B); Kaplan Meier-plotter 在线数据库分析结果表明,高表达组肺腺癌患者的OS较低(HR=2.15, 95%CI1.81~2.54,P<0.001)(图2C);UALCAN在线数据库分析结果也显示CDT1高表达的肺腺癌患者具有较低的OS(P=0.004)(图2D)。
表1 肺腺癌组织CDT1基因表达与患者临床病理特征的关系(例)
表2 肺腺癌患者单因素和多因素COX回归分析结果
注:A为TCGA-LUAD数据集中的数据 ;B分别为GEPIA在线数据库数据;C为Kaplan Meier-plotter数据库中数据。
2.4 CDT1基因相关信号通路 CDT1基因高表达样本主要富集在细胞周期、嘌呤与嘧啶代谢、RNA降解、核苷酸切除修复以及P53信号通路中,详见表3。
表3 CDT1基因GSEA功能富集分析结果
3 讨论
DNA复制是细胞增殖的关键步骤。正常情况下,DNA复制的整个过程均受到体内分子网络的严密调控,以确保机体进行正常的细胞增殖。DNA复制错误造成的DNA损伤可导致癌转化、发育障碍和衰老[12]。DNA复制起点许可是控制细胞分裂和基因组完整性的一个进化保守步骤,该步骤主要是由微脂质体维持(MCM)解旋酶复合物的DNA装载的。CDT1蛋白是真核细胞的DNA复制起点许可过程中必不可少的组分。CDT1可与ORC和CDC6协同作用,招募并参与解旋酶MCM的核心装载[7]。因此,CDT1的任何异常都可能导致DNA复制过程出错,从而激活DNA损伤检查点诱发机体的恶性转化[13]。
Arentson等[14]在一种永生化的原始红细胞系中,通过整合逆转录病毒DNA激活了CDT1,他们发现过表达CDT1的NIH3T3细胞能够在Rag2-/-小鼠中形成肿瘤,由此鉴定CDT1是一种潜在的致癌基因。Bravou等[11]通过免疫组化检测发现,与非肿瘤性结肠上皮相比,结直肠癌灶内CDT1蛋白表达增强。另有研究者指出,在肝细胞癌中CDT1的过表达与DNA损伤反应有关,而且CDT1的过表达与肿瘤分级以及TNM分期显著相关,是肝细胞癌的重要预后生物标志物[10]。这些研究均表明了CDT1在多种肿瘤的发生发展过程中扮演了重要角色。Karakaidos等[15]报道了在非小细胞肺癌的一个亚群中,CDT1显著过表达,且与CDC6水平呈正相关,并且CDT1及CDC6的过表达与p53的突变一致,说明CDT1过表达可导致细胞过度复制,同时可影响染色体的稳定性,然而该研究并未具体分析CDT1在肺腺癌患者中的表达与临床预后的关系。
正常情况下,CDT1受到多种机制的负性调控,一旦解除对CDT1的调控可导致染色体损伤,从而导致染色体的不稳定性,进一步诱发正常细胞突变成肿瘤[16]。本研究利用生信挖掘的方法,通过下载并分析TCGA-LUAD数据集基因表达谱数据发现,与正常肺组织相比,CDT1在肺腺癌组织中的表达水平显著上调。同时有研究[17]显示,CDT1是肿瘤发展与发生浸润转移的重要因素。本研究通过χ2检验分析验证了CDT1表达水平与患者的Stage分期及远处转移具有显著相关性,多因素COX回归分析提示CDT1可作为肺腺癌的独立预后因子。 另有研究[18]发现,转基因过表达CDT1的模型小鼠生存期不超过两周,显著低于正常小鼠。本研究的生存分析以及在线工具验证结果也表明CDT1高表达的肺腺癌患者总体生存率较差。GSEA功能富集分析预测结果显示,CDT1可能参与调节细胞周期和与致癌信号相关的通路,但其参与调节的具体生物学信号通路仍有待实验验证。由此可见,CDT1基因表达水平的变化对肺腺癌发生发展具有显著影响。
综上所述, CDT1在肺腺癌患者中高表达,与肺腺癌患者的Stage分期及远处转移等相关,可作为导致肺腺癌不良预后的独立危险因子,并通过参与多种信号通路促进肺腺癌的发生发展。本研究的局限性在于仅从生物信息学角度对CDT1在肺腺癌组织中的表达变化及与患者临床病理特征、预后相关性和信号通路等进行分析,而缺乏CDT1参与肺腺癌发生发展的体内外生物学实验研究证据。因此,接下来应通过具体相关实验验证本研究中的生信分析研究结果,从而为将来CDT1作为肺腺癌治疗的分子靶点提供更多临床线索及证据。