APP下载

基于TCGA数据集分析CDCA5在肺腺癌中的临床意义与分子机制

2021-01-13王萍黄奔范维柳家翠程庆元段怡萍陈梁玥马甜甜喻明霞

分子诊断与治疗杂志 2020年12期
关键词:腺癌生存率肺癌

王萍 黄奔 范维 柳家翠 程庆元 段怡萍 陈梁玥 马甜甜 喻明霞★

肺癌是常见的恶性肿瘤之一,研究表明,超过半数的肺癌患者在中晚期才被确诊[1]。肺癌主要包括两种组织性类型:小细胞肺癌和非小细胞肺癌,其中肺腺癌是非小细胞肺癌中诊断最多的组织学亚型[2]。尽管在研究发病机制和治疗方法方面取得了一定的进展,肺腺癌仍然是最具侵袭性和最迅速致命的类型,其5年生存率低于20%[3]。细胞分裂周期相关5(cell division cycle associated 5,CDCA5)是在细胞分裂周期中姐妹染色单体结合和分离所必需的主要调节因子[4]。CDCA5保证了减数分裂细胞和有丝分裂细胞中染色体的精确分离,在DNA 修复中起着重要的作用[5]。研究发现,CDCA5与肿瘤的发生发展密切相关。CDCA5被证实在乳腺癌、胃癌、结直肠癌等癌症中异常表达,且与癌症患者的预后相关[6-8]。然而,关于CDCA5在肺腺癌中的表达、临床意义、预后以及分子机制目前尚无研究报道。因此,本研究通过数据挖掘癌症基因组图谱(the Cancer Genome Atlas,TCGA)数据库,分析CDCA5在肺腺癌中的表达,探究CDCA5在肺腺癌中的表达与患者临床病理特征的联系,结合患者的生存资料分析其预后价值,探索其在肺腺癌中的分子作用机制。

1 材料与方法

1.1 数据资料的下载与处理

在TCGA 数据库(https://portal.gdc.cancer.gov/)上下载535 例肺腺癌样本和59 例正常肺组织样本RNA 测序数据(HTSeq-FPKM,level 3)。使用R 3.6.1 软件将基因表达数据归一化处理,再进行log2转化用于后续分析。利用R 3.6.1 软件提取肺腺癌样本和正常肺组织样本中CDCA5mRNA 的表达量用于分析比较表达水平差异。此外,在TCGA数据库中下载肺腺癌患者的临床资料,包括患者的年龄、性别、生存时间、生存状态、T 分期、N 分期、M 分期、stage 分期。删除生存时间缺失和上述任何一项临床特征不明确的患者数据。

1.2 CDCA5 表达与患者临床特征和预后的相关性分析

根据CDCA5在肺腺癌患者中表达水平的中位值,将肺腺癌患者划分为高表达组和低表达组。使用IBM SPSS Statistics 25.0 统计软件分析CDCA5表达与患者的年龄、性别、T 分期、N 分期、M 分期、stage 分期的联系。使用GEPIA 在线数据库(http://gepia.cancer-pku.cn/)和OncoLnc 在线数据库(http://www.oncolnc.org/)分析CDCA5与患者总体生存率(overall survival,OS)的关系,使用Kaplan Meier-plotter 在线数据库(https://kmplot.com/analysis/)分析CDCA5与患者总体生存率(overall survival,OS)和进展后生存率(post progression survival,PPS)的关系。根据TCGA-LUAD 数据集中肺腺癌患者的生存数据,结合CDCA5的表达量,使用单因素和多因素cox 回归分析CDCA5在肺腺癌患者中的预后价值。

1.3 基因富集分析

使用GSEA 4.0.2 软件进行基因富集分析。以MsigDB(Molecular Signature Database)数据库中的c2.cp.kegg.v7.0.symbols.gmt 数据集作为功能基因集。采用缺省加权富集统计的方法,随机组合次数设1 000 次。以P<0.05 和错误发现率(false discovery rate,FDR)小于0.05 的基因集作为显著富集的基因集。

1.4 统计学分析

使用Mann-Whitney U 检验分析CDCA5在肺腺癌样本和肺正常组织样本中的表达差异;使用卡方检验分析CDCA5表达与患者临床特征的相关性;生存分析使用log rank 检验;cox 比例风险回归模型用于评价CDCA5的预后意义。以P<0.05为差异具有统计学意义。

2 结果

2.1 CDCA5 在肺腺癌组织中表达显著上调

在TCGA-LUAD 数据集中,肺腺癌组织的CDCA5表达水平显著高于正常组织,差异具有统计学意义(P<0.05)(图1A)。在57 对配对的肺腺癌组织和癌旁组织中分析发现,CDCA5在肺腺癌组织中显著上调,差异具有统计学意义(P<0.05)(图1B)。在GEPIA 数据库中,共有483 例肺腺癌组织样本、347 例正常肺组织样本,结果也显示CDCA5在肺腺癌组织中显著上调表达(P<0.05)。图1C。

图1 CDCA5 在肺腺癌组织和正常肺组织样本中的表达差异分析Figure 1 Differential analysis of CDCA5 expression in lung adenocarcinoma and normal lung tissue samples

2.2 CDCA5 与肺腺癌患者临床病理特征的联系

相关性分析显示CDCA5在肺腺癌患者中的表达与Stage 分期(P=0.003)和淋巴结浸润(P=0.016)有关。见表1。

表1 CDCA5 表达与患者临床特征的相关性分析[n(%)]Table 1 Correlation analysis of clinical characteristics between CDCA5 expression and patients[n(%)]

2.3 CDCA5 高表达提示患者预后不良

在GEPIA 数据库中,CDCA5的表达水平与患者的总体生存率相关,高表达提示预后不良(P=0.006)(图2A);OncoLnc 数据库分析结果显示CDCA5的表达也与患者的总体生存率相关(P=0.003)(图2B);Kaplan Meier-plotter 数据库分析结果表明高表达的CDCA5 与肺腺癌患者的总体生存率(HR=2.04,95%CI:1.72~2.42,P<0.05)(图2C)和进展后生存率(HR=1.67,95%CI:1.08~2.58,P=0.020)正相关(图2D)。

图2 CDCA5 与肺腺癌患者预后的相关性分析Figure 2 Prognosis analysis between CDCA5 expression and lung adenocarcinoma

在TCGA-LUAD 数据集中,单因素cox 回归分析结果显示,Stage 分期、T 分期、N 分期和CDCA5均可以作为肺腺癌潜在的预后因素(P<0.001)。而多因素cox 回归分析结果提示,只有Stage 分期(HR=1.90,95%CI:1.18~3.04,P=0.010)和CDCA5表达(HR=1.28,95%CI:1.06~1.54,P=0.010)可以作为肺腺癌的独立预后因素。见表2。

表2 单因素和多因素cox 回归分析Table 2 Univariate and multivariate cox regression analysis

2.4 GESA 富集分析结果

GSEA 分析结果显示,CDCA5主要参与了22 条信号途径(P<0.05,FDR<0.05)。其中包括了细胞周期、DNA 复制、错配修复、同源重复、RNA 降解和P53 信号通路等和致癌相关的途径。见表3、图4。

表3 GSEA 富集分析结果Table 3 Results of GSEA enrichment analysis

图4 CDCA5 基因高表达样本相关富集基因集Figure 4 High expression of CDCA5 gene in samples correlated with enrichment of gene sets

3 讨论

细胞分裂周期相关(cell division cycle-associated,CDCA)蛋白家族由8 个成员组成(CDCA1-8)。其中CDCA5基因位于染色体11q13.1,它在间期细胞的细胞核中表达,在有丝分裂中从染色质中分散,并与内聚蛋白复合物相互作用[4,9-11]。在培养的细胞中,敲除CDCA5会导致有丝分裂停滞和姐妹染色单体粘聚失败[12]。CDCA5是姐妹染色单体粘聚和分离的主要调节因子,主要作用是稳定姐妹染色单体,调节有丝分裂,维持基因组的完整性和稳定性[4]。研究表明,细胞分裂过程中的障碍会导致癌症的发生[13-14],因此CDCA5在肿瘤的发生发展中的作用也受到了研究者的关注[15-17]。然而,目前对CDCA5在肺腺癌中的研究鲜有报道。

Phan 等研究者[6]通过利用生物信息学分析发现,CDCA5在乳腺癌组织中异常表达,高表达CDCA5的患者3年生存率低于50%。在肝细胞癌组织中,CDCA5mRNA 和蛋白表达也明显均高于正常组织,且与患者的组织学分级、肿瘤大小和TNM 分期等显著相关[15-18];Kaplan-Meier 生存分析显示,CDCA5 表达升高的患者的总体生存率较短[19]。机制分析表明,CDCA5可以通过AKT 通路促进肝细胞癌细胞增殖,从而促进了肿瘤发生[20]。在胃癌中,CDCA5可以通过影响Cyclin E1的表达而影响细胞周期,在胃癌的进展中起到关键作用[7]。CDCA5还可以通过激活ERK 信号通路促进结直肠癌进展[8]。高表达的CDCA5也与上尿路和膀胱尿路上皮癌患者的疾病特异性生存(disease free survival,DSS)和无转移生存(metastatic free survival,MeFS)显著相关[5]。这些研究结果都表明了CDCA5在肿瘤中扮演了重要的角色,可作为人类肿瘤的新型分子标志物。

本研究利用GESA 分析发现,CDCA5在肺腺癌中参与多种分子途径,因此沉默CDCA5的表达,阻断CDCA5介导的致癌途径或许也可成为肺腺癌的治疗策略。

综上所述,CDCA5在肺腺癌中异常表达上调,并与肺腺癌患者的恶性进展相关,高表达的CDCA5提示患者预后不良。CDCA5可以作为肺腺癌的独立预后因素,并且有望成为肺腺癌治疗的分子策略。

猜你喜欢

腺癌生存率肺癌
云南地区多结节肺腺癌EGFR突变及其临床意义
氩氦刀冷冻治疗肺癌80例的临床观察
十二指肠腺癌88例临床特征及相关预后因素
肿瘤复发,为何5 年是一个坎
以盆腔巨大包块就诊的宫颈微偏腺癌2例报告
长链非编码RNA APTR、HEIH、FAS-ASA1、FAM83H-AS1、DICER1-AS1、PR-lncRNA在肺癌中的表达
CXCL-14在非小细胞肺癌中的表达水平及临床意义
“五年生存率”不等于只能活五年
日本首次公布本国居民癌症三年生存率
日本癌症患者十年生存率达59%左右