肺腺癌中CDK1的生物信息学分析
2022-08-17马玉博赵若晗任凤云
马玉博,潘 博,赵若晗,任凤云
(1.牡丹江医学院,黑龙江 牡丹江 157011;2.牡丹江医学院附属红旗医院影像科)
肺癌是最常见的癌症类型,是发生率和死亡率最多的恶性肿瘤[1-2]。依照组织学基本特征,肺癌分为非小细胞肺癌和小细胞肺癌,其中约85 %为非小细胞肺癌,非小细胞肺癌中的重要组织学类别是肺腺癌。由于其早期症状不明显,一旦发现大多处于后期,死亡率很高[3]。因此,需要去寻找与肺腺癌(lung adenocarcinoma,LUAD)相关的潜在预后指标和靶点。
细胞周期蛋白依赖激酶(Cyclin dependent kinase 1,CDK1)是细胞周期检查点调控因子,通过调节抗凋亡因子的生存促进细胞活力[4-5],CDK1蛋白的上调与肿瘤的诊断、预后密切相关[6]。有报道,CDK1异常表达与临床病理特征相关,但CDK1的表达模式和预后价值仍有待进一步研究。
1 资料与方法
1.1一般资料 利用GEPIA数据库(http://gepia.cancer-pku.cn/)分析CDK1表达及与肺腺癌患者预后的关系。登录UALCAN数据库(http://ualcan.path.uab.edu/)分析 CDK1与肺腺癌患者临床特征之间的关系。Oncomine数据库(https://www.oncomine.org/)、WebGestalt数据库(http://www.webgestalt.org/)挖掘CDK1的共表达基因,并对其进行基因本体论(Gene Ontology,GO)功能注释和京都基因与基因组百科全书(KyotoEncyclopedia of Genes and Genomes,KEGG)富集分析,利用String数据库(https://string-db.org/)、Cytoscape构建蛋白质互作网络(Protein-Protein Interaction Networks,PPI)和可视化分析,Kaplan-Meier Plotter数据库(https://kmplot.com/analysis/)分析hub基因与肺腺癌总生存率的关系。
1.2方法
1.2.1CDK1在不同癌症组织和正常组织中的差异表达 GEPIA数据库分析CDK1在各种不同癌症组织和正常组织中的表达状况,进而分析CDK1在肺腺癌和正常组织中的表达。
1.2.2CDK1与肺腺癌患者临床特征之间关系的分析 UALCAN[7]是一个交互的网站平台,对来自肿瘤基因组图谱计划(The Cancer Genome Atlas, TCGA)的31种癌症类型的临床数据和3级RNA序列进行深入分析。以UALCAN数据库为基础,按下述步骤分析CDK1的表达与肺腺癌患者临床特征的关系:(1)在数据库首页选择TCGA analysis;(2)Enter gene symbol(s):CDK1;(3)TCGA dataset:LUNG ADENOCARCINOMA;(4) Links for analysis: Expression。对应选择各种不同的临床特征进行分析。
1.2.3CDK1与肺腺癌患者预后关系的分析 对肺腺癌和正常样本CDK1表达与患者总生存率(Overall survival,OS)进行分析。
1.2.4分析CDK1的共表达基因 Oncomine数据库[8]收集了715个基因表达数据集,86 733个癌组织和正常组织样本数据,是最大的癌基因芯片全球数据库和集成数据挖掘平台,旨在挖掘癌症基因信息。通过Oncomine数据系统库分析CDK1在肺腺癌患者中的表达情况,按以下步骤进行: 登录 Oncomine 数据,在数据库检索界面中输入筛选条件:(1) GENE: CDK1;(2)ANALYSIS TYPE: COEXPRESSION ANALYSIS; (3)CANCER TYPE: LUNG CANCER;(4)设置临界条件为:P -VALUE: 0.01,FOLD CHANGE:2,GENE RANK: TOP 10%。在上述筛选条件下,选取全部肺腺癌数据集,并基于所选数据对CDK1的共表达基因进行分析。
1.2.5GO和KEGG功能富集分析 在2019年的更新中,WebGestalt支持12个生物体、342个基因标识符和155175个功能分类[9]。共表达基因的GO功能富集分析和KEGG通路富集分析是借助此在线工具开展的。
1.2.6共表达基因蛋白质互建网络分析 String是一个检索基因、蛋白质相互作用关系的工具[10],Cytoscape是网络图分析的开放型互联网平台,它能数据可视化分子相互之间功能网络和资源整合模块化网络[11]。PPI网络是从String获得的,PPI网络借助Cytoscape软件开展可视化分析,继而借助cytoHubba插件选择出排行靠前的hub基因继续研究。
1.2.7分析hub基因与肺腺癌的关系 Kaplan-Meier Plotter是分析临床预后和基因表达的网站平台,覆盖了乳腺癌、卵巢癌、肺癌和胃癌等肿瘤的基因及临床数据[12-13]。为了进一步分析hub基因的潜在作用,我们通过GEPIA分析hub基因在肺腺癌中的表达情况,Kaplan-Meier Plotter数据库系统分析肺腺癌的总生存率与hub基因两者之间的内在联系,以此讨论hub基因对肺腺癌患者的作用。
1.2.8统计方法 采用数据库默认的统计学方法。单因素方差分析正常组织和肺腺癌中CDK1的表达;Kaplan-Meier法绘制生存曲线,log - rank检验比较CDK1高、低表达组的生存率,P<0.05为差异有统计学意义。
2 结果
2.1CDK1在不同癌症组织和正常组织中的表达结果 通过GEPIA在线分析CDK1在不同癌症组织和正常组织中的差异表达(图1A),进而分析提取TCGA和GTEx数据库中LUAD患者483例,正常对照347例,显示CDK1表达水平在LUAD中显著升高(图1B)。
图1A CDK1在31种癌症组织和正常组织中的表达比较
ACC:肾上腺皮质癌;BLCA:膀胱尿路上皮癌;BRCA:乳腺浸润癌;CESC:宫颈鳞癌和腺癌;CHOL:胆管癌;COAD:结肠癌;DLBC:弥漫性大B细胞淋巴瘤;ESCA:食管癌;GBM:胶质母细胞瘤;HNSC:头颈鳞状细胞癌;KICH:肾嫌色细胞癌;KIRC:肾透明细胞癌;KIRP:肾乳头状细胞癌;LAML:急性髓细胞样白血病;LGG:脑低级别胶质瘤;LIHC:肝细胞肝癌;LUAD:肺腺癌;LUSC:肺鳞癌;OV:卵巢浆液性囊腺癌;PAAD:胰腺癌;PCPG:嗜铬细胞瘤和副神经节瘤;PRAD:前列腺癌;READ:直肠腺癌;SARC:肉瘤;SKCM:皮肤黑色素瘤;STAD:胃癌;TGCT:睾丸癌;THCA:甲状腺癌;THYM:胸腺癌;UCEC:子宫内膜癌;UCS:子宫肉瘤。
图1B CDK1在癌组织和正常组织中的
2.2CDK1与肺腺癌患者临床特征之间关系分析的结果 CDK1与肺腺癌患者临床特征之间的关系 根据UALCAN数据库检索源自TCGA数据库中的肺腺癌临床数据,分析患者临床特征与CDK1在肺腺癌中的表达两者之间的关系。结果显示,在不同种族、性别、年龄的肺腺癌患者中,CDK1的表达未见明显差异,此外,肺腺癌的淋巴结转移、肿瘤分期、TP53、组织学亚型也未见到与CDK1的表达存在明显相关性,而吸烟习惯也并没有影响CDK1的表达(图2)。
图2 CDK1的表达与肺腺癌患者临床特征之间的关系
2.3CDK1与肺腺癌患者预后关系分析的结果 借助GEPIA分析CDK1表达与肺腺癌患者预后的内在联系,数据表明,和CDK1高表达的肺腺癌患者比较,CDK1低表达的患者总生存率高,差异有统计学意义(P<0.05)(图3)。
图3 肺腺癌患者CDK1基因表达与总生存率
2.4CDK1共表达基因的结果 通过筛选后,我们对Su等[14]的数据集进行分析,筛选出18个基因,分别是MAD2L1、DLGAP5、CEP55、TOP2A、KIF2C、ZWINT、UBE2C、RRM2、MCM4、NUSAP1、KIAA0101、CCNB1、TPX2、CENPE、CDKN3、TYMS、MLF1IP、RFC4,整合CDK1共表达基因用于后续的分析。
2.5GO和KEGG功能富集分析结果 GO分析显示,生物学过程方面,CDK1表达相关基因主要富集在染色体定位、染色体分离、细胞器裂变等(图4A)。细胞组成方面主要富集在染色体凝集、染色体区域等(图4B),分子功能方面主要富集在ATP酶活性(图4C)。KEGG分析显示CDK1表达相关基因主要富集在细胞周期、p53信号通路等过程(图4D)。
2.6共表达基因蛋白质互建网络分析的结果 基于STRING构建CDK1及其表达相关基因的PPI网络,结果显示hub基因与肺腺癌的关系,为了进一步探讨共表达基因之间的内在联系,将共表达基因添加到STRING在线工具,获得PPI网络,把获得的最终数据导入Cytoscape中,选择主要模块进一步分析。利用插件 cytoHubba并按Degree计算方法得到最终的PPI网络。按Degree高低排序,筛选出排名前5的hub基因进一步分析,5个hub基因分别为CDC6、MAD2L1、TOP2A、KIAA0101、 MCM4(图5)。
图4 CDK1共表达基因GO功能和KEGG通路富集分析
图5 hub基因网络互作图
2.7hub基因与肺腺癌的关系 借助GEPIA网站数据库分析肺腺癌患者中hub基因的表达情况,结果显示相对于正常组织,5个hub基因在肺腺癌中明显高表达(P<0.01),符合我们前期的分析结果,即CDC6、MAD2L1、TOP2A、KIAA0101、MCM4基因在肺腺癌中表达上调(图6)。Kaplan-Meier plotter系统数据库分析肺腺癌患者总生存率和hub基因中的联系,发现CDC6、MAD2L1、TOP2A、KIAA0101、MCM4均与肺腺癌患者的 OS 密切相关(P<0.05),且CDC6、MAD2L1、TOP2A、KIAA0101、MCM4在肺腺癌中的表达越低,患者预后越好(图7)。
图6 hub基因的验证(P<0.01)
图7 hub基因与肺腺癌总生存率的关系(P<0.05)
3 讨论
肺癌是世界上最致命的癌症之一[15]。肺腺癌是肺癌中最常见和最具侵袭性的亚型,具有最大的异质性和侵袭性。肺腺癌的发展与吸烟等环境暴露密切相关[16]。当肿瘤局限于肺部且只在局部淋巴结扩散的时候,最有效的治疗方法是手术。但是大多数肺腺癌患者在初次诊断时就已经出现远处转移或被诊断为晚期,并不符合手术切除的条件,这是肺腺癌总体预后不良的一个重要原因[17]。转移也是肺腺癌患者存活率下降的主要潜在原因[18],癌细胞发生转移的基本特征是上皮-间质转化(EMT)。因此,关于寻找新的肺腺癌治疗靶标或预后生物标志物的研究,对于提高肺腺癌患者总体生存率和预后,将具有十分重要的意义。
Xu等[19]研究认为,OPN3通过促进上皮-间质转化,继而促进肺腺癌转移,OPN3很有可能成为肺腺癌临床研究上有用的潜在靶点和预后指标。有研究[20]认为,SYT13在肺腺癌的形成进展中发挥至关重要的作用,干扰SYT13能够明显抑制肺腺癌细胞的增殖、迁移、侵袭,这可能有助于肺腺癌的靶向治疗。Zou等[21]关于肝细胞癌的相关研究认为CDK1是潜在的预后生物标志物,与肝细胞癌的免疫细胞浸润相关。CDK1的抑制剂结合免疫疗法可以提高肝细胞癌患者的预后。Xing等[22]研究表明,CDK1表达水平与乳腺癌患者的总体和进展后生存率以及无复发概率相关。CDK1可能为乳腺癌患者提供潜在的治疗靶点和预后生物标志物。故此CDK1在肿瘤形成进展中的功能还有待科学研究。
本研究通过GEPIA在线数据库发现,CDK1在肺腺癌中表达明显高出正常组织。UALCAN数据库分析表明肺腺癌患者的分期、淋巴结转移、性别、年龄及吸烟习惯等临床特征与CDK1的表达没有显著相关性。通过GEPIA数据库分析CDK1的表达发现,肺腺癌患者中低表达CDK1基因的总生存率高于高表达组(P<0.05)。Oncomine数据库挖掘筛选出CDK1的共表达基因有MAD2L1、TOP2A、MCM4等18个基因。GO分析显示,CDK1共表达基因主要与染色体定位、染色体分离、细胞器裂变、染色体凝集、染色体区域、ATP酶活性相关。KEGG分析显示,CDK1共表达基因参与p53信号通路等进程。肿瘤数据库不仅为疾病的诊断和治疗提供了强有力的依据,而且为深入研究肺腺癌和CDK1基因的关系奠定了初步的基础。但CDK1在肺腺癌中的具体作用及临床意义需要更进一步的科学实验验证。
综上所述,CDK1基因在LUAD中可能是一个潜在的致癌基因。CDK1在LUAD中的表达与肿瘤的发生、发展及预后密切相关,可以作为重要的生物标志物。因此,有必要进一步研究该基因在LUAD中的机制以及功能,为全面了解CDK1在肿瘤中的作用以及LUAD的诊断和预后提供更多依据。