基于生物信息学分析ESPL1基因在肺腺癌中表达与突变的临床意义
2021-12-16柳家翠黄奔程庆元蔡伟国段怡平陈梁玥马甜甜朱翠雯喻明霞
柳家翠 黄奔 程庆元 蔡伟国 段怡平 陈梁玥 马甜甜 朱翠雯 喻明霞★
作者单位:1.武汉大学中南医院基因诊断中心,湖北,武汉430071
2.武汉大学中南医院影像科,湖北,武汉430071
肺腺癌(Lung adenocarcinoma,LUAD)是肺癌主要的组织学类型[1]。肺癌患者五年生存率仅为15%,尽管治疗取得一定进展,但生存率仅小幅提升[2]。因此,深入认识肺癌分子发病机制,寻求有效的新型标志物进行分子靶向治疗,对改善肺癌患者的总体生存期具有重要意义。外纺锤体极样蛋白1(Extra spindle poles-like 1 protein,ESPL1)具有半胱氨酸型内肽酶活性,其编码的分离酶在染色体分离和细胞分裂过程中发挥重要作用[3]。分离酶的功能是在有丝分裂后期开始时裂解黏附素,从而释放黏附的姐妹染色单体。分离酶还参与DNA 损伤修复、膜运输等多种基本生物功能[4]。ESPL1表达受到严格调控以确保许多重要细胞生物学活动的正常运行。由于其在细胞周期和DNA 损伤修复中的重要性,ESPL1的表达异常或突变极可能与恶性肿瘤的发生发展有关。研究发现,ESPL1在乳腺癌[5]、前列腺癌[6]、子宫内膜癌[7]等肿瘤中异常表达,并影响患者预后。但是该分子在肺腺癌中的表达与临床相关性还未有讨论。因此,本研究利用癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库中的肺腺癌样本数据,探索ESPL1在肺腺癌中的表达、突变及预后价值,并预测ESPL1在肺腺癌发生发展中的分子作用机制。
1 材料与方法
1.1 原始数据的下载及预处理
检索并下载来自TCGA 官网(https://portal.gdc.cancer.gov/)的肺腺癌(LUAD)的表达谱数据(535 例肿瘤组织样本,59 例正常组织样本)及相应临床信息。使用Strawberry Perl 5.30.1 软件将原始基因表达谱数据整理成基因表达矩阵文件并整理肺腺癌患者临床资料。
1.2 ESPL1 表达、突变与患者临床病理特征及预后的相关性分析
通过R 4.0.2 软件中“limma”包、“beeswarm”包提取ESPL1在肺腺癌组织样本和正常肺组织样本中的表达量数据并分析比较两组的表达差异;以ESPL1在肺腺癌患者中表达值中位数为界进一步将肿瘤组样本分为高、低表达水平两组。使用IBM SPSS Statistics 25.0 软件对ESPL1表达与临床病理特征之间的相关性进行卡方检验。利用R 4.0.2 软件“survival”包分析两组之间总体生存率(overall survival,OS)的差异;根据下载整理的临床病理信息,结合ESPL1表达量,研究ESPL1与年龄、性别、TNM 分期等临床相关性。通过单因素和多因素COX 回归分析判断ESPL1在肺腺癌中预后价值。通过cBioportal 在线软件分析ESPL1在TCGA 数据库中的突变情况以及突变患者的生存率。
1.3 在线工具验证ESPL1 在肺腺癌预后情况
使用GEPIA 在线数据库(http://gepia.cancerpku.cn/)、Kaplan Meier-plotter 在线数据库(https://kmplot.com/analysis/)分析ESPL1在肺腺癌中的表达与OS 的关系,详细参数设置如下:①GEPIA 数据库,Gene:“ESPL1”;Methods:“Overall survival”;Group Cutoff:“Median”;Dataset:“LUAD”,其他为数据库默认条件;②Kaplan Meier-plotter 数据库,Gene symbol:“ESPL1”;Survival:“OS”;Probe set options:“only JetSet best probe set”;COX regression:“multivariate”;其他条件选择数据库默认条件。
1.4 蛋白互作网络的构建与基因富集分析
使用检索相互作用基因数据库(STRING 11.0,https://string-db.org/)搜索工具在蛋白质水平上分析共表达基因之间的潜在交互作用,筛选条件为:中等置信分数>0.95。利用Cytoscape 软件(3.6.0 版,https://cytoscape.org/.)对蛋白质相互作用(Protein-Protein Interaction,PPI)网络进行可视化。使用GSEA 4.0.3 软件对ESPL1进行基因富集分析。以Molecular Signature Database(MsigDB)数据库中的c2.cp.kegg.v7.0.symbols.gmt 数据集作为功能基因集进行富集分析。将ESPL1的表达水平分为高、低表达两组。采用缺省加权富集统计的方法,随机组合次数设1 000 次,其他参数设为默认值。
1.5 统计学分析
采用SPSS 25.0 软件进行数据分析,计数资料以n(%)表示,行χ2检验;Wilcoxon 秩和检验,使用Excel 将肺腺癌患者年龄、性别、TNM 分期等临床信息进行量化赋值,采用单因素和多因素分析采用COX 比例风险回归模型,生存分析采用KM 法,P<0.05 表示差异有统计学意义。
2 结果
2.1 ESPL1 表达差异与突变分析
在肺腺癌组织中,ESPL1表达水平高于正常肺组织,差异有统计学意义(P<0.05)。见图1A-B。cBioportal 网站分析结果显示,TCGA 数据库的516 个肿瘤样本中有8 个发生了ESPL1突变,突变率为1.6%。见图1C。
图1 ESPL1 在肺腺癌组织及正常肺组织中的表达差异分析及突变情况Figure 1 Expression and mutation rate of ESPL1 in lung adenocarcinoma and normal lung tissues
2.2 ESPL1表达与临床病理特征及预后相关性分析
ESPL1表达水平与性别和远处转移具有相关性,差异有统计学意义(P<0.05)。见表1。Stage 分期Ⅱ、Ⅲ、Ⅳ期与I 期相比,均高表达ESPL1,差异有统计学意义(P<0.05)见图2A,发生远处转移患者组ESPL1表达量显著高于未发生远处转移组,差异有统计学意义(P<0.05)。见图2D。
表1 ESPL1 与肺腺癌患者临床病理特征的相关性分析[n(%)]Table 1 Correlation analysis between ESPL1and clinicopathological features of lung adenocarcinoma[n(%)]
图2 ESPL1 表达量与肺腺癌患者临床病理特征相关性分析Figure 2 Correlation analysis between ESPL1 expression and clinicopathological characteristics of patients with lung adenocarcinoma
2.3 ESPL1 表达、突变与肺腺癌患者预后的关系
TCGA-LUAD 数据集中,ESPL1高表达与肺腺癌患者不良预后有关,差异有统计学意义(P<0.05),见图3A。GEPIA 数据库结果显示,ESPL1高表达组具有不良预后,差异有统计学意义(HR=1.6,P<0.05),见图3B;Kaplan Meier-plotter 数据库分析结果同样显示高表达ESPL1组肺腺癌患者OS 较差(HR=1.56,95%CI:1.37~1.77,P<0.05),见图3C;cBioportal 分析结果显示发生ESPL1基因突变组生存率较低,差异有统计学意义(P<0.05)。见图3D。
图3 ESPL1 在肺腺癌中的预后作用Figure 3 Prognosis of ESPL1in lung adenocarcinoma
2.4 单因素和多因素COX 回归分析
stage 分期(HR=1.473,95%CI:1.196-1.814,P<0.05)和ESPL1表达(HR=1.122,95%CI:1.014~1.241,P<0.05)可以作为肺腺癌的独立预后因素。见表2。
表2 单因素和多因素COX 回归分析Table 2 Univariate and multivariate COX regression analysis
2.5 PPI 网络构建与GSEA 富集分析
共表达基因预测结果显示KIF18B 是与ESPL1相关性最强的基因(spearman 相关系数为0.92,P<0.05),见图4A,与ESPL1共表达基因的蛋白互作网络,见图4B。GSEA 结果显示ESPL1主要富集在细胞周期、卵母细胞减数分裂、碱基切除修复以及Wnt 信号通路等。见图4C。
图4 ESPL1 的PPI 网络构建及GSEA 功能富集分析Figure 4 PPI network construction of ESPL1 and GSEA functional enrichment analysis
3 讨论
染色体结构和数目的正常是细胞正常存活和维持细胞后代遗传稳定性必不可少的基本条件。研究表明[8],染色体的错误分离会导致DNA 损伤以及非整倍体的产生而这些改变将会导致包括恶性肿瘤在内的多种人类疾病的发生。而ESPL1基因表达的分离酶就是一种在细胞有丝分裂中促使姐妹染色单体分离从而防止染色体发生内聚的酶,目前研究较多并且与ESPL1具有显著相关性的KIF18B是驱动蛋白8 家族的成员,与微管运动有关,和ESPL1一样在细胞有丝分裂中发挥重要作用[9]。研究发现在特异性诱导乳腺高表达ESPL1的转基因小鼠[10-11]中发生了乳腺肿瘤并且导致了非整倍体的产生。Mukherjee[12]与Shepard[13]等人发现了在斑马鱼和小鼠的早期致死胚胎存在ESPL1的纯合缺失,说明ESPL1的基因突变可能对机体产生致死性严重影响。由ESPL1在细胞周期以及DNA 损伤修复中的重要作用来看,研究其在肺腺癌肿瘤病人的表达以及突变情况,为深入了解患者发病机制以及寻找相应治疗靶点具有十分重要意义。
本研究结合多种生物信息学方法分析发现,ESPL1在肺腺癌的发生发展中扮演了重要角色。研究表明,发现肿瘤发生发展的特定抑制途径或分子靶点是阻滞肿瘤进展以及减轻副作用的最具前景方法[14]。ESPL1有潜力成为肿瘤治疗中具有吸引力的分子靶点。目前,分离酶在多种肿瘤中过表达并参与肿瘤相关调控通路,比如,据报道约四分之一过度表达分离酶的乳腺癌是p53 功能改变的Luminal-B 亚型[15]。因此,抑制分离酶活性的药物等抑制剂可为肿瘤治疗提供新思路。另外,Zhang 等[16]已经筛选出Sepin-1 作为分离酶靶点,Sepin-1 能够抑制三阴性乳腺癌异种移植瘤生长,并且Sepin-1 的敏感性与肿瘤中ESPL1表达水平呈正相关。由此,可以通过检测ESPL1在肿瘤病人的表达量并进行表达和突变分析,以作为是否满足使用分子抑制剂的使用条件,从而实现对患者的个体化治疗。
综上所述,ESPL1在肺腺癌中表达明显上调,且具有一定突变率。该基因的过表达与突变均与肺腺癌患者的恶性进展及不良预后有关。ESPL1有望成为肿瘤治疗的新型分子标志物。