APP下载

肾透明细胞癌中拓扑异构酶Ⅱα与免疫浸润的关系及相关基因分析

2023-11-01马俊杰安韶光梅静宇张磊张浩轩陆进

中国医科大学学报 2023年10期
关键词:结果显示细胞周期数据库

马俊杰,安韶光,梅静宇,张磊,张浩轩,陆进

(蚌埠医学院 1. 临床医学院2020级; 2. 检验医学院2019级; 3. 第二附属医院肿瘤外科; 4. 基础医学院人体解剖学教研室,安徽 蚌埠 233030)

肾细胞癌 (renal cell carcinoma,RCC) 是泌尿生殖系统常见的恶性肿瘤之一,占成人肾脏肿瘤的85% 以上[1]。2020年RCC新发病例达43万,死亡患者约18万例[2]。肾透明细胞癌 (kidney renal clear cell carcinoma,KIRC) 是RCC的主要组织学亚型,约占80%[3]。目前,对于早期KIRC患者,手术切除仍然是主要和最有效的治疗方法,但发生远处转移的KIRC患者手术和放化疗效果不明显,5年生存率<10%,且复发风险较高[4]。因此,挖掘KIRC的新型生物标志物对于患者的诊断与治疗具有积极作用。

拓扑异构酶 Ⅱα (topoisomerase Ⅱα,TOP2A) 属于DNA 解链因子,在细胞增殖、DNA 复制以及染色体浓缩和分离等多种生物学过程 (biological process,BP) 中发挥关键作用,其表达具有明显的细胞周期依赖性[5]。TOP2A表达或结构异常时可导致染色体不稳定以及肿瘤的发生,如在卵巢癌和肺癌中TOP2A表达异常导致患者不良预后[6-7],但其在KIRC中的作用目前仍待商榷。因此,本研究旨在通过生物信息学方法分析TOP2A在KIRC中的表达、预后和免疫学等有关分子机制,为KIRC的诊断和治疗探索新的生物分子标志物。

1 材料与方法

1.1 数据来源

KIRC单细胞测序数据来自基因表达综合数据库 (Gene Expression Omnibus,GEO) GSE111360队列的GSM3029087 (p87)、GSM3029088 (p88) 和GSM 3029091 (p91) 3个样本,根据以下标准过滤样本中的细胞和基因:(1) 基因表达量200~50 000;(2) 线粒体基因百分比<15%;(3) 表达基因数量200~5 000;(4) ≥3个细胞中表达的基因。其余分析所使用的数据均为各数据库默认来源。

1.2 TOP2A差异表达与预后分析

TOP2A基因差异表达、临床分期及总生存期(overall survival,OS) 的Kaplan-Meier (K-M) 曲线通过GEPIA (http://gepia.cancer-pku.cn/) 在线工具分析;TOP2A在正常肾组织和KIRC组织中的免疫组化结果应用HPA数据库进行获取。

1.3 TOP2A单细胞分析

单细胞测序数据通过R包“Seurat”进行分析,首先通过NormalizeData函数对数据进行标准化,再通过FindIntegrationAnchors函数对3个患者样本识别锚点进行整合,然后通过RunPCA函数计算数据的主成分,选取前20个主成分通过K-最邻近分布进行聚类分析,细胞类型根据标记基因通过CellMarker数据库 (http://bio-bigdata.hrbmu.edu.cn/CellMarker/) 和文献收集进行注释。

1.4 TOP2A免疫分析

TOP2A基因表达与KIRC免疫细胞浸润水平之间的相关性通过TIMER2.0 (http://timer.cistrome.org/)分析;利用Sangerbox探究TOP2A基因表达与免疫和基质评分的关系,利用GEPIA2021的EPIC算法分析CD8+T细胞 (cut-off=80%)、CD4+T细胞 (cut-off=60%)、B细胞 (cut-off=84%)、NK细胞 (cut-off=85%)、巨噬细胞 (cut-off=70%) 和调节T (Tregs) 细胞 (cut-off=50%)的浸润水平与KIRC患者OS的关系。

1.5 TOP2A列线图

将TOP2A基因和患者的临床特征纳入Aclbi进行单因素Cox回归分析,将P< 0.05的因素纳入模型进行列线图的构建,并通过校准曲线和受试者操作特征 (receiver operating characteristic,ROC) 曲线下面积 (area under the curve,AUC) 进行验证。

1.6 TOP2A相关基因筛选

通过STRING数据库检索TOP2A基因的200个相关表达基因。然后,通过GEPIA2.0筛选 TCGA-KIRC数据集中表达上调的基因 (logFC≥1且q<0.05) 和TOP2A相关基因,共得到586个表达上调基因 (以q值由小到大排序) 和1 000个TOP2A相关基因 (按相关性由大到小排序);最后,各取前200个基因进行韦恩图绘制,得到11个与TOP2A相关的基因。

1.7 TOP2A相关基因富集分析

将获得的TOP2A及相关基因导入Aclbi分析其相关性;然后,通过 Sangerbox探究TOP2A及相关基因的基因本体论 (Gene Ontology,GO) 和京都基因与基因组数据库 (Kyoto Encyclopedia of Genes and Genomes,KEGG) 通路富集;最后,通过Sangerbox以KEGG通路基因集为参考,根据TOP2A基因表达中位值分为高、低表达组,对不同表达组进行基因集富集分析 (gene set enrichment analysis,GSEA)。

1.8 TOP2A相关基因预后风险模型构建

将TOP2A及相关基因导入Aclbi在线分析工具进行LASSO回归分析,将筛选出的基因进行风险评分 (风险评分=基因表达量×系数) 计算,根据风险评分的中位值将患者分为高、低风险组进行下游分析。

1.9 统计学分析

单细胞数据通过R4.2.1软件进行分析,其余分析为各数据库默认软件。采用单向方差分析检验TOP2A基因在KIRC和正常组织差异表达,不同肿瘤分期表达采用F检验比较差异,免疫细胞和上皮细胞差异表达采用Wilcoxon检验,采用K-M法和logrank检测进行生存分析,采用Spearman相关性分析基因表达与免疫细胞浸润的水平相关性;P< 0.05为差异有统计学意义。

2 结果

2.1 TOP2A差异表达

TOP2A在KIRC组织中表达上调,且TOP2A基因的表达水平随患者临床分期的增高而增加 (P<0.05,图1A、1B)。TOP2A基因的高表达水平不利于患者的OS (图1C);GSEA分析结果显示,高表达的TOP2A主要富集在细胞周期、不匹配修复和孕酮介导的卵母细胞成熟等与细胞增殖相关通路 (图1D)。同样,HPA数据库结果显示,TOP2A在肾癌组织中的蛋白质表达上调 (图1E)。

图1 TOP2A差异表达、预后和GSEA分析Fig.1 TOP2A differential expression,prognosis and GSEA analysis

2.2 TOP2A基因单细胞表达分析

根据各聚类的标记基因可将各细胞分为上皮细胞和免疫细胞2种类型 (图2A、2B),且TOP2A基因在免疫细胞中的表达量高于上皮细胞 (图2C)。

由于TOP2A基因主要在免疫细胞中表达,进一步对免疫细胞亚型进行聚类。根据各亚型的标记基因,共得到6种细胞类型 NK细胞、CD8+T细胞、常规T细胞、Tregs、B细胞和肥大细胞 (图2D、2E)。TOP2A在多种免疫细胞中均有表达 (图2F)。

2.3 TOP2A免疫相关分析

TIMER2.0数据库对TOP2A基因表达与各免疫细胞浸润水平的相关性分析结果显示,TOP2A与大多数免疫细胞浸润呈正相关 (图3A)。GEPIA2021数据库结果显示,CD8+T细胞和CD4+T细胞的高浸润水平与KIRC患者较好的预后相关,而B细胞、巨噬细胞、NK细胞及Tregs细胞在KIRC高浸润水平均为KIRC患者预后的危险因素 (图3B)。

图3 免疫细胞浸润水平与TOP2A基因表达及患者预后的关系Fig.3 Relationship between immune cell infiltration level and TOP2A gene expression and patient prognosis

2.4 TOP2A预后列线图

将TOP2A及患者的临床特征纳入单因素Cox回归分析,结果显示,TOP2A基因可做为KIRC患者预后影响因素 (图4A),TOP2A基因及患者临床特征所构建的列线图可预测KIRC患者的1、3和5年的生存状况,且随着列线图得分的增高,患者的生存率降低 (图4B)。校准曲线显示其具有较好的预测准确性 (图4C),且1年AUC 为0.86、3年AUC为0.80、5年AUC为0.75,表明列线图可良好地预测患者的生存状况 (图4D)。

2.5 TOP2A相关基因分析

TOP2A基因的相关基因进行韦恩图分析,共筛选出12个基因,且TOP2A基因及其相关基因的相关性较高 (图5A)。对包括TOP2A在内的12个基因进行GO功能注释和KEGG富集分析,结果显示,其KEGG通路主要富集在细胞周期、p53信号通路和细胞衰老等 (图5B);分子功能 (molecular function,MF) 主要包括腺苷酸结合、蛋白激酶活性和微管结合等;细胞构成 (cellular component,CC) 主要包括微管细胞骨架、染色体和微管组织中心等;BP主要包括细胞周期相变的调节、微管细胞骨架组织和细胞器调节等 (图5C)。

图5 TOP2A及其相关基因的富集分析Fig.5 Enrichment analysis of TOP2A and its related genes

2.6 TOP2A及其相关基因的风险评分模型

将TOP2A及其相关基因导入LASSO回归模型进行10倍交叉验证,得到最小λ值为0.013 8,筛选出包括TOP2A在内的 9个特征基因,再根据基因表达量及相关系数构建风险评分 (图6A)。根据风险评分中位值将患者分为高、低风险组,结果显示,随着风险评分的增高患者的死亡率增高 (图6B),与低风险组相比,高风险组的OS显著缩短 (图6C)。且该模型预测患者OS ROC的AUC值1年为0.685、3年为0.655以及5年为0.659,具有较好的预测能力 (图6D)。

3 讨论

KIRC是目前肾脏恶性肿瘤中最常见的组织学亚型,由于肿瘤的高度异质性,KIRC在不同患者中呈现多样化的临床表现,且晚期患者对于常见的化疗药物敏感性不高[8-9]。因此,迫切需要新的分子标志物评估患者临床的治疗和预后。目前,TOP2A已被证实与多种恶性肿瘤的进展和不良预后有关[10-11]。但其在KIRC中的相关研究甚少。

TOP2A基因在KIRC组织中的表达显著上调,并且与患者的不良预后和临床分期增高有关。此外,高表达的TOP2A主要富集在细胞周期和错配修复等过程,SMITH等[12]研究发现在肿瘤细胞由静止期进入细胞周期时,TOP2A的合成激活促进肿瘤细胞的增殖,这可能是其促进肿瘤发生发展的原因之一。差异分析和富集分析结果显示,TOP2A的表达可能与KIRC的发生、发展和转移关系密切。

对KIRC患者的单细胞测序数据分析发现,TOP2A基因在多种免疫细胞中表达,且与多种免疫细胞浸润水平呈正相关,与XU等[13]在肾乳头状细胞癌中的研究结果一致。不同的是在KIRC中,各免疫细胞的浸润水平长期增高反而不利于患者的预后。研究[14]显示,正常人体中CD4/CD8细胞比例处于特定的范围,二者的比例失调可导致机体免疫功能的异常。此外,巨噬细胞和B细胞也可能由于其在肿瘤中被诱导产生不同分化表型导致肿瘤细胞的增殖或肿瘤免疫逃避的产生[15-16]。TOP2A的表达不仅有利于KIRC的发生与转移,还可激活机体的免疫系统。肿瘤微环境是由肿瘤细胞与肿瘤间质细胞、免疫细胞、细胞外基质、血管组织和信号分子等相互作用形成的动态系统,各成分的相对比例改变也可能导致肿瘤侵袭性增高及患者的不良预后[17-18],这可能是TOP2A基因诱导KIRC患者不良预后的原因之一。

总之,本研究基于生物信息学方法探究了TOP2A基因在KIRC的表达和免疫浸润等有关分子机制,建立了预后风险模型,并应用列线图预测了TOP2A基因在KIRC中的有关预后作用,表明TOP2A可作为KIRC的预后分子标志物,对临床治疗和预后提供参考。本研究还需要相关的基础和临床实验进行验证,以便更加准确地探究有关分子机制及预后意义。

猜你喜欢

结果显示细胞周期数据库
红霉素联合顺铂对A549细胞的细胞周期和凋亡的影响
最严象牙禁售令
数据库
新闻眼
第四次大熊猫调查结果显示我国野生大熊猫保护取得新成效
数据库
NSCLC survivin表达特点及其与细胞周期的关系研究
X线照射剂量率对A549肺癌细胞周期的影响
数据库
数据库