基于公共数据库分析LDHA、LDHB 基因在肺腺癌中的表达及其预后
2023-05-25鲁伟陈婷婷姚轶敏
鲁伟 陈婷婷 姚轶敏
肺癌是全世界癌症相关死亡率的主要原因[1]。在肺癌患者中,约85%为非小细胞肺癌[2]。肺腺癌(LUAD)是非小细胞肺癌中最常见的病理类型,由于其早期病理特征不明显、转移时间较晚、恶性程度较高,尽管治疗的手段和方法在不断进步,但患者5 年生存率仍不足20%[3]。如何更早地筛查和诊断LUAD,探索其驱动机制,找到可靠的生物标志物及判断预后具有重要临床意义。糖酵解代谢异常增强是肿瘤细胞的重要生物学特征之一。糖酵解过程中乳酸的产生可能促进肿瘤的发展[4]。乳酸脱氢酶(LDH)催化丙酮酸转化为乳酸的可逆反应,在肿瘤细胞糖酵解中起关键作用[5]。LDH 是糖酵解的关键酶,与231 种癌细胞的存活和增殖有关[6]。尽管多项研究报告LDH 与几种实体瘤的预后有关,但该过程的具体机制仍不清楚,可能与Warburg 效应有关[7]。本研究旨在运用癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库、基因表达谱交互式分析(Gene Expression Profiling Interactive Analysis,GEPIA)数据库、人类蛋白图谱(Human Protein Atlas,HPA)数据库、Kaplan-Meier(KM)Plotter 网站、肿瘤免疫评估资源库(Tumor Immune Estimation Resource,TIMER)在线数据库、UCLCAN 数据库等工具,明确LDHA、LDHB 基因在LUAD 中的表达情况以及对其进行预后分析。
1 资料与方法
1.1获得相关数据 我们从TCGA 数据库下载了594 个样本(包括535 个LUAD 样本和59 个正常肺样本)的RNA 测序(RNA-seq)数据和相应的临床信息。通过TCGA 数据库找到LDHA、LDHB 基因在其中的表达情况。
1.2验证基因表达情况 GEPIA 是一个用来表达分析和交互分析癌症和正常基因的服务器,可通过单基因分析、癌种分析、多基因分析等方法得到LDHA、LDHB 基因在LUAD 癌组织及癌旁组织中的表达情况,进行表达水平的作图和生存分析。
UALCAN 数据库是一个交互式web 网站,可用于在线分析和寻找更多的癌症组学数据,可以进行miRNA 的差异分析、生存分析以及靶基因预测。本研究利用UALCAN 数据库分析LDHA/LDHB 表达和临床因素之间的相关性。
1.3分析诊断价值 通过“ggplot2”(用于可视化)进行表达差异分析,获得LDHA、LDHB 基因在LUAD组织与癌旁组织中的表达差异情况及LDHA、LDHB基因与患者临床资料相关性分析,包括肿瘤分期、年龄、性别、吸烟等。
使用pROC 包对LUAD TCGA 数据进行ROC分析,结果用ggplot2 进行可视化。pROC 包默认会对数据的结局顺序进行校正。利用受试者工作特征曲线(ROC 曲线),通过曲线下的面积(AUC)来确定不同标准的界限值下的疾病识别能力,判断LDHA/LDHB 基因对于LUAD 的诊断价值。
1.4预后相关性分析 使用survival 包进行比例风险假设检验并进行拟合生存回归,结果用survminer包以及ggplot2 包进行可视化。如果选用了最佳分组方法(best),则对应使用survminer 包中surv_cutpoint函数进行最佳分组cut-off 筛选。同时可以使用KM Plotter 数据库、HPA 数据库的预后模块进行预后价值判断的辅助验证。
1.5单基因GO 和KEGG 富集分析 通过“stat”R包(基础包)对关键基因进行单基因pearson 相关性分析,保留满足cor>0.5,P<0.05 阈值的相关性基因。通过“clusterProfiler”R 包(用于富集分析)和“ggplot2”R 包(用于可视化)对相关性基因进行GO注释和KEGG 通路分析。
1.6免疫浸润相关性分析 TIMER 是一个分析肿瘤浸润免疫细胞成分的软件,几乎涵盖了所有的癌症种类。基于高通量测序数据来分析肿瘤组织中免疫细胞的浸润情况,支持6 种常见免疫细胞的分析。通过TIMER 在线数据库进行免疫浸润分析,评估LUAD 患者关键基因的表达与浸润免疫细胞之间的关系。
1.7统计学方法 所有数据统计分析使用R version 4.0.2 软件。采用在线统计学分析数据,P<0.05 为差异有统计学意义。
2 结果
2.1LUAD 患者LDHA/LDHB 表达增加 利用TCGA数据库中获得的数据来分析LUAD 患者LDHA/LDHB的mRNA 表达水平,发现与邻近正常组织的表达水平相比,LDHA/LDHB 在LUAD 患者中的表达显著增加,差异有统计学意义(P<0.01)(见图1A)。与配对的癌旁组织相比,LUAD 患者LDHA/LDHB 的表达明显上升,差异有统计学意义(P<0.01)(见图1B)。同时,基于HPA 数据库也发现LDHA/LDHB 在LUAD 中的蛋白表达,与正常肺组织相比,LDHA/LDHB 在不同抗体染色程度的LUAD 中的蛋白水平均有升高。
图1 LDHA/LDHB 在LUAD 中的表达
2.2LUAD 患者LDHA/LDHB 表达与临床相关性通过使用UCLCAN 在线工具,结合不同的临床参数来调查不同情况的LUAD 患者中LDHA/LDHB 的表达。首先从性别来看,与正常对照组相比较,LDHA/LDHB 在男性和女性LUAD 患者中的表达水平均显著增加(P<0.05)(见图2A)。其次,不同肿瘤分期的LUAD 患者中均观察到LDHA/LDHB 表达明显上升(P<0.05)(见图2B)。另外,根据淋巴转移状态,LUAD患者LDHA/LDHB 表达也随着淋巴结转移数增多而显著增加(P<0.05),见图2C。
图2 LDHA/LDHB 在不同LUAD 患者中的表达
2.3ROC 曲线分析 通过TCGA 数据库中LUAD的表达谱数据绘制ROC 曲线分析其诊断价值,发现LDHA 可作为区分LUAD 与正常肺部组织生物标志物(AUC=0.952,95%CI:0.934~0.970),LDHB 在LUAD患者诊断中有一定的诊断价值(AUC=0.734,95%CI:0.693~0.775),见图3。
图3 LUAD 及邻近组织中LDHA/LDHB 表达的受试者工作特征曲线分析
2.4LUAD 患者LDHA/LDHB 预后相关分析 利用不同数据库得到的LDHA/LDHB 在LUAD 中的生存状况来进行预后分析。从包含LUAD 样本与正常相邻组织样本的GEPIA 数据库评估来看,LUAD 中LDHA/LDHB 的表达显著高于正常组织(见图4A)。此外,通过TCGA 数据库、KM Plotter 数据库的数据也证实了LDHA/LDHB 在LUAD 中存在着过表达。KM 生存曲线综合分析显示,在患病后100 个月内,LDHA/LDHB 表达较高的患者常存在着预后不良的情况(P<0.05),见图4B、4C。
图4 LUAD 患者LDHA/LDHB 的总体生存期曲线
2.5LDHA/LDHB 相关基因GO 和KEGG 通路分析利用DAVID 生物信息学微阵列分析将与LDHA 最相关的前894 个基因进行富集分析,发现这些基因中富集了糖酵解/糖异生、碳代谢作用和氨基酸的生物合成。为了在LDHA 高表达和生存期较短的患者中识别出调控方向相同的基因,我们将与LDHA 相关性最高的894 个基因与LUAD 中100 个存活相关上调基因进行交集,在交叉点检测到LDHA 和LUAD存活相关的49 个基因。对其GO 功能富集和KEGG途径分析,结果表明,差异表达基因在微管、中间体、染色体分离等过程中显著富集。
同理,使用DAVID 生物信息学微阵列分析将与LDHB 最相关的前283 个基因进行富集分析,发现这些基因中富集了未折叠结合蛋白、伴侣复合物。为了在LDHB 高表达和存活期较低的患者中识别出具有相同调控方向的基因,我们将与LDHB 相关性最高的299 个基因与LUAD 中100 个存活相关上调基因进行交集,在交叉点检测到与LDHB 和LUAD 存活具有相关性的49 个基因。对其进行GO 功能富集和KEGG 途径分析,结果表明,差异表达基因在微管、脱氧核糖核苷酸的代谢过程中显著富集。
2.6LDHA/LDHB 与免疫浸润的相关性分析 我们使用TIMER 数据库分析LDHA/LDHB 的表达与多种浸润性免疫细胞的关系,结果表明,LUAD 中LDHA的表达水平与辅助型T 细胞2(Th2)细胞呈显著正相关(P<0.05),与B 细胞、CD4+T 细胞、中性粒细胞呈负相关(P<0.05)。LUAD 中LDHB 的表达水平与Th2呈显著正相关(P<0.05),与自然杀伤(NK)细胞呈显著负相关(P<0.05)。见图5。
图5 TIMER 数据库中LDHA/LDHB 与不同免疫细胞的浸润相关性散点图
为了进一步验证基因与免疫浸润的相关性,通过GEPIA 数据库中探究LDHA/LDHB 表达与T 细胞检查点(如CD27、CD134 和CD197)之间的相互关系。结果显示,LDHA/LDHB 表达与LUAD 中CD27、CD134 和CD197 的表达显著相关(P<0.05)。见图6。
图6 LUAD 中LDHA/LDHB 表达与CD27、CD134 和CD197 之间相关性散点图
3 讨论
本研究主要基于生物信息学的方法研究LDHA/LDHB 表达水平与LUAD 的关系。研究表明,LDHA/LDHB 在包括肺癌、乳腺癌、胃癌、肾癌等多种人类癌症中普遍存在表达异常的情况[8-11]。LDH 是参与糖酵解的关键酶,通常通过加强有氧糖酵解促进肿瘤进展[12]。在本研究中,我们对不同公共数据库中LDHA/LDHB 表达水平与LUAD 之间的关系进行全面分析,发现LUAD 组织中LDHA/LDHB 的表达显著上调,LDHA/LDHB 表达水平与LUAD 的分期、淋巴结转移状态、免疫细胞浸润和不良预后相关。在细胞免疫方面,LDHA 的失活导致乳酸生成减少和肿瘤pH的中和,然后介导CD8+T 细胞和NK 细胞聚集,抑制肿瘤进展[13]。LDH 相关的乳酸积累甚至可以直接破坏T 细胞和NK 细胞,导致肿瘤免疫逃逸[14]。在本研究中,我们使用TIMER 数据库分析LDHA/LDHB 的表达与多种浸润性免疫细胞的关系,结果表明,LUAD 中LDHA 的表达水平与Th2 细胞呈显著正相关,与B 细胞、CD4+T 细胞、中性粒细胞呈负相关。LUAD 中LDHB 的表达水平与Th2 细胞呈显著正相关,与NK 细胞呈显著负相关。这些结果有力证实了LDHA/LDHB 参与LUAD 免疫应答,是抑制肿瘤免疫逃逸和免疫耐受的潜在靶点。
LDH 表达升高与LUAD 患者的不良预后相关。从代谢的角度来看,无论在常压或缺氧环境中,恶性肿瘤细胞都处于糖酵解的活跃状态,由于Warburg效应,乳酸产生增强。LDH 是糖酵解过程中丙酮酸转化为乳酸的催化剂,癌细胞绕过氧化磷酸化利用LDHA 将丙酮酸还原为乳酸[15]。这将丙酮酸的代谢前体转移到戊糖磷酸途径,为癌细胞生长提供代谢基础。此外,LDH 被认为是组织破坏的指标,在癌症患者中,由于细胞增殖能力强,癌细胞周期缩短,导致坏死风险增加。且邻近的正常组织如肺、肝和骨可能被癌细胞侵袭[16],这些器官的损伤也会导致LDH水平升高。LDH 受细胞内缺氧诱导因子(HIF)的调控,缺氧或基因突变使HIF 合成增加,进而导致与血管生长、肿瘤转移、糖酵解以及抗凋亡等一系列相关蛋白的过度表达,这有助于增加癌细胞的增殖和侵袭[17]。所有这些机制可能共同促进癌症患者LDH 水平的升高,使其成为判断肿瘤预后的预测因子。
综上所述,本文研究表明LDHA/LDHB 在LUAD发生、进展、预后判断的方面发挥重要作用。通过多种数据库的数据分析证明LDHA 和LDHB 参与了LUAD 的进程,可作为LUAD 相关的一种潜在的预后生物标志物。这些发现可能有助于我们进一步了解LDHA 和LDHB 的作用,以及为LUAD 预后评估及靶向治疗提供价值。