基于生物信息学分析乳酸脱氢酶A在肺腺癌中的表达及其临床意义*
2021-09-22王菊勇
张 轶,王菊勇
(上海中医药大学附属龙华医院GCP办公室 200032)
非小细胞肺癌(non-small cell lung cancer,NSCLC)作为全球主要的公共卫生问题严重威胁人类的生命健康。肺腺癌(lung adenocarcinoma,LUAD)是NSCLC中最常见的病理类型,具有恶性程度高、局部浸润和血行转移较早、早期一般无明显临床症状等特点,明确诊断时已属中晚期[1-3];尽管免疫疗法和靶向治疗已在临床中有较广泛的应用,但患者5年生存率仍不足20%[4]。因此LUAD的早期诊疗对于延缓其恶性进程和病死率的降低具有重要意义。
代谢重编程是恶性肿瘤的重要特征之一,表现为肿瘤细胞即使在氧气充足的条件下也不经线粒体的氧化磷酸化,而是通过糖酵解途径摄取葡萄糖生成少量三磷酸腺苷(ATP)和大量乳酸的代谢过程,即“Warburg效应”或有氧糖酵解[5]。影响肿瘤代谢重编程的机制复杂,其中乳酸脱氢酶A(lactate dehydrogenase A,LDHA)作为糖酵解通路关键酶之一,能催化糖酵解终末产物丙酮酸转化成乳酸,作为合成氨基酸、核酸等细胞增殖必需的原料,维持组织缺氧微环境,促进肿瘤细胞的生长和增殖[6]。研究表明,LDHA在包括NSCLC在内的多种恶性肿瘤中过表达,发挥类似癌基因的作用[7]。但由于研究方法、干预措施及样本来源的巨大差异,其结论的可靠性亟须大样本数据进行验证,并且LDHA在LUAD组织中的生物学功能及其与肿瘤发生、发展和预后的关系尚待进一步探讨。因此,本研究基于癌症基因组图谱计划(The Cancer Genome Atlas,TCGA)和人类蛋白质表达图谱(Human Protein Atlas,HPA)等高通量多组学数据库,全面分析LDHA基因和蛋白表达对LUAD临床病理特征及预后的影响,旨在为探索LUAD的发生、发展、诊断、治疗及预后提供新的研究思路和理论依据。
1 资料与方法
1.1 LUAD组织中LDHA表达差异分析
GEPIA2(http://gepia2.cancer-pku.cn/)即基因表达谱数据动态分析,通过该平台预测LDHA基因(Ensembl ID:ENSG00000134333)在TCGA数据集常见恶性肿瘤及LUAD中的表达情况。Oncomine数据库(https://www.oncomine.org /resource /login.html)是包括基因表达数据库(gene expression omnibus,GEO)和TCGA数据在内的大型肿瘤生物信息学分析数据库,在该数据库中检索LDHA相关数据集,限定条件如下。Gene:LDHA;Cancer Type:Lung Adenocarcinoma;Analysis Type:Cancervs.Normal Analysis;Data Type:mRNA;Gene Summary:P<0.05,提取各基因芯片信息验证LDHA表达差异。HPA数据库(https://www.proteinatlas.org/)是基于免疫检测技术分析的大型蛋白组数据库,提供了26 000种人类蛋白质在48种正常组织和20种肿瘤组织中的分布信息及表达水平[8]。选取HPA数据库中正常肺组织和LUAD组织的LDHA免疫组织化学实验结果,比较正常肺组织和LUAD组织中LDHA蛋白表达水平、抗体染色程度及阳性颗粒分布情况。
1.2 LDHA与LUAD患者临床病理相关性预测
Ualcan在线分析平台(http://ualcan.path.uab.edu/)收录了TCGA数据集中各类癌症患者基因表达情况和临床病理相关性图表,本研究在该平台中设定Gene symbol为“LDHA”;TCGA dataset为“Lung Adenocarcinoma”,进一步分析LDHA与肿瘤分期、有无淋巴结转移、种族、性别、年龄及吸烟习惯之间的关系。GEPIA2网站的“Survival Analysis”模块中预测LDHA表达与LUAD患者总生存期(overall survival,OS)及无病生存期(disease-free survival,DFS)的关系。
1.3 LDHA生物学功能预测
通过LinkedOmics网站(http://www.linkefomics.org)获取LDHA在LUAD中的共表达基因,筛选Pearson系数大于0.4的正相关基因导入Metascape分析平台(http://metascape.org)进行基因本体(gene ontology,GO)功能分析、京都基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析及共表达基因互作分析。
1.4 LDHA蛋白相互作用网络分析
基于中国知网、万方数据知识服务平台、维普网、PubMed、EMBase、The Cochrane Library等数据库,检索建库至2020年12月有关LDHA与LUAD关系的研究。参照中国生物医学文献数据库主题词及关键词表、PubMed MeSH词汇表选择相应检索词。中文数据库以“乳酸脱氢酶A”or“LDHA”and“肺腺癌”为检索词进行检索;外文数据库以“lactate dehydrogenase A”or“LDHA”and“lung adenocarcinoma”or“LUAD”为检索词进行检索,获取文献中与LDHA直接或间接相互作用进而影响LUAD发生、发展、诊断及预后的蛋白分子,利用STRING-DB(https://string-db.org/)和Cytoscape3.7.1软件构建可视化蛋白互作网络(protein-protein interaction,PPI)。
1.5 统计学处理
正常肺组织与LUAD组织中LDHA表达差异的组间比较,配对样本采用配对t检验,非配对样本采用Wilcoxon秩和检验;LDHA mRNA的表达与LUAD临床病理相关性采用非参数检验;Pearson相关性分析筛选LDHA共表达基因;采用Kaplan-Meier模型和log-rank检验评估LDHA表达与LUAD患者OS和DFS的关系。检验水准α=0.05。
2 结 果
2.1 LDHA mRNA在不同肿瘤组织及LUAD中的表达差异
使用GEPIA2平台分析LDHA在TCGA数据库常见恶性肿瘤中的表达水平发现,LUAD组织中LDHA的中位表达值为674.98,明显高于正常肺组织,见图1A;进一步检索483例LUAD组织和59例正常肺组织中LDHA mRNA的表达信息,结果显示与正常肺组织相比,LUAD组织中LDHA mRNA表达水平是正常肺组织的2.44倍(P<0.05),见图1B。分析Oncomine数据库中9项共涉及569例LUAD组织和260例癌旁正常组织的基因芯片数据集,结果显示LDHA mRNA在LUAD组织中较正常肺组织高表达,差异均有统计学意义(P<0.05),见表1。
图1 LDHA mRNA在不同肿瘤组织及LUAD中的表达差异
表1 Oncomine数据库中LDHA mRNA在不同LUAD研究中的表达
2.2 LDHA蛋白在LUAD组织中的表达
为验证上述LDHA mRNA的表达差异,本研究检索了HPA数据库中采用LDHA抗体(CAB069404)在LUAD及正常肺组织中的免疫组织化学染色结果,发现在3例正常肺组织中抗体均呈低染色水平,3例LUAD组织中均呈强染色或中等染色水平,且阳性染色颗粒主要位于细胞质或细胞膜上。这一结果与基因表达结果相一致,进一步证实了LDHA蛋白在LUAD组织中较正常肺组织高表达,见图2。
图2 LDHA蛋白在LUAD组织和正常肺组织中的表达(IHC)
2.3 LDHA与LUAD临床病理特征的关系
通过UALCAN数据库对LDHA表达水平与LUAD临床病理特征之间的关系进行分析,结果显示,LDHA表达与肿瘤分期呈正相关(P<0.05),且随淋巴结转移数量增加而表达上调(P<0.05),但与患者的种族、性别、年龄和吸烟习惯无关,见图3。
A:LDHA表达与肿瘤分期的关系;B:LDHA表达与淋巴结转移的关系;C:LDHA表达与种族的关系;D:LDHA表达与性别的关系;E:LDHA表达与年龄的关系;F:LDHA表达与吸烟习惯的关系。
2.4 LDHA对LUAD患者预后的影响
为明确LDHA是否对LUAD患者预后存在影响,本研究在GEPIA2网站下载了TCGA数据库中478例LUAD患者的生存信息,从LDHA mRNA表达水平的50%取截断值将该数据集分为高表达和低表达两组,每组各239例。Kaplan-Meier单因素生存分析结果显示,LDHA mRNA低表达组的OS优于高表达组,差异有统计学意义(logrankP<0.01,HR=1.9),但两组患者的DFS无明显差异(logrankP=0.16,HR=1.2),见图4。
2.5 LDHA在LUAD中潜在分子调控机制预测
在LinkedOmics网站获取LDHA在TCGA LUAD数据库中共表达基因。将筛选出的191个正相关基因导入Metascape数据分析平台进行GO基因富集分析和KEGG通路分析。GO分析结果显示,LDHA在LUAD中正相关表达的基因主要富集的生物学过程有:细胞分裂、嘌呤核糖核苷三磷酸代谢、细胞周期相变、有丝分裂的微管细胞骨架组成、DNA复制等;涉及的细胞组分有:染色体着丝粒区、中心颗粒体、微管组织中心、微管和线粒体包膜等;涉及的分子功能有:钙粘蛋白结合、单糖结合、激酶结合和异构酶活性等,见图5。KEGG信号通路主要涉及糖酵解途径、细胞周期、蛋白酶体、嘌呤代谢、磷酸戊糖途径、人类T淋巴细胞白血病病毒I型(human T-lymphotropic virus tupe-1,HTLV-1)感染、腺嘌呤核苷酸生物合成、细胞凋亡、RNA转运等,提示LDHA可能通过上述途径影响LUAD细胞恶性增殖和患者的临床预后,见表2。PPI网络分析进一步表明,LDHA可能与肿瘤糖酵解过程密切相关,具体结果如图6所示,其中MCODE1代表糖酵解途径和细胞周期;MCODE2代表蛋白酶体生物合成;MCODE3代表核糖体生物合成;MCODE 4代表糖异生过程。
表2 LUAD中LDHA共表达基因的KEGG通路富集分析
图5 LUAD中LDHA共表达基因的GO功能富集分析
图6 LDHA在LUAD中共表达基因互作分析
2.6 LDHA蛋白相互作用网络分析
依据上述文献检索策略,初步获取76篇文献,通过阅读文题、摘要、正文及软件去重进行筛选,最终纳入32个与LDHA直接或间接相互作用进而影响LUAD的蛋白分子,见表3。PPI预测分析结果显示,有26种蛋白与LDHA可能存在直接相互作用联系,排名前10位的分别为丝氨酸/苏氨酸激酶1(AKT Serine/Threonine Kinase 1,AKT1)、POU结构域5类转录因子1(POU domain class 5 transcription factor 1,POU5F1,OCT4)、M型丙酮酸激酶(pyruvate kinase M,PKM)、溶质载体家族2(solute carrier family 2,SLC2A1)、转录因子Sox2(transcription factor Sox2,SOX2)、低氧诱导因子-1α(hypoxia inducible factor-1α,HIF-1α)、丙糖磷酸异构酶1(triosephosphate isomerase 1,TPI1)、N-钙粘蛋白(N-cadherin,CDH2)、Twist相关蛋白1(Twist-relatedprotein 1,TWIST1)和锯齿形典型缺口配体1(Jagged Canonical Notch Ligand 1,JAG1),见图7。
A:总生存曲线;B:无病生存曲线。
表3 LUAD中LDHA相关作用蛋白
续表3 LUAD中LDHA相关作用蛋白
图7 LDHA相关蛋白PPI网络预测
3 讨 论
LDHA是由LDHA、LDHB或LDHC 3个独立基因编码的同源或异源四聚体,其中LDHA和LDHB基因分别编码的M和H蛋白亚基可构成5种LDH同工酶(LDH1~5),LDHC仅构成LDH-C4一种同工酶[23]。由4个M亚基组成的LDHA(LDH5)已被证实在多种实体肿瘤组织中以HIF-1α依赖性方式上调表达[24]。LDHA作为Warburg效应的关键酶之一,其异常表达在包括肺癌、胰腺癌、胃癌、肝细胞癌等多种人类癌症中普遍存在,通过调节上皮间充质转化相关因子直接或间接促进恶性肿瘤的增殖与侵袭过程[25-26]。体内研究发现下调LDHA的表达能使LUAD小鼠移植瘤发生减少和已形成的肿瘤消退[27]。体外实验证实抑制LDHA活性可促使线粒体功能再激活,明显抑制LUAD细胞系A549和H1975的生长[28]。Meta分析显示,治疗前较高的LDH浓度与总体生存率较差有关,血清LDH水平可作为预测肺癌患者存活率的生物标志物[29]。
随着生物信息学的迅速发展,越来越多的高通量测序数据可以公开获取。由于NSCLC分型多样,为进一步明确LDHA在LUAD中的表达差异及潜在分子调控机制,准确推测该基因对LUAD疾病进展的影响,本研究利用GEPIA2在线分析平台挖掘TCGA数据库中的大样本规范数据,纳入59例正常肺组织和515例LUAD组织,经统计分析得出LDHA mRNA在LUAD中的表达约是正常肺组织的2.44倍。Oncomine数据库中9个独立微阵列基因芯片结果均表明LDHA mRNA在LUAD组织中过表达。又通过HPA数据库对该基因编码蛋白的免疫组织化学结果进行分析,结果发现LDHA蛋白在正常肺组织中呈低表达或未检出,而在LUAD组织中呈中、高程度表达,与mRNA分析结果相一致。临床病理特征分析显示,LDHA与LUAD的病理分级和淋巴结转移数量呈正相关,而与患者的种族、性别、年龄和吸烟习惯无关。一项对190例晚期NSCLC患者治疗前血清LDH水平与表皮生长因子受体酪氨酸激酶抑制剂治疗效果的研究表明,治疗前LDH升高与患者较短的OS和PFS有关[30]。本研究利用Kaplan-Meier法分析了TCGA数据库中的生存数据,证实了LUAD组织中LDHA高表达组患者的OS明显低于低表达组,提示LDHA可作为潜在有价值的生物标志物监测LUAD患者病情进展。
目前针对LDHA基因在LUAD中表达的潜在分子调控机制鲜有研究,在TCGA数据库中检索出191个与LDHA基因Pearson相关系数大于0.4的基因,利用Metascape工具对其进行生物学过程、细胞组分、分子功能注释和KEGG通路富集分析,将文献数据库检索出与LDHA直接或间接相互作用影响LUAD的蛋白因子纳入STRING-DB网站识别构建PPI网络,发现该基因与影响糖酵解途径的PKM、SLC2A1、HIF-1α和TPI1等密切相关。LDHA高表达主要富集了细胞分裂、嘌呤核糖核苷三磷酸代谢过程、细胞周期、有丝分裂的微管细胞骨架组成、DNA复制、减数分裂、核糖核蛋白复合物的合成等生物学过程,涉及糖酵解、磷酸戊糖途径、嘌呤代谢和糖异生等能量代谢信号通路。由于染色体不稳定、拷贝数变化的逐步积累和等位基因失衡赋予了肺癌细胞恶性进展的相关特征[31]。此外,LDHA参与调控肿瘤细胞的有氧糖酵解,导致乳酸生成增加,酸性肿瘤微环境有助于肿瘤免疫逃逸的发生[32]。已有研究表明,程序性死亡配体1(programmed death ligand 1,PD-L1)在EGFR突变和K-Ras突变的NSCLC组织中均表达升高,且乳酸能够诱导PD-L1水平上调,降低干扰素-γ的产生,削弱肿瘤浸润的杀伤性CD8+T淋巴细胞和NK细胞的活化,引发T淋巴细胞衰竭,克服肺癌细胞的免疫监视[33-35]。因此,干预肿瘤的代谢途径以调节肿瘤的免疫功能,开发结合免疫疗法和代谢靶向疗法的药物是肺癌治疗的潜在策略之一。
综上所述,本研究通过高通量多组学数据库纳入足够的样本数量和真实可靠的研究结果,对LDHA在LUAD中潜在的生物学作用和预后影响进行分析挖掘,为进一步探索LDHA的生物学作用和分子机制提供了具有更高可信度的理论依据,同时为临床诊疗和预后判断提供重要的参考价值。