APP下载

基于数据挖掘分析KEAP1基因在肺癌中的表达及意义

2024-12-31张馨王雨娜赵贝

医学信息 2024年18期
关键词:生物信息学生存期肺癌

摘要:目的" 利用生物信息学技术对人胞质接头蛋白(KEAP1)进行分析,并汇总其在肺癌中的表达情况及意义,为后续肺癌相关治疗和预后提供有力的依据。方法" 利用GEO数据库挖掘KEAP1基因表达及染色体定位,利用Kaplan-Meier数据库分析肺癌中KEAP1表达与患者预后的关系,通过Linkedomics数据库和String数据库获取该基因在不同组织和疾病中的表达数据和蛋白相互作用网络,分析KEAP1与其他蛋白之间的关系,探索与其他基因的关联和调控网络。通过GEPIA2数据库进行KEAP1表达分析,比较KEAP1在正常肺组织和肺癌组织中的表达情况。结果" KEPA1基因位于19号染色体上;该基因表达量与肺癌患者的预后生存分析有相关性(P<0.05);基因共分析显示,在肺癌中PTGER4、CD36、KRAS等基因与KEAP1基因表达呈负相关(P<0.05);KEAP1在肺癌中主要通过KEAP1-NFE2L2 通路发挥作用;与正常肺组织相比,KEAP1基因突变后在肺癌组织中表达异常下降(P<0.05)。结论" KEAP1突变与肺癌患者更短的生存期相关,该基因的降低与肺癌的发生和进展有关。在肺癌的驱动基因中,KEAP1在肺癌患者中属于突变风险较高的基因,有望成为肺癌预后评估和治疗的有效靶点。

关键词:肺癌;KEAP1基因;生物信息学;预后;生存期

中图分类号:R734.2" " " " " " " " " " " " " " " " " " " 文献标识码:A" " " " " " " " " " " " " "DOI:10.3969/j.issn.1006-1959.2024.18.003

文章编号:1006-1959(2024)18-0012-07

Abstract:Objective" To analyze the expression and significance of human cytoplasmic adaptor protein 1 (KEAP1) in lung cancer by bioinformatics technology, and to provide a strong basis for the follow-up treatment and prognosis of lung cancer.Methods" GEO database was used to mine the expression and chromosomal localization of KEAP1 gene. Kaplan-Meier database was used to analyze the relationship between KEAP1 expression and prognosis of patients with lung cancer. Linkedomics database and String database were used to obtain the expression data and protein interaction network of KEAP1 gene in different tissues and diseases, the relationship between KEAP1 and other proteins was analyzed, and the association and regulatory network with other genes was explored. The expression of KEAP1 was analyzed by GEPIA2 database to compare the expression of KEAP1 in normal lung tissues and lung cancer tissues.Results" KEPA1 gene was located on chromosome 19, and the expression of this gene was correlated with the prognosis and survival analysis of patients with lung cancer (Plt;0.05). Gene co-analysis showed that PTGER4, CD36, KRAS and other genes were negatively correlated with KEAP1 gene expression in lung cancer (Plt;0.05). KEAP1 played a role in lung cancer mainly through the KEAP1-NFE2L2 pathway; compared with normal lung tissues, the expression of KEAP1 in lung cancer tissues decreased significantly after gene mutation (Plt;0.05).Conclusion" KEAP1 mutation is associated with shorter survival time in patients with lung cancer, and the decrease of this gene is related to the occurrence and progression of lung cancer. Among the driving genes of lung cancer, KEAP1 is a gene with a high risk of mutation in patients with lung cancer, which is expected to become an effective target for prognosis evaluation and treatment of lung cancer.

Key words:Lung cancer;KEAP1 gene;Bioinformatics;Prognosis;Survival period

肺癌(lung cancer)是美国癌症相关死亡的主要原因,平均5年生存率为15%。吸烟仍然是肺癌的主要危险因素。肺癌分为小细胞癌及非小细胞癌(如腺癌、鳞状细胞癌、大细胞癌)[1]。尽管目前很容易识别出有患肺癌风险的人群,但现有的证据并不支持对肺癌进行大规模筛查。对于早期诊断肺癌的患者,通过手术切除和术后化疗可能治愈,切除的程度取决于肿瘤的大小、位置以及患者的术前肺储备[2]。然而,在绝大多数肺癌患者中,被发现时已处于晚期阶段,可用的治疗策略有限。因此寻找有效的分子靶标对肺癌的治疗和预后具有重要的临床意义[3]。KEAP1 是一种高度保守的富含半胱氨酸的624个氨基酸的蛋白质,在哺乳动物中具有大约92%的序列同源性。KEAP1属于BTB-Kelch家族蛋白,该家族的所有成员都能够通过其BTB结构域与CUL3结合[4]。Nrf2转录因子控制着参与细胞防御氧化应激的数百个基因的表达。Nrf2活性调节的主要途径是通过与KEAP1蛋白的相互作用。在常氧下,KEAP1结合Nrf2并将其靶向蛋白酶体降解,而KEAP1再生。在氧化应激下,Nrf2和KEAP1之间的相互作用被中断,Nrf2激活保护基因的转录。目前,Nrf2系统激活被认为是治疗不同病理的强大细胞保护策略[5]。KEAP1-Nrf2系统就像一把双刃剑:Nrf2 活性保护细胞并使细胞抵抗氧化和亲电应激,而升高的 Nrf2 活性有助于癌细胞的存活和增殖。KEAP1基因的缺失或突变会导致Nrf2蛋白的过度激活,从而促进肺癌细胞的生长和转移和抵抗化疗药物[6]。为此,本研究通过GEO数据库、Kaplan-Meier等数据库分析KEAP1基因在肺癌中的表达和预后关系,旨在为后续研究提供参考。

1资料与方法

1.1数据来源" 在GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)输入关键词“KEAP1”,数据集筛选:选择与肺癌相关的数据集。

1.2生存分析" 在Kaplan-Meier数据库(http:kmplot.com/)的mRNA gene chip一栏中选择“Start KM plotter”,Gene Symbol选择“KEAP1”,Split patients by“Auto”,筛选性能最佳的阈值作为截止值。Survival选择“OS or PPS”。分析KEAP1基因表达与肺癌患者生存率之间的关系。

1.3相关性分析" 在Linkedomics数据库(http:www.linkedomics.org/)选择癌症类型“TCGA_LUAD”,选择研究数据“TCGA LUAD HiSeq RNA”,输入基因“KEAP1”,选择数据集“TCGA LUADHiSeq RNA ”,确定统计学方法 “Pearson Correlation test”。

1.4 KEAP1相互作用蛋白分析" 在String-db数据库(http: string-db.org)中,Protein Name输入“KEAP1”基因,Organisms选择“Homo sapiens”,获取KEAP1的蛋白相互作用网络。

1.5组织表达差异分析" 在GEPIA2数据库(http://gepia2.cancer-pku.cn/)以“KEAP1”作为关键词进行搜索,选择与LUAD相关的数据集,基因表达分析点击“Expression”标签,选择肿瘤类型为“LUAD”,观察KEAP1在LUAD肿瘤与正常组织中的表达水平。

1.6免疫组化表达情况" 在The Human Protein Atlas数据库(https://www.proteinatlas.org/)中,关键词输入“KEAP1”,选择肺组织数据集:点击“Tissue specificity”,选择“Respiratory system”,再选择“Lung”,查看KEAP1在正常肺组织和肺癌组织中的免疫组化图像。

1.7统计学方法" 采用SPSS 20.0进行统计分析,计量资料以(x±s)表示,配对样本比较使用配对t检验;采用Kaplan-Meier法分析KEAP1表达与预后的关系,应用Log-rank检验比较组间生存率,P<0.05为差异有统计学意义,P<0.01为统计学意义显著。

2结果

2.1 KEAP1基因结构及数据集表达情况" KEAP1基因是人类基因组中的一种重要基因,位于染色体19p13.2位点。KEAP1蛋白质属于Cullin3-RBX1 E3泛素连接酶复合物的组分之一,并与核因子E2相关因子2(Nrf2)相互作用。该复合物在细胞中通过对Nrf2的调控,参与了氧化应激反应和抗氧化防御系统的调节[7],见图1。

2.2 KEAP1表达与肺癌患者预后的关系" Kaplan-Meier分析显示,KEAP1 mRNA表达量与肺癌患者的OS和PPS均有相关性(OS:Log-rank P=0.044;PPS:Log-rank P=0.023),见图2。

2.3 KEAP1相关基因的Linkedomics分析" 基因共表达分析显示,与KEPA1呈正相关的基因和与KEPA1呈负相关的基因大概有50多种,见图3。

2.4 KEAP1在肺癌组织String数据分析" KEAP1与SQSTM1、CUL3、NEIL2、NFE2L2、IKBKB、RBX1等基因关系密切,见图4。根据通路分析发现,KEAP1在肺癌中主要通过KEAP1-NFE2L2 通路发挥作用。

2.5 KEAP1在肺癌组织中的GEPIA2分析结果" KEAP1基因在大多数肿瘤组织中均呈高表达,但在胰腺癌(PAAD)、胸腺瘤(THYM)、淋巴样肿瘤弥漫性大B细胞淋巴瘤(DLBC)及脑低级胶质瘤(LGG)中KEAP1表达水平比其相应的正常组织中的表达水平显著增高,见图5、图6。为明确KEAP1基因表达与肺癌患者病理分期是否存在统计学意义,在GEPIA2数据库输入KEAP1基因并进行数据挖掘,结果显示:KEAP1mRNA在不同病理分期肺癌患者中的表达存差异(F=0.592,P=0.62),见图7A。基于GEPIA2数据库挖掘与KEAP1相关基因分析结果显示,肺癌组织KEAP1的mRNA表达水平与基因PTGER4、CD36、KRASmRNA 表达水平呈负相关(P<0.05),见图7B~图7D。通过GEPIA2分析KEAP1肺癌数据集,该数据集中包括例肺癌组织样本和例正常肺组织样本。结果显示,与正常肺组织相比,KEAP1基因突变后在肺癌组织中表达异常,差异具有统计学意义(P<0.05),见图7E。

2.6 KEAP1在正常肺脏与肺癌的免疫组化" 在The Human Protein Atlas 数据库中得到KEAP1蛋白在1例正常肺组织和12例肺癌组织中的表达情况,其中2例肺癌组织蛋白表达及抗体染色程度为“高度”水平,4例为“中度”水平,5例为“低度”水平,1例未检测到染色结果,见图8。

3讨论

在全球范围内,肺癌在过去几十年中一直是最常见的癌症,是北美和其他发达国家癌症相关死亡的主要原因[8]。肺癌通常直到晚期才被诊断出来,其死亡率较高。因而,肺癌的早期诊断至关重要,特别是在筛查高危人群时,如吸烟者、暴露于烟雾、油田、有毒职业场所时,需要确定用于早期诊断的敏感和特异性分子标志物[9]。2004年,肺癌遗传流行病学联盟首次发现6q23-25区域存在影响肺癌风险的主要易感位点[10]。随着全基因组学的发展,现在有可能更全面地探索人类基因组,以了解遗传单核苷酸多态性(snp)与人类疾病之间的关联。有研究已经成功地确定了与肺癌易感性显著相关的遗传因素,相关证据的强度各不相同,一些基因座已被细化为特定的亚组,包括性别、种族、吸烟状况和组织学亚型[11]。

KEAP1/Nrf2通路被认为是氧化还原稳态的关键调节因子,在生理环境下保护细胞免受氧化应激和外源物的影响。癌细胞在起始和进展过程中经常经历这一途径,异常的KEAP1-Nrf2活性主要在非小细胞肺癌(NSCLC)中被发现,这表明细胞/起源组织可能会影响恶性转化过程中的遗传选择[12]。KEAP1在约16%的NSCLC中发生突变,包括12%的肺鳞状细胞癌(LUSCs)和20%的肺腺癌(LUADs)[13]。KEAP1突变的肺癌患者总生存期较短,预后较差[14-16]。有研究报告了Nrf2介导的转录在预防癌症方面的潜在作用是由涉及异生物质和氧化应激的机制引起的。这表明 KEAP1-Nrf2系统是通过Nrf2激活的调节剂(抑制剂/激活剂)来对抗癌症的潜在治疗靶点[6]。

KEAP1基因是人类基因组中的一种重要基因,位于染色体19p13.2位置[17]。本研究显示,KEAP1 mRNA表达量与肺癌患者的OS和PPS均有相关性,与KEAP1mRNA低表达组相比,KEAP1 mRNA高表达组肺癌患者总体生存时间和进展生存时间缩短。通过Linkedomics数据库对KEAP1基因进行分析,确定KEAP1基因在反应性氧化物种的清除过程中扮演着重要角色,揭示了与KEAP1相互作用的蛋白质,此外,还确定了KEAP1与其他信号通路蛋白的关联,如Nrf2、PI3K/AKT等。KEAP1是调控氧化应激反应的关键基因,它通过调控Nrf2的稳定性和转录活性来调节细胞对氧化应激的反应[18]。根据GEPIA2的分析结果,可以看到KEAP1基因在正常组织和肺癌组织中的表达差异。在某些肺癌类型中,KEAP1基因的表达水平下降;同时,一些突变体和功能失活的KEAP1也被发现[19]。基于GEPIA2数据库基因相关性分析结果显示,在肺癌中过表达的PTGER4[20]、CD36[21]、KRAS[22]等基因与KEAP1基因表达呈负相关。这意味着KEAP1基因的降低与肺癌的发展和进展有关。需要注意的是,GEPIA2的分析结果虽然提供了有关KEAP1在肺癌组织中的表达变化的信息,但仍需要进一步的实验验证和研究来确定其确切的功能和调控机制。因此,这些结果仅作为初步的参考,需要与其他研究结果相结合来全面理解KEAP1在肺癌中的作用。利用THPA数据库进行KEAP1免疫组化分析,发现KEAP1在正常生理状态和疾病中的表达模式和定位信息存在差异。

综上所述,KEAP1突变与肺癌患者更短的生存期相关,该基因的降低与肺癌的发生和进展有关。在肺癌的驱动基因中,KEAP1在肺癌患者中属于突变风险较高的基因,有望成为肺癌预后评估和治疗的有效靶点。

参考文献:

[1]Bade BC,Dela Cruz CS.Lung Cancer 2020: Epidemiology, Etiology, and Prevention[J].Clin Chest Med,2020,41(1):1-24.

[2]Nasim F,Sabath BF,Eapen GA.Lung Cancer[J].Med Clin North Am,2019,103(3):463-473.

[3]彭旭红,蒋静,屈佳肴,等.基于数据挖掘分析Elafin在肺癌中的表达及意义[J].天津医药,2021,49(2):169-174.

[4]Baird L,Yamamoto M.The Molecular Mechanisms Regulating the KEAP1-NRF2 Pathway[J].Mol Cell Biol,2020,40(13):e00099-20.

[5]Ulasov AV,Rosenkranz AA,Georgiev GP,et al.Nrf2/Keap1/ARE signaling: Towards specific regulation[J].Life Sci,2022,291:120111.

[6]Deshmukh P,Unni S,Krishnappa G,et al.The Keap1-Nrf2 pathway: promising therapeutic target to counteract ROS-mediated damage in cancers and neurodegenerative diseases[J].Biophys Rev,2017,9(1):41-56.

[7]Dinkova-Kostova AT,Kostov RV,Canning P.Keap1, the cysteine-based mammalian intracellular sensor for electrophiles and oxidants[J].Arch Biochem Biophys,2017,617:84-93.

[8]Bray F,Ferlay J,Soerjomataram I,et al.Global cancer statistics 2018: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries[J].CA Cancer J Clin,2018,68(6):394-424.

[9]Nooreldeen R,Bach H.Current and Future Development in Lung Cancer Diagnosis[J].Int J Mol Sci,2021,22(16):8661.

[10]Bailey-Wilson JE,Amos CI,Pinney SM,et al.A major lung cancer susceptibility locus maps to chromosome 6q23-25[J].Am J Hum Genet,2004,75(3):460-474.

[11]Bossé Y,Amos CI.A Decade of GWAS Results in Lung Cancer[J].Cancer Epidemiol Biomarkers Prev,2018,27(4):363-379.

[12]Xu K,Ma J,Hall SRR,et al.Battles against aberrant KEAP1-NRF2 signaling in lung cancer: intertwined metabolic and immune networks[J].Theranostics,2023,13(2):704-723.

[13]Cancer Genome Atlas Research Network.Comprehensive molecular profiling of lung adenocarcinoma[J].Nature,2014,511(7511):543-550.

[14]Jeong Y,Hoang NT,Lovejoy A,et al.Role of KEAP1/NRF2 and TP53 Mutations in Lung Squamous Cell Carcinoma Development and Radiation Resistance[J].Cancer Discov,2017,7(1):86-101.

[15]Arbour KC,Jordan E,Kim HR,et al.Effects of Co-occurring Genomic Alterations on Outcomes in Patients with KRAS-Mutant Non-Small Cell Lung Cancer[J].Clin Cancer Res,2018,24(2):334-440.

[16]Chen X,Su C,Ren S,et al.Pan-cancer analysis of KEAP1 mutations as biomarkers for immunotherapy outcomes[J].Ann Transl Med,2020,8(4):141.

[17]Goel MK,Khanna P,Kishore J.Understanding survival analysis: Kaplan-Meier estimate[J].Int J Ayurveda Res,2010,1(4):274-278.

[18]Szklarczyk D,Gable AL,Nastou KC,et al.The STRING database in 2021: customizable protein-protein networks, and functional characterization of user-uploaded gene/measurement sets[J].Nucleic Acids Res,2021,49(D1):D605-D612.

[19]Tang Z,Kang B,Li C,et al.GEPIA2: an enhanced web server for large-scale expression profiling and interactive analysis[J].Nucleic Acids Res,2019,47(W1):W556-W60.

[20]Zhang Y,Huang J,Zou Q,et al.Methylated PTGER4 is better than CA125, CEA, Cyfra211 and NSE as a therapeutic response assessment marker in stage IV lung cancer[J].Oncol Lett,2020,19(4):3229-3238.

[21]Liu LZ,Wang B,Zhang R,et al.The activated CD36-Src axis promotes lung adenocarcinoma cell proliferation and actin remodeling-involved metastasis in high-fat environment[J].Cell Death Dis,2023,14(8):548.

[22]Ricciuti B,Son J,Okoro JJ,et al.Comparative Analysis and Isoform-Specific Therapeutic Vulnerabilities of KRAS Mutations in Non-Small Cell Lung Cancer[J].Clin Cancer Res,2022,28(8):1640-1650.

收稿日期:2023-09-26;修回日期:2023-10-09

编辑/成森

基金项目:国家自然科学基金项目(编号:81760236)

作者简介:张馨文(1999.7-),女,山西侯马人,硕士研究生,主要从事糖尿病神经科学研究

通讯作者:赵贝(1983.1-),男,山东枣庄人,博士,副教授,主要从事糖尿病神经科学研究

猜你喜欢

生物信息学生存期肺癌
中医防治肺癌术后并发症
对比增强磁敏感加权成像对肺癌脑转移瘤检出的研究
“PBL+E—learning”教学模式探索
移动教学在生物信息学课程改革中的应用
中医大数据下生物信息学的发展及教育模式浅析
鼻咽癌患者长期生存期的危险因素分析
数据挖掘技术在生物信息学中的应用
胃癌术后患者营养状况及生存期对生存质量的影响
术中淋巴结清扫个数对胃癌3年总生存期的影响
microRNA-205在人非小细胞肺癌中的表达及临床意义