APP下载

基于生物信息学和机器学习挖掘糖尿病足溃疡中线粒体自噬相关靶基因并分析其免疫相关性

2025-02-19吴瑜陕斌曾昭洋

中国现代医生 2025年2期
关键词:生物信息学机器学习

[摘要]"目的"通过生物信息学及机器学习挖掘糖尿病足溃疡(diabetic"foot"ulcer,DFU)中线粒体自噬相关靶基因并分析其免疫相关性。方法"通过基因表达综合数据库(Gene"Expression"Omnibus,GEO)获得糖尿病足溃疡相关数据集并筛选差异基因(differential"expressed"genes,DEGs),在Genecards数据库获得线粒体自噬相关基因,二者取交集后对所获得的交集基因进行基因本体论(gene"ontology,GO)、京都基因与基因组百科全书(Kyoto"Encyclopedia"of"Genes"and"Genomes,KEGG)、蛋白质-蛋白质相互作用(protein-protein"interaction,PPI)分析,利用PPI筛选出核心基因后使用支持向量机递归特征消除、最小绝对收缩和选择算子、随机森林、极端梯度提升4种机器学习模型挖掘线粒体自噬相关靶基因。对DEGs进行免疫浸润分析,将分析结果与靶基因交汇获得靶基因与免疫浸润的相关性。结果"GO富集结果显示主要富集于线粒体自噬的调节等,KEGG富集结果显示主要富集于低氧诱导因子-1信号通路、p53信号通路、AMPK信号通路等。机器学习结果显示TP53、CYCS为靶基因。免疫浸润结果显示TP53与浆细胞、调节性T细胞、辅助性滤泡T细胞、CD8+T细胞、单核细胞有明显相关性。CYCS与记忆B细胞、CD8+T细胞、单核细胞、浆细胞、调节性T细胞有明显相关性。结论"TP53、CYCS可能是糖尿病足溃疡中调节线粒体自噬的靶基因,对改善氧化应激具有关键作用;且浆细胞、T细胞等免疫细胞失调也可能对线粒体自噬有一定影响。

[关键词]"生物信息学;机器学习;糖尿病足溃疡;线粒体自噬

[中图分类号]"R34""""""[文献标识码]"A""""""[DOI]"10.3969/j.issn.1673-9701.2025.02.008

Mining"mitophagy-related"target"genesnbsp;in"diabetic"foot"ulcers"and"analysing"their"immune"relevance"based"on"bioinformatics"analysis"and"machine"learning

WU"Yu,"SHAN"Bin,"ZENG"Zhaoyang

College"of"Integrated"Traditional"Chinese"and"Western"Medicine,"Gansu"University"of"Chinese"Medicine,"Lanzhou"730000,"Gansu,"China

[Abstract]"Objective"To"investigate"mitophagy"in"diabetic"foot"ulcer"(DFU)"target"genes"and"analyze"the"immune"correlation."Methods"DFU"related"datasets"were"obtained"from"the"Gene"Expression"Omnibus"(GEO)"and"screened"for"their"differential"expression"genes(DEGs)."Mitophagy"related"genes"(MRGs)"were"obtained"from"the"Genecards"database."DEGs"and"MRGs"were"intersected"and"analysed"using"gene"ontology"(GO),"Kyoto"Encyclopedia"of"Genes"and"Genomes"(KEGG)"and"protein-protein"interaction"(PPI)."Target"genes"were"mined"using"four"machine"learning"models:"Support"vector"machine-recursive"feature"eliminatio,"least"absolute"shrinkage"and"selection"operator,"random"forest,"extreme"gradient"boosting."DEGs"were"analysed"for"immune"infiltration"and"the"correlation"of"target"genes"with"immune"infiltration."Results"GO"enrichment"results"showed"that"it"was"mainly"enriched"in"regulation"of"autophagy"of"mitochondrion."KEGG"enrichment"results"showed"that"hypoxia"inducible"factor-1"signalling"pathway,"p53"signalling"pathway"and"AMPK"signalling"pathway"were"mainly"enriched."Machine"learning"results"showed"TP53"and"CYCS"as"target"genes."Immune"infiltration"results"showed"a"clear"correlation"of"TP53"with"plasma"cells,"regulatory"T"cells,"follicular"helper"T"cells,"CD8+"T"cells"and"monocytes."CYCS"showed"a"clear"correlation"with"B"cell"memory,"T"cells"CD8+"T"cells,"monocytes,"plasma"cells"and"regulatory"T"cells."Conclusion"TP53,"CYCS"may"be"the"target"genes"regulating"mitophagy"in"DFU"and"have"a"key"role"in"reducing"the"level"of"oxidative"stress."At"the"same"time,"the"dysregulation"of"plasma"cells,"T"cells"and"other"immune"cells"may"also"have"some"effect"on"mitophagy.

[Key"words]"Bioinformatic"analysis;"Machine"learning;"Diabetic"foot"ulcer;"Mitophagy

糖尿病足溃疡(diabetic"foot"ulcer,DFU)是糖尿病晚期患者最严重的并发症之一,其高发病率、高截肢率和高死亡率给患者和社会带来巨大挑战[1]。DFU的创面愈合过程停留在一种慢性炎性阶段,难以愈合[2]。线粒体是活性氧(reactive"oxygen"species,ROS)产生的主要细胞器[3]。长期的炎症环境损害线粒体功能,导致线粒体功能失调,ROS大量堆积,进一步加重创面的氧化应激,延缓创面愈合[4]。线粒体自噬可明显改善这种氧化应激失调[5]。目前尚未明确线粒体自噬失调与DFU间的关键靶基因。研究表明炎症反应作为DFU最突出的表现,参与线粒体自噬的相关因子同时也参与多个免疫信号的传导,因此线粒体自噬和免疫反应可能也有一定的相关性[6]。本研究基于生物信息学和机器学习方法,对DFU相关数据集进行挖掘,探讨DFU过程中对线粒体自噬有显著影响的靶"基因并对其免疫相关性进行分析。

1""资料与方法

1.1""数据收集及处理

基因表达综合数据库(Gene"Expression"Omnibus,GEO)数据库中下载数据集GSE80178、GSE134431和GSE7014。在Genecard数据库检索“mitophagy”获得线粒体自噬相关基因Mitophagy"related"genes(MRGs)。

1.2""差异基因的获取及处理

通过Rstudio4.3.3平台,将合并数据集中的样本分为DFU组和糖尿病足皮肤(diabetic"foot"skin,DFS)组,使用Limma包对合并后数据集进行差异基因(differential"expressed"genes,DEGs)分析,设定筛选条件为|LogFC|gt;0.5,Plt;0.05。其中,logFCgt;0.5为上调基因,logFClt;–0.5为下调基因。获得的DEGs再使用Ggplot2包、Pheatmap包和GgVolcano包绘制热图及火山图。

1.3""构建蛋白质-蛋白质互作网络获取核心基因与机器学习

使用在线工具VENNY"2.1(https://bioinfogp.cnb."csic.es/tools/venny/index.html)对获取的DEGs与MRGs进行交集处理,绘制韦恩图,下载交集基因DEGs-MRGs。使用ClusterProfiler包对DEGs-MRGs进行基因本体论(gene"ontology,GO)/京都基因与基因组百科全书(Kyoto"Encyclopedia"of"Genes"and"Genomes,KEGG)富集分析并计算富集倍数。将DEGs-MRGs导入STRINGS数据库(https://cn.string-"db.org/)中进行分析,最低蛋白质-蛋白质相互作用(protein-protein"interaction,PPI)分数设定为0.700。将分析结果导出至Cytoscape软件进一步分析并可视化处理。使用CytoHubba插件获取排名前20位的基因作为核心基因。基于核心基因,利用支持向量机递归特征消除(support"vector"machine-recursive"feature"elimination,SVM-RFE)、最小绝对收缩和选择算子(least"absolute"shrinkage"and"selection"operator,LASSO)、随机森林、极端梯度提升(extreme"gradient"boosting,XGBoost)4种模型进行机器学习[7-10]。LASSO回归通过寻找分类错误最小时的λ确定最佳变量[7]。使用glmnet包对DEGs-MRGs进行LASSO回归分析,使用在线工具VENNY"2.1对4个模型预测出的特征基因进行交集分析并可视化,交集出的结果视为靶点基因。

1.4""统计学方法

采用R4.3.3统计学软件对数据进行分析,使用受试者操作特征(receiver"operating"characteristic,ROC)曲线评估测试集GSE7014中的靶基因临床诊断效能。使用Corrplot包、Ggplot2包、Ggpubr包进行相关性分析并可视化。Plt;0.05为差异有统计学意义。

2""结果

2.1""数据收集及处理

在GEO数据库中下载GSE80178、GSE134431和GSE7014数据集。GSE80178数据集包括6个DFU样本,3个DFS样本,3个健康人皮肤样本。GSE134431数据集包括8个DFS样本,13个DFU样本。GSE7014数据集包括30例糖尿病患者样本和6名健康人样本。GSE80178、GSE134431定义为训练集,GSE7014为测试集。将训练集进行合并、去批次、标准化处理。在Genecard数据库检索“mitophagy”获得MRGs"5131个。

2.2""DEGs的获取及表达情况

使用Limma包对训练集进行差异分析,获得DEGs"666个;其中上调基因412个,下调基因254个。通过可视化结果反映出DEGs在DFU组和DFS组有较为明显的表达差异。

2.3""交集基因的获取及表达情况

将DEGs及MRGs进行取交集处理,获得DEGs-MRGs"171个:其中上调基因90个,下调基因81个。DEGs-MRGs排名前10位的上调基因包括HK2、BNIP3、FGFBP1、RCAN1、IL1B、TGM1、PNP、EIF4EBP1、FBLIM1、IL24;排名前10位的下调基因包括PIP、CLU、SERPINA12、MYH11、AMY2B、ATP1A1、CXCL12、PHGDH、GAN、FGFR2。

2.4""GO富集分析结果

对DEGs-MRGs进行GO富集分析。获得的富集结果包括生物过程(bioprocess,BP)624条,细胞结构(cyto-architecture,CC)47条,分子功能(molecular"function,MF)55条。富集分析结果显示,BP主要富集于线粒体自噬的调节、线粒体分解、调节大自噬及调节自噬等;CC主要富集于覆膜、血小板α颗粒腔、富含ficolin-1的颗粒内腔等;MF主要富集于糖磷酸酶活性、磷脂酰肌醇3-激酶调节亚基的结合等,所有富集结果差异均有统计学意义(Plt;0.05),见图1。在GO"Circle结果中,线粒体自噬调节的BP"Z分值最低,表明该BP在DFU发展过程中明显下调,该过程所包涵的基因以下调基因为主,包含1个上调基因和3个下调基因。GO富集弦图结果显示调节自噬过程所包含的基因最多。进一步对富集结果进行热图分析显示,线粒体自噬调节共涉及4个差异表达明显的DEGs-MRGs,分别为BNIP3、CSNK2A2、TP53、VPS13D,其中BNIP3高表达,CSNK2A2、TP53、VPS13D均低表达。

对DEGs-MRGs进行KEGG富集分析,获得差异有统计学意义的富集结果31条,分为5大类,10个子类。主要富集于组氨酸代谢、甘氨酸、丝氨酸和苏氨酸代谢、果糖和甘露糖代谢、碳代谢、糖酵解/糖异生、HIF-1信号通路、p53信号通路、AMPK信号通路等。

2.5""构建PPI网络筛选核心基因

构建PPI网络共获得168个节点,96条连线。对低交互分数(lt;0.700)及无相关性节点进行删除,获得65个节点,96条连线。其中TP53是连线最多的基因。选择EPC方式计算基因分值,取排名前20位的基因作为核心基因,包括TP53、EGFR、IL1B、TGFB1、CD44、CXCL12、CD274、PIK3R1、CCND1、H6PD、HK2、NCL、PFKP、ENO2、PGAM1、PFKFB3、CYCS、EML4、EPHA2、PHGDH。

2.6""机器学习

基于核心基因使用SVM-RFE识别最优特征基因,包括FGFR2、CYCS、PIK3R1、PFKFB2、HK2、TP53、PFKP、IL1B、PGAM1。使用LASSO预测特征基因,包括CYCS、TP53、FGFR2、IL1B、PIK3R1。使用随机森林识别特征基因,包括PIK3R1、CYCS、PFKFB2、PFKP、TP53、FGFR2。使用XGBoost筛选出特征基因,包括PGAM1、CCND1、TP53、IL1B、CYCS、HK2。将4种机器学习结果交集后获得TP53、CYCS两个枢纽。测试集中ROC分析TP53的曲线下面积(area"under"the"curve,AUC)值0.84,CYCS的AUC值0.72,均大于0.7,具有良好的诊断效能。

2.7""免疫浸润分析

记忆B细胞、浆细胞、CD8+T细胞、辅助性滤泡T细胞、调节性T细胞、NK细胞、单核细胞均具有明显浸润(Plt;0.05)。与DFS组相比,DFU组浆细胞、调节性T细胞分数显著降低;记忆B细胞、单核细胞、CD8+T细胞分数显著升高。TP53与浆细胞、调节性T细胞呈正相关,与辅助性滤泡T细胞、CD8+T细胞、单核细胞呈负相关性。CYCS与记忆B细胞、CD8+T细胞、单核细胞呈正相关性;与浆细胞、调节性T细胞呈负相关。

3""讨论

本研究通过生物信息学分析结合机器学习模型,识别DFU中与线粒体自噬显著相关的关键靶点基因,并探讨这些基因在DFU免疫微环境中的作用。线粒体自噬在DFU的发生、发展过程中受到显著影响,且与氧化应激和炎症反应密切相关。首先,本研究通过DEGs和MRGs的交集分析,筛选出171个DEGs-MRGs,其中富集分析表明这些基因在自噬调节、糖代谢、低氧诱导因子(hypoxia"inducible"factor-1,HIF)-1信号通路、p53信号通路及AMPK信号通路中具有显著作用。这些信号通路的激活与DFU中的氧化应激反应高度相关,提示线粒体自噬在调节DFU中的能量代谢及细胞存活中起关键作用。通过构建的PPI网络,TP53和CYCS基因在DEGs-MRGs中表现出突出的交互性和调控功能,进一步的机器学习分析也证明这两个基因在DFU中的重要性。ROC分析结果表明,TP53和CYCS均有良好的诊断效能,提示它们可作为DFU患者的诊断生物标志物,具有潜在的临床应用价值。

TP53是一种肿瘤抑制基因,参与细胞周期的调控和凋亡。除此之外,p53同样对线粒体自噬具有调节作用[11-13]。一方面p53可调节PINK1/parkin轴,通过竞争性结合parkin,阻断其易位至受损的线粒体,阻止线粒体自噬;另一方面,p53也可通过影响BNIP3及其同源物NIX调控线粒体自噬[14-15]。细胞色素C(cytochrome"C,CYCS)是一种关键的细胞凋亡蛋白[16],目前尚无对CYCS与线粒体自噬相关的研究,对两者间的关系更多集中于线粒体结构受损后释放CYCS,从而诱导细胞凋亡[17-18]。但CYCS介导的细胞凋亡与线粒体自噬是否相关仍需进一步研究。此外,本研究通过免疫浸润分析揭示DFU患者的免疫细胞分布特征,发现记忆B细胞、单核细胞及CD8+T细胞在DFU患者中显著升高,而调节性T细胞和浆细胞的水平显著降低。特别是作为线粒体自噬靶基因的TP53和CYCS与多种免疫细胞浸润水平间表现出显著的相关性。免疫失调有可能直接导致线粒体功能损害,影响线粒体自噬[19]。

本研究存在一定局限性:①数据量相对较少;②只基于公共数据库进行分析,缺少实验验证。综上,本研究从生物信息学角度初步证明在DFU发展中线粒体自噬过程受到一定程度的影响。利用机器学习模型挖掘出影响线粒体自噬的靶点基因TP53、CYCS,其中TP53具有更好的诊断效能,且与部分免疫细胞浸润具有高度的相关性。

利益冲突:所有作者均声明不存在利益冲突。

[参考文献]

[1] MCDERMOTT"K,"FANG"M,"BOULTON"A"J"M,"et"al."Etiology,"epidemiology,"and"disparities"in"the"burden"of"diabetic"foot"ulcers[J]."Diabetes"Care,"2023,"46(1):"209–221.

[2] WANG"X,"YUAN"C"X,"XU"B,"et"al."Diabetic"foot"ulcers:"Classification,"risk"factors"and"management[J]."World"J"Diabetes,"2022,"13(12):"1049–1065.

[3] PALMA"F"R,"GANTNER"B"N,"SAKIYAMA"M"J,"""""et"al."ROS"production"by"mitochondria:"Function"or"dysfunction?[J]."Oncogene,"2024,"43(5):"295–303.

[4] DENG"L,"DU"C,"SONG"P,"et"al."The"role"of"oxidative"stress"and"antioxidants"in"diabetic"wound"healing[J]."Oxid"Med"Cell"Longev,"2021,"2021:"8852759.

[5] LIU"L,"ZHANG"W,"LIU"T,"et"al."The"physiological"metabolite"α-ketoglutarate"ameliorates"osteoarthritis"by"regulating"mitophagy"and"oxidative"stress[J]."Redox"Biol,"2023,"62:"102663.

[6] PICCA"A,"FAITG"J,"AUWERX"J,"et"al.nbsp;Mitophagy"in"human"health,"ageing"and"disease[J]."Nat"Metab,"2023,"5(12):"2047–2061.

[7] ZHANG"J,"YU"R,"GUO"X,"et"al."Identification"of"""TYR,"TYRP1,"DCT"and"LARP7"as"related"biomarkers"and"immune"infiltration"characteristics"of"vitiligo"via"comprehensive"strategies[J]."Bioengineered,"2021,"12(1):"2214–2227.

[8] LIN"X,"LI"C,"ZHANG"Y,"et"al."Selecting"feature""subsets"based"on"SVM-RFE"and"the"overlapping"ratio"with"applications"in"bioinformatics[J]."Molecules,"2017,"23(1):"110.

[9] ZHU"E,"SHU"X,"XU"Z,"et"al."Screening"of"immune-related"secretory"proteins"linking"chronic"kidney"disease"with"calcific"aortic"valve"disease"based"on"comprehensive"bioinformatics"analysis"and"machine"learning[J]."J"Transl"Med,"2023,"21(1):"359.

[10] CHEN"Y,"ZHANG"Y,"JIANG"M,"et"al."HMOX1"as"a"therapeutic"target"associated"with"diabetic"foot"ulcers"based"on"single-cell"analysis"and"machine"learning"[J]."Int"Wound"J,"2024,"21(3):"e14815.

[11] SHEN"W,"SONG"Z,"ZHONG"X,"et"al."Sangerbox:"A"comprehensive,"interaction-friendly"clinical"bioinformatics"analysis"platform[J]."Imeta,"2022,"1(3):"e36.

[12] VOSKARIDES"K,"GIANNOPOULOU"N."The"role"of"TP53"in"adaptation"and"evolution[J]."Cells,"2023,"12(3):"512.

[13] CHEN"Y,"YANG"F,"SHI"Y,"et"al."RNF31"alleviates"liver"steatosis"by"promoting"p53/BNIP3-related"mitophagy"in"hepatocytes[J]."Free"Radic"Biol"Med,"2024,"219:"163–179.

[14] CHEN"L,"CHEN"D,"PAN"Y,"et"al."Inhibition"of"mitochondrial"OMA1"ameliorates"osteosarcoma"tumorigenesis[J]."Cell"Death"Dis,"2024,"15(11):"786.

[15] HOSHINO"A,"MITA"Y,"OKAWA"Y,"et"al."Cytosolic"p53"inhibits"Parkin-mediated"mitophagy"and"promotes"mitochondrial"dysfunction"in"the"mouse"heart[J]."Nat"Commun,"2013,"4:"2308.

[16] XUE"Q,"KANG"R,"KLIONSKY"D"J,"et"al."Copper"metabolism"in"cell"death"and"autophagy[J]."Autophagy,"2023,"19(8):"2175–2195.

[17] TANAKA"A,"CLELAND"M"M,"XU"S,"et"al."Proteasome"and"p97"mediate"mitophagy"and"degradation"of"mitofusins"induced"by"Parkin[J]."J"Cell"Biol,"2010,"191(7):"1367–1380.

[18] LU"G,"TAN"H"W"S,"SCHMAUCK-MEDINA"T,"et"al."WIPI2"positively"regulates"mitophagy"bynbsp;promoting"mitochondrial"recruitment"of"VCP[J]."Autophagy,"2022,"18(12):"2865–2879.

[19] WANG"Y,"PENG"B,"NING"C,"et"al."Characterization"of"immune"features"and"immunotherapy"response"in"subtypes"of"hepatocellular"carcinoma"based"on"mitophagy[J]."Front"Immunol,"2022,"13:"966167.

(收稿日期:2024–10–21)

(修回日期:2024–12–03)

猜你喜欢

生物信息学机器学习
浅谈医学院校生物信息学专业青年教师规范培训模式的建立
基于词典与机器学习的中文微博情感分析
“PBL+E—learning”教学模式探索
移动教学在生物信息学课程改革中的应用
中医大数据下生物信息学的发展及教育模式浅析
基于机器学习的图像特征提取技术在图像版权保护中的应用
数据挖掘技术在生物信息学中的应用
基于网络搜索数据的平遥旅游客流量预测分析
前缀字母为特征在维吾尔语文本情感分类中的研究
生物信息学课堂危机及对策研究