APP下载

非酒精性脂肪性肝病差异表达基因的筛选和生物信息学分析

2023-10-10王士宁程书平杨丽洁俞媛洁吴鹏波谭诗云

医学研究杂志 2023年8期
关键词:差异基因信号转导关键

王士宁 程书平 杨丽洁 俞媛洁 吴鹏波 李 明 谭诗云

非酒精性脂肪性肝病(non-alcoholic fatty liver disease,NAFLD)最新命名为代谢相关脂肪性肝病(metabolic associated fatty liver disease,MAFLD),已成为全球范围内最常见的慢性肝病和健康体检发现肝功能异常的首要原因[1,2]。NAFLD是一种与遗传易感性和胰岛素抵抗(insulin resistance,IR)密切相关,非过量饮酒得获得性代谢应激性肝损伤。其病理学改变以弥漫性肝细胞大泡性脂肪变为主,NAFLD疾病谱包括非酒精性脂肪肝(non-alcoholic fatty liver,NAFL)也称为单纯性脂肪肝、非酒精性脂肪性肝炎(non-alcoholic steatohepatitis,NASH)及其相关肝硬化,甚至可能发展成肝细胞癌[3,4]。随着NAFLD的患病率逐渐升高,连同伴发心脑血管疾病导致患者死亡风险增加[5]。目前尚无特异性的非侵入性诊断和预后生物学标志物及根治手段。因此,有必要深入研究并明确NAFLD的发病机制,研发有效的预防和治疗方法。本研究采用生物信息学方法对GEO数据库下载的NAFLD相关两个数据集GSE48452和GSE63067进行挖掘和分析,筛选出共同的差异性表达关键基因,以期为进一步探讨NAFLD的发病机制和治疗靶点提供理论依据。

资料与方法

1.数据来源:从GEO数据库下载与NAFLD相关的表达矩阵。筛选标准:①具有正常对照和NAFLD的样本量;②样本量总个数≥10。最终选取GSE48452和GSE63067用于本研究。GSE48452包含12个健康对照,12个NASH样本量,GSE63067包含7个健康对照,7个NASH样本量。

2.差异基因筛选与可视化:两组原始数据集采用GEO2R在线分析工具分别对GSE48452、GSE63067数据集样本进行分组并分析差异表达基因,以|log2FC|(差异倍数fold change)>0.5,P<0.05,鉴定健康对照样本和NASH样本差异显著的基因。并使用R包ggplot2和 ggrepel绘制火山图,用Venn y2.1.0对上述2个数据集的差异基因绘制Venn图取交集。

3.差异基因功能分析:使用DAVID在线分析对筛选出来的25个差异基因进行GO富集分析,包括生物学过程(biological process,BP)、细胞组分和定位(cellular component,CC)以及分子功能(molecular function,MF),同时进行KEGG信号通路分析,设置P<0.05。

4.蛋白质互作网络分析:使用String 11.5数据库预测NAFLD差异基因编码蛋白间的蛋白质互相作用(protein-protein interaction,PPI)网络图。采用Cytoscape3.8.0进一步进行可视化展示。利用Cytoscape插件MCODE获得有显著相互作用的功能模块,设置参数degree cutoff=2、node cutoff=0.2、k-score=2及max.depth=100。利用插件cytoHubba的MCC算法筛选得分最高的前8个基因作用关键基因。

结 果

1.差异表达基因筛选结果:经GEO2R分析及R 4.1.0软件分别筛选出差异表达上下调基因,分别从数据集GSE48452和GSE63067中提取到差异基因331个和791个,绘制火山图(图1),其中蓝色为下调基因、红色为上调基因,分别绘制GSE48452和GSE63067的热图(图2)。取2个数据集差异表达基因的交集,制作Venn图(图3),得到相同差异基因25个,其中上调基因7个,下调基因18个。

图1 差异基因火山图A.GSE48452差异基因火山图;B.GSE63067差异基因火山图

图2 差异基因热图A.GSE63067差异基因的热图;B.GSE48452差异基因的热图

图3 GSE48452和GSE63067相同差异基因的Venn图A.上调基因;B.下调基因

2.差异基因GO分析和KEGG分析:GO富集分析结果显示这些差异基因主要参与对ERK1和ERK2级联的正向调节反应、抗菌肽介导的抗菌体液免疫反应、趋化作用、对T淋巴细胞迁移的正向调节、凋亡过程的负向调节,并且参与炎性反应、G-蛋白偶联受体信号转导途径、对Ras蛋白信号转导的积极调节等生物过程;主要细胞成分位于细胞外空间、细胞外区域;主要分子功能与受体结合及CCR6趋化因子受体结合等相关(表1)。KEGG信号通路分析显示,DEGs富集于IL-17信号转导途径、前列腺癌、炎性介质对TRP通道的调节、TNF信号转导途径及癌症中的转录错误调控等通路(表2)。

表1 NAFLD差异基因的GO富集分析

表2 NAFLD差异基因的KEGG信号通路分析

3.蛋白质互作网络分析:除去游离的蛋白节点,共有14个蛋白质节点连接形成17条复杂的PPI网络。最显著模块由10个重要节点及12条边的网络构成。利用cytoHubba的MCC算法筛选出8个关键基因,即MMP9、IGF1、CHI3L1、CXCL10、CDKN1A、CCL20、IGFBP2、NRG1(表3、图4)。

图4 NASH发展中构建DEG的PPI网络A.非酒精性脂肪性肝炎的DEG的PPI网络;B.中心基因的可视化

表3 关键基因

讨 论

NAFLD全球患病率约为25%,现已成为全世界范围内慢性肝病的常见病因[5,6]。肝组织活检是诊断NASH和确定预后的唯一可依赖的方法,但因其有创性并穿刺组织局限及可能出现并发症,其价格昂贵,不易在临床上广泛开展。近年来,随着生物信息学技术的快速发展,其在许多疾病的研究中发挥着重要作用。

本研究GO分析发现,差异基因主要参与细胞对ERK1和ERK2级联的正向调节反应、抗菌肽介导的抗菌体液免疫反应、细胞的趋化作用、对T淋巴细胞迁移的正向调节、凋亡过程的负向调节,并且参与炎性反应、G-蛋白偶联受体信号转导途径、对Ras蛋白信号转导的积极调节等生物过程;富集于细胞外空间、细胞外区域;主要分子功能与受体结合及CCR6趋化因子受体结合等相关(表1)。KEGG信号通路分析提示,差异基因主要参与IL-17信号转导途径、前列腺癌、炎性介质对TRP通道的调节、TNF信号转导途径及癌症中的转录错误调控等通路。

经Cytoscape软件筛选出8个关键基因,分别是MMP9、IGF1、CHI3L1、CXCL10、CDKN1A、CCL20、IGFBP2和NRG1。MMP9是锌依赖性中性蛋白酶家族的一员,可降解细胞外基质和基膜,并与肝衰竭中的窦道损伤、肝脏重塑和坏死有关联。相关研究证明,MMP9随着纤维化程度的加深而减少[7]。与另一项研究证明一致,该研究显示,晚期纤维化的丙型肝炎患者中MMP9的浓度降低[8]。本研究发现,MMP9在NASH中明显下调,与上诉结果中文献一致。因此,在NAFLD的发展中,这种蛋白酶在纤维化中参与了类似的病理生理过程。此外,肝脏是胰岛素介导的调节代谢的一个关键器官。它不仅具有糖代谢和脂肪代谢的作用,也是血浆蛋白和内分泌因子(IGF1)及其结合蛋白(insulin-like growth factor binding protein,IGFBP)的主要合成场所,从而影响全身的代谢和生长。IGF1是一种在分子结构上与胰岛素类似得多肽蛋白物质。有关研究发现,IGF1系统可能在NAFLD/NASH的发病机制中的潜在作用[9~11]。因此,IGF1可能是一个潜在的治疗靶点。CHI3L1,又称YKL-40是几丁质酶家族的成员,但缺乏几丁质酶活性。

CHI3L1在炎症、组织重塑和癌症中发挥重要作用。它在炎症性肝病(NAFLD/NASH)中的作用还没有确定。有关研究证明,巨噬细胞衍生的YKL-40是NAFLD患者肝脏纤维化的一个可行的生物学标志物[12]。另有研究得出结论,CHI3L1通过抑制肝脏巨噬细胞的凋亡加剧了肝脏纤维化的进展[13]。该途径可能是一个有希望的治疗靶点。CXCL10又称为干扰素诱导蛋白,是一种具有炎症特征的趋化因子。有关研究证明,CXCL10基因缺失在饮食诱发的NASH小鼠模型中的保护作用。另有研究证实,香叶木素通过STAT1/CXCL10的方式改调节脂肪生成和炎性反应来改善NASH[14]。可能为NASH的治疗提供一个有希望的候选者。

CDKN1A是衰老过程中的一个关键基因,也被称为细胞衰老的生物学标志物,它可以通过减少Rb的磷酸化来促进衰老相关分泌表型的产生。有关研究表明,CDKN1A是治疗NASH的关键靶基因,但仍需大量实验研究进一步验证[15]。CCL20也被称为巨噬细胞炎症蛋白。相关研究发现,肝星状细胞是产生CCL20的主要细胞类型,诱导出一种促纤维化和促炎症的表达特征。CCL20代表了一个新的候选分子,可能参与了研究人群中NAFLD纤维化的发病机制。作为一种可溶性的炎性介质,CCL20也可能代表一种潜在的诊断和(或)治疗靶点。仍需大量相关研究证实。IGFBP2是一种36kDa的蛋白质,属于IGF1和IGF2结合的6个类似蛋白质之一。近年来有研究表明,循环IGFBP-2水平与NAFLD的发生率呈负相关[16]。另有研究发现,IGFBP-2可能作为NAFLD进展的生物学标志物。神经胶质蛋白(NRG)是一组与表皮生长因子(EGF)家族有关的蛋白。其作为配体激活酪氨酸激酶受体。近年来有研究证明,NRG1通过PI3K/Akt途径与ErbB3相互作用,在NAFLD的发病机制中发挥保护作用[17]。NRG1可能成为NAFLD新的治疗靶点,仍需大量实验研究验证。

本研究的不足之处在于未能通过实验进一步验证这些关键DEGs在NAFLD发生、发展过程中的表达变化及具体作用。因此未来笔者将通过后续的实验研究来验证这些关键DEGs的功能。

综上所述,本研究通过生物信息学分析了NAFLD样本差异基因,构建PPI网络病获得8个Hub基因,其作为NAFLD进展的潜在关键调节因素。该结果提供了NAFLD进展过程中潜在的关键基因和临床标志物。

猜你喜欢

差异基因信号转导关键
硝酸甘油,用对是关键
高考考好是关键
Wnt/β-catenin信号转导通路在瘢痕疙瘩形成中的作用机制研究
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
益气活血方对破裂型腰椎间盘突出大鼠p38MAPK 信号转导通路的影响
紫檀芪处理对酿酒酵母基因组表达变化的影响
HGF/c—Met信号转导通路在结直肠癌肝转移中的作用
SSH技术在丝状真菌功能基因筛选中的应用
从肺肠ERK信号转导通路的变化探讨“肺与大肠相表里”
生意无大小,关键是怎么做?