基于生物信息学探讨黑果枸杞总黄酮治疗非酒精性脂肪肝的作用机制
2022-01-05阿力米江奥布力塔力甫马建宝伊再提外力古丽巴哈尔卡吾力
阿力米江·奥布力塔力甫,马建宝,伊再提·外力,古丽巴哈尔·卡吾力
新疆医科大学药学院药剂教研室,乌鲁木齐 830011
非酒精性脂肪肝病(NAFLD)是肝功能障碍疾病,可发展为肝硬化,甚至是肝细胞癌(HCC)[1]。一些研究试图阐明氧化应激、脂肪细胞因子的产生/释放、肝内胰岛素抵抗、脂肪积聚和先天免疫系统激活在NAFLD发病机理中的关系。然而,NAFLD发病机理的内在分子机制尚未完全阐明,需要更多的研究以提供更深入的了解并探索更有利的治疗靶标[2]。
黑果枸杞(LyciumruthenicumMurr.)含有的抗氧化活性成分由于其安全性高于合成抗氧化剂而被广泛关注。水溶性抗氧化剂原花青素在内的总黄酮是黑果枸杞的一类重要活性成分[3]。随着对黑果枸杞总黄酮成分的一系列药理学研究发现这些成分具有抗氧化、免疫调节、降血脂等药理活性。黑枸杞总黄酮可降低ROS的产生和炎症,增加肝脏中脂肪酸的氧化,并减少脂肪酸的合成,具有还原能力、降血脂功效、清除·OH的能力和抗脂质体过氧化反应的活性[4]。免疫细胞在炎症反应和抑制细胞恶性增殖方面扮演重要角色。研究发现,H-黄酮通过上调CTRP6来有效抑制了巨噬细胞的浸润,炎症和血管斑形成[5]。黑枸杞总黄酮成分具有通过抑制或激活免疫细胞和脂肪细胞之间的相互作用,减轻脂肪组织中的慢性炎症并积极改善NAFLD的可能性。
本文旨把黑果枸杞总黄酮的抗氧化、降血脂、免疫调节等药理活性作为治疗非酒精性脂肪肝的切入点,通过整合生物信息学分析及各大数据库信息系统地研究黑果枸杞总黄酮治疗非酒精性脂肪肝的药理机制,为进一步阐明NAFLD治疗机制和黑果枸杞类黄酮成分的药理机制提供新的方法与思路(整体思路如图1所示)。
图1 总技术路线Fig.1 General technical route
1 材料和方法
1.1 NAFLD的微阵列数据集
我们通过基因表达综合GEO数据库(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE89632)得到NAFLD的基因表达数据集。我们使用以下术语系统地搜索了微阵列研究:“脂肪肝”,“非酒精性”,“基因表达”,“智人”和“微阵列”。根据以下资格标准筛选数据集:(1)至少包含10个样本;(2)至少包含五个疾病组和至少五个健康对照组;(3)GEO提供了原始数据或通过阵列进行基因表达谱分析[6]。
1.2 差异基因分析
首先,我们从GEO数据库中下载了微阵列数据集的基因表达矩阵和相关注释文档,并使用相应的注释文档将微阵列探针映射到基因名。如果多个探针映射到同一基因名,则采用平均值。NAFLD表达微阵列数据集均由分位数标准化。通过使用“limma”(用于微阵列数据的线性模型)R包确定每个微阵列中NAFLD与正常对照组之间的DEG。| log2FC| > 0.5和P值<0.05被视为确定DEG的临界标准。
1.3 WGCNA(加权基因共表达网络分析)
使用“WGCNA” R软件包构建了DEG的加权基因共表达网络。将β的软阈值功率设置为最佳值,生成加权邻接矩阵。然后进行了层次聚类分析。将邻接矩阵转换为拓扑重叠矩阵(TOM),我们使用基于TOM差异测量的平均连锁层次聚类对具有相似基因表达模块的基因进行分类,这些基因模块由聚类树的分支和不同颜色表示,构建了模块关系。使用了Person方法计算了基因模块与表型之间的相关性,以及确定了与临床特征有关的模块。再筛选出每个模块相关的基因。
1.4 超高效液相-质谱
1.4.1 仪器设备与试剂
ExionLC超高效液相、QTrap 6500+质谱仪(美国SCIEX公司);Heraeus Fresco17离心机(美国Thermo公司);明澈-D 24 UV纯水仪(美国Merck Millipore公司);ACQUITY ULC BEH C18色谱柱(1.7 μm,2.1 mm×150 mm,美国Waters公司);黑果枸杞总黄酮(新疆医科大学实验中心自制);甲醇(67-56-1,LC-MS级),乙腈(75-05-8,LC-MS级)(德国CNW公司);甲酸(64-18-6,LC-MS级,美国SIGMA公司)。
1.4.2 代谢物的提取
取适量黑枸杞粉末,按照最佳工艺提取黑果枸杞总黄酮:乙醇体积分数80%、提取时间60 min、料液比1 g∶15 mL、提取温度70 ℃[7]。取20 mg样品加入1.5 mL EP管中,加入600 μL提取液(1%乙酸,75%甲醇),混合均匀;冰水浴超声提取30 min,将样品4 ℃,12 000 rpm离心10 min,取上清于2 mL进样瓶中;上机检测。
1.4.3 色谱-质谱条件[8]
色谱柱:UPLC BEH C18色谱柱(1.7 μm,2.1 mm×150 mm);柱温箱温度设为40 ℃,自动进样器温度设为8 ℃;流动相为乙腈-0.1%甲酸水溶液,梯度洗脱:0~0.50 min,10%乙腈;0.50~15.00 min,10%→60%乙腈;15.00~16.01 min,60%→98%乙腈;16.01~18.00 min,98%乙腈;18.00~18.01 min,98%→10%乙腈;18.01~20.00min,10%乙腈;进样量 2 μL。
质谱参数:AB Sciex QTrap 6500+质谱仪;喷雾电压(IS):+5 000/-4 500 V;鞘气:35 psi;源内温度:500 ℃;离子源气体1:55 psi;离子源气体2:60 psi。
1.4.4 数据处理
对质谱数据,使用Skyline软件对MRM数据进行处理。
1.5 蛋白互作网络
黑果枸杞总黄酮活性成分基本信息来自中药系统药理学数据库TCMSP(https://tcmspw.com/tcmsp.php)。化合物靶标是从Swiss数据库(http://swisstargetprediction.ch/)和Pharmmapper数据库(http://lilab-ecust.cn/pharmmapper)中筛选获取,筛选条件分别为probability>0和z-score>0.8。再利用STRING蛋白互作关系数据库(http://www.string-db.org/newstring_cgi/show_input_page.pl)下载交集基因互作信息,构建了“靶点基因蛋白互作PPI”网络模型图。并使用Cytoscape软件中的cytohubba插件筛选出PPI(蛋白相互作用网络图)中的关键靶点子网络图。
1.6 生物信息学注释
导入关键基因到DAVID数据库(https://david.ncifcrf.gov/),下载GO生物进程注释信息和KEGG信号通路注释信息,再用在线绘图工具ImageGP(http://www.ehbio.com/ImageGP/)和R语言GOplot包对数据进行可视化。
1.7 分子对接
利用分子对接技术研究黑果枸杞总黄酮中活性成分与相关靶蛋白的相互作用,能够一定程度上说明其活性成分及其靶点的作用机制与结合活性。利用TCMSP数据库下载活性成分的结构文件,同时利用数据库RSCB PDB(https://www.rcsb.org/)数据库下载关键靶点的结构文件,将这俩同时导入Vina进行分子对接。对小分子和蛋白的结合能力进行打分以评价结合能力。
1.8 生存分析
Hub基因的生存数据由在线网站GEPIA(http://gepia2.cancer-pku.cn/#survival)分析,该网站已链接到癌症基因组图谱(TCGA)的数据库。利用TCGA中的数据,我们根据特定基因的高表达和低表达将HCC患者分为两组,并使用Kaplan-Meier图分析了总生存率。采用GEPIA在线分析肝癌与正常组中Hub基因的相对表达量,并探讨从NAFLD到HCC进展的发病机理。并基于生存分析结果筛选出Hub基因中不仅可以作为肝癌预后生物标志物,又可以在黑枸杞总黄酮治疗NAFLD过程中起到关键作用的基因。
1.9 免疫细胞浸润相关性评估
1.9.1 免疫浸润
用CIBERSORT算法分析获得的归一化基因表达数据,得到22种免疫细胞的比例。根据P<0.05筛选样品值,计算样品中每种免疫细胞的百分比。然后,我们使用“ggplot2”软件包对免疫细胞浸润矩阵数据进行PCA聚类分析,以绘制二维PCA聚类图,以确定NAFLD患者与正常对照组之间的免疫细胞浸润是否存在差异。
1.9.2 Hub基因与浸润性免疫细胞之间的相关性分析
“ggstatsplot”软件包(https://github.com/IndrajeetPatil/ggstatsplot)用于对诊断标记和浸润免疫细胞进行Spearman相关分析,而“ggplot2”软件包用于可视化结果。
2 结果
2.1 NAFLD的微阵列数据集分析结果
根据先前建立的纳入标准,本研究筛选出GPL14951平台2016年的数据集GSE89632。在这个数据集中,共有39位NAFLD患者和24位对照。
2.2 差异基因分析结果
GSE89632数据集通过质控、ID转换和重复基因取平均值等一系列处理之后得到20 818个基因表达值。使用R软件中的“Limma”软件包筛选出差异基因,得到1 741个上调差异基因和1 634个下调差异基因(见图2)。
图2 差异基因火山图Fig.2 Volcano map of differential genes注:蓝色:下调;灰色:无变化;红色:上调。Note:Blue:Down regulation;Gray:No change;Red:Up regulation.
2.3 WGCNA分析结果
通过层次聚类分析,总共确定了19个模块,每个模块用不同的颜色表示(见图3)。为了探索模块特征基因与临床特征之间的相关性,我们绘制了一个热图(见图4)。图中的每一列显示相关性和相应的P值(红色代表正相关,绿色代表负相关。颜色越深,相关系数越强)。我们发现每种临床特征与某些模块密切相关。例如,我们可以从图4疾病组与蓝色模块最相关且正相关,其相关系数为0.85,P值为2e-18。通过MM值筛选出每个模块的五个最相关的基因(module membership,是计算基因的表达量和模块特征值之间的相关系数,相关性越高,说明基因和模块的关联性就越高)[9]。表1列出了每个模块的五个最相关的基因。
图3 差异表达基因聚类树状图Fig.3 Gene dendrogram of all DEGs clustered based on a dissimilarity measure
图4 模块-特征相关图Fig.4 Module-feature correlation graph
表1 每个模块内的最相关前5个基因
2.4 超高效液相-质谱分析结果
在负离子模式下,黑果枸杞总黄酮供试品溶液的总离子流图(见图5A);在正离子模式下,黑果枸杞总黄酮供试品溶液的总离子流图(见图5B)[10]。采用高分辨质谱对数据库中的活性成分匹配,定性分析黑果枸杞总黄酮的活性成分,得到92个化合物[11]。并在TCMSP数据库得到各化合物相关信息,以DL值大于等于0.18作为筛选条件,筛选出71个类药性化合物。化合物相关信息见表2。
图5 黑果枸杞总黄酮负离子模式总离子流图(A)及正离子模式总离子流图(B)Fig.5 Total ion current diagram in negative ion mode (A) and total ion current diagram in positive ion mode (B) of total flavonoids of L.ruthenicum
表2 化合物成分相关信息
2.5 蛋白互作网络分析结果
通过Pharmmapper数据库和Swiss数据库得到化合物相关靶点,经过去重复、筛选得到375个基因。然后,与WGCNA分析得到的95个基因取交集得到24个关键基因,这些基因可能是黑枸杞总黄酮治疗非酒精性脂肪肝的关键基因(见图6)。通过大量有关报道可以得知,NLRP3、ASCII和Casp-1等炎症相关基因在NAFLD发展过程中起着重要作用[12],所以后面研究中也对这3个基因进行分析。再利用STRING蛋白互作关系数据库下载交集基因互作信息,构建了“靶点基因蛋白互作PPI”网络模型图[13](见图7)。并使用Cytoscape软件中的CytoHubba插件筛选出PPI(蛋白相互作用网络图)中的10个关键靶点F3、MMP2、PGF、NTRK2、PIK3R1、CASP1、NLRP3、SPHK1、PTGS2、VEGFA等,这10个关键基因作为黑果枸杞总黄酮干预非酒精性脂肪肝疾病的Hub基因,对其进行接下来的分子对接、生存分析和免疫浸润分析等一系列研究(见图8)。
图6 交集基因韦恩图Fig.6 Venn diagram of intersection gene
图7 蛋白互作网络图Fig.7 Protein interaction network diagram
图8 Hub基因互作网络图Fig.8 Hub genes interaction network diagram
2.6 生物信息学注释
2.6.1 KEGG富集结果
将把27个作用靶点导入到David数据库,得到9个关键通路。再把得到的KEGG分析数据导入到Easychart进行可视化分析(见图9)。代谢途径(metabolic pathway)通路是最显著的代谢通路,可能是黑果枸杞总黄酮治疗NAFLD的最重要的通路,癌症的途径(pathway in cancer)、鞘脂类信号通路(sphingolipid signal pathway)、VEGF信号通路(VEGF signaling pathway)、PI3K-AKT信号通路(PI3K-AKT signal pathway);Fcγ-r介导的吞噬作用(Fc gamma R-mediated phagocytosis)通路等可能是较重要的通路。
图9 KEGG富集散点图Fig.9 KEGG distribution point map
2.6.2 GO分析结果
将上述筛选出来的27个交集基因导入DAVID数据库进行GO分析,共得到33个GO条目。黑枸杞总黄酮治疗NAFLD与凋亡过程的负调控(negative regulation of apoptotic process)、应对缺氧(response to hypoxia)、基因表达正调控(positive regulation of gene expression)、凋亡过程(apoptotic process)、NF kappaB导入细胞核正调控(positive regulation of NF-kappaB import into nucleus)、白细胞介素-1β分泌的正向调节(positive regulation of interleukin-1 beta secretion)等19个生物过程(BP)条目密切相关;与鞘氨醇激酶活性(sphingosine kinase activity)、ATP结合(ATP binding)、激酶活性(kinase activity)、1-磷酸鞘氨醇受体活性(sphingosine-1-phosphate receptor activity)、镁离子结合(magneium ion binding)等10个分子功能(MF)条目密切相关;与细胞外空隙(extracellular space)、细胞溶质(ytosol)、胞外区(extracellular region)、NLRP3 炎症体(NLRP3 inflammasome complex)等4个细胞组分(CC)条目密切相关(见图10)。
图10 GO 生物进程分析Fig.10 GO biological process analysis注:BP:生物过程;MF:分子功能类别;CC:细胞成分。Note:BP:Biological process;MF:Molecular function categories;CC:Cell composition.
2.7 分子对接结果
分子对接技术可研究活性成分与关键靶点的结合能力,有利于验证网络中的关键成分和靶点。将10个Hub基因靶点与其71个活性成分进行分子对接,结合能≤-5.0 kJ/mol,表明其结合性好[14]。分子对接结果(见图11,热图中结合能取绝对值,分数越高说明成分与靶点结合能力大)表明,大多数黑果枸杞总黄酮成分与关键靶点具有较好的结合力。分别选取3组亲和力较强的靶点和成分构建分子对接3D模式图(见图12)。
图11 分子对接结果热图Fig.11 Heat map of molecular docking results注:横坐标:靶点;纵坐标:化合物编号(见表2)。Note:Abscissa:the targets;Ordinate:the compound numbers (As shown in Table 2).
图12 部分分子对接3D图Fig.12 3D view of partial molecular docking注:A:橙皮苷-PTGS2;B:圣草次苷-SPHK;C:穗花杉双黄酮-F3。Note:A:Hesperidin-PTGS2;B:Eriocitrin-SPHK;C:Amentoflavone-F3.
2.8 生存分析结果
把10个Hub基因导入到GEPIA数据库中得到生存分析结果(见图13),其中两个VEGFA、PGF与HCC的生存分析密切相关(P<0.05),采用GEPIA在线分析肝癌与正常组中Hub基因的相对表达量。与正常肝组织相比,肝癌组织中VEGFA相对表达量明显下降(P<0.05),而其他Hub基因在两种组织中的表达差异无统计学意义(见图14)。VEGFA基因也是Hub基因网络中最关键基因。VEGFA可能与从NAFLD到HCC的进展密切相关[15]。可能作为肝癌预后生物标志物,也可能是黑枸杞总黄酮治疗NAFLD的最关键基因。
图13 生存分析图Fig.13 Survival analysis diagram注:横坐标:生存时间(月);纵坐标:生存概率。Note:Abscissa:survival time (Month);Ordinate:probability of survival.
图14 Hub基因相对表达量Fig.14 Relative expression of Hub gene注:正常160例,肝癌组织369例;黑色代表正常组,红色代表肝癌组。Note:160 cases of normal and 369 cases of liver cancer;Black represents the normal group and red represents the liver cancer group.
图15 GSE89632数据集中63个样本中22个免疫细胞亚群的相对百分比Fig.15 The relative percentage of 22 subpopulations of immune cells in 63 samples from GSE89632 datasets
2.9 免疫细胞浸润相关性评价
2.9.1 免疫细胞浸润评估结果
使用CIBERSORT算法,我们首先研究了22个免疫细胞亚群在NAFLD与正常组织之间免疫浸润的差异。图15总结了从29名正常对照和34名NAFLD患者获得的浸润结果[16]。通过PCA发现,来自NAFLD患者和正常对照组的组织中免疫细胞的比例显示出明显的群体偏见聚类和个体差异[17](见图16)。
图16 NAFLD样品和对照样品之间的免疫细胞浸润的PCA图Fig.16 PCA cluster plot of immune cell infiltration between NAFLD samples and control samples
2.9.2 Hub基因与浸润性免疫细胞之间的相关性分析结果
结果表明CASP1与巨噬M1细胞(r=0.48,P=0.01)正相关、与巨噬M2细胞(r=0.46,P=0.04)正相关、与激活肥大细胞(r=-0.47,P=0.02)负相关。F3与单核细胞(r=0.5,P=0.001)正相关、与γδT细胞(r=-0.48,P=0.01)负相关。MMP2与巨噬M2细胞(r=-0.56,P=0.001)负相关。NLRP3与巨噬M1细胞(r=0.45,P=0.04)正相关。NTRK2与巨噬M2细胞(r=-0.46,P=0.001)负相关。PGF与巨噬M2细胞(r=-0.53,P=0.002)负相关、与激活肥大细胞(r=0.53,P=0.002)正相关、与γδT细胞(r=-0.49,P=0.01)负相关。SPHK1与γδT细胞(r=-0.48,P=0.01)负相关、单核细胞(r=0.51,P=0.004)正相关、与巨噬M2细胞(r=-0.56,P=0.001)负相关。PTGS2与静息肥大细胞(r=-0.51,P=0.006)负相关。VEGFA与幼稚B细胞(r=0.51,P=0.004)正相关、与γδT细胞(r=-0.55,P=0.001)负相关、单核细胞(r=0.52,P=0.003)正相关。PIK3R1与激活肥大细胞(r=-0.53,P=0.002)负相关、与静息CD4+记忆T细胞(r=0.5,P=0.008)正相关(见图17)。
图17 Hub基因和浸润的免疫细胞之间的相关性Fig.17 Correlation between hub gene and infiltrating immune cells
3 讨论与结论
氧化应激和炎症导致高甘油三酸酯血症引起的NAFLD[18]。黑果枸杞包含水溶性抗氧化剂原花青素等多种黄酮类化合物。研究发现黑果枸杞原花青素可显著减轻肝脏中甘油三酸酯的积累,减少炎症,提高GSH-Px活性和降低MDA水平。可降低ROS的产生和炎症,增加肝脏中脂肪酸的氧化,并减少脂肪酸的合成,从而改善由高脂饮食诱导的NAFLD[19]。
在本研究中,我们下载GEO数据库上的NAFLD微阵列,比较了NAFLD和正常对照之间的基因表达谱,得到了1 741个上调差异基因和1 634个下调差异基因。构建了WGCNA基因共表达网络,与得到的活性成分靶标取交集得到24个黑枸杞总黄酮治疗NAFLD的关键基因。此外,进行功能注释和PPI网络构建等多种生物信息分析以了解Hub基因的潜在生物学功能。
在功能注释部分,KEGG通路分析中基因富集最高的通路是代谢途径,而广泛认为代谢功能障碍引起的脂质积聚是引起NAFLD的重要原因之一[20]。GO生物进程分析中基因富集到细胞凋亡。有强有力的证据表明,细胞凋亡会导致NASH炎症[21]。
NLRP3炎性体活化在NAFLD的发病机制中的作用受到了广泛关注[22]。在分子对接结果中与NLRP3结合评分最高的是原花青素B2。而早前研究发现,原花青素B2显著降低了肺组织中的NLRP3、ASC和caspase-1信号[23]。在人脐静脉内皮细胞(HUVEC)中,原花青素B2显著抑制了NLRP3炎性小体的激活,并抑制了随后对脂多糖(LPS)的caspase-1激活和白介素IL-1β分泌。原花青素B2负调控NLRP3的基因表达[24]。
我们通过分析Hub基因和免疫细胞之间的相关性,发现Hub基因与巨噬M1细胞、巨噬M2细胞、单核细胞、γδT细胞、激活肥大细胞、静息肥大细胞、幼稚B细胞、静息CD4+记忆T细胞等免疫细胞密切相关。研究发现,脂质诱导的肝细胞刺激触发含有肿瘤坏死因子相关凋亡诱导配体(TRAIL)的细胞外囊泡的释放,进而激活巨噬细胞以产生IL-1β和IL-6[25]。此外,在小鼠血液中发现了两个子集的单核细胞,即促炎性单核细胞产生具有促炎或修复表型的巨噬细胞,促炎性单核细胞是脂肪性肝炎的已知驱动程序,总之促炎性单核细胞/巨噬细胞是人类和小鼠脂肪性肝炎的已知驱动器[26]。因此,我们推测Hub基因通过激活或抑制这几个免疫细胞来参与NAFLD的发生和发展。
总之,我们通过生物信息分析、UPLC/MS-MS等方法揭示了非酒精性脂肪肝疾病相关的核心基因并探讨了黑果枸杞总黄酮治疗NAFLD的作用机制。尽管先前的一些研究结果与我们的分析结果相符,但该研究结果的可靠性仍需要进一步的实验验证。