基于GEO数据库及网络药理学研究绞股蓝治疗冠心病的作用机制
2021-10-26刘本涛袁彩英梁水月黄嘉咏严振硕霍丽妮
刘本涛, 袁彩英, 陈 睿,2, 梁水月, 黄嘉咏, 严振硕, 梁 燕, 霍丽妮*
(1.广西中医药大学,广西 南宁 530001;2.广西中医药大学赛恩斯新医药学院,广西 南宁 530222;3.广西医科大学,广西 南宁 530021)
冠心病即冠状动脉粥样硬化性心脏病(Coronary atherosclerotic heart disease,CHD),是由冠状动脉发生粥样硬化导致血管腔狭窄或闭塞引起的心肌缺血缺氧或坏死性心脏病[1]。据《中国心血管病报告2018》[2]显示,中国心血管病患病率处于持续增长阶段,推算现患病人数2.9亿,其中CHD患病人数达1 100万,并且CHD死亡率呈不断上升趋势。目前CHD的治疗主要以西药为主,但都存在不同程度的毒副作用,较西药而言中医药治疗CHD具有一定优势,尤其是中药复方与西药的联合应用,临床疗效显著[3-4]。
近年来,中药绞股蓝及其复方在辅助治疗CHD方面取得了显著成效[5-7]。绞股蓝GynostemmaPentaphyllum(Thunb.)Makino又名七叶胆,为葫芦科绞股蓝属多年生草质藤本攀缘植物。现代研究表明,绞股蓝中主要化学成分为皂苷、多糖、黄酮类等,具有降血糖、降血脂、保肝、抗动脉粥样硬化、保护心脑血管等作用[8-10]。绞股蓝治疗CHD虽然具有显著疗效,但其作用的分子机制尚不明确,还有待深入研究。因此,本研究利用基因表达综合数据库(Gene expression omnibus,GEO)对CHD相关差异表达基因进行分析并将其作为疾病靶标,同时借助网络药理学方法探索绞股蓝治疗CHD的作用靶点及相关通路,以阐明绞股蓝治疗CHD的分子机制。
1 材料与方法
1.1 数据库和数据处理工具 GEO数据库(https://www.Ncbi.nlm.nih.gov/geo/)、TCMSP数据库(http://lsp.nwu.edu.cn/tcmsp.php)、PubChem数据库(https://www.ncbi.nlm.nih.gov/)、Swiss Target Prediction数据库(http://www.swisstargetprediction.ch/)、STRING数据库(https://string-db.org/)、DAVID6.8数据库(http://David.Ncifcrf.gov/)、KEGG数据库(http://www.kegg.jp)、PDB数据库(http://www.rcsb.org/pdb/home/home.do)、Venny2.1.0在线平台(https://bioinfogp.cnb.csic.es/tools/venny/index.html);Cytoscape3.7.1软件、ChemDraw Professional 16.0软件、SYBYL 2.0分子对接软件。
1.2 基因芯片及差异表达基因筛选 在GEO数据库中以“coronary atherosclerotic heart disease”为关键词检索与CHD相关的基因表达谱数据,并将“Organism”设置为“Homosapiens”来查找符合条件的基因芯片数据集;采用GEO数据库提供的Analyze with GEO2R功能分析所选基因表达谱数据,以P<0.05且|logFC|≥1.5为条件筛选差异表达基因(Differentially expressed genes,DEGs),获取与CHD相关的靶基因。
1.3 绞股蓝活性成分收集及潜在靶点预测 从TCMSP数据库中获取绞股蓝已知化学成分,并筛选出口服生物利用度(Oral bioavailability,OB)≥30%、类药性(Drug-likeness,DL)≥0.18的化合物作为候选活性成分[11];在PubChem数据库中检索各候选成分或利用ChemDraw Professional 16.0软件绘制其结构式,获取各化合物的SMILE化学式并上传至Swiss Target Prediction数据库,从而预测各成分潜在作用靶标;利用在线平台Venny2.1.0将上述获得的疾病靶基因与绞股蓝候选活性成分潜在作用靶标进行匹配,得到绞股蓝治疗CHD的作用靶点及对应活性成分。
1.4 活性成分-作用靶点网络构建及分析 将绞股蓝治疗CHD的活性成分及其作用靶点筛选结果导入Cytoscape3.7.1软件,构建绞股蓝治疗CHD活性成分-靶点网络,网络中节点(node)代表成分及作用靶点,边(edge)代表成分与靶点相互作用关系。利用软件Network Analyzer功能对网络进行分析,根据度值(degree)设置节点大小及颜色,以介数中心性(betweenness centrality)反映边的粗细。
1.5 蛋白互作分析 采用STRING数据库对绞股蓝治疗CHD的作用靶标之间的相互作用进行分析,获取蛋白相互作用(Protein-protein interaction,PPI)网络。保存蛋白相互作用结果文件,从中获取node1、node2 和combined score相关信息,利用Cytoscape3.7.1构建PPI网络,计算网络中每个靶点的degree值,利用degree值排名靠前的靶点建立核心靶蛋白互作网络,以degree值大小设置节点大小及颜色,边的粗细与combine score相关联。
1.6 GO基因功能注释和KEGG通路富集分析 将筛选所得绞股蓝治疗CHD潜在作用靶点导入DAVID数据库中进行基因本体(Gene ontology,GO)功能注释和京都基因与基因百科全书(Kyoto encyclopedia of genes and genomes,KEGG)通路富集分析,设定阈值P<0.05,靶基因名称列表为人,根据涉及靶点数目的多少筛选排名靠前的生物过程及通路。
1.7 靶点通路分析 将绞股蓝治疗CHD的靶标蛋白导入KEGG数据库,通过KEGG Mapper工具的Search Pathway功能获取相关通路网络,限定物种为人,筛选排名靠前的几条通路进行整合,绘制绞股蓝治疗CHD的最终通路图。
1.8 分子对接验证活性成分-关键靶点 根据上述分析结果,选择绞股蓝主要活性成分及其核心靶点作为分子对接的配体和受体,经PDB数据库筛选并下载受体蛋白及其共结晶,利用对接软件SYBYL对受体蛋白和配体小分子进行优化,删除水分子,添加极性氢原子,构建活性口袋并进行分子对接,预测两者的结合性能,从而验证本研究结果的准确性。
2 结果
2.1 CHD差异表达基因 从GEO数据库中筛选获取到基因芯片GSE19339,此数据集为GPL570芯片平台采集CHD患者血栓源性白细胞的基因表达谱数据。包括4个正常样本GSM480386~GSM480389和4个病患样本GSM480382~GSM480385。该芯片共检测54 675个基因,较完整覆盖人类基因组。利用GEO2R对全部样本进行分析,以P<0.05、|logFC|≥1.5为筛选条件,共得到1 577个DEGs,其中上调基因834个,下调基因743个,筛选所得DEGs即为CHD相关靶基因,见图1、表1。
表1 排名前30的上调和下调表达基因
图1 排名前30的上调和下调表达基因热图
2.2 绞股蓝治疗CHD活性成分及作用靶标 从TCMSP数据库中收集到24个OB≥30%、DL≥0.18的候选活性成分,经Swiss Target Prediction数据库预测,共获取潜在作用靶点1 120个,删除重复项后得到活性成分对应的328个潜在靶,将其与1 577个疾病靶基因进行比对取交集,得到43个共同靶标(图2),并且24个候选活性成分均包含在内,即为绞股蓝治疗CHD的作用靶点及对应活性成分,见表2,可知主要包括黄酮、植物甾醇、皂苷,可能是绞股蓝发挥药效作用的物质基础。
表2 绞股蓝治疗CHD活性成分及对应靶标
图2 CHD-绞股蓝活性成分潜在靶标韦恩图
2.3 绞股蓝治疗CHD活性成分-作用靶点网络构建 利用Cytoscape3.7.1软件构建绞股蓝治疗CHD活性成分-作用靶点网络(图3),包括67个节点(24个活性成分、43个作用靶点)和168条边,其中圆形节点代表活性成分,V字形节点代表靶点,边代表成分与靶点相互作用关系。节点的degree值代表网络中节点与节点相连的数目,其值越高,节点越大,颜色越深。由此可知,MOL009969、MOL009986、MOL009973、MOL009888、MOL000098、MOL004355、MOL000351、MOL000338、MOL000359、MOL005440、MOL000953等活性成分的degree值较大,可能是绞股蓝发挥药效的主要成分;雌激素受体β(Estrogen receptor β,ESR2)、维生素D受体(Vitamin D receptor,VDR)、维甲酸相关孤核受体α(Nuclear receptor ROR-α,RORA)、前列腺素E合成酶(Prostaglandin E synthase,PTGES)、酪氨酸激酶受体(Vascular endothelial growth factor receptor 2,KDR)、过氧化物酶体增殖物激活受体γ(Peroxisome proliferator-activated receptor γ,PPARG)、细胞周期蛋白B(Dual specificity phosphatase Cdc25B,CDC25B)、血管内皮生长因子A(Vascular endothelial growth factor A,VEGFA)、受体型酪氨酸蛋白磷酸酶F(Receptor-type tyrosine-protein phosphatase F,PTPRF)、乙酰肝素酶(Heparanase,HPSE)、酰基辅酶A去饱和酶(Acyl-CoA desaturase,SCD)、脂肪酸结合蛋白(Fatty acid binding protein,FABP)等靶点分别与多个活性成分关联,可能是绞股蓝活性成分治疗CHD的核心靶点。网络中同一活性成分可作用于不同靶点,同一靶点可与多个成分对应,提示绞股蓝治疗CHD具有多成分、多靶点协同作用的特点。
图3 绞股蓝治疗CHD活性成分-靶点网络
2.4 PPI网络及核心靶点 将43个潜在靶标导入STRING数据库,置信度设为>0.4,得到PPI网络(图4)。利用Cytoscape3.7.1软件计算网络中每个靶点的degree值,筛选degree值排名前十的靶点构建核心靶点互作网络(图5),图中节点大小代表该靶点作用强度,degree值越高,节点越大,对应颜色越深;边的粗细代表靶点间的关联程度,combine score值越大,靶点间关联度越高,边越粗。由此可知,核心靶点互作网络中包括VEGFA、白细胞介素-6(Interleukin-6,IL6)、基质金属蛋白酶-2(Matrix metalloproteinase 2,MMP2)、PPARG、骨髓过氧化物酶(Myeloperoxidase,MPO)、原癌基因酪氨酸蛋白激酶Src(Tyrosine-protein kinase Src,SRC)、KDR、肝细胞生长因子受体(Hepatocyte growth factor receptor,MET)、FABP5、精氨酸酶-1(Arginase-1,ARG1)等重要的CHD相关靶标蛋白,可能在绞股蓝治疗CHD中发挥主要作用,而且作用机制复杂多样,非单一蛋白靶标作用而成。
图4 绞股蓝治疗CHD潜在靶点互作网络
图5 绞股蓝治疗CHD核心靶点互作网络
2.5 GO基因功能注释和KEGG通路富集分析 将43个潜在靶点导入DAVID数据库进行GO基因功能注释和KEGG通路富集分析,根据分析结果设定P<0.05,共映射到显著富集的27条GO条目,包括生物过程(Biological process,BP)、细胞组分(Cellular component,CC)和分子功能(Molecular function,MF)3个模块(图6)。其中,BP主要涉及氨基酸磷酸化、趋化作用、细胞趋化正调控、细胞分裂、呼吸急促正调控等方面;CC主要涉及质膜胞质侧外源成分;MF主要涉及ATP结合、蛋白激酶活性、视黄醇X受体结合、锌离子结合、转运活性、肝素结合、碳酸盐脱水酶活性等方面。
图6 GO基因功能注释
KEGG通路富集分析(图7)显示,绞股蓝治疗CHD的潜在药效靶点主要涉及癌蛋白多糖信号通路(proteoglycans in cancer)、癌症信号通路(pathways in cancer)、磷酯酰肌醇3激酶/蛋白激酶B信号通路(PI3K-Akt signaling pathway)、PPAR信号通路(PPAR signaling pathway)、黏着斑(focal adhesion)、黏附连接(adherens junction)、Rap1信号通路(Rap1 signaling pathway)、血管内皮生长因子信号通路(VEGF signaling pathway)等多条信号通路,相关靶基因包括FGFR1、HPSE、VEGFA、MET、MMP2、SRC、KDR、SCD、PPARG、FABP3、FABP4,FABP5、IL6、BCL2等。
图7 KEGG通路富集分析
2.6 通路图绘制 将绞股蓝治疗CHD的43个潜在作用靶点导入KEGG数据库进行通路分析,经KEGG Mapper工具获取相关通路注释,筛选排名靠前的几条通路进行整合绘制最终通路图(图8),图中通路涉及靶点标记为浅蓝色,绞股蓝治疗CHD的靶点标记为浅绿色。由此可知,主要涉及pathways in cancer、focal adhesion、PI3K-Akt、Rap1、MAPK、VEGF、Ras、PPAR等信号通路,出现18个绞股蓝治疗CHD的靶点,RTK、MET、FAK、SRC、VEGF等可在多条通路中发挥作用,表明绞股蓝治疗CHD的作用机制主要与上述靶点和通路相关,各靶点、通路之间相互协调,共同参与药理作用的发挥。
图8 绞股蓝治疗CHD通路图
2.7 分子对接结果 选择主要活性成分及其对应核心靶点作为配体和受体进行分子对接,根据对接得分大小判断活性成分与靶标蛋白的结合性能,一般分值在6以上表明两者结合活性较好,分值越高则结合越稳定[12]。如表3所示,大多数活性成分与其核心靶点有着较好的结合活性,部分成分与靶点对接得分较低,可能是由于绞股蓝皂苷类成分分子量较大,与靶蛋白的原始小分子配体存在一定差异所致。图9为绞股蓝皂苷XXXV_qt与PPARG(6K0T)的分子对接示意图,可知两者主要通过疏水接触产生相互作用。
表3 绞股蓝治疗CHD活性成分与其关键靶点的分子对接得分值
图9 绞股蓝皂苷XXXV_qt与PPARG(6K0T)的分子对接
3 讨论
冠心病(CHD)在中医学中可归入“心痛”“胸痹”等范畴,其病位在心,并涉及肝、脾、肾,兼有痰浊、血瘀、气滞、寒凝等病变[13]。绞股蓝性味甘寒、微苦,归心、脾、肺、肾经,具有养心安神、健脾利胃、清肺化痰、补气养阴之功[10]。因此,绞股蓝在CHD的临床诊疗中日益受到关注。本文借助GEO数据库对CHD的差异表达基因即疾病靶点进行筛选,同时利用网络药理学技术,根据多成分、多靶点共同作用的研究思路,对绞股蓝治疗CHD的活性成分及其作用的分子机制进行系统研究。结果表明,黄酮、植物甾醇及皂苷类成分是绞股蓝治疗CHD的活性成分,主要包括槲皮素、谷甾醇、波菜甾醇、绞股蓝皂苷等。槲皮素具有抗心肌缺血及缺血再灌注损伤、抗动脉粥样硬化、改善冠状动脉血循环等多种药理作用[14-16];植物甾醇具有显著的降血脂活性,改善血脂异常可延缓动脉粥样硬化进程,降低CHD的风险[17];绞股蓝皂苷具有神经保护、抗动脉粥样硬化、调节糖脂代谢等作用[18-20],表明本研究结果具有一定可靠性。
通过对绞股蓝治疗CHD活性成分-作用靶点网络及PPI网络进行分析,推断ESR2、RORA、VDR、KDR、PTGES、PPARG、CDC25B、PTPRF、VEGFA、HPSE、FABP、SCD、IL6、MMP2、MPO、SRC、MET、ARG1等是绞股蓝治疗CHD的核心靶点。Mansur等[21]认为ESR2是CHD的独立危险因素。RORA可通过调节脂质代谢、参与炎性反应等机制使TNF-α、IL-6等炎症因子释放减少[22]。艾思迪等[23]认为VDR表达降低可能是冠心病的潜在危险因素。KDR是血管内皮细胞VEGF上具有高亲和力的酪氨酸受体,主要介导内皮细胞增殖,引起血管通透性升高,活化的KDR能激活PI3K,发挥维持细胞存活效应[24]。VEGFA是至今发现的作用最强、特异性最高的VEGF亚型中最重要的一个因子,具有增加微、小静脉血管的通透性、促使血管内皮细胞分裂增殖及诱导血管生成再生等作用[25]。Scheller等[26]发现,IL-6表达水平与冠状动脉严重病变的发生率呈正相关,上述结论进一步证实了本研究所得绞股蓝治疗CHD核心靶点的准确性。
经GO基因功能注释,发现绞股蓝活性成分对氨基酸磷酸化、趋化作用、细胞趋化正调控、细胞分裂、呼吸急促正调控等生物学过程有一定影响,并在绞股蓝治疗CHD所涉及的作用靶点及相关通路中有所体现。通过KEGG富集分析,证实绞股蓝对癌蛋白多糖信号通路、PI3K-Akt信号通路、PPAR信号通路、黏着斑、Rap1信号通路、VEGF信号通路等多条CHD相关信号通路以及VEGFA、MET、MMP2、SRC、KDR、PPARG、FABP、IL6等相关靶点均具有调控作用。PI3K-Akt信号通路[27]、VEGF信号通路[28]、PPAR信号通路[29]、黏着斑激酶介导信号通路[30]等是CHD发生发展中的重要通路,本研究结果表明绞股蓝可能通过上述通路发挥对CHD的治疗作用,这对绞股蓝治疗CHD的作用机制研究具有一定意义。
综上所述,本研究借助GEO数据库探寻CHD相关靶基因,为CHD的深入研究和临床治疗提供了新思路;利用网络药理学方法挖掘绞股蓝治疗CHD活性成分,通过网络构建及通路富集阐述了活性成分与作用靶点和通路之间的联系,揭示了绞股蓝治疗CHD的潜在分子机制,为绞股蓝的临床应用及深入研究提供了理论基础;分子对接结果显示绞股蓝活性成分与核心靶点之间结合性能良好,验证了网络药理学预测靶点的准确性。本文研究结果虽得到相关文献佐证,但未进行实验验证,后续可结合本研究结果对绞股蓝治疗CHD的作用机制进行相关实验研究,使其药理作用机制更加明确。