基于网络药理学和分子对接探讨威麦宁治疗肺腺癌的机制研究
2021-03-11陶姣阳莫泽君林耀煌李嘉凯
胡 伟,陶姣阳,莫泽君,林耀煌,梁 娇,李嘉凯
(浙江大学医学院附属第二医院药学部,浙江 杭州 310009)
无论是在全球或者是在我国,肺癌都已成为癌症发病率和死亡率首位,据19年国家癌症中心发布的数据,15年我国新发肺癌病例约78.7万例,死亡病例约63.1万例[1]。非小细胞肺癌(non-small cell lung cancer,NSCLC)约占肺癌总病例数的80%~85%,而肺腺癌(LUAD)为其主要病理类型,约占NSCLC的60%。LUAD发病隐匿不易察觉,早期就诊患者较少,对于晚期或转移患者主要治疗手段为化疗和放疗,而放化疗具有严重毒副作用,并会大大降低患者的生活质量。因此,LUAD患者迫切需要临床疗效稳定和毒副作用小的治疗方案。
威麦宁胶囊是从金荞麦的干燥根茎中,使用现代技术提取的活性成分,作为我国首个治疗肺癌单方中成药[2],具有清热解毒、活血化瘀、驱邪扶正等作用,临床主要配合放、化疗治疗肿瘤有增效减毒作用,也用于不适宜放、化疗肺癌患者的治疗。虽然,相关的临床观察研究发现[3-4],威麦宁胶囊配合放化疗治疗NSCLC患者能带来明显的临床获益,但是关于其发挥抗肿瘤作用的内在药理学机制却鲜有报道。
网络药理学是一种集合系统生物学、组学和计算生物学,并基于成分、疾病、靶点之间相互作用网络的系统研究方法,可以系统的揭示药物治疗疾病的作用机制[5]。中药具有多成分、多靶点、多途径的作用特点,而网络药理学相较于传统的试验方法,能够以科学的分析方法全面的阐述中药潜在的作用机制[6]。分子对接技术是根据结构生物学的原理,利用计算机高精度对接模拟,并将蛋白和配体的结合位点和潜力进行评估,是发现和确认药物靶点快捷有效的新途径[7]。本文基于网络药理学的方法,分析研究威麦宁胶囊有效成分治疗LUAD的可能的作用靶点,并通过分子对接技术进行评估确认,提高结果的可靠性。
1 材料与方法
1.1 威麦宁胶囊的有效成分及相关靶点的筛选威麦宁胶囊为金荞麦干燥根茎的提取物,通过检索TCMSP(https:// tcmspw.com/ tcmsp.php)、TCMID(http://119.3.41.228:8000/ tcmid/)、BATMAN-TCM(http://bionet.ncpsb.org/batman-tcm/index.php)和ETCM(http://www.tcmip.cn/ ETCM /index.php)数据平台收集金荞麦根茎(Rhizoma Fagopyri Cymosi)的化学成分,根据ADME参数筛选活性成分,设定同时满足口服生物利用度OB≥30%和类药性DL≥0.18的成分作为活性成分[7],同时利用TCMSP和DrugBank(https://www.drugbank.ca/)预测活性成分靶点。并且根据已发表的文献,补充其活性化合物及其靶点。筛选所得靶点,需在Uniprot数据库(https://www. uniprot.org)将活性成分作用的蛋白质靶点进行统一规范。
1.2 肺腺癌的差异表达基因的获取从GEO数据库搜索组织来源为人,同时含有肺腺癌和正常肺组织样本的基因表达数据集,筛选出GSE116959和GSE43458两个探针芯片数据集。GSE 116959芯片包含57个肺腺癌组织和11个正常肺组织样本基因表达谱,GSE43458芯片包含80个肺腺癌组织和30个正常肺组织样本的基因表达谱。本研究利用R语言的limma软件包对芯片进行基因差异分析,ggplot2软件包绘制火山图,根据相关参数adj.P<0.05和差异倍数∣logFC∣>1作为筛选条件。
1.3 交集靶点及其相互作用网络构建为明晰药物作用靶点与肺腺癌差异表达靶点之间的关系,本研究将所得靶点信息输入在线Venn分析工具(http://bioinformatics.psb.ugent.be/webtools/Venn/),并绘制Venn图,获得药物与疾病的交集靶点。然后,将交集靶点输入蛋白交互作用网站String(https://string-db.org),生物种类选择“Homo sapiens”,最小相互作用阈值设置“medium confidence”(>0.4),其他参数选择默认值,即可得到PPI网络。使用CytoScape 3.7.2将所得PPI结果进一步美化,得到交集蛋白PPI网络图。
1.4 GO和KEGG通路富集分析Metascape平台(http://metascape.org/gp/index.html)拥有全面的注释功能并且每月更新基因注释的数据资料。将威麦宁治疗肺腺癌的作用靶点输入Metascape平台,设置P<0.01,最小基因数=3,富集因子>1.5。将其主要的GO与KEGG通路进行富集分析,然后利用R语言ggplot2软件包将结果绘制气泡图。
1.5 核心靶点的提取和分析使用CytoScape 3.7.2中的CytoHubb插件,利用MCC算法,提取得到排名前10个蛋白的相互作用网络图,将其作为核心基因并进行KEGG通路富集分析。
1.6 分子对接将威麦宁的主要有效成分和10个核心靶点,用Autodock软件进行分子对接。使用TCMSP数据库,下载药物小分子化合物的MOL2格式文件,并通过pymol转换为PDB格式;然后通过PDB数据库(http://www.rcsb.org/)下载靶蛋白与其他配体结合的复合物的PDB格式文件,对接区域即原始配体所在位置。使用Autodock软件在对接时,选择Genetic Algorithm作为对接算法,并设置输出样品数为100,计算次数为27 000,其他参数使用默认值。
2 结果
2.1 威麦宁胶囊的有效成分及相关靶点通过检索几个数据库,根据筛选条件OB≥30%和DL≥0.18,共获得15个有效成分;然后通过检索相关文献[2],发现原花青素b2(Procyanidin b2)为威麦宁胶囊的重要活性成分,于是将其归入有效活性成分见Tab 1所示。通过TCMSP和DrugBank对获得的16个活性成分进行相关靶点的预测,然后使用Uniprot(https://www. uniprot. org/)数据库将所得靶点蛋白进行规范化处理,结果总共获得353个有效靶点;使用Cytoscape 3.7.2软件对所得的活性成分和靶点进行可视化网络展示,如Fig 1所示。网络图中红色六边形代表有效成分,紫色圆形代表degree>3的靶点,淡蓝色菱形代表degree≤3的靶点,节点越大代表degree值越大。结果显示木犀草素(luteolin)和槲皮素(quercetin)的degree值分别为154和57,很可能是威麦宁胶囊发挥药理作用的主要活性成分。
Tab 1 Main active ingredients of Weimaining
2.2 肺腺癌的差异表达基因使用R语言limma软件包对GSE116159和GSE43458数据集进行基因差异分析,分别获得肺腺癌(LUAD)相对正常肺组织存在1 862和746个差异基因,GSE116159中表达上调的有674个,下调的1 188个,GSE43458中表达上调291个,下调455个。将两个数据集获得的差异基因取并集,总共得到2 217个可能与LUAD有关的差异基因。将结果用R语言绘制火山图展示,见Fig 2、3。
Fig 1 Component-target network of Weimaining
Fig 2 Volcano map of GSE116159 differential genes
Fig 3 Volcano map of GSE116159 differential genes
Fig 4 Venn diagram of targets of Weimaining and LUAD
2.3 交集靶点及其相互作用网络将威麦宁胶囊主要有效成分所对应的靶点进行去重后,共获得204个潜在作用靶点,同时通过对两个LUAD数据集数据挖掘,共获得2 217个和LUAD相关的差异表达基因。然后将药物和疾病所对应的靶点分别导入在线Venn分析工具,获得41个交集靶点,并绘制Venn图,见Fig 4。最后将获得的41个共同作用靶点,利用蛋白交互网站String进行蛋白相互作用分析,并将其结果导入Cytoscape 3.7.2软件进行可视化,结果见Fig 5。PPI网络中共有39个节点(去除2个独立节点),162条边,节点大小和节点颜色根据degree值排序,degree值越大节点越大颜色越亮;边的粗细和颜色根据combined score排序,combined score值越大边越粗颜色越亮。
Tab 2 MCC Score values of core targets
Fig 5 PPI network at intersectiontargets of Weimaining and LUAD
Fig 6 GO enrichment and KEGG pathway enrichment analysis of intersection targets
Tab 3 KEGG pathway enrichment analysis of core targets
Tab 4 Docking results of main active componentsof Weimaining with core targets
2.4 GO和KEGG通路富集分析将之前获得威麦宁胶囊治疗LUAD的41个靶点基因放入Metas-cape平台,分别进行GO富集分析和KEGG通路富集分析。GO 富集分析主要包括BP(Biological Processes)、CC(Cellular Components)、MF(Molecular Function),利用R语言将结果绘制成气泡图,横坐标为Gene ratio,纵坐标为富集结果,富集结果的-log10(Qvalue)值以颜色表示,气泡大小表示基因Count值,见Fig 6。
细胞组分(CC)的富集结果,显示威麦宁胶囊和LUAD的交集基因主要分布在RNA聚合酶Ⅱ转录因子复合物、细胞膜筏、浓缩的染色体、ficolin-1-rich颗粒内腔和内质网腔等细胞部位。
分子功能(MF)富集的结果,显示交集基因主要是对G蛋白偶联胺受体、功能类固醇激素受体、氧化还原酶和丝氨酸肽链内切酶的活性影响,以及通过与蛋白激酶、整合素、转录因子和生长因子的结合,从而发挥作用。
生物过程(BP)的富集结果,显示交集基因主要富集在对细胞死亡的正向调节、细胞增殖的负调控、DNA结合转录因子活性的调控、多细胞生物过程、对金属离子反应、对细胞外刺激的反应、细胞对激素刺激的反应和对含嘌呤化合物的反应等生物过程。
KEGG通路富集分析结果显示,41个交集基因显著富集在12条通路上(Qvalue<0.01)。包括液体剪切应力和动脉粥样硬化、癌症通路、AGE-RAGE信号通路、p53信号通路、癌症中的转录失调、cAMP信号通路、金属铂耐药等通路,也说明威麦宁胶囊可以通过多靶点多通路协调作用,从而发挥治疗LUAD的功效。
2.5 核心靶点的提取和分析使用CytoHubba插件,选择MCC方式进行核心靶点的提取,根据MCC score提取前10的靶点,如Tab 2所示。将Top10的靶点利用Metascape分析平台进行KEGG通路富集分析,所得结果与交集靶点结果基本一致,主要富集在IL-17信号通路,癌症通路和癌症中的转录失调这3条通路,见Tab 3。
2.6 主要活性成分和核心靶点的分子对接威麦宁胶囊中活性成分对应靶点的网络图中,显示木犀草素(luteolin)和槲皮素(quercetin)很可能是其发挥药理作用的主要活性成分。通过威麦宁胶囊和LUAD所获得的交集靶点的PPI网络图,然后使用CytoHubba获得10个核心靶点。从TCMSP数据库获取木犀草素和槲皮素的mol2结构式,PDB数据库下载核心蛋白的pdb结构式,使用Autodock软件进行分子对接,结合能(Binding energy)越小说明配体和受体结合越稳定,越可能发生相互作用。然后使用Pymol软件对所得对接结果进行可视化展示。结果显示木犀草素和槲皮素与核心靶点结合性较好,结合能均小于0 KJ·mol-1并显示着相同的趋势,如Tab 4所示,排在前五位的靶点蛋白为MMP-9、MMP-1、CAT、PLAU和PPARG。
3 讨论
本研究利用网络药理学和分子对接的方法,探讨了威麦宁胶囊治疗LUAD的潜在作用机制。通过数据库、基因芯片数据挖掘以及分子对接的结果找出了威麦宁的主要活性成分木犀草素和槲皮素,以及可能通过与MMP-9、MMP-1、CAT、PLAU和PPARG发生相互作用,作为威麦宁胶囊治疗LUAD的主要靶点。
MMP-9和MMP-1都属于基质金属蛋白酶(MMPs),一种锌依赖性内肽酶,MMPs的基因多态性与肺癌的易感性存在相关性,比如MMP-1-16071G/2G基因型在亚洲人中发现肺癌风险增加,而MMP-9-1562C/T基因型很可能是肺癌的保护因素[8];并且已发现在MMP-9和MMP-1多种肿瘤组织中均为高表达,而降低MMP-9和MMP-1的表达不仅可以抑制NSCLC细胞的活力和迁移能力,还能提高耐药细胞对EGFR抑制剂的敏感性[9]。CAT为过氧化氢酶,可以保护细胞免受过氧化氢的毒性作用,促进T细胞、B细胞、肥大细胞和成纤维细胞的生长,CAT可以降低组织中过多ROS引起的损伤,与癌旁组织相比,在NSCLC细胞中,CAT的表达量和活性都会降,同时CAT可以产生氧来克服肿瘤细胞的缺氧,进而增加效应T细胞的浸润,同时耗尽肿瘤中的免疫抑制细胞,增强PD1单抗的疗效[10]。PLAU尿激酶型纤溶酶原激活剂,除了可以激活纤溶酶原,还与肺癌细胞的增殖,侵袭和转移有关,如KLF17通过Src/p38/MAPK信号通路抑制PLAU可以抑制LUAD的侵袭[11]。PPARG是一种配体激活的转录因子,属于过氧化物酶体增殖活化受体(PPARs)家族,PPARs受体的激动剂能有效的抑制LUAD细胞的增殖,发现PPARG蛋白过表达或者激动剂罗格列酮的诱导,可以增强辐射诱导的NSCLC细胞的凋亡,并且这种放射增敏效应是由Bax介导[12]。
KEGG通路富集分析结果显示,威麦宁胶囊治疗LUAD的潜在作用机制除了直接作用于癌症通路,癌症中的转录失调以及金属铂耐药,还包括流体剪切应力和动脉粥样硬化、AGE-RAGE信号通路、p53信号通路、cAMP信号通路等通路。流体剪切应力和动脉粥样硬化通路对血管的再生有着重要的调节作用,流体剪切应力可以调节血管内皮细胞中相关基因的表达,影响着内皮细胞的形态、分化、迁移和增殖[13]。AGE-RAGE信号通路主要是指晚期糖基化终产物(advanced glycation end products,AGEs)与其受体RAGE结合后可启动一系列信号转导反应,合成和释放多种细胞因子和生长因子,诱导ROS生成增多,诱发氧化应激和炎症反应。目前,在人类肺癌组织中均发现RAGE 蛋白表达,并参与肿瘤细胞的增殖、凋亡、自噬、侵袭、远处转移及耐药[14]。p53信号通路广泛作用于多种肿瘤组织,可以调节多种基因表达,加速DNA的损伤修复,调节细胞周期,诱导细胞凋亡等作用。研究表明,促进p53蛋白的合成,抑制p53的泛素化和降解,可以促进LUAD细胞凋亡,抑制LUAD的进展[15]。cAMP信号通路,通过调节细胞内第二信使cAMP的水平而引起反应的信号通路,在基因调控,以及细胞迁移、增殖、凋亡等过程中发挥着重要作用[16]。
目前已有相关的临床研究证明,威麦宁胶囊联合放疗或化疗在治疗LUAD患者临床观察研究中,改善患者免疫状态,提高疗效,减轻放化疗毒性,延长患者生存期[3-4]。 但是关于其作用的药理学机制,影响的通路及具体蛋白却很少有人研究,本文研究的重要性就得到很好的体现。
综上所述,本文通过网络药理学和分子对接的方法,阐明了威麦宁胶囊治疗LUAD主要有效成分、作用靶点,以及相关的通路,发现其可以通过直接细胞抑制作用和增加放化疗的敏感性发挥疗效。但是想要揭示其分子学机制,仍需要通过进一步的体内外研究对本文的研究结果进行验证,这也将是作者接下来要进行的工作。