基于网络药理学与分子对接的新冠肺炎三焦疫毒寒湿症用药机理研究
2021-02-03杜海涛王平李娜丁洁张敬袁成民孙铁锋韩莉张忠法
杜海涛,王平,李娜,丁洁,张敬,袁成民,孙铁锋,韩莉,张忠法
(1.山东中医药大学 药学院,山东 济南 250355;2.山东省中医药研究院,山东 济南 250014;3.天津大学 精密测试技术及仪器国家重点实验室,天津 3000722;4.潍坊市中医院,山东 潍坊 261000;5.济南市传染病医院,山东 济南 250021)
新冠肺炎(COVID-19)是一种由新型高致病性的冠状病毒(SARS-CoV-2)感染引起的蔓延到全世界范围的急性呼吸道传染病[1-2]。该病潜伏期长、传染性强,人群普遍易感,临床上以发热、干咳、乏力为初期表现,后期严重患者还会出现胃肠道严重不适、急性呼吸窘迫综合征等症状,在全世界范围内广泛传播,对人们的生产生活和健康造成了巨大威胁[3]。
山东省COVID-19病例以输入性为主。该地地形复杂,沿海地区傍水、内陆地区地平易湿,发病季为冬春之交,气温仍低,极易感外寒。而COVID-19具有典型的湿毒致病特点,疫毒从口鼻入,侵袭气道,进一步出现邪犯肺卫、邪犯肠胃等证[4]。患者携带原发湿疫并由于山东复杂地域与时令,易从上向下至三焦传变,多数病人辨证为“三焦疫毒寒湿症”,《疫证治例》云“疫病邪自中作,或出而三阳三阴之经,入而三阳之腑,三阴之脏,每随人元气之厚薄、脏腑之寒热以为传化”。三焦疫毒寒湿症药队出自济南市COVID-19救治定点医疗机构——济南市传染病医院总结的P2药队,针对COVID-19寒、湿、毒、瘀特点兼扶正达邪、三焦分治之《伤寒论》桂枝汤、《温病条辨》三仁汤或藿朴夏苓汤化裁而来。药队由桂枝、广藿香、防风、贯众、半夏、泽泻、茯苓构成:桂枝温阳化气以利水,可解表宣肺;广藿香芳香化湿之效温煦而不燥烈,能除中焦湿邪,并助脾胃正气;防风乃风药,可解表发汗、祛风胜湿,泻上焦补下焦,能治肺实,散肝舒脾;贯众清热解毒;清半夏燥湿化痰,降逆止呕;泽泻、茯苓淡渗利湿,可解困脾之湿,诸药合用,可治疗三焦疫毒寒湿。在此基础上,根据患者自身情况灵活加减味进而演化成多个对症COVID-19患者临床用方,对收治入院的35例患者进行治疗,已取得良好的治疗效果[5]。本研究从分子调控出发,运用分子对接及网络药理学方法,寻找三焦疫毒寒湿症药队治疗COVID-19的直接及间接作用机制,确定在机体网络中重要靶标,为三焦疫毒寒湿症系列方在抗疫战中发挥更大的作用提供理论基础。
1 材料与方法
1.1 药队中入血成分的筛选
利用中药系统药理学数据库与分析平台(traditional Chinese system pharmacology database and analysis platform, TCMSP, https://tcmspw.com/tcmsp.php)检索桂枝、广藿香、防风、贯众、半夏、泽泻和茯苓的活性成分。根据TCMSP靶点筛选指南和化合物ADME(absorption, distribution, metabolism, excretion)参数,设置口服生物利用度(OB)≥30%且类药性(DL)≥0.18,以此条件筛选,并下载*.mol2结构文件建立药队中核心成分的数据库[6]。
1.2 活性成分靶标预测
将收集的化学成分逐一输入至Open Babel,将化合物结构转化为SMILES并导入到Swiss Target Prediction数据库(http://swisstargetprediction.ch/),设置种属为“homosapiens”,将筛选后的化合物与数据库中靶点进行模拟对接,基于二维/三维结构相似性预测化合物靶点,选取结果Probability大于0的靶点建立化合物靶点数据库,并导入Cytoscape 3.7.1进行可视化,生成药队成分-靶标网络[7]。
1.3 蛋白质-蛋白质相互作用网络构建
将1.2下预测到的靶标导入 STRING平台(https://string-db.org/)进行蛋白质-蛋白质相互作用(protein-protein interaction,PPI)分析,设定物种为人,将最低相互作用阈值设置为 0.99 进行筛选,隐藏离散节点,构建PPI网络关系。下载结果以*.tsv 格式保存,导入Cytoscape3.7.1可视化,并用Network analyzer 插件分析网络特征靶点。以“度值”评价节点的重要程度,度值代表网络中与该节点直接作用的节点数目,值越大表示参与的生物功能越多,其生物学重要性越强,并以度值数值大小为PPI节点着色。
1.4 基因本体论及信号通路分析
将靶点基因名用Uniprot数据库(https://www.uniprot.org/)转换为Uniprot ID。在DAVID(the database for annotation,visualization and intergrated discovery)6.8平台(https://david.ncifcrf.gov)对核心靶点进行基因本体分析(gene ontology,GO)及京都基因和基因组百科全书(Kyoto encyclopedia of genes and genomes, KEGG)通路富集分析,选择差异性有显著统计学意义(P≤0.01)的条目,得到关键核心靶标参与的过程及通路信息。
1.5 分子对接
在 PDB数据库(https://www.rcsb.org/)检索 Mpro 与 ACE2 的人源高分辨晶体结构(PDB ID: Mpro-6LU7; ACE2-1R42),导入薛定谔Maestro 11.9软件。使用Protein Preparation Wizard套件预处理原始结构,包括向蛋白质中添加氢原子、键顺序的分配以及删除5Å以上的水分子;使用配体结合位点来定义蛋白质的活性位点,使用Receptor Grid Generation套件,使用基于网格的能量学的配体对接算法(glide)生成格点文件;使用LigPrep套件对配体进行预处理,包括互生成不同构象和使用Epik在pH(7.0±2.0)下的电离态,添加氢原子,中和带电基团,优化配体的几何构型;最后利用Ligand Docking套件进行分子对接,分析格点结合能值分数,该数值为负则提示能自由结合。本次研究设定对接得分小于-5为结合具有显著性[8],以此初步验证常用药队在COVID-19防治的直接作用机理。
2 结果
2.1 药队入血成分及靶点筛选结果
从 TCMSP中检索筛选获得建立数据库共含中药活性成分共 77个,表1为其中的主要活性成分,全部活性成分请查阅OSID。通过Swiss Target Prediction获取预测靶点 4760 个。利用 Cytoscape3.7.1 构建药队成分-靶标网络见图1,该网络共898个节点,4841条边。图中,边代表相互作用关系,绿色方形节点代表成分靶点,蓝色椭圆形节点代表活性成分,红色V型节点代表来源药物。因部分成分没有对应靶点,网络图中成分节点共68个,其中MOL000358为半夏、防风与桂枝的共有成分,MOL000359为防风、桂枝与泽泻的共有成分。
表1 常用药队活性成分信息
图1 常用药队成分-靶标
2.2 PPI网络结果
将STRING11.0平台获取的 PPI关系导入Cytoscape3.7.1 软件进行可视化分析,生成PPI网络如图2所示。该网络共有218个节点、254条边,其中,边代表PPI关系,方形节点代表靶标蛋白,节点颜色代表度值高低。可见CDK1、AKT1、STAT3、CDK2与PLK1等靶标在网络中发挥核心作用,具有进一步研究的价值。
注:颜色范围,表示从左往右为度值降低。
2.3 GO和KEGG 富集结果
将潜在靶点导入DAVID 6.8中进行分析,包含3个分支,即分子功能(MF)、细胞组分(CC)以及生物过程(BP),筛选P≤0.01的过程,列出富集数前十位的过程(图3)。其中,在MF层面,预测靶点主要与蛋白结合(protein binding)、ATP结合(ATP binding)和蛋白激酶活性(protein kinase activity)相关;在CC层面,胞浆(cytosol)、胞核(nucleus)和胞质(cytoplasm)所占比例较大;在BP层面,与蛋白质磷酸化(protein phosphorylation)、RNA聚合酶II启动子对转录的正调控(positive regulation of transcription from RNA polymerase II promoter)和信号转导(signal transduction)关系紧密。
图3 GO富集分析结果
通过KEGG富集分析药队核心成分抗COVID-19可能参与的通路,结果得到P≤0.01的信号通路共105条,图4列举了富集数前20位的相关通路。其中 PI3K-Akt信号通路(PI3K-Akt signaling pathway)、FOXO信号通路(FOXO signaling pathway)、RAS信号通路(RAS signaling pathway)和MAPK信号通路(MAPK signaling pathway)等与肺系疾病密切相关。KEGG富集分析表明药队的核心成分可能作用于这些通路,从而起到抵御新型冠状病毒引起的各种症状的作用。
图4 KEGG富集分析结果
2.4 分子对接结果
Mpro 的晶体结构为 6LU7(2.16 Å),ACE2 的晶体结构为 1R42(2.2 Å)。使用glide gscore来描述配体与受体蛋白的匹配程度,分数绝对值越大,匹配程度越高[9-10]。二者结合分数均小于-5的化合物得分如表2所示。其中,与IR42结合最佳的化合物是(2R)-5,7-二羟基-2-(4-羟基苯基)苯并二氢吡喃-4-酮(MOL001040,glide gscore:-8.708,glide energy:-43.340),与6LU7结合最佳的化合物是(+)-表儿茶素(MOL000073,glide gscore:-6.881,glide energy:-38.862),对接模式见图5。
表2 药队核心化合物分子对接分数
图5 分子对接模式
3 讨论
SARS-CoV-2的感染会引起严重的肺部炎症及并发症,而宿主对病毒感染的免疫反应有限,需要依靠强有力的外部干预。据国家中医药管理局通报,多地中医药治疗COVID-19的参与率可达90%以上,对症状有明显的改善作用[11]。水土有别,人文迥异,中医药的有效性关键是把握“辨证施治”原则,不应只局限于直接抗病毒药物,诊疗方案必须依据发病人群的不同进行相应的调整,从调节机体状态、改善体内环境、扶持自身正气、增强抵御外邪能力方面出发,亦可达到治疗目的[12-13]。本文所提之药队由桂枝、广藿香、防风、贯众、半夏、泽泻、茯苓组成,贯众味苦,性微寒,《普济方》云“解一切诸热度”,凡温热毒邪所致之证,皆可用之;桂枝解肌散邪,温通利水;防风发表胜湿;广藿香芳香化湿,开胃健脾;半夏燥湿化痰;茯苓、泽泻,淡渗利湿,诸药合用,可治疗三焦疫毒寒湿。
基于SARS-CoV-2与SARS-CoV基因与结构的对比研究,发现二者基因序列同源性接近80%,进而发现SARS-CoV-2与ACE2受体的亲和力明显高于SARS-CoV,因此SARS-CoV-2传染性更强[14]。ACE2受体在肺泡上皮细胞在内的多种人体细胞表面表达,是肾素-血管紧张素-醛固酮系统(RAS)的关键分子[15]。在获得SARS-CoV-2水解酶(Mpro)和ACE2高分辨率晶体结构基础上,结合虚拟筛选和酶学测试相结合的研发思路,是归纳筛选新药的思路之一[16]。从分子对接角度来看,潜在有效化合物(+)-表儿茶素(MOL000073)、儿茶素(MOL000492)、3,23-二羟基-12-齐墩果烯-28-酸(MOL005923)、5-羟基-7,4′-二甲氧基黄烷酮(MOL005911)、(2R)-5,7-二羟基-2-(4-羟基苯基)苯并二氢吡喃-4-酮(MOL001040)、黄芩素(MOL002714)、黄芩苷(MOL002776)同属于黄酮类,占化合物数目的半数以上(54%),此类化合物与Mpro、ACE2均有较好的亲和性,具有进一步开发价值。据报道,黄酮类化合物(尤其是黄酮醇类)具有广泛的抗病毒抗菌作用[17]。Jo等[18]通过分子对接及蛋白水解法、色氨酸荧光法验证,发现黄酮类化合物(尤其是黄酮醇类)具有疏水性芳环和亲水性羟基,能与SARS-CoV Mpro活性位点完美亲和,并有效阻断Mpro的活性使其失去原本调控复制的能力。综上所述,药队中的黄酮类成分,具有靶向性的抗病毒、抗炎和抗氧化功效,其对接得分小于-5,能够与靶蛋白自发结合,为开发P2药队提供了重要的参考。
本研究基于系统生物学理论,通过网络药理学手段检索到三焦疫毒寒湿症药队77种活性成分,4760个潜在作用靶标,构建了其成分-靶点网络。通过PPI分析发现靶标CDK1、AKT1、STAT3、CDK2与PLK1在调控中起核心作用,STAT3、EGFR、JUN、MAPK3、PIK3R1、TNF、BCL2、IL1B等主要与细胞因子相关,是调控病毒引发机体过度免疫导致炎性因子风暴的关键靶标[19-20]。炎症反应对于病毒性肺炎是一把“双刃剑”,有益的炎症对局部组织抵抗感染具有帮助,但若COVID-19患者的炎症加剧导致免疫过度反而会危及机体,造成弥漫性肺泡损伤和纤维化、呼吸衰竭和多器官功能障碍,控制炎症反应对于控制三焦湿寒症状向危重症转变有重要意义。STAT3可被干扰素(IFN)、表皮生长因子(EGF)、白介素(IL)丝裂素激活的蛋白激酶(MAPK)等激活,介导细胞多种基因的表达,在生长、凋亡、免疫中起关键作用。有研究表明,STAT3直接抑制剂能限制细胞因子风暴和T细胞淋巴细胞减少[21]。一项针对COVID-19患者的转录组学研究显示病毒可导致淋巴细胞凋亡,其相关基因设计自噬相关基因BCL2、AKT1、MAPK、PIK3,凋亡相关基因JUN、BCL2、TNF、MAPK,p53信号相关BCL2、CDK2等[22]。提示药队多个核心成分参与调控COVID-19患者炎症、免疫、凋亡、自噬等过程,多途径多靶点整体调节湿寒症状。
本研究运用网络药理学和分子对接方法考察了三焦疫毒寒湿症P2药队治疗COVID-19的作用机制,主要从抗炎、抗病毒、调节免疫、调节细胞周期、抗癌等方面通过多途径多靶点发挥作用。值得注意的是,受制于当前对病毒和染病机制认识的不足、计算机预测方法及数据库数据可靠性等自身局限性的影响,分子对接和网络药理学预测可能会存在与实际出现偏差的情况,需要进一步深入研究。