基于实体语法系统的泽漆治疗肺癌的作用机制研究△
2021-04-19张宪宝王耘
张宪宝,王耘
北京中医药大学,北京 100029
泽漆为大戟科植物泽漆EuphorbiahelioscopiaLinn.的干燥全草,广布于全国[1]。泽漆味苦,性微寒,有毒,归肺、小肠、大肠经,具有很好的利水消肿、消痰退热、散结杀虫等功效[2]。虽然有毒,但其毒性较小[3]。在古今临床应用中,泽漆具有确切的治疗肺癌的功效。《金匮要略》中记载:“咳而脉沉者,泽漆汤主之”,因该论述太过简略,导致泽漆没有得到应有的重视[4]。随着现代中药在肿瘤治疗方面的应用效果良好,泽漆也被证实有良好的抗肿瘤活性,泽漆汤[5]、泽漆汤加减[6]、葶苈泽漆汤[7]等方剂在临床肺癌治疗中都发挥了确切的治疗作用。然而目前对泽漆的研究多为成分鉴定、分析及体内、体外活性的初步研究[8],其治疗肺癌的分子机制和途径尚不完全明确,有待深入解析。
本研究结合中药学和生物学领域多种数据库(中药成分、靶点、蛋白相互作用及疾病相关靶点等),以实体语法系统(entity grammar system,EGS)为框架,利用定性推理技术系统地推导泽漆成分的作用靶点与肺癌相关靶点的相互作用关系,解析泽漆治疗肺癌的分子机制和途径,为泽漆的进一步研究提供参考。
1 数据来源与方法
1.1 数据来源
泽漆中含有的化学成分来源于中药系统药理学数据库与分析平台[9](traditional Chinese medicine systems pharmacology database and analysis platform,TCMSP)。泽漆化学成分的靶点信息以及化学成分对靶点的作用信息(促进或抑制)来源于DrugBank[10]、STITCH[11](search tool for interacting chemicals)、BindingDB[12](bingding database)和TTD[13](therapeutic target database)数据库。蛋白质相互作用背景网络来源于String[14]数据库。为了保证应用EGS进行定性推理的准确性,本研究只采用了具有明确抑制作用或者促进作用的蛋白-蛋白相互作用(PPI)关系。肺癌相关靶点数据来源于OMIM[15](online mendelian inheritance in man)、GENE[16]、KEGG[17](Kyoto Encyclopedia of genes and genomes)和DrugBank数据库。
1.2 EGS定性推理系统的数学原理
EGS是一种形式化的语法系统,朝向复杂生物系统建模[18]。一般情况下,EGS用五元组G=(VN,VT,F,P,S)表示,其中VT(末端字符)和VN(非末端字符)指系统中的基本元素,F表示基本元素之间的结构关系,P代表由已知实体产生新实体的推理规则,S表示系统初始状态。当无需考虑或者区分末端字符和非末端字符时,实体语法系统可以用四元组G=(V,F,P,S)表示,其中V=VN∪VT。由于EGS具有可扩展性,已经被用于建立化学过程的调控工程图模型[19]并用于阐明中药的分子机制[20]。
中药具有多成分、多靶点的性质,在作用机制解析时本研究采取了如下考虑。对应给定的疾病D,中药的化学成分可以分为3个部分,第一部分为直接作用于疾病D靶点的成分,第二部分为可通过蛋白相互作用等生物作用间接作用于疾病D靶点的成分,第三部分为和疾病D靶点无关的成分。EGS利用有向网络进行推理的优点为不仅可以获得中药中直接作用于疾病的成分和靶点,也可以获得通过间接方式作用于疾病的成分和靶点。
本研究基于EGS构建泽漆治疗肺癌的作用机制解析系统:V包含各种不同的节点,中药(泽漆)、化学成分、蛋白质和疾病(肺癌);F包含包括各种节点间的关系以及相互作用;P则定义了节点之间的推理规则;S为系统的初始状态。其具体的数学原理如下。
V=V1∪V2∪V3∪V4∪V5
V1是中药的集合,此处V1={泽漆},V2是中药泽漆化学成分的集合,V3是泽漆化学成分靶标的集合,V4是人类蛋白质的集合,V5是肺癌目前已知相关蛋白的集合,其中V4⊇V3∪V5;
F={include(X,Y),com2tar(X,Y,Z),dis_tar(X),link(X,Y,Z),draw(X,Y,Z,M),step(X,Y,Z,M),minstep(X,Y,Z,M)}.
在include(X,Y)中,X=“泽漆”,Y∈V3;在com2tar(X,Y,Z)中,X∈V2,Y∈V3,Z∈{“activation”,“inhibition”};在dis_tar(X)中,X∈V5;在link(X,Y,Z)中,X∈V4,Y∈V4,Z∈{“activation”,“inhibition”};在draw(X,Y,Z,M)中,X∈V2,Y∈V4,Z∈{“activation”,“inhibition”},M∈{1,2,3,…,n};在step(X,Y,Z,M)中,X∈V2,Y∈V5,Z∈{“activation”,“inhibition”},M∈{1,2,3,…,n};在minstep(X,Y,Z,M)中,X∈V2,Y∈V5,Z∈{“activation”,“inhibition”},M∈{1,2,3,4,…,n}。
上述F中包含的基本关系类型为初始状态以及在系统推理过程中产生的全部节点关系。include(X,Y)定义中药X含有化学成分Y,本研究中X特指泽漆;com2tar(X,Y,Z)表示了中药成分X和作用靶标Y之间的作用关系为Z;link(X,Y,Z)定义了蛋白质X和蛋白质Y之间的作用关系为Z;draw(X,Y,Z,M)定义了中药成分X经过M步以作用方式Z作用于蛋白质Y;step(X,Y,Z,M)表示中药成分X经过M步以作用方式Z作用于肺癌相关蛋白Y,而minstep(X,Y,Z,M)则表示中药成分X作用于肺癌相关蛋白Y所需的最小步数。值得注意的是,在不同的节点关系中,变量X、Y、Z、M、N等可表示不同的意义,而在相同的节点关系中尽管表示变量的字母不同,其含义相同,即字母在变量中的位置决定变量的具体含义。
P=P1∪P2∪P3∪P4∪P5∪P6∪P7,
P1={include(H,X),com2tar(X,Y,R) ⟹ draw(X,Y,R,1)},
P2={draw(X,Y,“activation”,N),
link(Y,B,“activation”),M=N+1 ⟹ draw(X,B,“activation”,M)},
P3={draw(X,Y,“activation”,N),
link(Y,B,“inhibition”),M=N+1 ⟹ draw(X,B,“inhibition”,M)},
P4={draw(X,Y,“inhibition”,N),
link(Y,B,“activation”),M=N+1 ⟹ draw(X,B,“inhibition”,M)},
P5={draw(X,Y,“inhibition”,N),
link(Y,B,“inhibition”),M=N+1 ⟹ draw(X,B,“activation”,M)},
P6={draw(X,Y,Z,M),dis_tar(D),Y=D⟹ step(X,D,R,M)},
P7={#min{M:step(X,D,R,M)}=W,step(X,D,R,W) ⟹ minstep(X,D,R,W)}.
规则P1用来推理中药泽漆的化学成分和靶点之间的关系并作为推理的起点;规则P2~P5用来推理中药化学成分到肺癌相关蛋白的作用关系和所有路径的距离,在此可根据具体研究设置不同对N作限定;规则P2中X到Y的作用方式为“activation”,Y到B的作用方式为“activation”,则X到B的作用方式为“activation”,同理可了解P3~P5中包含的另外3种作用方式的推理;一个化学成分作用于某个疾病相关蛋白可能经过多条路径。
S=S1∪S2∪S3,
S1={include(H,X),com2tar(X,Y,R),link(X,Y,R)},
S2={dis_tar(X)},
S3={draw(X,Y,R,1)}.
S1是用EGS用来研究推理的具体初始信息,包括中药泽漆含有的化学成分、成分作用靶点及人类蛋白质相互作用信息;S2代表推导的终点,即肺癌已知相关靶点;S3代表推导的起点,用数字1标记作为推导的第一步。
1.3 分子对接
为保证EGS推理的可靠性,采用分子对接技术对利用相似性搜索获得的成分靶点关系进行验证。靶点蛋白晶体结构从PDB(protein data bank)数据库中搜索下载,优先选择含有相应生物活性配体且分辨率高的蛋白晶体。将获得的蛋白晶体进行删去配体分子和水分子、补全不完整氨基酸残基、删除多余蛋白质构象和加氢等预处理。利用LibDock工具,conformation method 参数设置为“BEST”,docking preferences参数设置为“High Quality”,其余参数为默认,进行分子对接。记录分子对接打分值LibDock Score,选取最优构象分析小分子和蛋白晶体间的相互作用。
1.4 富集分析
利用富集分析进一步研究由EGS推理获得的泽漆治疗肺癌的作用靶点。DAVID[21](the database for annotation and integrated discovery)是一个生物信息数据库,为研究人员提供了一套全面的基因功能注释工具,以了解大量基因背后的生物学意义。本研究将泽漆的直接和间接作用靶点以“Entrez Gene ID”的形式导入DAVID数据库,在人源(homo sapiens)范围内,对泽漆的作用靶点进行基因本体(GO)富集分析和KEGG通路富集分析。对所得结果(P<0.05)按照命中靶点的数目进行降序排序,选取排名靠前的结果,从细胞组件、分子功能、生物过程和生物通路等多方面、多层次地解析泽漆治疗肺癌的潜在作用机制。
2 结果与讨论
2.1 泽漆化学成分筛选及靶点检索
在TCMSP数据库中获得了泽漆的79个化学成分。使用类药五原则和口服生物利用度(OB)值对成分进行筛选,最终得到成药性和生物利用度较好的成分14个,相关信息见表1。本研究中采取的具体规则为相对分子质量(MW)≤ 500;脂溶性(AlgP)≤5;氢键供体数目(HD)≤5;氢键受体数目(HA)≤10;OB≥30.00%。
从TTD、DrugBank、BindingDB、PubChem等数据库检索了表1中14个泽漆化学成分的靶点及具体生物实验作用信息,以便于进一步的EGS推导,其中异嗪皮啶、泽漆内酯B、泽漆内酯C、天芥菜碱性、嘌呤、4′,5-二羟基-7-甲氧基黄烷酮6个化学成分的靶点信息由结构相似性搜索得到。为保证后续用于EGS进行定性推理的可靠性和准确性,本研究仅采用具有明确的促进和抑制作用的“成分-靶点”作用关系,以保证网络的有向性。成分酒石酸未在已有数据库找到其确切作用的靶点信息,其余13个成分的靶点信息及作用方式见表2。
表1 泽漆化学成分详细信息
表2 泽漆化学成分靶点及具体作用信息
2.2 肺癌靶点检索及EGS推理背景网络构建
采用数据库检索的形式,以“lung cancer”为关键词,限定物种为人源(homo sapiens),在OMIM、GENE、DrugBank和KEGG数据库中检索,取4个数据库结果的并集,获得肺癌相关靶点445个。
选取STRING数据库中人源(homo sapiens)PPI信息(文件名9606.protein. actions.v11.0.txt.gz),筛选其中具有明确抑制或激活作用的PPI关系,选取打分值(score)≥0.700的有向PPI关系作为后续EGS推导的背景网络,其中包含节点(蛋白)3560个,边19 466条,其中激活关系16 186条,抑制关系3280条。
2.3 EGS推理结果
2.3.1泽漆化学成分分析 通过EGS的定性推理,泽漆有7个潜在化学成分直接或间接地作用于55个肺癌相关靶点,进而对肺癌起到了治疗作用(图1)。7个潜在化学成分分别是木犀草素、槲皮素、山柰酚、没食子酸甲酯、没食子酸、泽漆内酯B、泽漆内酯C;泽漆的55个肺癌相关靶点中有11个直接作用靶点和44个通过PPI调控到的间接靶点。木犀草素是四羟基黄酮类化合物,具有消炎、抗过敏、抗肿瘤等多种药理活性。研究发现木犀草素既可以抑制非小细胞肺癌A549细胞的增殖、侵袭和迁移能力[22],又可以抑制小细胞肺癌H1688、H446细胞的增殖、侵袭和迁移能力[23]。槲皮素为黄酮类化合物,具有抗肿瘤作用,可以抑制A549细胞增殖并促进其凋亡[24],并且可以显著抑制A549细胞的迁移和侵袭能力[25]。山柰酚是黄酮醇类化合物,具有抗肿瘤、抗氧化及组织保护等多种作用。研究表明,山柰酚可诱导肺癌H446细胞的细胞周期阻滞,上调H446细胞中的p53和Bax蛋白表达,下调Bcl-2蛋白表达,诱导细胞凋亡[26]。没食子酸是天然植物多酚类化合物,可以通过抑制信号传导与转录激活因子3(STAT3)信号通路,产生对A549细胞的生长抑制及凋亡诱导作用[27]。
此外,由于初始数据中的泽漆内酯作用靶点信息来源于化学相似性搜索,故采用分子对接技术对泽漆内酯B和泽漆内酯C与其靶点三磷酸腺苷结合盒转运蛋白2(ABCG2)间的作用关系进行确认。对接采用的ABCG2蛋白晶体的PDB编号为6ETI[28],解析度为0.31 nm,该蛋白晶体共有A~F 6条链,作用位点在A链和B链之间。采用LibDock工具,将蛋白晶体和配体小分子以柔性的方式进行对接,结果见表3。泽漆内酯B和泽漆内酯C具有较高的分子对接打分值(表3),同时,分析泽漆内酯B和泽漆内酯C与ABCG2之间的相互作用也具有相似性(图2)。可以作为ABCG2的潜在抑制剂。值得一提的是,ABCG2参与多种肿瘤的多药耐药过程。有研究表明,泽漆提取物可以逆转胃癌SGC7901/DDP细胞的多药耐药性,这既能佐证泽漆内酯B、泽漆内酯C和ABCG2的潜在作用关系,也表明泽漆中的成分不仅可以抗肿瘤,同时也有逆转肿瘤多药耐药的作用。
注:不同的图形代表不同的实体;V形节点代表泽漆的化学成分;长方形节点代表作用靶点,深红色为实体语法系统推理得到的泽漆治疗肺癌的直接作用靶点,紫色为间接作用靶点;箭头的指向代表作用的方向,红线三角形箭头代表正向(activation)调节作用,T形箭头代表负向(inhibition)调节作用;实线代表直接相互作用;虚线代表间接相互作用。
表3 漆内酯B、泽漆内酯C和6ETI的分子对接结果
2.3.2泽漆潜在靶点GO富集分析 将EGS推理得到的55个潜在肺癌治疗靶点进行GO富集分析(限定P<0.05)。结果表明,泽漆55个潜在肺癌治疗靶点参与了28个分子功能(molecular function,MF)相关术语、15个细胞组件(cellular component,CC)相关术语以及74个生物过程(biological progress,BP)相关术语(图3)。MF主要与蛋白质结合(protein binding)、ATP结合(ATP binding)以及蛋白激酶活性(protein kinase activity)等术语有关,尤其是蛋白质结合,有45个潜在靶点与之相关,表明这些蛋白通过选择性的非共价作用与其他蛋白或者蛋白复合物结合而发挥作用。CC主要与胞质溶胶(cytosol)、质膜(plasma membrane)、核(nucleus)、细胞质(cytoplasm)等术语相关,提示这55个潜在靶点在细胞中较为分散,有利于对癌细胞发挥综合的调控作用。BP主要涉及凋亡过程(apoptotic process)、细胞增殖的正调控(positive regulation of cell proliferation)、细胞表面受体信号通路(cell surface receptor signaling pathway)等术语。
值得关注的是,在治疗癌症时,会采用抑制癌细胞增殖或者促进癌细胞凋亡的手段,然而生物过程却富集到了细胞增殖的正调控、凋亡的负调控。结合泽漆成分与靶点间的关系(图1)可知,泽漆的相关成分主要对增殖的正调控靶点以及凋亡的负调控靶点产生抑制作用,也就是实际上产生了抑制细胞增殖和促进细胞凋亡的作用。半胱氨酸天冬氨酸蛋白酶-3(CASP3)是细胞凋亡过程中最主要的终末剪切酶,也是杀伤性T细胞(CTL)杀伤机制的重要组成部分。没食子酸和木犀草素可以直接正向激活CASP3(图1),起到促进凋亡的作用。由此可见,通过有向网络图可以有效获取正确的生物调控信息。
2.4 通路富集分析
为了进一步确认泽漆治疗肺癌的多成分、多靶点、多途径的具体作用机制,本研究将EGS得到的55个潜在靶点进行了KEGG通路富集分析,以探究更深层次的作用机制。结果表明,泽漆55个潜在靶点中有44个被富集到了29个KEGG通路(P<0.05)中,按照命中靶点数进行降序排序,取前10个信号通路(图4)。通路分析结果表明,泽漆潜在靶点发挥效应主要和癌症涉及通路(pathways in cancer)、丝裂原活化蛋白激酶(MAPK)信号通路(MAPK signaling pathway)、Rap1信号通路(Rap1 signaling pathway)、磷脂酰肌醇3-激酶(PI3K)-蛋白激酶B(Akt)信号通路(PI3K-Akt signaling pathway)、黏附连接(adherens junction)等通路有关。
注:红色字体表示A链中的氨基酸残基;黑色字体表示B链中的氨基酸残基。
图3 泽漆潜在作用靶点GO富集分析结果
图4 泽漆潜在作用靶点KEGG通路富集分析结果
MAPK级联是一个高度保守的模块,参与细胞增殖、分化和迁移等多种细胞功能。哺乳动物至少表达4组明显受调控的MAPKs,即细胞外信号调节激酶1/2(ERK1/2)、Jun氨基末端激酶1/2/3(JNK1/2/3)、p38蛋白α/β/γ/δ(p38α/β/γ/δ)和ERK5,分别由丝分裂原活化蛋白激酶激酶1/2(MEK1/2)、MKK4/7、MKK3/6、MEK5特异性激活。然而,每个MAPKK可以由多于1个的MAPKKK激活,增加了MAPK信号通路的复杂性和多样性。经过实体语法系统推理,泽漆成分中的木犀草素可以抑制生长因子(GF),槲皮素和没食子酸甲酯可以抑制生长因子受体(EGFR)酪氨酸蛋白激酶(RTK),经过MAPK信号通路的级联反应起到抑制细胞增殖的作用(图5)。细胞凋亡即程序性细胞死亡。Caspase-3是细胞凋亡下游的执行者。泽漆成分中的没食子酸和木犀草素可直接激活Caspase-3,从而促进细胞凋亡(图5)。
PI3K-Akt信号通路被多种细胞刺激或毒性刺激激活,具有调节细胞的转录、翻译、增殖、生长和存活等基本功能。PI3K催化细胞膜产生磷脂酰肌醇-3,4,5-三磷酸(PIP3)。PIP3反过来作为第二信使帮助激活Akt。一旦被激活,Akt可以通过磷酸化参与细胞凋亡、蛋白质合成、新陈代谢和细胞周期的底物来控制关键的细胞过程。周期蛋白依赖性激酶1(CDK1)调控细胞从G2期到M期,使细胞进入细胞分裂周期进行增殖。槲皮素可抑制CDK1从而抑制细胞有丝分裂,使细胞无法增殖。泽漆中的木犀草素和没食子酸甲酯通过抑制PI3K-Akt通路上游(GF和RTK,图5)进而间接抑制Akt的活性起到促进肺癌细胞凋亡的作用。
图5 泽漆治疗肺癌潜在作用机制
经EGS推理,泽漆可能主要通过2个方面治疗肺癌:1)抑制肺癌细胞增殖。泽漆可能通过木犀草素对GF的抑制、没食子酸甲酯和槲皮素对EGFR的抑制及槲皮素对CDK1的抑制,起到了抑制肺癌细胞增殖的作用。2)促进肺癌细胞凋亡。泽漆成分中的没食子酸和木犀草素可直接激活Caspase-3促进肺癌细胞凋亡,也可能间接抑制Akt的活性(抑制上游GF和RTK)起到促进肺癌细胞凋亡的作用。此外,泽漆中的泽漆内酯B和泽漆内酯C具有潜在的ABCG2抑制活性,发挥逆转肺癌肿瘤多药耐药的功效。
3 总结与展望
本研究综合利用中药成分数据、化学成分活性实验数据及人类PPI数据,通过EGS对有向网络进行推理,获得了木犀草素、槲皮素、山柰酚、没食子酸甲酯、没食子酸、泽漆内酯B、泽漆内酯C共7个泽漆治疗肺癌的潜在活性成分,并得到了11个治疗肺癌的直接作用靶点和44个间接作用靶点。EGS具有强大的融合和推理能力,在中药研究中有待发挥更大的作用。本研究利用由EGS获得的更丰富、更全面的信息,结合成分靶点关系、GO富集分析、KEGG通路富集分析等多层次的分析手段,系统地解析了泽漆治疗肺癌的潜在分子作用机制,为泽漆治疗肺癌的应用和肺癌的治疗提供了参考。泽漆在肺癌治疗中能抑制肿瘤细胞增殖、促进肿瘤细胞凋亡,同时还具有潜在的逆转多药耐药的功效,有待进一步研究与应用。