基于网络药理学和分子对接技术分析白屈菜红碱抗乳腺癌的作用机制
2021-07-09张新新张欣悦张富鑫张卉郭增军
张 蕾,王 敏,张新新,张欣悦,张富鑫,曹 珍,张卉,郭增军
(1. 西安交通大学药学院,陕西西安 710061;2. 陕西省植物提取物工程技术中心,陕西西安 710061;3. 西安交通大学附属西安市儿童医院,陕西西安 710003; 4. 西安交通大学第二附属医院,陕西西安 710061)
乳腺癌是女性最常见的恶性肿瘤,发病率伴随着年龄的增长而增加,已严重威胁女性健康[1-2]。目前,对乳腺癌的治疗是以手术为主,联合放疗、化疗和内分泌治疗的综合治疗模式,但是手术治疗和放射治疗主要适用于局部治疗,而用于乳腺癌化疗的药物如阿霉素、环磷酰胺和5-氟尿嘧啶等均具有较强的不良反应,并且多药耐药的产生极大地限制了治疗效果。因此,寻找高效低毒的抗肿瘤药物是当前抗肿瘤治疗领域的热点。
白屈菜红碱(chelerythrine)是一种天然的苯并菲啶类生物碱(图1),具有抗菌[3-4]、抗血小板[5]、抗炎[6]、抗寄生虫[7]、抗肿瘤[9]等多种生物活性作用。白屈菜红碱对多种肿瘤(前列腺癌、乳腺癌、肝癌、肾癌、胃癌等)显示出细胞毒活性[9 -13]。在抗乳腺癌方面,白屈菜红碱可选择性抑制三阴性乳腺癌细胞的生长,对乳腺癌MDA-MB-231细胞的半抑制浓度(IC50)为1.6 μmoL。其作用机制是通过产生活性氧而导致细胞凋亡[10,14],且白屈菜红碱可通过抑制体外MDR1和P-gp的表达来逆转乳腺癌细胞的多药耐药性[15]。以上研究表明白屈菜红碱具有发展为乳腺癌治疗药物的潜力,但白屈菜红碱抗乳腺癌的作用靶点和分子机制尚不清楚,阻碍了其进一步的研究与临床应用。
图1 白屈菜红碱的结构
网络药理学是近年来融合系统生物学、高通量筛选、计算机技术等方法研究“药物-靶点-疾病”之间复杂关系的学科,可加速药物靶点的确认[16]。分子对接技术是评估有机小分子配体与靶标蛋白相互作用的方法,其优势在于其速度和精度[17],可用以确定天然产物小分子和靶标蛋白的结合位点及结合力的大小。
本研究旨在运用网络药理学方法及分子对接技术,阐释白屈菜红碱抗乳腺癌的作用机制,为白屈菜红碱发展成为抗乳腺癌药物提供科学依据。
1 材料与方法
1.1 白屈菜红碱的反向寻靶研究利用Pubchem数据库(https://pubchem.ncbi.nlm.nih.gov/)获取白屈菜红碱的化学结构,然后将该化合物结构上传至Swiss Target Prediction 数据库(http://www.swisstargetprediction.ch/),检索可得白屈菜红碱的作用靶点集。在人类疾病数据库Malacards(http://www.malacards.org/)中检索“Breast cancer”得到乳腺癌相关靶点基因集。使用UniPort数据库中UniProt KB功能,输入药物与疾病靶点名称,获得相应靶点的UniProt号。寻找成分靶点集与疾病靶点集的重复项,这些重复项即为白屈菜红碱对乳腺癌可能的作用靶点。
1.2 白屈菜红碱潜在作用靶点互作网络构建与分析将白屈菜红碱对乳腺癌的潜在作用靶点导入String数据库(https://string-db.org/),获得所预测靶点的相互作用关系。使用Cytoscape 3.7.2软件绘制 “靶点蛋白相互作用网络”(PPI),通过软件分析计算网络拓扑参数,包括度值(degree)、介数(betweenness centrality, BC)等。
1.3 基因本体(gene ontology, GO)功能富集和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG)通路富集分析将白屈菜红碱抗乳腺癌的靶基因上传至 Metascape数据库(http://metascape.org/),获得GO功能富集以及KEGG信号通路富集分析结果。GO分类富集分析包括细胞组分(cellular component, CC)、生物过程(biological process, BP)、分子功能(molecular function, MF)3个部分,通过R语言将显著性差异排序前20位的基因富集分析结果进行可视化处理。
1.4 分子对接研究使用Chemdraw 14.0软件将白屈菜红碱的结构进行能量最小化。通过靶蛋白数据库(http://www.rcsb.org/pdb/home/home.do)获得核心靶基因的三维结构,用Discovery Studio 2016软件对受体蛋白进行预处理。使用AutoDock Vina 1.5.6软件进行半柔性对接,对接结果用Pymol与Ligplot软件进行可视化。
1.5 核心靶基因表达水平与乳腺癌患者预后的相关性分析利用Kaplan-Meier Plotter数据库(https://kmplot.com/analysis/)的乳腺癌数据集分析核心靶基因的表达与乳腺癌患者预后的关系,筛选条件:①mRNA-seq: breast cancer;②Probe set options: user selected probe set,其他选项按默认设置。
2 结 果
2.1 白屈菜红碱的反向寻靶研究从Mala Cards数据库获得乳腺癌相关的靶基因858个,Swiss Target Prediction数据库预测白屈菜红碱相关的靶点100个。将药物靶点映射到疾病靶点中,最终获得白屈菜红碱抗乳腺癌的潜在作用靶点37个(表1)。
表1 白屈菜红碱作用于乳腺癌的37个靶点
2.2 白屈菜红碱潜在作用靶点互作网络构建与分析基于STRING平台获取白屈菜红碱抗乳腺癌靶点间的互作信息,在Cytoscape 3.7.2软件中进行可视化及分析。得到白屈菜红碱抗乳腺癌靶点相互作用网络(图2),该网络包括36个节点,163条边。对靶点互作网络进行拓扑学分析,分析参数包括“度”和“中介”。度为某个节点连接的边的总数目,该参数的意义在于衡量节点间直接联系的能力,而中介性则反映了节点在网络拓扑结构中所处位置的枢纽程度。将PPI网络中节点的度值和中介性均高于平均值的节点作为白屈菜红碱抗乳腺癌的核心靶点。经计算,得到8个关键靶点(表2):哺乳动物雷帕霉素靶蛋白(mammalian target of rapamycin, mTOR),丝裂原活化蛋白激酶1(mitogen-activated protein kinase 1, MAPK1),酪氨酸激酶受体2(Erb-B2 receptor tyrosine kinase 2, ERBB2),细胞周期检控点激酶(checkpoint kinase 1, CHEK1),磷脂酰肌醇-3-激酶α单位(phosphatidylinositol-4, 5-bisphosphate 3-kinase catalytic subunit alpha, PIK3CA),组蛋白去乙酰化酶(histone deacetylase 1, HDAC1),人前列腺素内过氧化物合酶2(prostaglandin-endoperoxide synthase 2, PTGS2),丝裂原活化蛋白激酶14(mitogen-activated protein kinase 14, MAPK14)。
表2 白屈菜红碱抗乳腺癌的关键靶基因
图2 白屈菜红碱的PPI网络
2.3 GO功能与KEGG通路富集分析利用Metascape数据库对白屈菜红碱抗乳腺癌的潜在靶标进行GO分类富集和 KEGG通路富集分析。根据显著性程度,GO功能富集分析与 KEGG通路分析均以P<0.05为差异具有统计学意义。GO富集分析共获得317条GO条目,KEGG富集分析共获得80条KEGG条目。
GO分类富集分析结果中,富集比例较高、P值较小的在BP分析中为激酶活性的正调控和细胞对激素刺激的反应等;CC分析中为微管组织中心和中心体等;在MF分析中为蛋白激酶活性和组蛋白脱乙酰酶活性等。KEGG通路富集分析结果显示,白屈菜红碱抗乳腺癌靶基因主要参与PI3K/AKT信号通路、VEGF信号通路、ErbB信号通路等。将PI3K/AKT信号通路中关键靶点的分布进行可视化(图3)。并根据P值,将排名前20位的富集结果用R软件进行可视化(图4)。
图3 PI3K/AKT信号通路中关键靶点的分布
图4 GO和KEGG富集分析
2.4 核心靶基因与乳腺癌患者预后的相关性分析为了明确白屈菜红碱作用于乳腺癌的核心靶基因是否能作为乳腺癌患者预后的分子标志物,利用Kaplan-Meier Plotter数据库分析核心靶基因表达与乳腺癌患者生存期的关系(图5)。结果显示,CHEK1和PIK3CA基因低表达患者的生存期显著高于这两种基因高表达患者(P<0.05)。mTOR和PTGS2基因高表达患者的生存期显著高于两种基因低表达患者(P<0.05)。MAPK1、MAPK14、ERBB2和HDAC1基因的表达量与患者的生存期无关(P>0.05)。
图5 Kaplan-Meier Plotter数据库分析核心靶基因表达与乳腺癌患者生存期的关系
2.5 分子对接分析使用Autodock Vina 1.5.6将核心靶基因与白屈菜红碱进行分子对接分析,对接的参数设置及相应的计算结果见表3 。使用Ligplot及Pymol软件进行可视化(图6),结果显示,白屈菜红碱与核心靶蛋白的结合自由能均小于-7 kcal/mol。结合常数的绝对值越大,说明化合物所需的自由能越少,一般认为其绝对值大于7的时候,化合物和蛋白两者结合的可能性较大[18]。本研究结果显示,白屈菜红碱与核心靶蛋白结合的可能性较大。
表3 对接参数及相应计算结果
图6 分子对接结果
3 讨 论
乳腺癌已成为女性癌症死亡的第二大病因,现有的乳腺癌化疗药物存在着不良反应大、易产生耐药性、缺乏选择性等局限性,因此研究开发治疗乳腺癌的新药物具有重要意义[19-21]。苯并菲啶类生物碱是一种天然来源的异喹啉类生物碱,研究发现这类化合物对多种肿瘤细胞显示出细胞毒活性,并且能够逆转多药耐药性。主要活性成分为苯并菲啶类生物碱及其衍生物的抗肿瘤药物UkrainTM对多种肿瘤细胞显示出细胞毒活性而对正常细胞无作用,且能对肿瘤细胞起辐射增敏作用而对正常细胞有辐射保护作用[24-25]。白屈菜红碱为最早发现的一类苯并菲啶类生物碱,具有显著的抗肿瘤活性,可通过作用于BCL-2家族[12]、诱导产生活性氧[14]、影响信号转导通路[22]、抑制PKC[23]、阻滞细胞周期[8]等发挥抗肿瘤作用。因此,本研究利用网络药理学的研究方法,深入挖掘白屈菜红碱抗乳腺癌的作用靶点,旨在揭示其抗乳腺癌的作用机制并为其进一步的临床研究提供科学依据。
网络药理学为药物的作用机制研究提供了全新的视角,通过网络药理学来寻找药物作用靶点,对药物的研究具有指导意义。本研究基于反向寻靶研究策略,得到白屈菜红碱抗乳腺癌的作用靶点37个,通过对37个作用靶点构建PPI蛋白互作网络,并进行拓扑学分析,最终得到关键靶点8个,分别为mTOR、MAPK1、ERBB2、CHEK1、PIK3CA、HDAC1、PTGS2和MAPK14。有研究证实,mTOR的表达与乳腺癌预后不良有关,而很多mTOR抑制剂已经应用于临床[26-27]。 MAPK对乳腺癌及三联阴亚型的发生起重要作用[28]。ERBB2是一种致癌基因,且ERBB2高表达的乳腺癌患者对于化疗药物及激素药物反应较差[29-30]。在乳腺癌中CHEK1高表达,且过表达CHEK1 mRNA可促进乳腺癌的发生[31]。 PIK3CA基因是一种高突变率原癌基因,其突变可使多种信号通路异常,从而导致原位杂交促进癌细胞的增殖和存活[32]。研究报道,HDAC1高表达的患者预后较好,患者的总生存期和无瘤生存期均较长[33]。 PTGS2基因变异与乳腺癌易感性相关[34-35]。有研究报道,白屈菜红碱可作用于mTOR,从而发挥其抗肿瘤作用[21],支持mTOR是白屈菜红碱抗乳腺癌关键靶点的预测结果。
GO功能富集分析白屈菜红碱抗乳腺癌的靶基因,结果显示,白屈菜红碱发挥抗乳腺癌作用与细胞周期密切相关。已有研究显示,白屈菜红碱可通过诱导乳腺癌细胞系凋亡和细胞周期停滞而选择性地抑制三阴性乳腺癌细胞系的生长[10],这与本研究预测的结果一致。KEGG通路富集分析结果显示,白屈菜红碱发挥抗乳腺癌作用与PI3K / AKT信号通路密切相关。PI3K/AKT通路与乳腺癌多药耐药具有密切关系,且是调控侵袭转移的重要信号通路[36]。已有研究表明,白屈菜红碱可作用于PI3K/AKT/mTOR信号通路下调MMP-2/9的表达,从而抑制肝癌细胞的转移作用[22],结合网络药理学的预测结果,可以推断PI3K/AKT/mTOR信号传导通路是白屈菜红碱抗乳腺癌的主要作用途径,该结论为后续研究提供了思路。
Kaplan-Meier Plotter数据库包含了54 675个基因和21种癌症的生存数据,可以进行基因的临床预后相关数据的分析[37]。利用Kaplan-Meier Plotter数据库分析白屈菜红碱作用于乳腺癌的核心靶基因的生存曲线,结果显示,上述8个关键靶点基因中的CHEK1、PIK3CA、mTOR和PTGS2基因的表达量与乳腺癌患者的生存期有关。提示CHEK1、PIK3CA、mTOR和PTGS2基因可能作为乳腺癌生存和预后的指标,而这些基因可能是白屈菜红碱影响乳腺癌发生发展的关键基因。
分子对接是将配体分子放置于受体分子的活性位点,寻找其合理的取向和构象,而使配体和受体结合达到化学互补和空间互补的最佳匹配状态。反向对接是指将某一特定化合物与多个受体蛋白相结合,从而发现药物的可能作用靶点[38]。基于反向分子对接技术,将白屈菜红碱与核心靶基因进行对接,分析复合物的结合模式,结果显示,白屈菜红碱与核心靶基因具有较好的结合活性,白屈菜红碱可能通过结合核心靶基因发挥其抗乳腺癌作用。
综上所述,本研究通过网络药理学分析预测了白屈菜红碱抗乳腺癌的潜在靶点及作用机制,并通过分子对接技术阐释了白屈菜红碱与核心靶蛋白的结合模式,为抗乳腺癌药物的研发提供了科学依据。