基于网络药理学探究EGCG 干预MDA-MB-231细胞的潜在分子机制
2021-12-30宋永佳李卓渝范立强赵黎明
谢 玲, 益 钧, 宋永佳, 李卓渝, 范立强, 赵黎明
(1. 华东理工大学生物工程学院,生物反应器工程国家重点实验室,上海 200237;2. 三生国健药业(上海)股份有限公司研发中心,上海 201203)
绿茶是中国的主要茶类之一,含有丰富的多酚类成分。表没食子儿茶素没食子酸酯(EGCG)是茶多酚的主要成分之一,占毛茶总重的9%~13%,占茶多酚总重的40%~50%[1]。随着人们对茶多酚研究的深入,EGCG 的药理作用得到了广泛的认可,日常适当饮用含EGCG 的饮品对身体大有裨益。绿茶和EGCG 的潜在健康益处包括化学预防、抗氧化作用、杀菌、改善心血管健康、减肥、皮肤免受电离辐射造成的损害等,尤其是其抗肿瘤能力。经发现,EGCG对肾上腺、膀胱、乳腺、宫颈、结直肠、食管、胃、肝、肺、口腔、卵巢、胰腺、前列腺和皮肤等多种癌细胞具有体外抗癌作用[2-4]。
在中国乃至全世界,乳腺癌是威胁女性健康的主要恶性肿瘤之一,随着医疗科技的进步,乳腺癌的治疗取得良好进展。据2018 年美国国立健康组织报道,乳腺癌的5 年存活率高达90%。但乳腺癌仍然已经超越宫颈癌,成为导致女性死亡人数第一的恶行肿瘤[5-6]。乳腺癌死亡率居高不下的主要原因是具有易复发和易远端转移的特点[7]。三阴性乳腺癌作为高侵袭力的乳腺癌亚种,由于缺乏靶向药物作用的受体,治疗后三年的复发率更是高于其他亚型,导致三阴性乳腺癌的治疗面临着巨大挑战[8-9]。
有研究报道,EGCG 能够抑制乳腺癌的生长且对正常乳腺细胞几乎没有毒性,可以作为治疗三阴性乳腺癌的潜在药物[10-12]。近年来,大量研究报道EGCG 具有抗乳腺癌活性,然而其分子机制尚不完全明确,需要更多研究加以揭示。众所周知,癌症的发病机理错综复杂,而且药物发挥作用往往要通过多靶点、多通路,故“一个药物,一个靶点,一种疾病”的模式已经不适应发展趋势[13-15]。网络药理学作为一门新兴学科,能够通过数据库挖掘“药物-疾病”靶点,并构建“靶点-靶点”相互作用和“靶点-通路”相互作用,为药物作用机理的探索和发现带来极大的便利[16]。
本文从EGCG 和三阴性乳腺癌细胞MDA-MB-231 为切入点,基于数据库挖掘,结合网络药理学和体外实验,探究EGCG 作用于三阴性乳腺癌细胞MDA-MB-231 的机理,为EGCG 治疗三阴性乳腺癌提供新思路。
1 材料与方法
1.1 EGCG 作用于MDA-MB-231 的靶点挖掘和筛选
使用TCMSP 数据库 (http://tcmspw.com/tcmsp.php),GeneCards 数据库(https://www.genecards.org/)(Relevance score>1.5) 以及Swiss Target Prediction 数据库 (http://www.swisstargetprediction.ch/) (Probability*>0.8) 挖掘EGCG 的潜在靶点蛋白,利用Uniprot 数据库 (https://www.uniprot.org/) 将蛋白名称转换为对应的基因名称 (Gene Symbol),将上述获得的所有靶点取并集,得到EGCG 的潜在靶点。另外,使用GeneCards数据库 (Relevance score>5) 寻找与MDA-MB-231 相关的潜在疾病靶点,与EGCG 的蛋白靶点映射取交集后,获得EGCG 与MDA-MB-231 共同作用的潜在靶点,绘制韦恩图。
1.2 PPI 网络构建
使用String version 11.0 (https://string-db.org/) 和软件Cytoscape 3.8.0 构建PPI (Protein-protein interaction)互作网络关系。在String 中选择物种“Homo sapiens”,将蛋白关系评分设置为≥0.9,隐藏游离蛋白。利用插件cytoHubba 中的MCC(Maximal Clique Centrality)算法,计算接近中心度,筛选排名前30 的核心靶基因(Hub 基因),最后将得到的数据导入Cytoscape 中作图。
1.3 GO 和KEGG 富集
基因本体论 GO (Gene Ontology) 是基因与基因之间的关联网络,涵盖生物学的三个方面:分子功能(MF)、生物过程 (BP)和细胞组件 (CC)。KEGG (Kyoto Encyclopedia of Genes and Genomes)的PATHWAY数据库包括了详细的代谢、膜转运、信号传递等一系列功能信息。
使用Metascape (https://metascape.org/) 进行GO和KEGG 富集分析。将1.2 节中筛选得到的30 个关键靶点蛋白基因名导入Metascape,选择“Custom Analysis”进行精确分析,物种选择“H.Species”,设置P-Value≥0.01,然后点击“Enrichment Analysis”分别进行 BP 和KEGG 分析。最后整理KEGG富集结果,在Cytoscape 绘制“靶点-信号通路”互作图。
1.4 分子对接
使用PDB 数据库 (https://www.rcsb.org/) 下载βcatenin (PBD ID: 1LUJ) 的晶体结构,在PDB 数据库的搜索栏输入β-catenin,选择PBD ID: 1LUJ 的βcatenin/ICAT(Inhibitor ofβ-Catenin and Tcf)复合物三维立体结构,选择“PDB”格式并下载。将下载好的“PDB”文件用软件PyMOL 打开,选中复合物中的ICAT 部分,在对话框中输入“Remove sele”,去除ICAT,得到β-catenin 的晶体结构。
使用NCBI 数据库 (https://www.ncbi.nlm.nih.gov/structure) 下载EGCG 的三维立体结构 (PubChem SID:96079440)。
使用AutoDockTools-1.5.6 对β-catenin 和EGCG进行预处理,包括加氢、去水和计算电荷。将已经预处理的β-catenin 和EGCG 分别通过软件AutoDock Tools-1.5.6 的“Grid->Macromolecules/Ligands->Open”导入。然后设置GridBox,调整X、Y、Z轴及中心坐标轴,将β-catenin 整个蛋白涵盖在Gridbox 中,设置结束后,点击“Grid->Output->Save GPF”保存。通过“Run->Run Autogrid”运行Autogrid,运行结束后打开蛋白和小分子,设置算法和对接参数,最后点击“Run->Run AutoDock”进行分子对接。对接图片使用软件PyMOL 进行处理。
1.5 体外实验验证
1.5.1 细胞 三阴性乳腺癌细胞MDA-MB-231,购于上海中国科学院生物化学与细胞生物研究所。
1.5.2 试剂与材料 DMEM (Dulbecco′s Modified Eagle Medium)培养基、胰蛋白酶细胞消化液:江苏凯基生物技术股份有限公司;胎牛血清:美国Gibco公司;ECL (Electro Chemilumine Scence)显影液、Western-IP 裂解液:上海碧云天生物技术有限公司;聚偏氟乙烯 (PVDF)膜:英国Whatman 公司;抗β-catenin抗体、抗β-actin 抗体、羊抗兔hP 二抗:北京博奥森生物技术有限公司;牛血清白蛋白:生工生物工程(上海)股份有限公司;细胞生长因子(HGF):北京义翘神州科技有限公司;EGCG:南京春秋生物工程有限公司。
1.5.3 仪器 细胞培养箱:美国Thermo Fisher 公司;双向垂直电泳仪、电转仪:北京市六一仪器厂;化学发光成像系统:上海天能科技有限公司。
1.5.4 Western Blot 法测定β-catenin 蛋白表达量 将MDA-MB-231 分别用20 μmol/L EGCG、40 ng/mL HGF 以及EGCG 和HGF 联合预处理48 h,收集细胞总蛋白,以每孔40 ng 的上样量进行SDS-PAGE 电泳分离蛋白,然后200 mA 恒流3 h 将蛋白转至PVDF 膜上,用5% BSA 封闭2 h 后孵育一抗过夜(抗体和5%BSA 按1:500 稀释),次日清洗膜与二抗(抗体和5%BSA 按1:2 000 稀释)孵育2 h。置于化学发光成像仪下观察并拍照。
2 结果分析
2.1 EGCG 作用于MDA-MB-231 的靶点挖掘和筛选
通过检索“EGCG”,在TCMSP 中,获得141 个靶点,删除和乳腺癌无关的靶点后保留21 个;在Swiss Target Prediction 中搜索“EGCG”,设置Probability≥0.8 后,获得16 个靶点;通过GeneCards 挖掘到537 个EGCG 潜在作用蛋白,其中Relevance score≥1.5 的蛋白靶点有215 个。对3 个数据库取合集后,最终获得全方靶点246 个。在GeneCards 数据库检索“MDAMB-231”获取疾病靶点,筛选Relevance score≥5 的阈值,得到181 个靶点。将两者取交集,得到88 个靶点蛋白,如图1 所示。
图1 EGCG 和MDA-MB-231 共同潜在靶点筛选Fig. 1 Screening of common and potential targets for EGCG and MDA-MB-231
2.2 PPI 网络分析
将EGCG 和MDA-MB-231 的共同核心靶点导入到String 中,得到蛋白互作网络图,结果如图2(a)所示,同时将数据信息导入Cytoscape 进行可视化处理,得到图2(b)所示的核心靶点网络交互图,图中方块的面积表示该靶点的Degree 值,面积随着节点的互作边数量的增加而增大;方块的颜色表示MCC值,颜色越深说明该靶点在该网络中的地位越靠近中心位置。其中MAPK3、SRC和MAPK1编码的蛋白质是Degree值和MCC 值均处于前3 的靶点。核心靶点详情见表1。
表1 EGCG 和MDA-MB-231 共同潜在靶点Table 1 Common and potential targets for EGCG and MDA-MB-231
图2 核心靶点网络互作图Fig. 2 Network interaction of core targets
2.3 GO 和KEGG 富集
GO 和KEGG 富集分析结果如图3 所示,其中圆圈的大小随着基因数量的增多而增大;圆圈颜色的深浅随着显著性值(−log10(P-value))的增大而变深;横坐标表示基因数量占某个生物进程或信号通路总基因数的百分比。GO 生物过程富集结果显示,核心靶点主要参与:促进细胞迁移、腺体发育、细胞氧化应激、调节DNA 结合转录因子活性等。
图3 核心靶点的GO (a) 和KEGG (b) 分析Fig. 3 GO (a) and KEGG (b) analysis of core targets
2.4 “靶点-通路”互作网络构建
处理KEGG 富集结果,将数据导入软件Cytoscape,把“靶点-通路”互作网络可视化,结果如图4 所示。该图呈现出30 个核心靶点与16 条高富集通路的互作网络,有利于直观地观察“蛋白-通路”之间的关系。
图4 核心靶点-信号通路互作图Fig. 4 Interactions between core targets and pathways
2.5 模块分析
聚类模块代表某些蛋白互作的关键特征,并且可能包含特殊的生物进程[17]。通过GO 富集分析,获得了2 个高度连接的子网络,即聚类模块(图5)。模块1(图5 (a))包含:内分泌抵抗通路(hsa01522),乙型肝炎通路(hsa05161)和催乳素信号通路(hsa04917);模块2(图5 (b))包含:乳腺癌通路(hsa05224),癌症通路(hsa05200)和黑色素瘤通路(hsa05218)。
2.6 分子对接验证EGCG 与β-catenin 的相互作用
图5 示出的核心聚类模块分析得到的7 个关键基因中,β-catenin(CTNNB1编码产物) 、 AKT1、RB1 和FOS 为胞内关键调控因子,其中β-catenin 既与细胞因子(EGF、HGF)及其受体(EGFR)有关,又与上述胞内其他关键调控因子有联系。为验证EGCG 与MDA-MBA-231 细胞共同作用靶蛋白βcatenin 的结合情况,以EGCG 为配体,β-catenin 为受体,使用Autodock 软件进行半柔性对接,得到如图6 所示的分子对接图。由图6 可见,EGCG 可与β-catenin 的568 位谷氨酸(Glu-568)和571 位谷氨酸(Glu-571)残基形成两个氢键。
图5 核心聚类模块Fig. 5 Core clustering modules
图6 EGCG 与β-catenin 的分子对接图Fig. 6 Moleculer docking of EGCG to β-catenin
2.7 实验验证EGCG 通过HGF/β-catenin 抑制MDAMB-231 活性
为验证EGCG 可通过HGF/β -catenin 通路抑制MDA-MB-231 细胞的相关活性,本文Western Blot 实验分析了对照组、HGF 诱导组以及EGCG 和HGF 联合处理组的β-catenin 的蛋白表达量的变化,结果见图7。由图可见,与对照组相比,经过30 ng/mL 的HGF诱导后,β-catenin 的表达量显著增加;EGCG 和HGF联合处理后,β-catenin 的表达量逐渐下降,且下降幅度与EGCG 的浓度呈剂量依赖性,用100 μmol/L的EGCG 处理后的β-catenin 的表达量减少到与对照组相当水平。
图7 Western Blot 检测β-catenin 蛋白的表达Fig. 7 Expression of β-catenin identified by Western Blot analysis
3 讨 论
我国的茶文化历史悠久,可以追溯到三千多年前。茶主要分为绿茶、红茶和乌龙茶,其中,绿茶是一种不经过发酵而直接高温炒制的茶,因此茶多酚等活性成分得以保留[18]。EGCG 是茶多酚的主要成分,其抗肿瘤作用在多篇报道中得以证实[4,19-20]。三阴性乳腺癌是雌激素、孕激素和Her2 受体均为阴性的乳腺浸润性癌,由于缺乏普遍性的靶点,三阴性乳腺癌的治疗主要采用化疗方法,但是化疗对普通细胞的毒性大,给患者带来极大痛苦[21-23]。使用饮食中的天然物质辅助治疗和预防癌症的概念正受到越来越多的关注。有研究发现,EGCG 能显著抑制三阴性乳腺癌的生长而对正常乳腺细胞几乎没有毒副作用,说明EGCG 具有治疗三阴性乳腺癌的潜能[11-12]。
基于药物“多靶点,多通路”作用的思路,本文使用网络药理学对EGCG 和MDA-MB-231 的潜在靶点进行挖掘,构建“PPI 网络”和“蛋白-通路网络”,发现了多个EGCG 作用于MDA-MB-231 的潜在靶点及多条潜在信号通路,为EGCG 作为治疗三阴性乳腺癌药物的开发提供了参考。
首先,本研究通过PPI 网络互作获得30 个核心靶点,将核心靶点导入到Cytoscape 中进行可视化分析并按照Degree 值(交互数量)排序,如图2(b)所示,其中MAPK3、SRC和MAPK1编码的蛋白质是Degree 值和MCC值均处于前3 的靶点。30 个核心靶点的基因名及编码的蛋白质如表1 所示,将核心靶点进行GO 富集分析发现,EGCG 可能通过以下生物进程抑制MDA-MB-231 活性,如调节细胞迁移、腺体发育过程、细胞氧化应激、调节DNA 结合转录因子活性、调节细胞蛋白定位、响应生长因子刺激、生长发育、响应毒性耐受、代谢途径负调控、表皮细胞迁移、凋亡信号通路、调控结合能力、蛋白激酶B 信号、响应机械刺激、生殖结构发育、响应辐射、调控DNA 代谢途径、肽基酪氨酸磷酸化、正向调控蛋白定位的形成等(图3(a))。这些生物进程和乳腺癌的发生和转移的细胞学机制密切相关。例如,乳腺作为腺体的一种,由基质细胞和上皮细胞组成,两者之间的通讯中断会诱发并促进乳腺癌,即乳腺异常发育对乳腺癌的发生至关重要[24]。三阴性乳腺癌的高迁移性和侵袭力实现了原发肿瘤向其他部位转移的可能,诊治后3 年内远处复发发生率和内脏转移发生率高,是乳腺癌患者存活率低的主要原因[8-9]。因此,我们认为EGCG 和三阴性乳腺癌的发生和转移机制相拮抗,以抑制细胞迁移,促进乳腺正常发育,通过抗氧化、调节基因转录等方式来预防和治疗MDAMB-231,这与众多相关报道吻合[25-27]。KEGG 富集分析显示,EGCG 作用于MDA-MB-231 可能参与的信号通路包括:癌症信号通路、内分泌抵抗通路、胰腺癌通路、直肠癌通路、小细胞肺癌通路、FoxO 信号通路、VEGF 信号通路、线粒体信号通路、癌症相关小RNA 通路等(图3(b))。有研究报道,内分泌抵抗会导致其他受体蛋白的高表达(如FGFR1,Her2),而通过下调该蛋白的表达能逆转耐药并达到治疗的目的[28-30]。而FoxO信号通路参与细胞增殖、细胞周期控制、细胞凋亡、细胞分化、代谢和DNA 损伤修复等多种功能[31]。这些说明EGCG 不仅对癌症有预防和治疗作用外,还可能通过恢复雌激素受体基因的表达和促进细胞凋亡来抑制MDA-MB-231 活性。将KEGG 富集结果导入到Cytoscape 软件中进行可视化分析,可进一步分析靶点和信号通路之间的联系,结果如图4 所示。
基于String 的核心蛋白网络互作构建,获得MAPK3、SRC、MAPK1、AKT1、MAPK8 这5 个关键核心基因(按照Degree 从大到小排序),这5 个靶点在EGCG 抑制MDA-MB-231 活性中发挥着重要的作用(图2)。通过核心聚类模块分析获得2 个核心子网络,其中包含7 个基因(EGFR、CTNNB1、EGF、RB1、FOS、HGF和AKT1)的模块2(图5)和乳腺癌通路存在关联性。在这些基因中,HGF和EGF的蛋白产物属于细胞因子,可分别与HGFR和EGFR特异性结合进而激活下游信号通路;FOS和RB1的蛋白产物是转录因子,在调控细胞生长、分裂、增殖等方面具有重要的作用;AKT1 基因编码是一种丝苏氨酸特异性蛋白激酶,通过其丝苏氨酸激酶介导PI3K 信号传导途径,PI3K/AKT1 的上游信号途径为EGFR,参与细胞活力与增殖的控制,抑制细胞凋亡和促进细胞周期进展;CTNNB1基因编码的蛋白β-catenin 是一种粘着连接蛋白,与钙粘蛋白(E-cadherin)、α-catenin 共同组成粘附连接复合体的,通过调控细胞生长以及细胞间的粘附,对上皮细胞层的构建与维持起着重要作用。核心聚类模块2 的预测结果与已有研究报道一致,如Bigelow等发现EGCG 可抑制HGF 诱导的Met 磷酸化以及AKT 和ERK 的下游活化,并下调HGF 诱导的乳腺癌细胞的迁移和侵袭能力[32];Sen 等[33]发现EGCG通过抑制相关的调节激酶下调EGF 诱导的MMP-9的表达从而抑制MDA-MB-231 的迁移;Hong 等[34]证实EGCG 通过使β-catenin信号通路失活抑制MDA-MB-231 细胞的生长。
由于聚类模块中CTNNB1基因编码的蛋白βcatenin 是将信号从细胞质传递到细胞核的关键蛋白,且在核心聚类模块中具有较为丰富的网络关系,因此本研究选择CTNNB1进一步探讨。文献[35]利用热点分析法解析了β-catenin 和T 细胞因子结合蛋白-4(TCF4, 在核内与β-catenin 结合并诱导下游信号通路的激活的蛋白质)在晶体结构中的相互作用,发现了β-catenin 上的3 个“热点”(A、B 和C 位点)对TCF4 的结合至关重要,其中,A 位点由许多极性残基(包括Glu-571)组成,对于β-catenin 与TCF4 的结合以及β-catenin 介导的增殖信号都是至关重要的。而本文的分子对接结果显示,EGCG 也可与β-catenin的上述A 位点中的Glu-571 残基形成氢键(图6),暗示EGCG 可能通过和TCF4 竞争性结合β-catenin,进而抑制下游信号通路的激活。
本文通过实验验证聚类模块中与CTNNB1具有网络关系的HGF 是否参与了EGCG 对MDA-MB-231 的抑制作用。结果显示(图7),HGF 能够诱导βcatenin 的表达,而EGCG 能显著抑制HGF 诱导的βcatenin 的表达上调,证实EGCG 能够通过HGF/βcatenin 参与MDA-MB-231 细胞功能的调节。有研究报道,β-catenin、E-cadherin(表皮钙粘蛋白)和Met(HGFR,肝细胞生长因子受体)共定位于细胞接触区,HGF 激活Met 引起β-catenin 磷酸化以及E-cadherin表达量的降低,导致细胞间粘附丧失和转移潜力增强[36-37]。因此,EGCG 或许通过阻断HGF 对Met的激活作用抑制β-catenin 的表达,同时也为Bigelow等报道的“EGCG 能抑制HGF 诱导的MDA-MB-231细胞迁移”提供理论参考[32]。总之,体外实验结果和模块分析预测结果吻合。
综上所述,本研究通过网络药理学发现EGCG通过多靶点、多途径发挥抗MDA-MB-231 的活性,探讨了EGCG 作用于MDA-MB-231 的关键活性靶点,核心生物进程和潜在信号通路,并通过体外实验初步验证了EGCG 对MDA-MB-231 核心子网络HGF/β-catenin 的调控作用。尽管本研究还存在一定的局限性,如基于网络药理学和体外实验还不足以验证EGCG 的抗肿瘤效应,还需进一步通过动物实验和临床试验加以研究,但从较整体的层面分析了EGCG和MDA-MB-231 的互作关系,为深入研究EGCG 治疗三阴性乳腺癌的机制奠定了基础并提供了新思路。