基于网络药理学的党参抗胰腺癌机制研究
2022-07-05徐晓青余亚萍王炳淑范永豪郑少江
徐晓青,余亚萍,王炳淑,范永豪,揭 伟,2,郑少江,2
(1.海南医学院第一附属医院肿瘤研究所,海口 571199;2.海南医学院急救与创伤研究教育部重点实验室,海口 571199)
胰腺癌(pancreatic cancer,PC)是一种消化系统恶性肿瘤,预后极差,患者5 年生存率低于9%,大多数患者在确诊后已属疾病晚期[1]。近年来,PC 发病率呈逐年上升趋势。报道显示,我国2006 年PC 的发病率达到12.17/10 万,预计到2030 年死亡率上升为恶性肿瘤的第二位[2]。因此,有关PC 的防治逐渐成为肿瘤研究的重点之一,但目前临床有关PC 特异性筛查和治疗的标志物仍相对缺乏。
近年来发现包括党参在内的一些中药对PC 的治疗有一定作用。党参(Codonopsis pilosula)为多年生草本植物,含有皂甙、多糖和甾醇等有成分,具有抗炎[3]、抗溃疡[4]、调节免疫[5,6]和促进骨髓造血等功能[7],同时,党参抗癌作用也逐渐被发现[8,9]。有报道显示党参可能对胃癌[10]、结直肠癌[11,12]、黑色素瘤[13]、骨肉瘤[14]等肿瘤有一定的治疗效果。在PC方面,有少量报道显示党参可能通过促进细胞凋亡和抑制细胞增殖来抑制PC 的增殖[15],但确切机制不明。
新近,网络药理学在预测药物治疗疾病的药理机制方面得到较多的关注[16,17]。本研究应用网络药理学相关技术与平台,预测党参在PC 治疗中的有效化合物及潜在的作用靶点及信号通路,为基于党参治疗PC 提供依据。
1 资料与方法
1.1 党参有效化合物及其作用靶点的挖掘与筛选
中药系统药理学数据库与分析平台(Tradition⁃al Chinese Medicine Systems Pharmacology Data⁃base and Analysis Platform,TCMSP;http://lsp.nwu.edu.cn/ tcmsp.php)可帮助研究人员实现中药化合物的网络药理学分析和可视化,并确定中药成分与疾病靶点之间的关系[18]。利用TCMSP 筛选党参有效化合物(设置口服生物利用度(oral bioavail⁃ability,OB)≥30%,类药性(drug likeness,DL)≥0.18),预测与相应有效化合物对应的靶基因。通过STRING 数据库(https://string-db.org/)将所有基因名转化为“GENE SYMBOL”格式,搜索蛋白的互作关系。
1.2 筛选PC 相关疾病基因
GeneCards 是 包 含 有HUGO/GDB(Human Genome Organization/Genome Database)命名委员会认可的人类基因Web 智能检索系统[19],该数据库综合了包括所有已知和预期人类基因的基因组、转录组、蛋白质组、遗传和功能信息[20]。应用Gene⁃Cards 数 据 库(https://www.genecards.org/)筛 选PC 相关基因,设定SCORE>1 为标准筛选出PC 的靶基因。
1.3 构建党参“化合物-交互基因”网络
通 过Venny 2.1.0(https://bioinfogp.cnb.csic.es/tools/venny/index.html)制作党参有效化合物靶基因和疾病靶基因Venn 图,并通过Venn 图寻找交互基因,通过Cytoscape 3.6.0(http://manual.cyto⁃scape.org/en/3.6.0/)构建化合物-交互基因的网络分析图。Cytoscape 在Java 基础上,是一个开放源代码的网络可视化软件平台,用于研究、探索和构建大型生物网络。它可以描绘任何与网络结构和层级有关系的内容,如基因表达调控或蛋白质相互作用网络[21]。
1.4 构建蛋白互作网络
将交互基因输入到STRING 数据库的“Multi⁃ple proteins”模块,置信分数>0.4,检索目标基因的蛋白互作网络(protein protein interaction,PPI),用Cytoscape 软件查看PPI 网络,用cytoHubba 模块分析,构建关键节点基因蛋白质相互作用网络,按De⁃gree 数值大小选择网络中前10 位的靶基因作为党参抗癌治疗的关键节点基因。根据Degree 数值大小,网络中节点从低到高,颜色由黄色变为红色。
1.5 GO 富集分析和KEGG 通路富集分析
DAVID(the Database for Annotation,Visualiza⁃tion and Integrated Discovery,https://david.ncifcrf.gov/)是一种生物信息学数据库,用于筛选基因和蛋白质集合以获得生物学相关数据[22]。采用DA⁃VID 数据库富集分析“化合物-交互基因”网络中的靶基因,包括GO(gene ontology)和KEGG(Kyoto Encyclopedia of Genes and Genomes)富集分析。将GO 富集分析和KEGG 通路富集分析p 值从小到大排序,筛选出与PC 相关的前10 个GO 条目和前20个KEGG 通路。
1.6 统计学处理
各组数据均由其相应平台软件包处理。P<0.05 为差异有统计学意义。
2 结果
2.1 党参有效化合物基本信息
利用TCMSP 数据库对党参有效化合物进行挖掘与筛选,按照设置的OB 和DL 值为标准,共筛选出21 种有效化合物,见表1。
表1 党参21 种有效化合物信息Tab 1 Information on 21 effective compounds of Codonopsis pilosula
2.2 党参有效化合物作用靶点与PC 靶基因维恩分析
通过TCMSP 数据库预测党参有效化合物作用靶基因,并利用STRING 数据库将所有靶基因名转化为“GENE SYMBOL”格式,共获得98 个靶基因。通过GeneCards 数据库筛查PC 相关疾病靶基因,设置SCOR>1 为参数标准筛选出PC 的靶基因1 278个,进一步通过维恩分析获得二者交互基因共54个,见图1。
图1 党参有效化合物作用靶点与胰腺癌靶基因维恩分析Fig 1 Venny analysis of targets for Codonopsis pilosula ef‑fective compounds and pancreatic cancer target genes
2.3 党参“化合物-交互基因”网络图
通过Cytoscape 构建“化合物-交互基因”的网络分析图,在网络中拥有最多交互基因的有效化合物成分有luteolin、spinasterol、glycitein 等,见图2。这些与交互基因有相互作用关系的有效化合物可能为党参发挥抗癌作用的重要物质基础。
图2 党参“化合物⁃交互基因”网络图Fig 2 Network diagram of“Codonopsis pilosula compound-interactive gene”
2.4 党参与胰腺癌靶点PPI 网络
在STRING 数据库的“Multiple proteins”模块中输入54 个交互基因,设置置信分数>0.4,交互基因的蛋白互作检索后再使用Cytoscape 软件显示PPI 网络,见图3。
图3 党参与胰腺癌靶点之间的相互作用网络Fig 3 The interaction network of Codonopsis pilosula and pancreatic cancer targets
使用cytoHubba 模块分析,将结果构建成关键节点基因的PPI 网络,共筛选出10 个 关键节点基因,分别为CASP3、TP53、MDM2、AKT1、ESR1、BCL2L1、MCL1、HSP90AA1、CASP9和CCND1,通过该网络展现PPI 网络中关键节点基因的关系及重要性,见图4。
图4 党参与胰腺癌靶点关键蛋白的互作网络Fig 4 The interaction network of Codonopsis pilosula and the key proteins of pancreatic cancer targets
2.5 GO 富集分析和KEGG 通路富集分析
将54 个交互基因输入DAVID 数据库功能注释工具进行GO 和KEGG 富集分析。GO 富集分析包括生物过程(biological process,BP)、细胞组分(cel⁃lular component,CC)和分子功能(molecular func⁃tion,MF)三部分,结果见表2。GO:0007265~Ras protein signal transduction 是 最 显 著 的BP,GO:0005654~nucleoplasm 是 最 显 著 的CC,而GO:0019903~protein phosphatase binding 是最显著的MF。 KEGG 通路富集结果如表3 所示,其中hsa04660: T cell receptor signaling pathway,hsa04668:TNF signaling pathway 和hsa04115:p53 signaling pathway 是排名靠前的通路,其中hsa05212:Pancreatic cancer 的详细网络结构图如图5 所示。
图5 富集的hsa05212:Pancreatic cancer 通路Fig 5 Enriched hsa05212:Pancreatic cancer pathway
表2 GO 富集分析Tab 2 GO enrichment analysis
表3 TOP 20 KEGG 通路富集Tab 3 TOP 20 KEGG signaling pathways
3 讨论
PC 是消化系统恶性肿瘤,其临床诊断和治疗都极具挑战性[23]。晚期PC 的治疗以化疗为主要手段,近年来使用中医药辅助治疗肿瘤得到了较多的关注。由于党参对人体循环、免疫、消化、神经、内分泌、运动、生殖等系统均具有一定的药理作用,其在抗肿瘤方面也显示了一定的效果。陆续有少量报道提示党参具有抗突变,改善机体免疫功能,防止肿瘤形成,提高化疗疗效的作用[24-26]。但上述有限的报道均未能充分阐明党参在抗肿瘤方面的复杂网络调节机制。
本研究采用经典的网络药理学的方法,首先筛选出21 种党参的有效化合物,其中luteolin、spinas⁃terol、glycitein 等是最主要的成分,具有较理想的OB 和DL 参数。Luteolin 中文名为木犀草素,存于植物,如蔬菜、水果和中药等,属黄酮类化合物,可对抗人类恶性肿瘤,如结肠癌、肺癌和胰腺癌等。它激活细胞周期阻滞,抑制肿瘤细胞增殖,进而诱导细胞凋亡,在体外和体内皆能阻止癌症发展[27];Spinasterol 中文名菠甾醇,是一种植物甾醇,其结构类似于维生素D。它可能存在于多种植物中。它是植物细胞的关键成分,也可以转化为等效的波甾醇苷。从灵芝菌中分离出的菠甾醇以时间和剂量依赖的方式对乳腺癌和卵巢癌细胞系产生有效的抑制作用[28];Glycitein 中文 名为甘氨酸,是一种异黄酮,通 过与ROS 相关的MAPK/STAT3/NF-κB 信号通路,激活G0/G1细胞周期阻滞并诱导AGS 细胞凋亡,从而达到治疗人类胃癌的目的[29]。除外这3种主要成分外,尚有其他18 种党参有效成分值得进一步关注。
随 后,利 用STRING 和GeneCards 数 据 库,本研究筛选出98 个党参作用靶基因,这提示党参的多靶点药理学特征可能有助于其发挥抗癌作用。同时还筛选出胰腺癌靶基因1 278 个,这提示了胰腺癌发病的复杂性。随后通过分析得到54 个交互基因并绘制了Venn 图和构建化合物-交互基因网络图,体现了党参治疗胰腺癌多靶点特性及多个靶点间具有协同作用。这一网络中最关键的10 个靶点基 因 为ESR1、HSP90AA1、CASP9、CASP3、TP53、MDM2、AKT1、BCL2L1、MCL1和CCND1,为今后党参治疗胰腺癌提供了较为精准的靶点。
ER1 即雌激素受体1,是一种促进细胞存活和增殖的转录因子,在大约70%的乳腺癌中表达,可介导乳腺癌的耐药性[30]。ER1 可能与不同的蛋白激酶相互作用,产生蛋白复合物,并在雌激素信号转导过程中刺激下游分子如Akt 的激活[31]。ER 在胰腺肿瘤中的潜在作用已争论多年,但最近有报道认为ER 的表达与胰腺癌的不良预后相关[32,33]。
HSP90AA1 编码热休克蛋白90α,通常称为Hsp90α,它能够与诱导致癌的蛋白质以及参与细胞外伤口愈合和炎症反应的蛋白质相互作用。Hsp90α 在细胞中的过度表达与胰腺癌的不良预后有关。相关研究显示,胰腺癌细胞胞质Hsp90α 的表达水平明显高于正常胰腺组织,但Hsp90α 在胰腺癌细胞胞核中的表达水平较低,此外,胰腺癌细胞胞质中Hsp90α 的表达与周围神经侵犯显著相关[34]。
TP53是一种肿瘤抑制基因,其产物具有调节细胞生长、衰老和癌症的作用,TP53基因检测时常被有关人士认为是人体“基因组的守护者”。胰腺癌中存在TP53的突变[35]。相关研究确定了TP53/miR-34a 轴的一个关键靶点(SERPINE1),该靶点或可作为早期检测胰腺癌的潜在生物标记物[36]。
MDM2癌基因的扩增与肿瘤转移密切相关,MDM2癌基因的改变对于理解胰腺癌的病因和转移机制至关重要。MDM2 的阳性表达率随着胰腺癌组织中的高、中、低分化程度而逐渐增高,且差异具有显著性,在胰腺癌组织中MDM2 的表达是显著高于正常组织的[37]。
AKT1基因编码丝氨酸/苏氨酸蛋白激酶,通过磷脂酰肌醇3-激酶(PI3K),由细胞外信号通路触发。当Akt 激活时,它会移动到细胞核、细胞质和细胞的其他部分,使多种底物蛋白磷酸化,Akt 的异常活跃会引起肿瘤的发生。Akt 通路是人胰腺癌进展的主要调节因子,也是一个重要的药理靶点,在临床前模型中,Akt 和线粒体代谢的体内药理联合抑制并有效地控制了胰腺癌的生长[38]。
Bcl-2基因可抑制细胞凋亡。在多种人类肿瘤中均发现Bcl-2 的表达上调,与肿瘤的发生、发展及治疗关系密切[39]。在胰腺癌中,Bcl-2 的上调表达在Rab14 介导的胰腺癌吉西他滨耐药中发挥作用[40]。此外,某些中草药成分处理PC 细胞后可以靶向Bcl-2 而诱导细胞凋亡,凸显了Bcl-2 在PC 治疗中的靶向价值[41]。
MCL-1为髓细胞白血病细胞分化蛋白-1(my⁃eloidcell lekemia-1),属于Bcl-2 凋亡调控基因家族成员。应用RNAi 特异性靶向沉默人胰腺癌癌株PANC-1 中的Mcl-1基因,结果显示能显著诱导PANC-1 细胞凋亡,细胞增殖活力明显下降,提示靶向Mcl-1 的RNAi 技术在胰腺癌的基因治疗上具有潜在价值[42]。
细胞周期蛋白1(CCND1)在多种肿瘤中均发现过表达[43],它可以作用细胞周期蛋白依赖性激酶CDK4 和CDK6 调节细胞周期从G1期向S 期的转变,使细胞快速生长,导致肿瘤生长。相关实验显示CCND1是胰腺癌细胞miR-584 直接靶基因,此外,CCND1 的抑制作用与miR-584 过表达对胰腺癌细胞的抑制作用相似,CCND1 表达的恢复明显消除了miR-584 过表达对胰腺癌细胞的抑制作用[44]。
Caspase 全称为含半胱氨酸的天冬氨酸蛋白水解酶(cysteinyl aspartate specific proteinase),调控细胞的分化、生长与凋亡过程,并决定凋亡的形态改变和生物学变化[45]。在外来蛋白信号的作用下,Caspase-9 切割并激活Caspase-3,被激活的Caspase-3 可致细胞程序性死亡。龙辉等[46]发现,正常胰腺组织中Caspase-3 表达低于胰腺癌组织。杜缘等[47]的实验提示,正常胰腺组织中Caspase-3 表达明显高于胰腺癌组织。蒲竞等[48]的报道提示,在胰腺癌中Caspase-3 阳性表达率随肿瘤的分化程度降低而降低。以上提示,Caspase 家族成员在胰腺癌的临床进展中发挥了重要作用,但有关成员的确切表达及作用尚有待进一步明确。
本文将54 个共有靶点基因进行GO 注释和KEGG 富集分析。GO:0007265~Ras protein signal transduction 是最显著的BP。文献表明,Ras 突变与胰腺癌关系非常密切[49,50]。GO:0005654~nucleo⁃plasm 是最显著的CC,提示党参相关靶基因主要定位于核质,提示可能与下游信号的转导有关。GO:0019903~protein phosphatase binding 是最显著的MF,提示党参相关性靶基因具有重要的蛋白修饰功能。更让人兴奋的是,KEGG 通路富集结果发现,党参相关靶基因涉及的KEGG 通路主要有以下几个方面,一是与炎症和免疫调节有关,主要涉及的KEGG 包括hsa04620:Toll-like receptor signaling pathway、hsa04660:T cell receptor signaling path⁃way、hsa04668:TNF signaling pathway 和hsa04662:B cell receptor signaling pathway 等。其次是经典的信号转导通路,包括hsa04915:Estrogen signaling pathway、 hsa04012: ErbB signaling pathway、hsa04630: Jak-STAT signaling pathway 和hsa04010:MAPK signaling pathway。第三是细胞周期与凋亡调节信号,主要涉及hsa04115:p53 signal⁃ing pathway 和hsa04110:Cell cycle 通路。上述党参相关基因的异常在hsa05212:Pancreatic cancer 通路中进一步得到了体现。KEGG 信号通路的复杂性提示党参在治疗胰腺癌中可能存在多网络互作/协作的机制。
总之,本研究总结了党参有效化合物类别,预测了这些有效化合物作用于胰腺癌中的靶基因,获得关键节点基因并进行了相关GO 功能注释和KEGG 信号富集,为应用党参辅助胰腺癌的治疗提供了参考依据。本研究利用网络药理学技术,将生物信息学与药理学结合,为党参的研发提供了一种基于大数据分析可行性策略,但相关研究结果还需要后续的实验验证。
作者贡献度说明:
揭伟,郑少江:论文设计;徐晓青,余亚萍,王炳淑,范永豪:文献检索;徐晓青,余亚萍,王炳淑,范永豪:数据统计;徐晓青,余亚萍,揭伟:图表制作;徐晓青,余亚萍,揭伟:文稿撰写;郑少江:基金获取。
所有作者无利益冲突。