通过网络药理学探究四君子汤在前列腺癌治疗中的机制
2020-06-08王庆哲张恩崇鞠培新宋永胜
王庆哲,张恩崇,鞠培新,宋永胜
0 引言
近年来,前列腺癌的发病率在全世界范围内逐年增长[1]。目前,前列腺癌的药物治疗以现代西药治疗为主,治疗效果尚不理想,因此开发前列腺癌的有效治疗药物是一项重要课题[2]。在之前的研究中,四君子汤已被证实具有抗癌的效果[3]。
本研究通过BATMAN-TCM(a Bioinformatics Analysis Tool for Molecular mechANism of Traditional Chinese Medicine)数据库中预测四君子汤靶向蛋白基因,然后对靶向蛋白基因进行功能富集分析,从而阐述四君子汤参与的生物学过程和机制。采用TCGA(The Cancer Genome Atlas Program)数据库中前列腺癌患者的RNA-seq数据,筛选前列腺癌和正常前列腺组织间差异表达的基因(Differentially expressed genes,DEGs)。然后通过STRING数据库构建PPI网络(Protein protein interaction network,PPI network),确定候选关键基因。最后在Gene Expression Profiling Interactive Analysis(GEPIA)数据库中再次验证候选关键基因的表达量在前列腺癌组织和正常前列腺组织之间是否有统计学差异。现报道如下。
1 材料与方法
1.1 预测四君子汤作用靶向蛋白基因 BATMAN-TCM数据库是一个探究传统中药微观分子机制的线上交互式网站,可以预测中药方剂、单药以及化合物的靶向蛋白位点,并对这些位点基因进行一系列功能富集分析[4]。本研究根据BATMAN-TCM数据库的说明文件,在该网页中输入四君子汤方剂,从而获取四君子汤含有的药材名称及靶蛋白基因列表。
1.2 对靶蛋白基因进行功能富集分析 GO(Gene Ontology)分析和KEGG通路富集分析通过大量的基因集合确定和该基因集相关的生物学过程[5]。GO分析包括细胞组件(Cellular component,CC)、生物过程(Biological process,BP)、分子功能(Molecular function,MF)。KEGG通路分析用来确定相关生物学事件的信号通路。本研究中,我们在R 3.5.2中使用clusterProfiler 软件包实现上述分析[6]。本研究选择GO分析以及KEGG分析结果中排名前十的项目,解释四君子汤的生物学行为。
1.3 筛选在前列腺癌组织与正常前列腺组织之间差异表达的靶蛋白基因 本研究对BATMAN-TCM数据库中获取的靶蛋白基因进行了筛选:筛选出在前列腺癌组织与正常前列腺组织之间差异表达的靶蛋白基因。TCGA数据库(https://portal.gdc.cancer.gov/)是一个癌症基因组学项目,从基因分子水平展示了33种癌症的2万多例原发性肿瘤及其配对癌旁组织样本[7-8]。本研究在TCGA数据库中下载了前列腺癌患者的临床信息以及RNA-seq数据。然后在R3.5.2中使用DESeq2 R软件包对RNA-seq数据进行处理并计算得出前列腺癌和正常前列腺组织间的DEGs[9]。然后选取靶蛋白基因和DEGs的交集,作为后续研究的对象。
1.4 构建蛋白互作网络筛选候选关键基因 STRING(https://string-db.org/cgi/about.pl)数据库是一个预测蛋白质之间相互作用关系的在线交互式网站,预测出来的相互作用关系包括直接作用关系(生物作用)及间接作用关系(功能相关性)[10]。PPI网络由一些蛋白质构成,每个节点代表一个蛋白质,连接蛋白质的连线代表蛋白质之间的相互作用关系。经过“2.3”项的筛选,将筛选的基因输入到STRING 数据库中,从而构建PPI网络,通过每个蛋白质在网络中的点度中心性(Degree)筛选候选核心基因。在构建PPI网络时,设定作用评分阈值为0.6。网络中每个蛋白的Degree通过Cytoscape 3.7.1中的CentiScaPe 2.2 插件计算得到[11]。Cytoscape是用于可视化分子相互作用网络和生物通路的开源软件平台。本研究选择Degree排前3位的蛋白质编码基因作为候选关键基因。
1.5 在GEPIA数据库中验证候选关键基因的表达模式 GEPIA(http://gepia.cancer-pku.cn/)数据库收集了TCGA项目和GTEx(Genotype-Tissue Expression)项目的基因组数据。GTEx项目从175位死者身上得到了1 641个尸检样本,这些样本来自54个身体部位,对几乎所有的转录基因的基因表达模式进行了观察,从而确定基因组中影响基因表达的特定区域[12]。本研究将候选关键基因输入到GEPIA数据库中,筛选出那些在前列腺癌组织和正常组织之间有统计学差异的基因作为关键基因。
1.6 探究核心基因的生物学意义 经过上述分析后,本研究获得了一个关键基因,为了证明该基因是四君子汤对前列腺癌的有效治疗靶点,通过生存分析,时间依赖性接受者操作特征曲线(Time-dependent receiver operating characteristic curve,tdROC)探索了该关键基因在前列腺癌患者中的生物学意义。在生存分析中,设定无病生存时间(Disease-free survival,DFS)代表患者预后,使用COX回归分析以及log-rank检验进行生存分析。选取该关键基因表达量的中位数为分割点,从而划分患者风险为高危或者低危。TdROC曲线选择3年、5年、7年为时间节点,通过曲线下面积(Area Under Curve,AUC)评估关键基因对患者预后的预测能力。生存分析和tdROC曲线分析均在R3.5.2中进行,其中生存分析计算通过survival软件包进行,绘图通过survminer软件包进行。TdROC的计算及绘图均通过timeROC软件包实现。
1.7 数据统计分析 本研究使用多种统计学分析方法,并在R3.5.2 中实现,在功能富集分析过程中,设定校正后P<0.05时具有统计学意义。在筛选DEGs过程中,设定校正后P<0.05,|LFC|>2为筛选标准。生存分析和tdROC曲线分析过程中,选择P<0.05具有统计学意义。
2 结果
2.1 BATMAN-TCM数据库对四君子汤的分析结果 四君子汤由陈皮、白茯苓、甘草、白芍、人参、泽泻、车前子、滑石、白术9种药材组成,包括618种化合物,根据化合物的结构,预测出1 622个靶蛋白。
2.2 靶蛋白基因功能富集分析 对1 622个靶蛋白基因进行了功能富集分析,见图1。结果显示,在生物过程中,四君子汤与膜结构的调节、循环系统的调节、细胞对药物的反应、对营养水平的反应、神经递质水平的调节、钙离子转运、肌肉系统发育等相关。在细胞组件中,四君子汤主要作用部位在跨膜转运复合体、离子通道、神经突触膜表面、神经细胞、突触后膜、受体以及突触膜固有成分上。在分子功能方面,四君子汤主要参与离子通道的门控活动、跨膜被动转运体活动、辅酶因子的结合以及配体和离子通道结合等方面。在KEGG通路分析中,四君子汤主要参与神经激活的配体受体相互作用、钙离子信号通路、cAMP信号通路、吗啡成瘾、cGMP-PKG信号通路、尼古丁成瘾、类胆碱突触、催产素信号通路、嘌呤代谢等信号通路。
图1 功能富集分析结果
2.3 筛选在前列腺癌组织与正常前列腺组织之间差异表达的靶蛋白基因 本研究在TCGA数据库中获得了540个前列腺癌样本,其中正常组织样本51个,前列腺癌组织样本489个,在R3.5.2中通过DESeq2软件包对上述样本进行基因差异表达分析。根据校正后P<0.05,|LFC|>2的筛选标准,得到了652个DEGs(图2A),然后对这652个DEGs和1 622个靶蛋白基因取交集,最终获得69个基因(图2B)。根据这540个样本的基因表达量,对这69个基因的表达情况通过热图展示(图2C),根据热图显示,69个基因在肿瘤样本和正常组织之间的表达情况分界清晰,表明数据质量良好。然后将这69个基因用于后续构建PPI网络。
2.4 构建蛋白互作网络筛选候选关键基因 将上一步骤中获得的69个基因输入到STRING数据库中构建PPI网络,在分析之前,设定相互作用评分阈值为0.6,即只有一个蛋白质和其他蛋白质之间的相互作用评分大于0.6时才会在网络中出现,对于相互作用评分小于0.6的蛋白质不做进一步分析。然后将数据从STRING数据库中下载,导入到Cytoscape 3.7.1中,对PPI网络进行可视化,结果见图3。然后再使用Cytoscape 3.7.1中的CentiScaPe 2.2 插件计算PPI网络中每一个蛋白质的Degree,选择排前3位的蛋白质编码基因作为候选关键基因:UGT1A1(Degree为8)、ALB(Degree为7)、PTGS2(Degree为6)、CYP19A1(Degree为6)和ADCY8(Degree为6)。
2.5 在GEPIA数据库中验证候选关键基因的表达模式 为了验证候选关键基因的表达量在前列腺癌组织和正常前列腺组织之间具有差异,使用GEPIA数据库查看了5个候选关键基因的表达量。结果显示,只有PTGS2在前列腺癌组织和正常前列腺组织之间的表达量具有差异,并在图4中展示了结果。PTGS2的表达量在前列腺癌组织中显著高于正常前列腺组织,可以推测PTGS2对前列腺癌的发生发展过程具有促进作用,PTGS2是一个危险因素。推测四君子汤对于前列腺癌的治疗作用可能通过抑制PTGS2的表达而实现。
图2 筛选在肿瘤和正常组织之间差异表达的四君子汤靶蛋白基因
注:A:TCGA数据库前列腺癌与正常组织间差异表达基因结果,图中每个点代表一个基因,红色代表肿瘤中显著高表达基因,绿色代表肿瘤中显著低表达基因,灰色代表肿瘤与正常样本组织之间表达无差异的基因。B:652个差异表达基因和1 622个四君子汤靶蛋白基因交集后共69个基因。C:对B中产生的69个基因在TCGA样本中的表达分布进行展示
图3 PPI网络
2.6 探究核心基因的生物学意义 从TCGA数据库中获取了前列腺癌患者的生存数据,选择前列腺癌根治术术后,并且未接受过任何其他治疗的患者。对患者进行生存分析和tdROC曲线分析,结果见图5。结果显示,PTGS2高表达的患者预后显著低于低表达组(Log-rankP=0.001,COX回归P<0.001,HR=0.6,95%CI:0.46~0.78),提示PTGS2对于前列腺癌患者是一种危险因素。TdROC曲线显示,3年时的AUC=0.700,5年时的AUC=0.671,7年时的AUC=0.792,表明PTGS2对患者预后具有良好的提示作用。上述两项结果,证明PTGS2是前列腺癌患者的危险因素,并且对于该疾病具有重要的生物学意义,也在生物机制上进一步解释了四君子汤对前列腺癌治疗的有效性。
图4 候选关键基因在GEPIA数据库中表达量情况
图5 PTGS2基因在前列腺癌中的生物意义
3 讨论
已有相关研究发现,四君子汤在胃癌、直肠癌等肿瘤中具有一定的治疗作用[13-14],而中药在肿瘤的治疗中也越来越被公众所重视,前列腺癌的治疗手段包括:保守治疗、前列腺癌根治术、放射治疗、内分泌治疗、化疗、免疫治疗以及前列腺癌晚期患者的姑息疗法。前列腺癌目前的药物治疗手段是以现代西药治疗为主,但是对于以肿瘤为主的包含多种病因的复杂性疾病,这些药物尚未达到理想治疗效果,基于这样的研究背景我们开展了本项研究。
在生物过程中,四君子汤与膜结构的调节、循环系统的调节、细胞对药物的反应、对营养水平的反应、神经递质水平的调节、钙离子转运、肌肉系统发育等相关。在细胞组件中,四君子汤主要作用部位在跨膜转运复合体、离子通道、神经突触膜表面、神经细胞、突触后膜、受体以及突触膜固有成分上。在分子功能方面,四君子汤主要参与离子通道的门控活动、跨膜被动转运体活动、辅酶因子的结合以及配体和离子通道结合等方面。在KEGG通路分析中,四君子汤主要参与神经激活的配体受体相互作用、钙离子信号通路、cAMP信号通路、吗啡成瘾、cGMP-PKG信号通路、尼古丁成瘾、类胆碱突触、催产素信号通路、嘌呤代谢等信号通路。
通过本文的生物信息学分析,确定PTGS2为四君子汤在前列腺癌治疗中的关键基因。该基因的表达量在前列腺癌组织中显著高于正常前列腺组织,推测PTGS2可能在前列腺癌中是一种危险因素。随后的生存分析和tdROC分析表明,PTGS2对前列腺癌的预后及诊断具有显著的作用,说明该基因在前列腺癌的生物学过程中具有重要地位。PTGS2又称作COX2基因,该基因参与前列腺素合成的关键步骤[将花生四烯酸转化为前列腺素H2(PGH2)][15]。PTGS2的上调还与细胞黏附增加、表型改变、抗凋亡和肿瘤血管生成有关[16]。在癌细胞中,PTGS2是产生前列腺素E2(PGE2)的关键步骤,在调节细胞活力、增殖和抵抗细胞凋亡方面发挥重要作用[17]。有报道,前列腺癌中PTGS2基因在促癌激酶(PKCε)的作用下高表达,使用PTGS2抑制剂后,小鼠模型中腺癌的发生以及血管生成减少[18]。还有研究表明,PTGS2促进前列腺癌的进展,并且可作为塞来昔布和染料木黄酮的作用靶点,可能在前列腺癌的化疗中发挥作用[19]。
本研究认为,四君子汤可通过靶向PTGS2基因抑制其表达,从而抑制前列腺癌的发生发展。本研究通过生物信息学方法预测出PTGS2为四君子汤的靶蛋白基因,然后又证明了PTGS2基因在前列腺癌组织中高表达,降低该基因的表达量可显著改善该患者的生存预后。最后通过查阅文献,发现PTGS2基因可以促进前列腺癌的发生发展。因此,本研究得出四君子汤可通过靶向PTGS2来发挥对前列腺癌的治疗作用的结论。然而本研究所有结论来自于生物信息学方法,需要在此基础上进行相应的功能学实验来验证并拓展上述结论。