葛根芩连汤治疗结直肠癌的潜在靶点及作用机制研究
2022-02-11蔡蓉周燕萍张金金胡作为
蔡蓉,周燕萍,张金金,胡作为,2
【提要】目的 采用网络药理学方法探讨葛根芩连汤治疗结直肠癌(CRC)的靶点和机制,通过生物信息学分析,验证CRC与邻近正常组织之间潜在靶基因的表达及预后关系。方法 利用TCMSP预测葛根芩连汤的化学成分及相关作用靶点,结合GeneCards,OMIM以及CTD数据库筛选与CRC疾病的共同靶点,通过Cytoscape软件构建药物-活性成分-疾病-靶点互作网络,并采用R软件进行GO富集和KEGG通路分析。最后,分别通过TCGA数据库和ROC、模型构建和评估的临床统计等验证了靶基因的差异表达和预后分析。结果 共收集葛根芩连汤与CRC的共同靶点153个,其中核心化合物有黄芩素、槲皮素、半枝莲素、豆甾醇等,MMP3、ALB、AKT1、VEGFA、IL1B等可作用葛根芩连汤抗结直肠癌的核心靶点。GO富集分析共得到430条结果,主要富集在G蛋白偶联神经递质受体活性,神经递质受体的活动,G蛋白偶联受体信号通路,偶联环核苷酸第二信使等。KEGG通路分析共得到72条通路,涉及Toll样受体信号通路,钙信号通路多条经典的炎症及肿瘤调节通路等。通过ROC分析探索hub genes,以及预后分析,发现MMP3在TNM 分期和风险预后模型都具有统计学意义。结论 结直肠癌中MMP3、ALB、AKT1、VEGFA、IL1B等差异表达是葛根芩连汤治疗CRC的潜在治疗靶点,通过影响Toll样受体信号通路,钙信号通路等多条信号传导发挥治疗结直肠癌的作用,体现了中药多成分-多靶点-多途径的作用特点。
结直肠癌(CRC)是全球三大癌症之一,其致死率在世界上排名第三[1],而且有研究表明,近年来CRC发病率逐年递增,甚至越来越年轻化[2]。现有的治疗方案主要包括放、化疗和肿瘤病变部位的手术切除,但是放、化疗会产生严重的毒副作用,手术治疗也会有一些并发症,效果不甚理想,同时患者的依从性和生活质量大幅度下降,导致治疗中途被迫停止或疗效欠佳[3]。因此迫切需要寻找新的治疗策略及方案,而中药及其有效成分对CRC患者在改善症状、延长生存期限、调节免疫功能和提高生活质量等方面具有独特及不可取代的优势[4]。
葛根芩连汤源自《伤寒论》,由葛根、黄芩、黄连、甘草4味药材组成,是医圣张仲景治疗表证未解,邪热入里证的经典方剂。目前研究发现,该复方化学成分复杂,王婷婷等[5]应用UPLC-LTQ-Orbitrap高分辨质谱仪从葛根芩连汤中鉴定出67个化合物,现代药理学研究表明葛根芩连汤及其药效物质在抑制炎症[6]、抗菌[7]、抗氧化[8]、保护肠道黏膜[9-10]等方面均有良好作用。然而,尽管已知葛根芩连汤的治疗效果,但其药理和分子作用机制尚未完全阐明。网络药理学为探索中国传统配方的兼容性和机制提供了有力的工具。
本研究采用网络药理学方法预测了葛根芩连汤治疗CRC的靶点和机制。通过生物信息学分析,验证了CRC与邻近正常组织之间潜在靶基因的表达,并验证了CRC中潜在靶基因与预后的关系。
1 材料与方法
1.1 数据库与软件
包括中药系统药理学分析平台(TCMSP) (http://tcmspw.com/tcmsp.php) ;靶点预测平台GeneCards(http://www.genecards.org/),OMIM(http://www.omim.org/)以及CTD数据库(http://ctdbase.org/);网络拓扑属性分析软件 Cytoscape 3.7.2;蛋白质相互作用分析平台String(https://string-db.org/) ;癌症基因组图谱TCGA(https://portal.gdc.cancer.gov/);统计分析软件R(3.6.3版本);pROC包[1.17.0.1版本];RMS 包(版本:5.1-4;https://cran.r-project.org/web/packages/rms/index.html)
1.2 葛根芩连汤的活性成分、作用靶点及结直肠癌疾病靶点的收集
应用TCMSP检索葛根芩连汤全方中葛根、黄芩、黄连、炙甘草的所有活性成分。根据研究结果,以口服生物利用度(OB) ≥30%,类药性(DL)≥0.18 为限制条件进行筛选,得到葛根芩连汤的生物活性成分,利用该平台得到相关有效成分的作用靶点。设置检索词为“colorectal cancer”,应用GeneCards,OMIM以及CTD数据库进行检索,经汇总、并集、去重后得到结直肠癌的疾病靶点。将药物靶点与疾病靶点取并集获得药物与疾病的共同靶点。
1.3 药物-活性成分-疾病-靶点互作网络构建
应用 Cytoscape软件构建药物-活性成分-疾病-靶点互作网络。网络图中“node”代表药物、活性成分、疾病和靶点,“edge”代表以上节点之间的相互关系。应用STRING和Cytoscape平台中的CytoHubba插件构建共同靶点PPI,并删去网络中游离的节点。“节点(node)”代表不同靶点,“边(edge) ”代表不同靶点之间的相互关系。
1.4 基因本体(Gene Ontology,GO) 分析和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG) 通路富集分析
采用R软件“clusterProfiler”分别进行GO富集和KEGG通路分析,并将所得结果按数值P降序排列并绘制GO及KEGG条状图,并根据富集因子值将核心通路以通路图形式呈现,设定P-adjust≤0.05作为筛选条件绘制靶点通路富集分析网络。
1.5 Hub genes在结直肠癌/癌旁表达分析
从TCGA官方网站下载OADREAD(结直肠癌) level 3 HTSeq-FPKM格式的RNAseq数据(包括51个正常组织和647个肿瘤组织),并进一步标准化为TPM值。由于所有数据均从TCGA下载,本研究不需要伦理委员会批准。采用R软件ggplot2包用于统计分析与可视化,用结直肠癌组织和正常结直肠组织作为变量生成散点图以计算hub基因的差异表达。
1.6 hub genes预后、模型构建和评估的临床统计分析
通过ROC分析探索hub基因的诊断价值,评估hub基因和生存率之间的相关性。所有统计分析通过pROC软件包实现的(Robin et al,2011)。计算出的曲线下面积(AUC)值范围为0.5~1.0,表明识别能力为50%~100%。使用Cox回归分析用于比较hub基因表达对TCGA患者的总生存期(OS)的影响以及分期的影响,构建森林图。基于Cox回归模型,选择在临床变量中的cox回归分析中P<0.05者进行分析,获得的多因素Cox中P值有意义的变量作为独立预后因素用于建立列线图,对 1 年、3 年和 5 年的预测生存概率进行个体化。RMS 包用于生成列线图,其中包括重要的临床特征和校准图。Calibration进行预后模型校准度分析,最后使timeROC包进行时间依赖性ROC曲线看hub基因在1、3、5年在结直肠癌进展和预后中的作用,其中预后数据来自一篇Cell的文章[11]。
2 结果
2.1 葛根芩连汤的活性成分及结直肠癌疾病靶点筛选
通过TCMSP数据库对葛根芩连汤中4味中药已报道活性成分进行检索,并以OB≥30%和 DL≥0.18为限制条件对其活性成分进行初步筛选,得到结果为葛根4个、黄芩36个、黄连14个、甘草92个,共收集到146个活性成分,去重后共得到140个生物活性成分(表1),并利用该平台得到相关有效成分的作用靶点,并通过Uniprot数据库将中药靶点进行基因注释。
表1 葛根芩连汤中候选的活性成分信息
续表1
续表1
续表1
通过检索GeneCards、OMIM、CTD数据库得到结直肠癌的疾病靶点,经过去重共得到1025个疾病治疗靶点。 应用R语言软件取并集获得药物与疾病的共同靶点153个,见图1A。
图1 互作网络图 A:葛根芩连汤作用靶点与疾病共同靶点韦恩图;B:葛根芩连汤-有效活性成分-疾病共同靶点互作网络,蓝色三角形为有效活性成分,橙色椭圆形为疾病共同靶点
2.2 药物的活性成分-靶点互作网络构建
应用 cytoscape构建药物活性成分-靶点互作网络(图1B),选取具有多个靶点且Degree最高的TOP 10的化合物节点(对应的Degree值分别为52、50、48、45、40、37、22、22、14、10),作用靶点为84个,由图体现了葛根芩连汤治疗结直肠癌的多靶点、多成分的特点。
应用STRING平台构建共同靶点PPI(图2A),并删去网络中游离的节点。“节点(node) ”代表不同靶点,“边(edge) ”代表不同靶点之间的相互关系,并进行Cytoscape美化,再利用插件CytoHubba插件选top20基因(图2B,表2,表3)可见蛋白互作频次较高的有ABCG2、MMP3、ALB 、CYP2C19 、CYP2D6、SCL22A8等,以上可作为葛根芩连汤治疗结直肠癌的潜在靶点。
图2 蛋白互作网络 A:STRING;B:Cytoscape美化图; C:Cytoscape+Cytohubba插件选top20基因
表2 Cytohubba算法计算结果
表3 关键靶点的拓扑参数分析
2.3 GO分析和KEGG通路富集分析
使用R软件“cluster-profiler”对以上84个靶标进行GO富集和KEGG通路分析。关键靶点的GO富集分析结果按照P由低到高排序,选取显著性排名前10的结果(图3,表4),分析结果显示葛根芩连汤具有微管结合,组蛋白激酶活性,微管蛋白结合,趋化因子的活动等分子功能,参与有丝分裂核分裂,核分裂,细胞器裂变,有丝分裂姐妹染色单体分离等生物过程,细胞组分有主轴,有丝分裂纺锤体,纺锤体微管,浓缩的染色体,着丝点区域,染色体着丝粒区域等来参与蛋白的合成,可见葛根芩连汤通过调控多个复杂的生物功能来治疗结直肠癌。KEGG 通路富集分析结果以气泡图形式呈现(图3,表4),可见葛根芩连汤的作用通路主要集中于细胞周期,卵母细胞减数分裂,细胞衰老,病毒蛋白与细胞因子及细胞因子受体的相互作用,PPAR信号通路等。以探究葛根芩连汤治疗结直肠癌可能的作用机制。并绘制了单体-靶点-通路图(见图4)。
表4 GO,KEGG分析表
续表4
图4 单体-靶点-通路图 蓝色三角形为有效活性成分,橙色椭圆形为靶点,黄色矩形为通路
表5 644例结直肠癌患者临床资料信息表 [n (%)]
图5 hub genes在结直肠癌/癌旁表达分析 ns: P≥0.05; *: P<0.05; **: P<0.01; ***: P<0.001
2.4 hub genes在结直肠癌/癌旁表达分析
根据结果,在结直肠癌中,与对照相比可以看出IL1B (B)、AKT1 (C)、CXCL8 (D)、MMP9 (E)、CTNNB1 (F)、TLR2 (H)、MPO (I)、CXCL10 (J)、MMP1 (K)、MMP3 (L)、SPP1 (N)、CD40LG (O)、PLAU (Q)、ABCG2(R)及SNAI2(T)均有统计学意义 (P<0.05)。
2.5 hub genes在结直肠癌的ROC分析
根据图6结果,在直肠癌中,与正常对照组相比,可以看出IL1B (A),CXCL8 (C),MMP9 (D),CTNNB1 (E),CXCL10 (H),MMP1 (I),MMP3 (J),SPP1 (K),CD40LG (L),PLAU (M),ABCG2 (N) 在AUC值均大于0.7,表现出较高的诊断价值。
图6 hub genes在结直肠癌的ROC分析
2.6 hub genes在结直肠癌的预后分析
根据结果可以看出,在结直肠癌疾病中,与对照组相比,MMP3(G)表达与预后相关(P<0.01),而IL1B (A),CXCL8 (B),MMP9 (C),CTNNB1 (D),CXCL10 (E),MMP1 (F),SPP1 (H),CD40LG (I),PLAU (J),ABCG2 (K)其他 10 个基因表达与预后无关(P>0.01)。因此,只有MMP3进入了模型构建的后续阶段。
2.7 hub genes在结直肠癌的森林图分析,Nomogram分析,Calibration分析,time-ROC分析
在 TCGA-结直肠癌集合中构建和验证预测列线图。对TCGA结直肠癌数据集中数据的单变量和多变量Cox回归分析验证了MMP3基因特征的显着性,其中发现其在TNM 分期和风险预后模型都具有统计学意义(图8)。此外,基于这些结果,我们开发了预测模型,并生成了列线图,分别预测 OS 和1、3、5 年生存率的概率。在hub genes在结直肠癌的time-ROC分析中我们发现1、3和5年的AUC分别达到0.766(95%CI0.689~0.842)、0.769(95%CI0.699~0.838)和0.721(95%CI0.631~0.812)MMP3在结直肠癌进展和预后中起着至关重要的作用。总之,结合预后和TNM分期模型为结直肠癌患者的总生存期提供了良好的预测潜力。
图7 hub genes在结直肠癌的预后分析
图8 hub genes在结直肠癌的森林图分析,Nomogram分析,Calibration进行预后模型校准度分析 A:单变量Cox回归分析的森林图,P<0.05的值被认为是显着的;B:列线图是基于MMP3预测预后因素建立的;C:分别用于1年、3年和5年生存率的列线图内部验证的校准图;D:MMP3在结直肠癌的time-ROC分析,列线图的时间依赖性ROC曲线分别比较1年、3年和5年总生存率
3 讨论
中医理论认为肿瘤的发生多为湿热毒聚,热久成瘤的结果,湿热伏邪为起病的关键,痰浊内阻耗阴损阳加重正虚,为肿瘤病情进展的主要环节[12]。周岱翰、郁仁存等当代国医大师对肿瘤的论治经验,热毒是肿瘤的重要病理因素之一,清热解毒法必须贯穿整个癌症治疗过程,而CRC的病性为本虚标实,即全身为虚,局部属实,且热毒内蕴为实[13]。
但中药配方总是含有不同种类的草药,并对多种靶点有影响,因此中药配方的抗肿瘤机制难以了解。网络药理学,最初由Hopkins[14-15]提出,结合系统生物学、生物信息学和多药理学是研究中药配方[16]中成分活性和靶点的有效途径。生物信息学分析是一种强大的方法,可以帮助识别肿瘤发生、进展和治疗的重要机制。综合网络药理学和生物信息学分析可以帮助我们探索中国传统癌症配方的机制。
通过TCMSP数据库对葛根芩连汤中活性成分进行检索,发现黄芩素、半枝莲素、槲皮素、豆甾醇等活性成分中与结直肠癌的共同靶点较多。研究表明,黄芩素可以介导PI3K/Akt/mTOR, NFκB, MAPK/ERK, Wnt/β-catenin等癌症关键信号通路的调控[17]。槲皮素可下调IL-6/STAT3信号通路的活性,减少炎性因子水平,阻碍肿瘤细胞的增殖,促进肿瘤细胞的凋亡,从而保护结肠炎性相关结肠癌小鼠组织损伤[18]。
本研究结合葛根芩连汤治疗CRC的潜在靶点以及 KEGG通路富集到的相关基因,发现可能主要通过基质金属蛋白酶3(MMP3)、血清白蛋白(ALB)、蛋白激酶B1(AKT1)、血管内皮生长因子A(VEGFA)、白介素1B(IL1B)等多个靶点共同作用,从而达到抗肿瘤的效果。通过KEGG 通路富集分析,发现葛根芩连汤可以主要通过细胞周期、卵母细胞减数分裂、细胞衰老、病毒蛋白与细胞因子及细胞因子受体的相互作用、PPAR信号转导通路等发挥抗肿瘤作用。再经过临床预后分析等结果显示,则可将MMP3作为本次研究中的核心基因,为后续具体的葛根芩连汤抗肿瘤机制研究提供参考。
而MMP3属于基质金属蛋白酶家族(matrix metalloproteinases, MMPs)的重要成员,是细胞外基质(ECM)合成和调节降解代谢平衡过程中存在的关键性酶之一,它能激活MMP2和MMP9,通过调节释放TGFβ1,影响肿瘤细胞的侵袭和转移、增殖等,以此在肿瘤进展及转移中起到重要作用[19-21]。蒋炳林等证明,结肠在直肠癌中MMP3、MMP7、MMP9、MMP13和MT1-MMP高表达,且MMP3的表达量是与结直肠癌的进展密切相关的,并随着结直肠癌的恶化,MMP3的表达量上升[22]。丁志祥[23]等利用生物信息学方法挖掘结肠癌的枢纽基因及潜在标志物,经验证发现CCND1、COL1A1、COL1A2、CXCL1、CXCL8、MMP1、MMP3、MYC和SPP1在结肠腺癌组织中表达显著高于正常结肠组织,为结肠癌的分子机制研究及预后判断提供了新靶点。而且已经有研究证明,一些中药组分在结直肠癌中可通过不同机制下调MMP1和MMP3的表达从而抑制肿瘤细胞增殖和侵袭[24-25]。
本研究结果表明,与癌旁组织相比,MMP3的表达在CRC中明显升高。来源于TCGA的数据也表明,对TCGA结直肠癌数据集中数据的单变量和多变量Cox回归分析验证了MMP3基因特征的显着性,其中发现其在TNM分期和风险预后模型都具有统计学意义,可能促进CRC的恶性进展和转移。因此,MMP3有望成为CRC治疗的潜在靶标。