APP下载

基于生物信息学手段筛选对肾透明细胞癌具有潜在干预作用的天然活性成分及中草药

2021-06-23徐易德陈琪白雪莹韩亚录张云霞常福厚

药学研究 2021年5期
关键词:中草药化合物数据库

徐易德,陈琪,白雪莹,韩亚录,张云霞,常福厚,2,3

(1.内蒙古医科大学药学院,内蒙古 呼和浩特 010000;2.内蒙古自治区新药筛选工程研究中心,内蒙古 呼和浩特 010000;3.内蒙古医科大学新药安全评价研究中心,内蒙古 呼和浩特 010000)

肾细胞癌(renal cell carcinoma,RCC)作为最常见的肾癌形式,约占成人癌症的2%~3%[1],其中接近25%~30%的RCC患者被诊断为局部晚期甚至转移阶段,严重威胁人类的健康和生命[2]。临床病理学分析大多数RCC属于透明细胞亚型(clear cell renal cell carcinoma,ccRCC),其中约10%为乳头状亚型,5%为嫌色细胞型,其他亚型如集合管癌、移行细胞癌和髓样癌约占5%~10%[3]。RCC的治疗方式包括手术切除和放疗,治疗药物包括VEGF和VEGF-R抑制剂,mTOR抑制剂以及免疫检查点抑制剂(immune checkpoint inhibitors,ICI)近几年也同样受到关注[4-6],然而,肿瘤对化疗不敏感性以及逐渐形成多药耐药性,是治疗RCC的难点之一。因此需要寻找更加合适的治疗方式。

随着中医药现代化的发展,在中药中寻找干预癌症的天然化合物的研究愈发涌现。本研究利用生物信息以及网络药理学方法,筛选ccRCC癌变和进展的差异表达基因 (differentially expressed genes, DEGs),探究ccRCC相关机制,接着通过文本挖掘寻找可影响关键靶点的天然化合物,借助在线数据平台反向寻找含有目标化合物的中药,为中医药干预ccRCC的研究铺垫基础工作。

1 资料方法

1.1 肾透明组织基因表达谱数据获取 ccRCC芯片数据GSE781[7]源于美国国立生物技术信息中心(NCBI)中的GEO数据库[8](Gene Express Ominibus,http://www.ncbi.nlm.nih.gov/geo),该数据集包含17个组织样品的基因芯片表达谱,其中12例ccRCC组织和5例邻近癌症的正常组织。每个总RNA样品均与两个不同的阵列杂交:Affymetrix U133A(GPL96,Affymetrix Human Genome U133A Array)和U133B(GPL97,Affymetrix Human Genome U133B Array)。

1.2 筛选癌症差异表达基因 借助GEO2R在线分析工具(http://www.ncbi.nlm.nih.gov/geo/geo2r),为精准筛选差异目标,将P<0.05和∣log2(fold change)∣>2为截取标准,进行ccRCC 组织相对正常邻旁组织的 DEGs 分析。并利用Venn[9](http://www.biovenn.nl/index.php)统计两组共有的上、下调基因。

1.3 差异基因的功能富集 为明确DEGs的功能以及分布区域,对其进行基因功能富集分析,包括生物过程(biologicalprocess,BP)、分子功能(molecular function, MF)和细胞成分(cellular component, CC)。将DEGs导入DAVID 数据库[10](https://david.ncifcrf.gov/)进行基因功能富集的同时预测DEGs映射的KEGG通路。

1.4 PPI网络筛选核心基因 STRING 数据库[11]https://string-db.org/cgi/input.pl)可以预测蛋白质及研究蛋白质间的相互作用关系。将DEGs导入STRING数据库计算后可视化展示,可视化条件为combine score≥0.7,在隐藏孤立及部分连接节点后,构建蛋白质相互作用网络图(protein protein interac-tion,PPI),使用Cytoscape软件中的cytohuba插件基于重要程度筛选关键基因。

1.5 核心基因的预后分析 运用基因表达谱动态数据库GEPIA[12](http://gepia.cancer-pku.cn/),以标准条件∣log2(fold change)∣>1、P<0.01对筛选得到的核心基因在ccRCC进行表达水平的验证,验证背景JitterSize=0.4,匹配数据库为TCGA以及GTEx。同时评估利用生存曲线明确核心基因在ccRCC患者中的预后价值。

1.6 影响核心基因的潜在中药成分 明确具有预后价值的核心基因后,借助在线工具毒性与基因比较数据库 CTD[13](http://ctdbase.org/)搜索基于文献报道与核心基因具有相互作用的化合物,对得到的化合物进行整理分类得到天然化合物。

1.7 基于潜在化合物反向筛选中药 得到目标天然化合物后,反向筛选含有目标化合物的中草药,分析过程利用TCMSP[14](https://tcmspw.com/index.php)数据库探索。

2 结果

2.1 ccRCC对于正常组织中的DEGs 对基因芯片GSE781进行分析,在GPL96中筛选到 552个差异DEGs,包括264个上调基因和258个下调基因 (见图1A); 在GPL97中检测到220个显著DEGs,包括110个上调基因和110个下调基因(见图1B)。将两组中共有357个上调基因,353个下调基因定义为ccRCCDEGs(见图1C/D)。

图1 ccRCCDEGs火山图及Venn图

2.2 筛选获取的核心基因 将ccRCCDEGs输入到STRING数据库,利用Cytoscape软件处理PPI网络图,利用MCODE插件对目标网络进行分析,Degree Cutoff:2,其余参数默认。得到27个模块,图中展示分数前五的模块(见图2A),结果得到模块基因大多为上调基因。利用cytohuba基于degree筛选排名前20的基因为核心基因(见图2B)。

图2 基因模块图及核心基因

2.3 Hub基因在ccRCC标本中表达验证及其与患者预后生存的关系 GEPIA验证了筛选的20个Hub基因中有15个在ccRCC标本中高表达,2个基因显著下调,与正常组织标本形成鲜明对比(见图3)。为了进一步探究Hub基因对ccRCC预后的影响,利用Kaplan Meier plotter确定Hub基因的生存数据,发现特有的9个Hub基因均与ccRCC患者预后不良相关(见图4),ASPM、BUB1、C3、KIF20A、RRM2、TOP2A的高表达的总生存期更低,EDN1、PTPN11、VWF的低表达对生存时间更有利。

图3 GEPIA数据库验证图

图4 生存曲线验证图

2.4 ccRCCDEGs涉及的生物过程、分子功能、细胞成分和信号通路 为了解差异基因模块中有相互作用的基因富集情况,将ccRCCDEGs导入David网站进行GO及KEGG富集分析。富集结果证明在疾病发生发展过程中涉及较多生物功能,其中生物过程包括氧化还原过程、排泄、对药物的反应、对缺氧的反应、白细胞迁移等,分子功能包括蛋白质二聚活性、运输活动、受体结合、无机阴离子交换活性、肝素结合等,细胞定位在细胞外泌体、质膜的组成部分、顶质膜、细胞外空间、基底外侧质膜等。在KEGG信号中富集到PPAR信号通路、碳代谢、甘氨酸,丝氨酸和苏氨酸的代谢、代谢途径、乙醛酸和二羧酸的代谢、缬氨酸,亮氨酸和异亮氨酸的降解、PI3K-Akt信号通路、柠檬酸盐循环(TCA循环)、泛酸和CoA生物合成等信号通路。

2.5 反向筛选可能影响关键基因的天然化合物及中药 研究将有明确差异以及有预后意义的BUB1、C3、KIF20A、RRM2、TOP2A基因确定为目标继续探究,筛选后得到影响目标基因的天然化合物共72个,分析发现不同化合物对同一目标基因的表达是不同的,如雌二醇可以导致TOP2A mRNA表达增加,而儿茶素却导致TOP2A mRNA表达水平下降。而同一种化合物对得到的不同目标基因影响趋势也不一致,如甲基睾丸激素使RRM2 mRNA表达增加,但却诱导TOP2A mRNA表达降低,具体内容如图5。探索所含筛选化合物的中草药,结果发现每一种化合物至少对应一种中草药,其中含有如槲皮素的中草药要多达188种,篇幅限制,表1中列出药物最多十种。

表1 含有目标化合物的中草药

图5 影响目标基因的化合物信息及关系

3 讨论

ccRCC早期并无明显症状,临床诊断不仅缺乏前期诊断标志物,而且容易转移,多数患者确诊时已发生转移,导致预后差、死亡率高,因涉及基因突变、表观遗传、编码及非编码基因表达变化等诸多因素,导致病理发生机制复杂,以至临床治疗手段受限[15]。外科手术切除虽然是原发性肾癌的第一选择,但总体预后较差,分子靶向治疗也存在个体差异,药物耐受、费用昂贵等问题依旧对临床治疗提出新的挑战。

在我国,中医药作为癌症的治疗手段已经广泛应用于临床抗癌,从患者的全身特点和病程考虑用药,而不只局限在癌症病灶本身,在癌的综合治疗中发挥了独特的作用。传统中医理论认为“正气存内,邪不可干”,个体的体质是决定机体发病的内在条件,体质因素在某种程度上决定个体对肿瘤的易感性[16]。利用现代医学观念阐述此话,则为行使相似功能的蛋白表达水平不同,故利用基因表达芯片数据分析ccRCC与正常人的差异基因,探究在疾病过程中异常表达的蛋白差异程度,得到结果为BUB1, KIF20A等目标基因高表达。BUB1是一种丝氨酸/苏氨酸蛋白激酶,在有丝分裂早期被召集,可促进着丝粒纺锤体组装检查点(soindle assembly checkpint SAV)的组装。BUB1被Mps1激酶磷酸化后,招募有丝分裂检查点复合体(mitotic checkpoint complex,MCC),发出有丝分裂后期的信号[17]。有明确研究发现BUB1在子宫内膜癌[18]、卵巢癌[19]、乳腺癌[20]等多种癌症中高表达,证明与肿瘤发生、侵袭和转移相关,并参与细胞增殖、肿瘤干细胞潜能等多个过程。KIF20A(Kinesin family member 20A)是驱动蛋白Kinesin6家族成员,涉及关键细胞功能,包括细胞器和囊泡胞内运动、纺锤体形成和胞质分裂,其表达水平和活性参与细胞内转运和细胞分裂的调控,在癌症发生发展中起着重要作用[21],研究证明如果沉默KIF20A,可以诱导抗紫杉醇乳腺癌细胞MCF-7的有丝分裂障碍,抑制增殖活性[22]。当敲低KIF20A亦可抑制肝癌细胞的增殖,并且使细胞周期阻滞在G2/M期,出现多核细胞,可能由于胞质分裂异常引起[23]。以上均证实抑制KIF20A基因的表达时,可发挥诱导细胞凋亡、改变细胞周期、血管生成和抑制转移作用[24]。RRM2(核糖核酸还原酶亚单位M2,ribonucleotide reductase M2)基因是细胞凋亡的重要调控基因,在各种恶性肿瘤中都有表达,同时与肿瘤生长和浸润呈正相关,与肿瘤耐药的形成有密切关系[25]。细胞在S期时,RRM2表达最高,调控细胞周期相关蛋白,显著促进了肿瘤细胞的生长和侵袭,与肿瘤生长密切相关。目前对 RRM2的研究不多,主要集中在胰腺癌、膀胱癌、胃癌上。RRM2与DNA合成代谢相关,导致DNA抗损伤能力增加而出现耐药,抑制RRM2的表达则降低肿瘤细胞DNA的抗损伤能力,通过沉默RRM2基因,胃癌细胞对不同浓度顺铂敏感性显著提高[26-27]。

表1(续)

表1(续)

TOP2A(拓扑异构酶Ⅱα)又称旋转酶,参与机体内基因复制、细胞增殖等过程[28]。具有明显的细胞周期特异性,在细胞增殖S期末和G2/M过渡期高表达,而在有丝分裂结束后表达下调,当细胞停止增殖活动时,TOP2A的表达则受到抑制[29],研究指出,TOP2A是影响胃癌患者总生存期的独立危险因素[30]。以上讨论证明利用生物信息学方法筛选得到潜在干预靶点准确,但中药成方制剂直接作用上述靶点研究较少,可能为中医并无“肾癌”病名,对于以痛性血尿、腰痛、腰部或上腹部肿块等临床表现中医将肾癌归属 “尿血”“症积”“肾积”“中石疽”等病的范畴[31], 肾癌为本虚标实病机,临床中化痰除湿解毒以及活血化瘀应各有侧重。预测到药物中豆蔻为芳香化湿药,川芎、乳香等为活血化瘀药符合上述辩证观,今后的治疗中在符合中医理论指导下可能对ccRCC具有干预作用。同时全身属虚,肾癌以气血俱虚为主,临证应祛邪不忘扶本,尤重气血,调理脾肾。研究验证到本次实验预测到当归具有补血活血之功效,体外实验中亦验证可有效抑制人肾透明细胞癌的增殖,同时对预测到的PI3k信号通路同样被显著干预[32]。

本次研究中利用生物信息学的方法探索ccRCC的关键差异靶点,探究疾病对信号通路的多途径积累改变,与中医学的整体观念及中药多靶弱效的显著特点相结合,希望借助现代技术探索到可干预中医未被定义疾病的中草药,以现代医学观念剖析中草药的潜在价值,本研究中发现同一核心基因可以被多种不同的化合物不同方向干预,不同成分可能包含于在同一种中草药中,这对阐述单一中草药影响ccRCC的不明确作用机制仍需探索,本研究预测药物较多,仅部分药物或单质实验验证为对目标疾病有疗效,但仍未经过实验验证的预测结果需要继续深入探索,为中医药的发展做出努力。

猜你喜欢

中草药化合物数据库
益林中草药 初现规模化
三味中草药 消炎效果好
中草药在口腔护理中的开发应用
例析高考中的铁及其化合物
例谈氯及其化合物的学习与考查
钒及其化合物在高考中的考查
金属元素及其化合物
数据库
脑筋急转弯
数据库