APP下载

基于网络药理学和分子对接探讨核心组方治疗肺癌的作用机制

2023-10-09高雅婷张星星郑莉莉童佳兵李泽庚

现代中药研究与实践 2023年4期
关键词:组方医案靶点

刘 桐,高雅婷,张星星,郑莉莉,童佳兵,,3,李泽庚,,3*

(1.安徽中医药大学 研究生院, 安徽 合肥 230038;2.安徽中医药大学第一附属医院 呼吸科,安徽 合肥230031;3.新安医学教育部重点实验室,安徽 合肥 230038)

肺癌是最常见的恶性癌症之一,致死率较高[1-2]。根据组织学分类,肺癌分为小细胞肺癌(SCLC, Small Cell Lung Cancer) 和非小细胞肺癌(NSCLC, Non-Small Cell Lung Cancer)。肺癌的主要治疗策略是手术切除、辅助化疗、辅助放疗等,虽然随着针对EGFR、ALK、ROS1 和NTRK 突变的几种酪氨酸激酶抑制剂的引入以及免疫检查点抑制剂(ICIs, Immune Checkpoint Inhibitors)的出现极大地改变了肺癌治疗的前景,然而患者的5 年生存率仍然很低[3-4],因此发现新的药物和合适的治疗技术是至关重要的。

肺癌在中医学归于“肺积”“肺岩”“积聚”等范畴。古医籍中有关于其论述,如《难经》曰:“肺之积,名曰息贲……喘咳,发肺壅。”《外证医案》云“正气虚则成岩。”中医药治疗肺癌有悠久的历史,能够改善患者的症状及生存水平,预防肺癌的复发与转移,延长患者的生存时间。本研究借助数据挖掘技术分析名老中医治疗肺癌的辨证用药及用药规律,采用网络药理学探讨药物和疾病靶点之间的潜在作用机制和具体的生物学意义,以期为中医药治疗肺癌提供理论支撑。

1 资料与方法

1.1 数据来源与检索方法

根据第一届至第三届国医大师名单、第一届全国名中医名单、第一批至第六批全国老中医药专家学术经验继承工作指导老师名单,建立治疗肺癌的医家excel 表格。检索中文数据库中国知网、万方、维普,收集excel 名单所列医家使用中医药治疗肺癌的医案,建立数据库。检索语种限制为中文,检索时限从数据库建立至2021 年10 月31 日。以CNKI 检索为例:(“肺癌”OR“肺肿瘤”OR“肺恶性肿瘤”)AND(“医案”OR“验案”OR“经验”)。

1.2 纳入与排除标准

①纳入诊断明确的患者,且医案中具有肺癌的病理学诊断结果;② 纳入有完整记录的医案,包括症状、舌脉、证型、中药处方;③ 同一个医案中有多次就诊记录,只纳入首诊记录;④排除转移性肺癌,或合并其他类型癌症的患者;⑤排除文献中记录不完整的医案;⑥排除重复的医案。

1.3 医案数据规范

参照2020 年版《中国药典》、《中华本草》及中国中医药出版社的教材《中药学》对中药名称进行规范。① 将具有多种别称的中药统一规范。如:将“七叶一枝花”“蚤休”改为“重楼”。② 将不同炮制方法,但是功效无明显差别的同一种中药进行规范。如:将“焦麦芽”“炒麦芽”改为“麦芽”。③ 将简称合并的中药进行拆分。如:将“焦三仙”拆分为“麦芽、山楂、神曲”。④同一种中药的不同炮制方法,以及同一种中药的不同部位,但是中药功效有一定差别的中药不进行统一。如:“生地”和“熟地”,“瓜蒌皮”和“瓜蒌仁”。

1.4 处方数据挖掘分析

统计每种药物在所有处方中出现的频数。在SPSS Modeler 18.0 选取关联规则中Apriori 模型,最低条件支持度10%,最小规则置信度80%。在SPSS 22.0 进行k 均值聚类分析,设置目标聚类数为4,最大迭代次数为10。

1.5 成分与靶点的筛选

基于TCMSP 数据库[5]筛选核心组方4 的药物活性成分。根据口服生物利用度(OB)≥30%和类药性(DL)≥0.18,获得有效活性成分。在TCMSP 中无法筛选到的药物,则使用TCMID 数据库进行分析。

从美国肿瘤基因组图谱计划数据库(TCGA, The Cancer Genome Atlas)中搜集到501 例肺腺癌,535 例肺鳞癌患者,108 例正常肺部样本的转录组基因表达谱。基于R 软件平台对样本的基因表达水平进行数值矫正与批次效应的移除,以增强数据的有效性。据|logFC|≥2 和P≤0.05 筛选条件分析肺癌疾病靶点。将获得的药物活性成分靶点与疾病靶点绘制韦恩图,筛选针对肺癌的潜在有效靶点。

1.6 蛋白互作网络(PPI)分析

使用STRING 在线工具对筛选得到的靶点信息,进行蛋白互作网络构建,设置有效的作用信息来源为默认选项,其中包括文献挖掘和实验分析,并设置最低互作评分为0.4,而后将分析结果以tsv 文件形式导出。

基于Cytoscape 软件,使用Network Analyzer 插件对蛋白互作网络进行网络结构的拓扑分析,获得网络评价指标:节点度值(Degree),中介中心性(Betweenness Centrality),近中心性(Closeness Centrality)。以所有节点度值中位数的2 倍为阈值,将度值大于该阈值的节点,视为网络的核心靶点,并绘制互作网络。

1.7 通路富集分析

通过DAVID 数据库对核心组方治疗肺癌的潜在靶点进行生物学功能富集分析。输入靶点名称,设置物种类型为“Homo sapiens”。使用功能注释工具,下载Gene_Ontology 选项和Pathways 选项的KEGG_PATHWAY 分析结果。基于R 软件,筛选假阳性(False Discovery Rate, FDR)低于0.01 的基因富集内容,并通过软件包“ggplot”和“Goplot”进行可视化。

1.8 核心靶基因筛选

为进一步从PPI 网络的核心靶点中,筛选有效影响NSCLC 细胞系增殖的基因,且用于后续的分子对接分析,可通过基因-癌症依赖关系,分析上述潜在靶点对NSCLC 的癌症生存依赖性。通过基因依赖关系数据库(DepMap)下载22Q1 版所有细胞实验数据,收集CRISPR 类型的基因-肿瘤细胞依赖性和细胞系的基因表达,以及相应细胞系的基本信息。而后,选择158 个NSCLC 细胞系的基因敲除数据,使用上述潜在靶点的表达水平和敲除效果评分进行可视化分析。CRISPR 得分在0 分以下表示该基因的敲除作用将抑制肿瘤增殖,反之则表示该基因在肿瘤发展中起相反的作用。

1.9 分子对接

对基因-癌症依赖性分析获得的核心6 个靶点,进行分子对接分析。从PDB 蛋白质数据库中获得蛋白晶体结构,即CCNB1(PDBID: 6GU2), CDK4(PDBID:2W96),CCNA2 (PDBID: 1E9H),CDK1(PDBID:4Y72),IL13 (PDBID: 3LB6),NFKBIA (PDBID:1IKN)。从PubChem 数据库下载化合物芹菜素、鞣花酸、异鼠李素、山柰酚、羽扇豆醇、木犀草素、蛇床子素、槲皮素、开环异落叶松树脂酚、乌苏酸的3D结构用于配体对接。随后通过Autodock Vina 进行分子对接,参数energy_range 为4,exhaustiveness 为25。全局搜索空间定义包含靶蛋白的所有残基。在配体-受体对接后,计算结合亲和力并进行排序,选择适合的对接姿势,同时对化合物与靶蛋白的配体-受体相互作用使用LigPlot 进行可视化。

2 结果

2.1 处方统计及病人基本信息分析

根据文献检索结果,初步收集的中医药治疗肺癌医案共370 个。根据纳入与排除标准,最终获得有效医案226 个。

在病理分型中腺癌138 例,鳞癌66 例,腺鳞癌5 例,小细胞肺癌17 例。NSCLC 发病率92.48%。性别分布中男性147 例,女性79 例,男女比例1.86 : 1,男性发病率高于女性。

在年龄分布上,最大年龄为86 岁,最小年龄为35 岁。其中,31 ~ 40 岁10 例,41 ~ 50 岁29 例,51 ~60 岁59 例,61 ~ 70 岁80 例,71 ~ 80 岁41 例,81 ~90 岁7 例。50 岁以上的病例187 例(82.74%),可发现50 岁上为高发病人群,结果见表1。

表1 基本资料Tab.1 Basic data

2.2 中药频数统计

226 个治疗肺癌的医案中共包含中药373 种,药物总频次3 983 次。统计前100 味中药的药性、药味、归经,并绘制热图,结果见图1。

图1 前100 味中药性味归经分布图Fig.1 Distribution map of nature, taste and channel tropism for 100 Chinese medicine

统计中药频次,得到高频中药25 种(频次≥35)。高频中药的百分比=频次/总处方数(即:频次/226)。其中,补虚药7 种,清热药7 种,化痰止咳平喘药5 种,消食药2 种,理气药1 种,利水渗湿药2 种,止血药1 种。排名前25 味的中药结果见表2。

表2 高频中药频次分布表Tab.2 Frequency distribution table of high frequency Chinese medicine

2.3 高频中药关联规则及k 均值聚类

使用SPSS Modeler,将治疗肺癌的高频药物即频次≥35 的高频中药(共计25 种)进行关联规则分析。关联网络图采用SPSS Modeler 18.0 建立节点图,结果见图2。

图2 高频药物关联网络图Fig.2 High frequency drugs association network diagram

在关联网络图中,网络线粗细与关联频数成正比关系,关联数越大,线条越粗。将图中的强链接结果以表格的形式展示,结果见表3。建立Apriori 关联模型,进行关联规则分析。共挖掘的二项关联规则2项,三项关联规则29 项(表格展示前10 组)。结果见表4、5。

表3 关系网络图强链接结果分布表Tab.3 Strong link result distribution table of association network diagram

表4 二项关联规则分布表Tab.4 Binomial association rule distribution table

表5 三项关联规则分布表(前组)Tab.5 Three association rule distribution table (top 10)

运用SPSS 22.0 软件对频次≥35 的高频中药(共计25 种)进行k 均值聚类,生成4 个核心组方,结果见表6。

表6 均值聚类核心组方Tab.6 K-means clustering for core prescriptions

结合肺癌“整体正虚、局部积聚、夹杂癌毒”的病因病机,核心组方4 的药物组成兼顾肺癌的各种病机,治则治法更全面,可以为中医药治疗肺癌提供参考,因此后续进一步进行网络药理学分析。

2.4 成分靶点网络的构建

据OB 和DL 参数,从核心组方4 中获得有效药物活性成分93 个。去除重复和无效靶基因后,获得药物靶点共478 个。同时根据癌症和正常样本的转录组差异分析结果,提取肺癌疾病靶点2 743 个。两者取交集后获得核心组方4 治疗肺癌的潜在有效靶点133 个,具体见图3。

图3 肺癌疾病靶点与核心组方药物靶点交集Fig.3 The intersection of lung cancer disease targets and core prescription drug targets

2.5 PPI 网络的分析

对靶点进行蛋白互作网络分析,结果表明核心组方的靶点度值最大值为54,最小值为1,中位数为8。按2 倍中位数作为阈值进行筛选,可获得核心靶点30个,见图4,排名前10 的见表7。图中靶点的显示面积越大,表明该节点的度值越高,其在整体互作网络中更具有重要性。

图4 30 个核心靶点的蛋白互作网络Fig.4 Protein interaction network for 30 core targets

表7 核心组方网络的核心靶点(前10)Tab.7 Core targets in the core Formulation network (top 10)

2.6 通路富集分析

根据DAVID 分析结果,可获得有效的生物学过程(Biological Process)、细胞组分(Cell Component)、分子功能(Molecular Function) 内容各15 项,以及KEGG 功能富集通路13 条。图5A 中靶点富集的前3条生物学过程,主要有:细胞对缺氧的反应(cellular response to hypoxia),正向调节凋亡过程(positive regulation of apoptotic process),炎症反应(inflammatory response)。图5D 中靶点富集的前3 条功能通路,主要涉及:MAPK 信号通路、PI3K-Akt 信号通路、TNF信号通路。

图5 核心组方治疗肺癌靶点的功能富集分析Fig.5 Enrichment of functional pathways of the core formula for the treatment of lung cancer targets

2.7 基因依赖性分析

针对靶点网络的30 个核心基因进行基因- 肿瘤细胞的依赖性分析。根据CRISPR 基因敲除数据,筛选对NSCLC 细胞系具有明显增殖抑制性的目标基因,并最终获得6 个关键基因:CCNA2,CCNB1, CDK1, CDK4, IL13, NFKBIA。经过基因敲除后,6 个基因在绝大部分的NSCLC 细胞系中均表现出抑制性,同时该抑制性效果与基因的表达水平无关(P>0.05)。见图6。

图6 6 个基因的表达水平与NSCLC 敲除效果Fig.6 Six genes expression levels and knock out effects of NSCLC

2.8 分子对接分析

通过Autodock Vina 计算6 个核心靶蛋白与组方内相应10 个化合物的结合亲和力,具体见表8。选择亲和力效果最好的3 对化学物-靶蛋白复合物进行可视化分析。如图7,化合物与其靶蛋白形成良好结合,结合亲和力为NFKBIA-ursolic acid(-9.2 kcal/mol,形成6 个氢键),CCNB1-quercetin(-9.3 kcal/mol,形成1 个氢键),CDK4-ursolic acid(-9.3 kcal/mol,形成2 个氢键)。

图7 分子对接图Fig.7 Molecular docking diagram

表8 核心靶点与化合物的结合亲和力Tab.8 Binding affinity of the core targets and the compounds

3 讨论

本次数据挖掘结果中,性别的频数分布显示男性的发病率高于女性,这可能与男性吸烟率以及男性较多的各种职业暴露因素有关[6]。年龄分布显示50 岁以上为肺癌的高发病年龄段,据报道1990—2019 年50 ~ 69 岁和70 岁及以上人群的肺癌发病率均整体呈上升趋势,年度变化百分比分别为0.58%和2.22%[7]。性味归经热图中用药频率前100 的中药,归经于肺经、胃经、脾经较多。肺癌病位在肺,脾土与肺金相生,肺气不足、久病及脾,会导致脾气亏虚,而顾护脾胃,能够扶助正气,可使患者自身机体抗癌有源。本次数据挖掘所涉及的医案,超过半数患者接受过手术、放化疗、靶向治疗,耗损正气,使脏腑气血阴阳失调[8],所以高频药物中补虚药较多。关联规则的组合中,以补益药组合为主,此类药物能够提高自身免疫方面,如在“扶正法”理论指导下的中药复方能够逆转免疫逃逸,还能增强外周免疫T 细胞的杀伤作用[9-10]。“癌毒”是机体蓄积已久而形成的邪气[11],会导致津液内停,生成痰浊,导致血液运行不畅,生成瘀血,而癌毒日久则会郁而化热。因此在辨证施治的基础上,常选择清热解毒药、化痰药、活血化瘀药等。

PPI 网络图表明核心组方4 能够通过JUN、MMP9、PTGS2、FOS、IL1B 发 挥 治 疗NSCLC 的 作用。c-JUN 是致癌转录因子[12],c-JUN 与自身或与原癌基因c-Fos 能够形成同源或异源二聚体,调控细胞周期的进程,促进细胞增殖[13]。由PTGS2 编码的蛋白质环氧化酶2(COX-2)在肺癌组织中可检测到过表达,能够影响肿瘤细胞的凋亡和侵袭,调节肿瘤血管形成过程[14]。且有研究表明在NSCLC 组织中COX-2 与c-Fos 的表达具有相关性[15]。MMP-9 是明胶酶之一,和肿瘤的侵袭和转移以及血管生成有密切的关系[16]。IL-1β 被分泌到肺癌细胞周围时,会诱导肿瘤周围的血管增生,继而促进肿瘤的进展、转移[17]。研究发现调控PI3K/Akt 信号通路能够抑制细胞增殖,Akt 磷酸化后能够激活下游靶分子,使该通路活性增加[18]。而MAPK 信号通路在炎症因子活化和肿瘤形成、进展、凋亡中发挥重要参与作用[19-20],p38 MAPK亦可调节细胞因子如IL-1、COX-2的产生。

针对筛选得到的6 个关键基因,其中CCNA2(Cyclin A2, 细胞周期蛋白A2), CCNB1(Cyclin B1, 细胞周期蛋白B1), CDK1, CDK4 均与细胞周期相关。如果细胞内Cyclin A 表达受到抑制,细胞周期会停滞在S 期。此外Cyclin B1 在许多肿瘤组织如肝癌、乳腺癌等均存在过表达现象[20]。NFKBIA 是NF-κB 的抑制因子,而NF-κB 通路的持续激活会导致细胞生长失控,促进肺癌细胞增殖。还能够转录具有抗凋亡活性的产物XIAP,继而达到抑制凋亡的作用[21]。在分子对接结果中,一般认为化合物和靶蛋白的复合物构象稳定时,两者之间的结合能越低,表明结合越紧密。结果显示蛇舌草/太子参/仙鹤草中的关键成分乌苏酸、槲皮素与核心靶蛋白具有最佳的结合效果(<-9 kcal/mol),同时其他8 个化合物也存在优异的对接效果(<-7 kcal/mol)。说明核心组方4 中关键成分乌苏酸、槲皮素和关键疾病靶点NFKBIA、CCNB1、CDK4 有良好结合活性,对细胞周期过程、NF-κB 信号通路有潜在抑制作用。

4 结论

治疗肺癌的核心组方其功效主要以补益肺脾、清热解毒化痰为主。其中,核心组方4 的作用机制可能是通过调节CCNA2、CCNB1、CDK1、CDK4、IL13和NFKBIA 的表达,继而抑制炎症相关通路、影响肺癌细胞周期而发挥抑制肺癌的作用。由于数据挖掘局限于已发表的文章中的总结,后续会纳入更多的临床治疗肺癌的有效医案及相关的实验结果加以验证,进一步探讨名医治疗肺癌的相关机制,为中药新药研发提供新方向。

猜你喜欢

组方医案靶点
Shunxin decoction (顺心组方) improves diastolic function in rats with heart failure with preserved ejection fraction induced by abdominal aorta constriction through cyclic guanosine monophosphatedependent protein kinase Signaling Pathway
蒙医药清瘟杀黏类方剂组方的知识发现研究
维生素D受体或是糖尿病治疗的新靶点
肿瘤免疫治疗发现新潜在靶点
医案聊斋续篇 吐泻案
医案聊斋续篇 晨泄案
部颁标准中治疗风温中成药的组方规律
针灸联合中药组方治疗风湿性关节炎的探讨
心力衰竭的分子重构机制及其潜在的治疗靶点
氯胺酮依赖脑内作用靶点的可视化研究