基于加权基因共表达网络的复方红豆杉胶囊治疗肺腺癌有效成分及作用机制分析
2023-01-06张泽鑫余佳蓓林思其刘紫凤陈林静陈栩静陈祎琦
张泽鑫,余佳蓓,林思其,刘紫凤,陈林静,陈栩静,陈祎琦
1 广州中医药大学第一临床医学院,广州5100062;2 广州中医药大学第二临床医学院
肺腺癌(LUAD)是非小细胞肺癌(NSCLC)中最常见的病理类型,五年生存率仅为4%~17%,预后不佳[1]。LUAD的发生发展是一个多基因共同参与、多因素共同作用、多阶段进展的复杂生物学过程,深入研究LUAD的分子机制是提高NSCLC诊疗效果的基础。中药抗肿瘤药复方红豆杉胶囊可用于治疗LUAD,研究显示,其有抗炎、增强免疫力的作用,对LUAD细胞具有较强的细胞毒性,但具体作用机制尚不明确[2]。加权基因共表达网络(WGCNA)分析是一种系统生物学方法,用来描述基因间的相关模式,其可利用系统生物学的思想寻找基因之间表达的相似性,并将表达高度相关的基因确定为一个基因模块。2021年3月—4月,本研究将WGCNA用于LUAD表达谱数据的分析,筛选出复方红豆杉胶囊治疗LUAD的有效成分及核心靶点,并通过GO功能富集和KEGG通路富集分析其作用机制,以期为LUAD的诊断和治疗提供新的策略。
1 材料与方法
1.1 复方红豆杉胶囊活性成分及作用靶点筛选 通过中药系统药理学数据库与分析平台(TCMSP,http://tcmspw.com/tcmsp.php)检索复方红豆杉胶囊关键成分红豆杉、红参、甘草的活性成分及相关作用靶点,根据口服利用度(OB)≥30%、化合物类药性(DL)≥0.18进行筛选。由于TCMSP中没有收录红豆杉的相关活性成分,因此使用中药分子机制的生物信息学分析数据库(BATMAN-TCM,http://bionet.ncpsb.org.cn/batman-tcm/)对红豆杉的药物活性成分进行补充。使用R语言(3.6.1)对活性成分和作用靶点进行配对。
1.2 LUAD差异表达基因共表达模块筛选 从TCGA数据库(https://portal.gdc.cancer.gov/)下载TCGA-LUAD的转录组数据和临床数据,从GEO数据库(https://www.ncbi.nlm.nih.gov/gds)下载LUAD表达谱(GSE83227)的基因芯片数据。从TCGA数据库中获得59个正常样本和535个LUAD样本;GEO数据库中获得33个正常样本和32个LUAD样本。通过R语言的RPKM函数和WGCNA包,筛选出具有RPKM值的基因,对基因表达量进行规范。使用函数pickSoftThreshold选择软阈值β=5和18以建立无标度网络,通过公式AIJ=|SIJ|β(AIJ:基因I与基因J之间的邻接矩阵,SIJ:通过所有基因对的皮尔逊相关性获得的相似性矩阵)并转换为拓扑重叠矩阵(TOM)及其相关的相似度(1-tom)。为了将相似的表达基因分为不同的共表达模块,构建了1-tom矩阵的层次聚类树,聚类树中表达具有高度相关性的基因确定为一个基因模块,分别用不同的颜色表示。为了筛选正常样本和肿瘤样本之间差异最大的基因模块,我们将其与数据的临床特征进行了整合分析,通过绘制基因模块和临床特征之间的相关热图来评估每个模块与正常样本和肿瘤样本的临床特征之间的相关性,选择相关性差异最大的基因模块进行后续研究。
1.3 复方红豆杉胶囊治疗LUAD的加权共表达基因筛选 通过R语言的VennDiagram包对复方红豆杉胶囊活性成分治疗靶点、TCGA数据库及GEO数据库中相关性差异最大的基因模块进行相互映射,取交集获得复方红豆杉胶囊治疗LUAD的加权共表达基因,并使用Cytoscape3.7.2绘制加权共表达基因的药物—化合物—靶点图。
1.4 加权共表达基因的功能与作用通路分析 使用R语言中的ClusterProfiler软件包对复方红豆杉胶囊治疗LUAD的加权共表达基因进行GO功能和KEGG通路富集分析,以筛选出复方红豆杉胶囊治疗LUAD相关的生物信息学过程。以上筛选过程设定过滤条件为pvalue Filter=0.05,qvalue Filter=1。
1.5 复方红豆杉胶囊治疗LUAD核心靶基因的筛选与验证 使用R语言的survival包对TCGA数据库的临床数据进行生存分析并通过Kaplan-Meier单变量生存分析图进行展示,其中,蓝色曲线代表基因低表达患者,红色曲线代表基因高表达患者,以P值代表该基因在高、低表达患者中是否存在显著性差异,秩数检验P<0.05的加权共表达基因被认为是与生存时间显著相关的加权共表达基因,即复方红豆杉胶囊治疗LUAD的核心靶基因。将筛选出的复方红豆杉胶囊治疗LUAD的核心靶基因直接导入到HPA数据库(https://www.proteinatlas.org/)中,验证其在正常肺组织和LUAD组织中的表达是否具有差异。
2 结果
2.1 复方红豆杉胶囊活性成分及作用靶点筛选结果 共得到复方红豆杉胶囊活性成分141个(甘草92个、红参4个、红豆杉45个),去重后作用靶点356个(甘草335个、红参20个、红豆杉271个)。
2.2 LUAD差异表达基因共表达模块筛选结果 排除未分配给任何功能组的灰色模块后,TCGA数据库中共得到15个基因共表达模块,GEO数据库中共得到5个基因共表达模块(OSID码图1、2)。绘制基因模块和临床特征之间的相关热图可见,TCGA数据库中的绿松石色模块(正常样本r=0.77,LUAD样本r=-0.77,P=9E-119)及GEO数据库中的绿松石色模块(正常样本r=0.88,LUAD样本r=-0.88,P=5E-22)相关性差异最明显,分别包含了6 587、649个基因(OSID码图3、4)。
2.3 复方红豆杉胶囊治疗LUAD的加权共表达基因筛选结果 将复方红豆杉胶囊活性成分治疗靶点、GEO数据库绿松石色基因、TCGA数据库绿松石色基因取交集,共得到复方红豆杉胶囊治疗LUAD的加权共表达基因14个,分别为LDLR、FOS、IL6、CAV1、TUBB3、TUBB6、MCL1、CA2、JUN、SLC6A4、CD36、ALDH1A1、MAOB、TFAP2C。通过绘制加权共表达基因的药物—化合物—靶点图可见,红豆素A(Taxumain A)和紫杉碱(Taxinine)为复方红豆杉胶囊治疗LUAD的主要活性成分。见OSID码图5。
2.4 加权共表达基因的功能与作用通路分析结果 对14个加权共表达基因进行GO功能和KEGG通路富集分析,GO功能分析显示,复方红豆杉胶囊治疗LUAD的主要生物过程为有机羟基化合物转运、细胞对氧化应激的反应、对脂多糖的反应等,主要细胞成分为内吞囊泡膜、内吞囊泡、膜筏等,主要分子功能为低密度脂蛋白颗粒受体活性、一氧化氮合酶结合、脂蛋白颗粒受体活性等;KEGG通路分析显示,复方红豆杉胶囊治疗LUAD可能通过致病性大肠杆菌感染、朊病毒病、苯丙胺成瘾等通路发挥作用。见OSID码图6、7。
2.5 复方红豆杉胶囊治疗LUAD核心靶基因的筛选与验证 Kaplan-Meier单变量生存分析图显示,
CAV1基因为复方红豆杉胶囊治疗LUAD的核心靶基因(P<0.009)。见OSID码图8。HPA数据库中免疫组织化学染色显示,CAV1在肺正常组织中染色中等(quantity:75%~25%),在LUAD组织中无染色(quantity:None)。见OSID码图8。
3 讨论
LUAD是最致命的恶性肿瘤之一,可分为原位癌、微浸润性腺癌和浸润性腺癌,其起源细胞和进展阶段尚不明确。LUAD的全球发病率为31.5%,病死率为27.1%,且发病率逐年增加[3]。目前LUAD的治疗方法主要包括手术、放化疗、微波消融等,尽管治疗方法很多,但其治疗效果仍然有限,预后不佳。因此,深入研究治疗LUAD的关键基因、关键信号通路,了解基因之间的调控机制对于LUAD的治疗具有重要意义。
本研究结果显示,复方红豆杉胶囊中共有141个候选化合物,其中治疗LUAD最主要的活性成分是Taxumain A和Taxinine。Taxumain A是一种有毒的蛋白质,也是一种Ⅱ型核糖体失活蛋白[4]。其可以通过修饰真核延伸因子2(eEF-2)或破坏28 S rRNA来不可逆地直接失活核糖体,并可间接通过修饰参与蛋白质合成翻译的因子来抑制蛋白质合成,进而诱导细胞坏死或细胞调亡,导致LUAD细胞死亡[5]。Taxinine是紫杉醇的中间体,对LUAD细胞具有细胞毒性[6]。此外,Taxinine也是红豆杉的抗血小板成分,具有抗血小板聚集的作用。其一方面可以抑制血小板调节肿瘤细胞和肿瘤的微环境,促进自然杀伤细胞识别肿瘤细胞[7];另一方面也可以抑制血小板促进肿瘤血管生成,减少肿瘤细胞增殖,增加肿瘤坏死,从而影响肿瘤的生长[8]。
本研究发现,复方红豆杉胶囊在治疗LUAD中具有14个加权共表达基因,其中最主要的核心基因为CAV1。CAV1是一种多功能膜蛋白,在癌症中起着双重作用。其在癌症的早期阶段表现为抑癌基因,对肿瘤的抑制功能是由其最主要的功能结构域脚手架区域(CSD)介导的[9]。CAV1的CSD可与各种信号蛋白分子相互作用,抑制其蛋白活性,从而抑制该信号途径[10]。CAV1的表达水平受生长因子刺激负调控,重组过表达CAV1可以通过介导细胞周期阻滞在G0/G1期来抑制细胞增殖[11]。但是,CAV1在晚期癌症和癌症转移中起到肿瘤启动子的作用[12]。通过生长因子诱导CAV1的络氨酸(Tyr14)和丝氨酸(Ser80)磷酸化以及胆固醇结合到CAV1基因启动子上,引起的CAV1的上调表达,可促进肿瘤细胞的迁移和侵袭并参与各种细胞代谢以维持癌细胞生存[13]。此外,有研究显示,CAV1的高表达可导致治疗耐药性,这也是导致LUAD临床预后不良的原因之一[14]。
GO功能分析可以提供涉及相关基因的生物学过程、细胞组成和分子功能,并帮助研究人员了解疾病的发病机制或药物机理。通过GO分析,我们发现复方红豆杉胶囊可调节有机羟基化合物的转运,有利于抗癌增殖。研究显示,有机羟基化合物可通过调节细胞周期和诱导细胞凋亡来实现抗增殖活性,对LUAD上皮细胞具有抗增殖作用,这与我们的研究结果一致[15]。我们还发现,复方红豆杉胶囊在治疗LUAD时主要在内吞囊泡膜发挥作用并可调节低密度脂蛋白颗粒受体的活性。研究显示,载脂蛋白颗粒可以通过低密度脂蛋白颗粒受体进入细胞,从而抑制炎症,增强人体的免疫防御能力[16]。KEGG通路分析显示,共有30条KEGG富集通路,其中致病性大肠杆菌感染信号传导途径富集的基因最多。相关报道显示,致病性大肠杆菌感染可引起炎症和产生活性氧[17]。炎症能够增强大肠杆菌在肠道微生物群中的弹性,从而增强大肠杆菌的促癌活性[18]。大肠杆菌诱导了氧化应激,而氧化应激参与了癌变过程。细胞正常氧化还原状态的紊乱会产生过氧化物和自由基,破坏包括蛋白质、脂质和DNA在内的细胞成分,从而引起毒性作用。此外,致病性大肠杆菌产生的毒素可干扰真核细胞的细胞周期或诱导DNA损伤,并影响正常细胞的分化、凋亡和增殖,进而导致LUAD的发生发展[19]。
综上所述,本研究通过TCMSP数据库和BATMAN-TCM数据库筛选出复方红豆杉胶囊的活性成分及作用靶点,并将WGCNA用于LUAD表达谱数据的分析,筛选出14个复方红豆杉胶囊治疗LUAD的加权共表达基因,这些加权共表达基因的主要功能为有机羟基化合物的转运、调节低密度脂蛋白颗粒受体的活性等,主要作用通路为致病性大肠杆菌感染信号传导途径。进一步分析发现,复方红豆杉胶囊治疗LUAD的主要的活性成分为Taxumain A、Taxinine,核心靶基因为CAV1,其可以作为治疗LUAD的关键活性成分及关键靶点,为LUAD的诊疗提供新的策略。