基于药物重定位策略挖掘肺腺癌治疗药物
2022-06-14王存良吴秋歌
王存良,吴秋歌
(1.郑州大学第一附属医院a.药学部;b.呼吸内科,河南 郑州 450052;2.河南省精准临床药学重点实验室,河南 郑州 450052)
近年来,肺癌的治疗取得了长足进步,但肺癌仍是世界范围内与癌症相关的死亡的主要原因,平均5 a生存率仅为18%[1]。非小细胞肺癌(non-small cell lung carcinoma,NSCLC)患者约占所有肺癌病例的85%,其中近50%有肺腺癌,是最常见的肺部肿瘤之一[2]。虽然肺腺癌的早期检测、诊断和靶向治疗已经取得了很大进展,但5 a生存率仍然很低,根据区域差异和疾病分期从4%~17%[3]。有肿瘤和合并症负担的患者由于未接受有效或特异性治疗而死亡的风险较高[3]。因此,了解肺腺癌发生发展中的分子机制和发现新的潜在治疗药物具有重要意义。关联性图谱(connectivity map,CMAP)是基于基因表达谱芯片研究药物作用机制和药物重定位的技术与数据资源,主要的优势在于能够高效地对全基因组上的基因表达做整体分析[4]。相对于低通量的药理学、毒理学方法以及色谱技术,该技术具有全面、高通量、准确等优点,因而广泛应用于药物研究[5]。基因表达谱描述了在给定疾病状态和时间内发生的所有转录改变。可以逆转某些变化的化合物可能会成为特定疾病状态的潜在抑制剂[6]。本研究利用肺腺癌组织与癌旁正常肺组织的差异基因表达谱数据,通过CMAP数据库和生物信息学方法,筛选对肺腺癌基因表达具有反向作用的负相关小分子化合物,期望寻找出潜在的有望在将来用于干预肺腺癌发生发展及其治疗的化合物,从而开辟出治疗肺腺癌的新方法。
1 材料和方法
1.1 基因表达谱数据基因表达数据库(Gene Expression Omnibus,GEO)是公共功能基因组数据存储库,是当今最大、最全面的公共基因表达数据资源。它创建于2000年,收录了世界各国研究机构提交的高通量基因表达数据。通过输入检索词“lung adenocarcinoma”,及其他筛选条件检索得到3个数据集(GSE10072[7]、GSE87340[8]、GSE40419[9])作为 本研究所需的肺腺癌组织样本的基因表达数据。
1.2 差异表达基因的筛选下载经log2转化后的表达矩阵用于后续分析,使用limma包(linear models for microarray data,微阵列数据的线性模型)对肺腺癌组织和癌旁正常组织的差异基因进行鉴定。筛选差异基因的标准为经错误发现率(false discovery rate,FDR)校正后的adj P<0.05和|log2FC|≥1。对3个数据集分别进行上述筛选,取交集后得到3个基因集共同上调和共同下调的差异基因。
1.3 差异基因的通路富集分析为了差异基因对肺腺癌影响的潜在机制,将1.2中的所有基因上传到DAVID数据库(Database for Annotation,Visualization,and Integrated Discovery)[10]进行在线分析。通过基因本体论(gene ontology,GO)分析和KEGG(Kyoto Encyclopedia of Genes and Genomes)通路分析,进一步探讨疾病的发病机制和药物的作用机制。以P<0.05为界值筛选显著影响的代谢通路。
1.4 候选小分子的鉴定CMAP是一个通过小分子药物来处理人类细胞,然后利用治疗后差异表达基因建立小分子药物、基因表达与疾病相关的数据库[4,6]。有助于研究人员快速鉴定与疾病高度相关的分子药物,分子药物的化学结构和可能的作用机制。首先将共同上调和下调的基因名称通过affymetrix(https://www.affymetrix.com)HGU133A平台在线批量转换为探针名称,分别保存为.grp格式文件备用。然后将上述文件导入CMAP(https://portals.broadinstitute.org/cmap/)数据库进行检索。
2 结果
2.1 肺腺癌差异基因的筛选从GEO数据库下载3个肺腺癌相关mRNA基因表达谱数据。GSE27262包括513个肺腺癌组织和59个癌旁正常组织,GSE87340包括27个肺腺癌组织和27个癌旁正常组织,GSE40419包括87个肺腺癌组织和77个癌旁正常组织,详细结果见表1。差异分析结果如图1所示,其中GSE27262中1 213个基因上调,1 895个基因出现下调(图1A);GSE87340中528个基因上调,712个基因出现下调(图1B);GSE40419中1 634个基因上调,1 780个基因出现下调(图1C)。venn图结果显示3个数据集共同上调差异基因285个(图1D),共同下调差异基因513个(图1E)。
图1 3个数据集中的差异表达基因和共同差异表达基因
表1 3个GEO数据集的临床信息
2.2 差异基因富集分析使用DAVID数据库对共同差异基因进行GO富集分析(P<0.05)后,共获得457个富集结果。其中包括生物过程306项,分子功能74项,细胞成分49项,排名前十的GO富集结果如图2所示。KEGG富集出28条通路,其中富集靶点较多的主要相关信号通路为:PI3K-Akt信号通路,Rap1信号通路,趋化因子信号通路,cGMP-PKG信号通路,HIF-1信号通路等(见图2和表2)。
表2 共同差异基因通路KEGG注释
图2 共同差异基因的GO和KEGG通路富集分析
2.3 鉴定潜在肺腺癌治疗小分子根据分析肺腺癌样本和相邻正常样本之间基因表达的探针组,确定了具有高度显著相关性的相关小分子药物。正值connectivity score评分代表正相关,表示药物扰动的表达谱与疾病扰动的表达谱正相关,即药物可以引起或者加剧该疾病状态;负值connectivity score评分代表负相关,表示药物扰动的表达谱与疾病扰动的表达谱负相关,即药物能够减轻甚至逆转该疾病状态。根据该策略,本研究以负相关评分connectivity score<-0.9为条件,筛选得到10个候选小分子(表3),按照负性富集关联系数由高到低依次为洛贝林、苄普地尔、莫西赛利、荜茇酰胺、碘化丙啶、奎尼卡因、氯丙嗪、酞氨西林、掌叶防己碱、罗利环素。
表3 CMAP分析结果
3 讨论
肺腺癌是最常见的肺癌类型,约占所有肺癌病例的40%[11]。肺腺癌是最具侵袭性的肿瘤类型之一,确诊时往往已至晚期,患者常需接受放射治疗、化学治疗及靶向治疗等辅助治疗。但是,肺腺癌对常规放射疗法和化学疗法耐药性高,这是其治疗的主要挑战,因此发掘新的肺腺癌治疗药物及方法非常重要。本研究通过比较GEO数据集中肺腺癌组织与癌旁正常肺组织的差异基因表达谱数据,结合CMAP数据库和生物信息学方法,筛选对肺腺癌基因表达具有抑制作用的小分子化合物。通过药物重定位策略拓展小分子药物的适用范围,为候选药物下一步的体外、体内和临床试验提供基础。药物重定位是近年来逐渐兴起的一种新的研发思路,即“老药新用”,挖掘已知药物的新用途。该策略可大幅度降低研制新药的时间和经济成本,尤其适用于对于研究经费有限的罕见病药物的开发以及需要紧急研发药物的情况等,如近年来新型冠状病毒肺炎的治疗,就多次用到这一策略[12-13]。
本研究最终筛选出的小分子药物有洛贝林、苄普地尔、莫西赛利、荜茇酰胺、碘化丙啶、奎尼卡因、氯丙嗪等。洛贝林为一种中枢兴奋药,可选择性刺激颈动脉体化学感受器,提高呼吸和血管运动中枢的兴奋性,常用于治疗各类窒息和呼吸衰竭等,不良反应少,安全范围广。其可能利用MAPKs途径以及抗氧化酶AOEs活性来减轻脂多糖诱导的非特异性肺部炎症,从而发挥缓解极性肺损伤的作用[14]。基于此,推测洛贝林可能通过核因子κB(nuclear factor kappa-B,NF-κB)信号通路和氧化应激反应,缓解肺癌组织微环境的免疫炎症,进而发挥抗肺腺癌的作用。苄普地尔是一种长效、非选择性的钙通道阻滞剂,曾被用作抗心绞痛治疗药物[15]。通过数据库检索,发现苄普地尔存在多个靶基因,CRK、FGFR4、LAMB1、PIK3R2、CD47、ELANE、HPGD和PRKCB,这些靶基因多与癌症的发生发展及治疗相关,因此,有望成为肺腺癌又一候选治疗药物[16]。荜茇酰胺为PI3K抑制剂,受其负向调节的基因主要与免疫、细胞应激、Toll样受体信号通路、补体系统、NF-κB信号通路和PI3K-Akt信号通路有关[17],据此推测荜茇酰胺在治疗肺腺癌方面具有一定的潜力,但该结论仍需要更深层次的实验验证。氯丙嗪是一种多巴胺受体阻断剂,为常用的抗精神病药物。有研究表明,其对肺腺癌A549细胞的增殖、侵袭、迁移具有显著的抑制作用,且该种作用呈剂量依赖性[18]。另有报道称氯丙嗪与抗感染药物戊双眯联合使用,能有效抑制肿瘤细胞增殖,其可能的机制是氯丙嗪是有丝分裂驱动蛋白KSP/Eg5的特异性抑制剂,通过有丝分裂阻滞和单极纺锤体的积累抑制肿瘤细胞的增殖[19]。具体的分子机制仍需进一步的实验研究。药物重定位策略目前越来越被科研人员和制药公司所重视,可通过数据库、人工智能和实验等多种方法来识别可重复利用的候选药物,但是其后续的临床应用仍面临重大技术挑战,相关的政策要求和监管措施也需同步落实[20]。
综上所述,本研究利用3个肺腺癌基因表达谱数据集,通过生物信息学的方法筛选出差异表达基因,根据此特征结合CMAP数据库筛选出具有肺腺癌治疗潜力的小分子药物,进一步的文献分析验证了该方法的可靠性,为肺腺癌的治疗提供了新的可能,为下一步的体内体外实验奠定基础。