基于芯片数据的雌激素受体阳性乳腺癌他莫昔芬耐药相关基因分析
2019-03-08王世霞杨艳芳
王世霞,杨艳芳,马 宁,刘 君
(天津医科大学肿瘤医院乳腺肿瘤二科,国家肿瘤临床医学研究中心,乳腺癌防治教育部重点实验室,天津市“肿瘤防治”重点实验室,天津市恶性肿瘤临床医学研究中心,天津300060)
近年来,中国的乳腺癌发病率正在逐年增加[1]。在美国,乳腺癌是导致女性癌症相关死亡的首要原因,也是最常见的肿瘤[2]。据文献报道,乳腺癌中约有70%~80%表达雌激素受体(estrogen receptor,ER)[3-4]。内分泌治疗是ER阳性乳腺癌的一线治疗方案,能够显著降低ER阳性乳腺癌患者的死亡率及复发转移风险。然而,临床上发现约50%的ER阳性乳腺癌对内分泌治疗表现出固有耐药,而对他莫昔芬(Tamoxifen,TAM)治疗有反应的患者中约30%~40%发展为获得性耐药。TAM耐药的机制与许多因素有关,如原癌基因的激活,抑癌基因的失活,ER表达的改变,共调节蛋白的改变以及生长因子信号通路的影响等[5]。因此,TAM耐药的现象依然是临床诊疗中的难题。
随着人类基因组计划的启动和开展,促进了生物信息学的兴起和迅猛发展。目前生物信息学已广泛应用于生命科学各个领域的研究,其在医学研究领域的地位也越来越重要。它在疾病基因筛查和诊断、生物相关实验设计和蛋白质组学等领域发挥了不可替代的作用,例如利用生物信息学工具已发现与肥胖、高血压、糖尿病、肿瘤等疾病相关的致病基因,为疾病诊断及治疗提供方向[6]。另外,在遗传病监测、肿瘤鉴别等领域,基因诊断技术得到广泛应用;功能基因组学和蛋白质组学等为肿瘤发病机制的研究、靶向药物的筛选和研发提供了新的思路和理论基础。充分并有效地利用生物信息学工具,如数据库、软件等,无论是从分子水平的角度进行阐述病因,还是对疾病的诊断、治疗、预防与药物研发都将产生强大的推动作用。本研究中应用生物信息学技术及工具,利用共享数据资源分析TAM耐药乳腺癌的基因表达谱并筛选TAM耐药和TAM敏感乳腺癌之间的差异表达基因(differentially expressed genes,DEGs),同时构建DEGs编码的蛋白质间的相互作用(protein-protein interaction,PPI)网络,分析并发掘潜在的与TAM耐药相关的基因,为进一步深入研究TAM耐药的机制提供新的线索,寻找ER阳性乳腺癌TAM耐药潜在的新的治疗靶点。
1 材料与方法
1.1 材料 本研究使用GEO数据库(Gene Expression Omnibus,http://www.ncbi.nlm.nih.gov/geo/)中由Elias D等提交的mRNA表达谱数据(登录号GSE67916)[7],由 GPL570 芯片平台产生(Affymetrix Human Genome U133 Plus 2.0 Array;Affymetrix,Inc.,Santa Clara,CA,USA)。该芯片平台包含人类基因组47 000多个转录本,4 895个序列,138 052个样本。其芯片数据库来源于Gen Bank、db EST和Ref Seq。GSE67916中18例样本均来自于ER阳性乳腺癌患者,包括 4株TAM耐药细胞系TamR1、TamR4、TamR7、TamR8和1株TAM敏感的细胞系MCF7/S0.5,其中TamR1和TamR4各有3个生物学重复以及TamR7和TamR8各有两个生物学重复;MCF7/S0.58个生物重复。经RNA提取、扩增和逆转录等步骤,最后与Affymetrix Human Genome U133 Plus 2.0芯片杂交、标准化处理等得到并上传GEO数据库。本研究采用10例TAM耐药(登录号GSM1658401~GSM1658410)和 8例TAM 敏感(登录号GSM1658411~GSM1658418)乳腺癌样本。
1.2 方法
1.2.1 数据处理及差异表达 利用GEO2R在线工具(https://www.ncbi.nlm.nih.gov/geo/geo2r/)对 数 据进行处理和分析。按照差异表达倍数绝对值>1.5,P<0.01的标准筛选TAM耐药和TAM敏感样本之间的DEGs。
1.2.2 GO功能及KEGG通路富集分析 基因本体论(GO)由Gene Ontology联合会系统地整理,是一套层次型的基因功能注释和分类系统,旨在方便地查询和更新的基因功能注释信息[8]。KEGG(Kyoto Encyclopedia of Genes and Genomes)数据库可以快速的查找基因参与的信号通路[9]。使用在线软件 DAVID(版本 6.8,http://david.abcc.ncifcrf.gov)中GO功能和KEGG通路富集分析模块对筛选的DEGs进行分析,纳入标准为P<0.05。
1.2.3 构建蛋白—蛋白相互作用网络(PPI网络) STRING在线工具收集了多种蛋白质-蛋白质间功能互作的信息[10],利用该工具对DEGs的蛋白—蛋白相互作用网络进行构建并分析;使用Cytoscape软件[11]对DEGs的PPI网络进行绘制,筛选关键节点基因(degree>20);同时应用Cytoscape的MCODE插件鉴定及分析成员间显著紧密连接的子网络。
2 结果
2.1 差异表达基因的筛选 根据设定的条件参数(差异表达倍数绝对值>1.5,P<0.01)共筛选出438个显著差异基因,其中上调差异基因300个,下调差异基因138个。
2.2 差异表达基因的GO功能富集分析 利用DAVID对上调及下调差异基因所参与的分子功能、生物过程和细胞成分进行分析。其中上调基因参与的主要分子功能(MF)有:蛋白质结合、poly(A)RNA结合、转录因子结合等;生物过程(BP)有:蛋白质转运、转录负调节、DNA模板化等;细胞成分(CC)有:细胞质、细胞质的核周区、细胞膜等。下调基因参与的主要分子功能(MF)有:蛋白质结合,激酶活性,细胞粘附的钙粘蛋白结合等;生物过程(BP)有:细胞对雌二醇刺激的反应,转录的正调控,DNA模板化和干扰素γ介导的信号传导途径等;细胞成分(CC)有:质膜、胞外外泌体、细胞质等。
2.3 上调及下调差异基因的KEGG通路富集分析 通过DAVID分析,上调差异基因主要集中在白细胞跨内皮迁移,溶酶体和RIG-I样受体信号传导通路等,下调差异基因主要集中在:病毒致癌作用,甲状腺激素信号通路,调节干细胞多能性信号通路和HIF-1信号通路等(图1)。
图1 上调及下调差异基因的KEGG通路富集分析Fig 1 KEGG pathway analysis for up-regulatedand downregulated genes
2.4 PPI网络分析 基于STRING的数据分析共发现629组蛋白间的相互作用关系,PPI网络由288个节点和 629个边缘组成,其中 MAPK1、ESR1、SMARCA4、RANBP2、PRKCA 编码的蛋白与其他超过20个蛋白之间存在相互作用关系(degree>20),是PPI网络中的关键蛋白(图2)。利用Scytoscape软件的MCODE插件共分析出两个子网(子网1和子网2)(图3),关键节点蛋白同时包含在子网络中。
图2 差异表达基因的蛋白—蛋白相互作用网络图Fig2 Protein-protein interaction network of differentially expressed genes
2.5 子网络的GO功能和KEGG通路富集分析 利用DAVID对两个子网络进行GO功能和KEGG通路富集分析发现,子网络1主要与蛋白质结合、DNA结合、核质、免疫应答、转录正调节、DNA模板化相关,主要通路富集在病毒致癌作用等(图4)。子网络2主要与细胞核、细胞外外泌体、蛋白质和DNA的结合等功能有关(图5)。此外,子网2中最主要的通路富集是MAPK信号通路(图5)。
图4子网络1的GO功能和KEGG通路富集分析Fig 4 GO and KEGG pathway analysis for genes in sub-network 1
图5 子网络1的GO功能和KEGG通路富集分析Fig 5 GO and KEGG pathway analysis for genes in sub-network 1
3 讨论
随着生物信息学的发展与应用,TAM耐药机制在基因水平方面的研究已取得重大进展。许多基因已被证实与TAM耐药相关,如乳腺癌扩增性抗原1(AIB1),50%以上的乳腺癌组织中存在AIB1的过表达。已有研究证明AIB1基因与TAM耐药相关,在TAM耐药细胞BT474中敲除AIB1基因,可恢复对TAM的敏感性[12]。作为一种分泌蛋白,前梯度蛋白2(AGR2)是蛋白质二硫键异构酶(PDI)家族的成员。TAM能刺激AGR2高表达,同时AGR2在TAM耐药中也发挥重要作用[13]。人表皮生长因子受体2(HER2)和G蛋白偶联型雌激素受体(GPER)被证明也与TAM耐药相关[14-15]。另外,TAM耐药的机制也与一些信号通路有关,如HER2酪氨酸激酶信号通路、PI3K信号通路[5]。
在ER阳性乳腺癌患者中,虽然TAM治疗已成为一线治疗方案,但其发生耐药的现象也越来越普遍。目前对于TAM耐药乳腺癌的发生和发展机制仍不清楚,因此TAM耐药乳腺癌的治疗不仅是目前临床治疗的难点,也是基础与临床研究的热点。发掘TAM耐药乳腺癌的新型治疗靶点显得尤为重要。本研究利用生物信息学技术,共挖掘出438个显著差异基因,其中上调表达基因300个,下调表达基因138个。对这些差异基因进行GO功能及KEGG通路富集分析示这些差异基因主要参与蛋白质结合及免疫应答等功能,同时也参与MAPK信号通路和HIF-1信号通路等。利用生物信息学工具对PPI网络分析结果显示蛋白间的相互作用主要集中在 MAPK1、ESR1、SMARCA4、RANBP2 和 PRKCA等节点基因。
MAPK1突变与多种癌症相关,如乳腺癌、前列腺癌和卵巢癌[16-18]。已有研究证明MAPK1超活化与TAM耐药有关[19],如活化的MAPK1通过促进ERα(雌激素受体α)磷酸化使ERα的配体非依赖性转录增加,且过度活化的MAPK通过NF-κB依赖性途径下调ERα的表达,从而引起TAM耐药[20]。本研究结果显示MAPK1位于PPI网络中的关键节点,临床中应用MAPK1抑制剂联合TAM治疗ER阳性乳腺癌可能会提高患者的治疗效果。
SMARCA4又称为BRG1,是编码SWI/SNF染色质重塑复合物的核心蛋白。其控制许多细胞过程,如DNA修复、参与细胞周期等[21]。BRG1的表达与三阴性乳腺癌的增殖及预后相关,BRG1高表达者预后较差[22]。此外,有研究表明BRG1通过JNK1通路诱导在雌激素应答启动子中聚集,参与雌激素拮抗剂介导的乳腺癌细胞生长停滞的过程[23]。然而,关于BRG1与TAM耐药的关系却鲜有报道。本研究结果表明SMARCA4基因在TAM耐药乳腺癌中表达升高且在PPI网络中属于中心蛋白,显示SMARCA4基因可能与TAM耐药相关。因此对SMARCA4基因的进一步研究可能为治疗TAM耐药的ER阳性乳腺癌找到新的潜在靶点。
ESR1是编码雌激素受体α(ERα)的基因,属于核受体家族的配体依赖性转录因子,在内分泌治疗中发挥关键作用[24]。研究表明ER表达下调或功能的丧失可能对TAM产生耐药[25]。ER突变引起的配体非依赖性转录介导癌细胞的增殖并引起TAM耐药[25]。本研究显示ESR1在TAM耐药样本中表达下降,和KIM等[26]的报道相似,ESR1基因表达下降使TAM药物缺乏结合靶点,导致部分ER阳性乳腺癌患者治疗效果较差,成为临床上的一大治疗难点。进一步对ESR1基因表达下调机制的研究,将有助于改善TAM耐药乳腺癌的治疗。PRKCA(蛋白激酶Cα)在不同的细胞过程中发挥重要作用,如细胞增殖、凋亡及分化等[27]。Kim等[28]的研究表明PKC-α介导乳腺癌细胞的侵袭和迁移。另有研究显示在TAM乳腺癌中PKC-α磷酸化水平显著增加,PKC-α通过抑制c-Jun磷酸化来抑制ER-α的表达[26]。这些数据暗示PKC-α是TAM耐药乳腺癌的潜在生物标志物。本研究结果显示PRKCA是关键节点基因,以PRKCA为靶点治疗TAM耐药乳腺癌将有广阔的临床研究前景。
Ran结合蛋白2(RANBP2)是核浆-胞质运输的调节因子[29],编码具有358-kDa的在有丝分裂等功能中起作用的核孔蛋白[30]。该基因与一些致瘤通路有关,例如间接参与P53和PI3K/Akt信号通路[31-32]。PI3K/Akt信号通路的激活与TAM继发性耐药相关。RANBP2可能通过干扰PI3K/Akt信号通路引起乳腺癌细胞对TAM产生耐药。目前关于RANBP2与TAM耐药机制的相关研究鲜有报道。本研究显示RANBP2在TAM耐药乳腺癌中过度表达,RANBP2的过表达可能直接或间接参与TAM耐药。进一步加深RANBP2在TAM耐药机制中的研究,为TAM耐药的ER阳性乳腺癌寻找更多的治疗选择。
通过生物信息学分析差异基因的GO功能及富集通路主要参与蛋白质结合、poly(A)RNA结合、转录因子结合、蛋白质转运、转录负调节、DNA模板化、细胞粘附的钙粘蛋白结合、转录的正调控、RIG-I样受体信号传导通路、HIF-1信号通路、MAPK信号通路等分子生物功能及信号通路。缺氧诱导因子(HIF-1)是肿瘤增殖及迁移等过程中的关键转录因子,HIF-1信号通路已被证实与多种癌症相关,如肝癌、结直肠癌等。HIF-1与MAPK/ERK通路相互作用,促进肿瘤的生长及增殖。但尚未有关于HIF-1信号通路与TAM耐药相关的研究和报道,进一步进行相关实验研究HIF-1信号通路的作用将有助于揭示ER阳性乳腺癌TAM耐药机制。
利用生物信息学方法有效发掘差异表达基因的相互作用信息,通过对差异基因的功能及参与的信号通路进一步研究,为TAM耐药的ER阳性乳腺癌的早期诊断及治疗靶点选择提供了新的线索,也为后期继续研究来验证这些潜在的治疗方法提供了方向。