TACC3 mRNA在乳腺癌中的表达及其基因富集分析
2020-08-14覃燕杨迪覃花杏罗前颖
覃燕,杨迪,覃花杏,罗前颖
(1.右江民族医学院护理学院,广西 百色 533000;2.右江民族医学院附属医院小儿外科,广西 百色 533000;3.右江民族医学院研究生学院,广西 百色 533000)
乳腺癌是全球女性最常见的恶性肿瘤,是女性肿瘤患者中发病率最高的肿瘤之一,乳腺癌的发病目前已呈年轻化趋势,已经成为危害女性健康头号杀手[1]。在常规手术、化疗等治疗后如果出现复发或者转移,乳腺癌患者的预后往往不良,特别是乳腺癌的治疗进入分子分型的时代,三阴性乳腺癌在早期已经出现转移并且对化疗耐药,死亡风险明显高于其他类型的乳腺癌患者[2],严重威胁着女性的生命。因此寻找一种敏感性高的指标对乳腺癌的诊疗具有重要意义。
转录相关酸性卷曲蛋白3(transforming acidic coiled coil protein 3,TACC3)是TACC家族的重要成员,作为一种非机动微管相关蛋白(microtubule-associated protein,MAP)定位于细胞中心体,对有丝分裂纺锤体的稳定性有重要的意义[3-4]。多个研究发现,TACC3的mRNA在多种癌组织中表达高于癌旁组织或者正常组织,并且高表达TACC3的癌症患者预后较低表达的癌症患者预后差[5-8]。而TACC3在乳腺癌的研究中发现,TACC3在乳腺癌组织中呈高表达[9]。最新研究发现,TACC3可作为乳腺癌独立的预后因素[10]。近年的基础研究发现TACC3能促进癌细胞增值及癌细胞迁移,与癌症的发展具有密切的关系[7-8,11]。然而关于TACC3是否能够调控相关基因而影响乳腺癌的发生发展报道较少。因此,本研究利用美国国立生物技术信息中心(National Canter for Biotechnology Information,NCBI)的基因表达汇编(Gene Expression Omnibus,GEO)公共数据集,探讨TACC3的mRNA水平在乳腺癌中的表达和临床价值,探寻TACC3参与乳腺癌发生发展可能的作用机制。
1 材料与方法
1.1数据收集 在NCBI上的GEO(http://www.ncbi.nlm.nih.gov/geo/)公共数据库中下载与乳腺癌相关的GSE42568的基因表达谱数据series matrix数据文件。GSE42568[12]总共有121例样本数据集,其中104例癌组织与17例正常组织。数据集中以探针信号强度反映基因的相对表达量,且数据集中附带有数据相应的临床信息及预后资料。
1.2临床相关性研究 运用R语言将GSE42568表达谱数据进行归一化处理,其中以探针名代表的基因表达量转化为以基因名表示每个基因。GSE42568表达谱数据中附带的临床资料包括数据中每一个乳腺癌患者的年龄、肿瘤分级、淋巴结状态、雌激素受体状态、T分期等临床信息,以及总生存时间等生存分析数据,可进一步进行临床数据相关分析及生存分析。结合目前较常用表达谱数据单基因分析方法,104例乳腺癌样本以TACC3 mRNA的表达水平进行高低排序,取中位值6.6588175将其分为52例TACC3 mRNA高表达组和52例TACC3 mRNA低表达组,并分析两组的乳腺癌患者的生存时间是否有差异。
1.3基因富集分析(GSEA) 在GSEA网站下载GSEA2-2.2.3(JAVA版本),将GSE42568数据集导入GSEA软件。参照基因集由GSEA网站MsigDB数据库中提供与生物信号传导相关的基因集,按照default weighted enrichment statustic的方法,每次分析重复1000次。在GSEA结果中,ES(enrichment score)表示GSEA基因富集评分,NES(normalized enrichment score)表示归一化后的基因富集评分,FDR(false discovery rates)是多重假设检验矫正后的P值,GSEA采用NES的绝对值|NES|≥1.0、P<0.05及FDR<0.25对结果进行过滤。
1.4作图及统计学处理 在GraphPad Prism 5.0和SPSS18.0中,运用t检验分析TACC3 mRNA在乳腺癌与正常组织中表达的差异;运用χ2检验分析104例乳腺癌临床资料与TACC3 mRNA表达量有无差异;生存分析采用Kaplan-Meier法Log-rank检验,上述统计学方法P<0.05认为差异具有统计学意义;在GSEA中,P<0.05以及<0.25的基因集作为显著基因集结果。
2 结果
2.1TACC3在乳腺癌中的表达 GSE42568包含104乳腺癌组织和17例正常组织的表达谱数据,TACC3的mRNA水平在癌组织的表达(中位值6.658817)显著高于正常组织(中位值4.895719),差异具有统计学意义(t=-5.912,P=0.001,见图1)。
注:P=0.001。
2.2TACC3与乳腺癌的临床资料的关系 在GSE42568中,TACC3 mRNA与乳腺癌患者的年龄、病理分级、淋巴结转移状态、雌激素受体状态、T分期差异均无统计学意义(P>0.05),见表1。
表1 TACC3表达水平与乳腺癌临床资料的关系
2.3TACC3与乳腺癌预后的关系 结合GSE42568数据库提供的临床预后资料,在总生存分析中乳腺癌中52例高表达TACC3 mRNA患者(中位生存时间79个月)较52例低表达组(中位生存时间82个月)生存时间短,差异具有统计学意义(Log-Rank=6.806,P=0.009,见图2)。以上结果说明乳腺癌中高表达TACC3 mRNA与乳腺癌患者的生存相关,提示TACC3在乳腺癌中可能能够影响乳腺癌患者生存时间。
注:Log-Rank=6.806,P=0.009。
2.4TACC3(GSEA)基因富集分析 了解TACC3 mRNA在乳腺癌中与患者预后的关系之后,通过运用GSEA分析TACC3推断乳腺癌进展的可能方式。结果发现在TACC3高表达的肿瘤样本中富集了细胞周期、DNA复制、RNA降解、原发性免疫缺陷、T细胞受体信号通路、剪接体等基因集(见图3),TACC3可能通过调节肿瘤细胞的细胞周期、DNA复制,免疫缺陷等方式影响乳腺癌细胞的发生发展。
注:(A)细胞周期:P<0.001,FDR=0.000,ES=0.63,NES=2.32;(B)DNA复制:P<0.001,FDR=0.000,ES=0.77,NES=2.35;(C)RNA降解:P<0.001,FDR=0.000,ES=0.59,NES=1.94;(D)原发性免疫缺陷:P<0.001,FDR=0.000,ES=0.70,NES=2.09;(E)T细胞受体信号通路:P<0.001,FDR=0.000,ES=0.54,NES=1.99;(F)剪接体:P<0.001,FDR=0.000,ES=0.55,NES=1.94。
3 讨论
乳腺癌是女性肿瘤发病率最高的肿瘤之一,严重影响着全世界女性的生活健康,因此,对乳腺癌发病及进展机制的研究具有重大的意义。TACC3是TACC家族的重要成员,作为一种非机动微管相关蛋白定位于细胞中心体,在癌症的研究中具有重要价值。
本研究利用GEO数据库GSE42568表达谱数据分析了TACC3在乳腺癌中表达高于正常组织,证实TACC3有可能是乳腺癌的致癌基因,同时发现高表达TACC3 mRNA乳腺癌患者的预后较差,本研究结果与2018年Song H等[13]的研究结果相似,运用PCR、免疫组化、WB检测TACC3在乳腺癌中表达发现,TACC3 mRNA水平在乳腺癌中高表达,而免疫组化结果TACC3在乳腺癌中表达与淋巴结转移具有相关性,PCR及免疫组化结果均提示高表达TACC3患者预后差。2012年,候婧等[14]研究发现,乳腺癌中TACC3的mRNA水平及蛋白水平均高于癌旁组织,并且TACC3 mRNA水平与乳腺癌患者的肿瘤大小、分化程度、淋巴结转移、p53表达具有一定程度影响,研究结果与本研究结果相似,进一步证实TACC3 mRNA在乳腺癌组织中高表达。
证实了TACC3 mRNA与乳腺癌生存有关之后,本研究利用GSEA软件预测了TACC3基因在乳腺癌中可能调控的基因集,探讨TACC3可能影响乳腺癌的机制,结果发现富集的基因集有:细胞周期、DNA复制、RNA降解、原发性免疫缺陷、T细胞受体信号通路、剪接体等基因集,TACC3可能通过调节肿瘤细胞的细胞周期,参考DNA复制,免疫缺陷等影响乳腺癌的发病进展。TACC3在癌症的机制分析中发现,TACC3与FGFR3呈协同作用,并且TACC3与FGFR3主要以 FGFR3-TACC3融合基因在癌症中发挥作用[15]。在鼻咽癌中FGFR3-TACC3具备致癌作用,表明FGFR3-TACC3可能是有用的诊断标记及治疗靶标[16]。2015年Carneiro BA等[17]在文章中报告了3例宫颈癌中发现FGFR3-TACC3基因融合,在最近研究中,在宫颈癌中的全面基因组分析发现融合、激活FGFR通路被认为对宫颈癌具有致癌作用,并认为FGFR3-TACC3是治疗宫颈癌的一个潜在的新靶点[18]。关于TACC3在乳腺癌中的研究中,Ha GH等的研究揭示了TACC3高表达可能与乳腺癌的发生发展相关,TACC3被认为是乳腺癌相关基因一个新的修饰点[19-20]。研究发现[21],TACC3还可能通过调控NOTCH通路介导乳腺上皮细胞及血管的生成。以上关于TACC3的研究揭示了TACC3在肿瘤发生发展起到的作用,提示TACC3具有潜在的临床价值。
总之,本研究通过利用GEO公共数据库GSE42568表达谱数据对TACC3 mRNA表达水平对乳腺癌患者预后进行探讨,证实了TACC3高表达的乳腺癌患者具有较差的预后,并可能调控等相关基因集。同时不足之处在于GEO表达谱数据集都是mRNA水平数据,无法完全代表TACC3在乳腺癌表达情况,而且GSE42568附带的临床资料不全,缺乏完整的乳腺癌分子型数据等。本研究目的在于为接下来对TACC3基因的临床研究及基础研究提供线索和依据。