APP下载

细胞分裂周期蛋白6拷贝数变异与肺腺癌患者预后关系的研究△

2019-11-08寇瑞环谢俞宁李佳莹金叶张志张雪梅

癌症进展 2019年19期
关键词:组肺共表达拷贝数

寇瑞环,谢俞宁,李佳莹,金叶,张志,张雪梅

1华北理工大学附属唐山市工人医院肿瘤科,河北 唐山 063210

2华北理工大学生命科学学院,河北 唐山 063210

肺癌是世界范围内病死率较高的一种恶性肿瘤,其发生发展涉及复杂的遗传和表观遗传变异[1]。肺癌可以分为小细胞肺癌和非小细胞肺癌(nonsmall cell lung cancer,NSCLC)两种亚型,其中约80%为NSCLC,而肺腺癌是NSCLC的重要亚型[2]。目前,临床治疗肺癌的技术不断提高,包括新药物的应用及外科手术水平的提高,但肺癌患者的5年总体生存率仍不理想[3]。因此,寻找一种肺癌发展进程中的相关标志物对肺癌的早期诊断及预后预测十分重要。相关研究表明,细胞分裂周期蛋白6(cell division cycle protein 6,CDC6)在肿瘤发生发展中起到着重要作用,并具有预后生物标志物的潜力,但其与肺癌的关系尚未明确[4]。CDC6是真核细胞DNA复制过程中的一种重要调节因子,在S期中,其对检查点的激活和维持具有重要作用;CDC6过表达干扰了细胞周期蛋白依赖性激酶抑制剂2A(INK4)-生长素反应因子(auxin response factor,ARF)肿瘤抑制机制,可能增加致癌风险[5]。因此,通过理解CDC6基因在肺癌发生发展中的作用,有可能为肺癌的早期诊断、治疗及改善患者预后提供新思路。拷贝数变异(copy number variation,CNV)是人类基因组内从1 kb到几个Mb的DNA片段拷贝数的不同,CNV是结构变异的一种形式,指与参照基因组相比,存在大小不等片段的缺失、插入、复制和复杂多位点变异。目前研究中,3p26-p11.1染色体(缺失)、3q26.2-29染色体(增加)和6q25.3-24.3染色体(缺失)的CNV在支气管内鳞状上皮化生患者中作为诊断肿瘤的预测因子,且准确度达97%,表明CNV的检查已在肺癌的临床诊断中表现出了独特潜力[6-7]。本研究通过公共数据库对CDC6基因进行研究,由癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库挖掘CDC6在肺癌中的拷贝数变化及拷贝数对CDC6转录的影响,并结合基因表达谱动态分析(Gene Expression Profiling Interactive Analysis,GEPIA)数据库研究CDC6基因在肺癌组织中的表达水平及与患者预后的关系,以期为肺癌的诊疗提供新的有效生物标志物。

1 材料与方法

1.1 数据获取

从TCGA数据库中获取肺腺癌(TCGALUAD)的转录谱(mRNA)数据、CNV数据及临床资料,筛选1991—2013年上述3组数据资料均齐全的经病理学检查确诊的肺腺癌者共512例,其中男性237例,女性275例;左侧肺腺癌199例,右侧肺腺癌298例,部位未知15例。mRNA-seq counts level3数据来源于下一代测序(next-generation sequence,NGS)数据,CNV 数据来自于 Affymetrix Genome-Wide Human SNP Array 6.0,针对TCGA数据,使用官方提供的下载软件进行下载。GEPIA是一种基于web的基因表达谱分析交互式分析工具,其可以根据TCGA和GTEx(Genotype-Tissue Expression)数据库数据,进行基因间的相关分析、患者生存分析、类似基因检测和降维分析[8]。使用GEPIA数据库对CDC6基因在肺癌组织中的表达情况,及与CDC6基因CNV和患者预后的关系进行研究。

1.2 数据分析

由TCGA下载的表达谱数据使用R语言软件edgR包进行数据标准化,表达差异基因阈值设置为|Log2FC|=1,P=0.01进行筛选。下载CNV数据,包括512例肺腺癌患者的肿瘤组织数据和512例癌旁对照组织数据,根据GRCh38基因组位置信息对Affymetrix Genome-Wide Human SNP Array 6.0芯片结果进行注释,对注释后的结果进行分析,寻找肺腺癌中的拷贝数差异基因。

1.3 基因本体功能富集和Pathway 分析

采用京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)、基因本体(gene ontology,GO)分析基因功能和基因组信息。

1.4 统计学分析

采用R语言软件(Rv3.5.0)进行数据分析。计数资料以例数和率(%)表示;计量资料多组间比较采用方差分析,进一步两两比较采用Bonferroni法;CDC6基因CNV与CDC6基因表达、CDC6基因的共表达基因的相关性分析采用Spearman相关性分析,以Spearman≥0.3,P<0.01筛选CDC6基因的共表达基因。采用Kaplan-Meier法绘制生存曲线,生存率的比较采用Log-rank检验。使用在线分析软件DAVID 6.8[10]对差异基因的共表达基因进行GO功能富集分析,使用在线数据库KOBAS 3.0软件[9]对差异基因的共表达基因进行KEGG通路分析,GO/KEGG使用超几何检验。以P<0.05为差异有统计学意义。

2 结果

2.1 CDC6基因CNV对CDC6mRNA表达水平的影响

对512例肺腺癌患者的CNV数据进行分析,结果显示:CDC6基因拷贝数单个缺失3例,占0.59%(3/512);正常 461例,占 90.04%(461/512);单个增加43例,占8.40%(43/512);扩增5例,占0.98%(5/512)。Spearman相关性分析结果显示,肺腺癌患者肿瘤组织中CDC6基因CNV与CDC6mRNA的表达量呈正相关(rs=0.271,P<0.01)。根据CDC6基因拷贝数不同将肺腺癌患者分为单个缺失组(n=3)、正常组(n=461)、单个增加组(n=43)和扩增组(n=5)。4组肺腺癌患者的CDC6mRNA表达量比较,差异有统计学意义(F=827408.55,P<0.01);两两比较结果显示,单个缺失组与正常组肺腺癌患者的CDC6mRNA表达量比较,差异无统计学意义(P>0.05);单个缺失组与单个增加组、扩增组肺腺癌患者的CDC6mRNA表达量比较,差异均有统计学意义(P<0.01);正常组、单个增加组和扩增组肺腺癌患者的CDC6mRNA表达量,组间两两比较,差异均有统计学意义(P<0.01)(表1)。

表1 不同组别肺腺癌患者CDC6 mRNA表达量的两两比较

2.2 CDC6基因表达与肺腺癌患者预后的关系

以CDC6基因表达量的中位数(838.76)为分界值,将512例肺腺癌患者分为CDC6高表达组(n=256)和CDC6低表达组(n=256),CDC6低表达组肺腺癌患者的生存结局明显优于CDC6高表达组,差异有统计学意义(HR=1.5,P=0.0049);CDC6基因高表达可能是肺腺癌患者的不利预后因素。(图1)

2.3 CDC6基因功能富集分析

KEGG通路分析结果显示:CDC6基因与多数共表达基因的表达水平呈正相关;其中,TOP2A、EXO1、CDCA5、BUB1B、MCM10、ORC1、NCAPH、BRCA1、RRM2基因均是CDC6基因的共表达的基因,且均与细胞分裂增殖有密切关联(表2)。对CDC6基因的共表达基因进行通路富集分析,结果发现:CDC6基因的共表达基因主要富集在修复相关通路(DNA复制、错配修复、核苷酸切除修复)、糖酵解通路和小细胞肺癌相关通路(表3)。GO功能富集分析结果显示,在细胞构成层面,CDC6基因的共表达基因参与了T复合物、透明带受体复合物、驱动蛋白复合体、DNA复制因子C复合物的形成;在分子功能层面,CDC6基因的共表达基因参与了四链体DNA结合;在生物学过程层面,CDC6基因的共表达基因参与了DNA链的延伸、核酸切除修复、蛋白质去甲酰化、转录偶联切除修复、WNT信号通路、平面细胞极性通路、核因子-κB诱导激酶(nuclear factor of kappa-B binducing kinase,NIK)/核因子-κB(nuclear factor of kappa-B,NF-κB)信号通路(表4)。

表2 CDC6基因的共表达基因分析

表3 CDC6共表达基因的KEGG通路富集分析

表4 CDC6共表达基因的GO功能富集分析

3 讨论

肺癌是世界范围内肿瘤相关死亡的最常见原因,每年约有1800例肺癌新发病例,且约有1600万例患者死亡,根据患者的病情阶段和地区差异,肺癌患者的5年生存率为4%~17%[8]。手术切除是目前临床治疗肺癌的优先选择手段,而对于Ⅲ期肺癌患者,放化疗联合使用是一种有效的治疗手段;血管生成素、表皮生长因子受体抑制剂等其他抗肿瘤药物的引入为肺癌的治疗提供了多种治疗方案,并使肺癌患者受益[11]。目前,关于肺癌的研究,预后生物标志物的筛选仍然是研究的重要方向。

CNV是肺癌发生、发展的重要影响因素;在NSCLC中,肺腺癌和肺鳞状细胞癌的CNV存在差异,其差异被研究用来区分NSCLC的亚型,同时,通过对不同肿瘤之间拷贝数差异的研究,发现CNV具有识别起源未知的肿瘤起源的潜力[12]。

CDC6在染色体17上编码,包含细胞周期蛋白依赖性激酶磷酸化位点,核苷酸结合腺苷三磷酸酶结构域等元件[13]。已有研究表明,CDC6受到miRNA-26a/b的调控,可以抑制肺癌细胞的增殖、迁移和侵袭[14],并且是前列腺癌和卵巢癌的不良预后指标[15-16]。本研究结果显示,在肺腺癌中,CDC6基因CNV与CDC6mRNA表达量呈正相关,表明CDC6基因的CNV极有可能在其表达的调控中扮演重要角色。CDC6低表达组肺腺癌患者的生存结局明显优于CDC6基因高表达组(P<0.01);CDC6基因的共表达基因TOP2A、EXO1、CDCA5与细胞分裂和周期调节有着密切的关系。在对CDC6基因的共表达基因集进行分析时,发现CDC6基因的共表达基因参与了WNT信号通路、NIK/NF-κB信号通路,此两个信号通路与肿瘤的发生发展关系密切[17-19]。

综上所述,本研究主要采用生物信息的方法,由公共数据库TCGA获得相应资料,结合GEPIA数据库及配套分析方案,探讨了CDC6在肺腺癌发展中的作用及其对预后的影响,鉴定CDC6作为肺腺癌预后标志物的潜力,然而CDC6在肺腺癌的真实作用究竟如何,仍需大量的临床和实验室证据佐证。

猜你喜欢

组肺共表达拷贝数
疏风解毒胶囊经miR-155/JAK1-STAT1信号通路发挥对甲型流感病毒H1N1肺炎模型小鼠的保护作用*
UdhA和博伊丁假丝酵母xylI基因共表达对木糖醇发酵的影响
线粒体DNA拷贝数变异机制及疾病预测价值分析
异甘草酸镁对博来霉素诱导肺纤维化大鼠治疗作用及其机制
侵袭性垂体腺瘤中lncRNA-mRNA的共表达网络
胎儿染色体组拷贝数变异与产前超声异常的相关性分析
山莨菪碱预处理对大鼠肝缺血再灌注诱发肺损伤的影响
HBV相关性肝细胞癌组织及癌旁组织PDCD1基因拷贝数差异分析
中国流行株HIV-1gag-gp120与IL-2/IL-6共表达核酸疫苗质粒的构建和实验免疫研究
共表达HIV-1与IL-6核酸疫苗质粒诱导小鼠免疫原性的研究