APP下载

基于Oncomine和TCGA数据挖掘分析MTERF2在胰腺癌中的表达及临床意义

2019-05-07王唯斯梅雯孙美涛李彬张态张若鹏熊伟

生物技术通讯 2019年2期
关键词:胰腺癌线粒体生存率

王唯斯,梅雯,孙美涛,李彬,张态,张若鹏,熊伟

大理大学 a.基础医学院;b.公共卫生学院;c.第一附属医院;云南 大理 671000

胰腺癌是常见的消化系统恶性肿瘤之一,其发病率和死亡率近年来明显上升。中国每年胰腺癌的诊断和死亡人数超过了美国的病例数[1]。胰腺癌的发病率与病死率相近,预后极差[2]。线粒体转录终止因子2(mitochondrial transcription termination factor 2,MTERF2)又称线粒体转录终止因子D3(mitochondrial transcription termination domain containing 3,MTERFD3)或线粒体转录终止样因子(mitochondrial transcription terminationlike factor,MTERFL),是通过比较血清培养与血清饥饿培养的人类成纤维细胞基因表达谱差异发现的一个细胞增殖抑制基因[3]。该基因定位于染色体12q24.1,含有4 个外显子和3 个内含子,cDNA 序列全长为1478 bp,编码385 个氨基酸残基组成的蛋白质[4]。MTERF2 高表达于新陈代谢较为旺盛的心脏、肝脏和骨骼肌组织,而在其他组织中表达水平较低,表明MTERF2 是一个典型的线粒体蛋白质[5-6]。前期研究还发现,MTERF2是血清饥饿诱导的蛋白质,过表达MTERF2 将细胞周期阻滞于G1/S 期,对细胞增殖和生长有较强的抑制作用,但并不导致细胞凋亡[7]。国内外不同的研究表明,MTERF2 在体内与线粒体DNA(mitochondrial DNA,mtDNA)的结合没有序列特异性,且抑制线粒体基因的表达[8-10]。MTERF2 在线粒体内的含量相对丰富,是线粒体拟核的重要组成成分[11]。MTERF2 是参与线粒体基因表达调控的重要因子,目前,对于MTERF2 基因在胰腺癌组织中的表达及其临床意义尚不清楚。深入研究胰腺癌的病因及其发病机制,寻找高度敏感的分子标志物,对胰腺癌的早期诊断和预后判断都具有重要意义。

Oncomine 数据库是目前世界上最大的肿瘤基因芯片数据库和整合数据提取平台,是赛默飞公司(Thermo Fisher Scientific)开发的商业化数据库,注册会员登陆后可提取肿瘤相关基因的信息,整合的芯片数据以高质量得到学术界的广泛认可。目前版本为Oncomine v4.5,包括100 种肿瘤类型、729 个数据集和91 866 个组织芯片结果。Oncomine 数据库集合了世界上最全的基因组DNA 拷贝数、突变、融合基因和mRNA 表达的芯片和深度测序结果[12]。癌症基因组图谱(The Cancer Genome Atlas,TCGA)是目前最大的癌症基因信息的数据库,有全面的癌症突变谱、基因表达数据以及相关的临床信息。此数据库对于了解癌细胞发生和发展的机制,发现新的治疗靶点和新的诊断治疗方法有重要意义[13]。

本研究旨在深度挖掘Oncomine 数据库中收录的MTERF2 在胰腺癌中的表达,对MTERF2 在人类胰腺癌组织和正常胰腺组织中的表达进行荟萃分析。利用R 语言软件从TCGA 数据库下载胰腺癌患者MTERF2的表达水平及其相关病例临床信息进行分析,探讨MTERF2 在胰腺癌中的表达及临床意义,并预测MTERF2 参与肿瘤发生发展的作用机制。

1 资料与方法

1.1 从Oncomine数据库提取数据

Oncomine 数据库是一个基于基因芯片的数据库和整合数据挖掘平台,可根据需要设定筛选和挖掘数据的条件。本研究中,我们设定的筛选条件为:①Gene:MTERFD3;②Analysis type:Cancer vs.Normal analysis;③Cancer type:Pancreatic can⁃cer;④Date type:mRNA and DNA;⑤Simple type:Clinical specimen;⑥临界值设定条件(Pvalue<1E-4,fold change 2,gene rank=top 10%)。数据输出保存为Excel 表格。

1.2 从TCGA数据库下载数据

从 TCGA(http://tcga-adtaa.nci.nih.gov/tcga/)数据库,使用R 2.15.3 软件Epicalc 函数包下载并预处理胰腺癌数据集的mRNA Seq V2 数据,进行MTERF2 相对表达量的分析,同时下载临床资料相关数据,进行临床病理相关性分析。

1.3 数据集整理与临床病理相关参数筛选

通过数据下载得到的含有MTERF2 mRNA 表达量的胰腺癌组织样本179 例,并有179 例胰腺癌病例相对应的临床病理资料和预后资料。通过对临床资料数据进行筛选分析,剔除临床病理资料不全或不完整的病例以及缺乏预后随访资料的病例,仅保留TCGA 数据集中包含临床参数和生存资料的病例,最后得到含有完整临床病理参数和生存资料的病例161 例。根据mRNA 测序结果分析,胰腺癌组织样本中MTERF2 mRNA 表达量为 57.3109~786.2748,中位数为 229.306。某一样本MTERF2 mRNA 表达水平大于中位数,则定义为MTERF2 高表达,反之则定义为低表达。根据这个定义,乳腺癌组织中MTERF2 高表达81例,低表达80 例。

1.4 利用Kaplan-Meier模型进行胰腺癌患者生存周期分析

用R 2.15.3 软件下载胰腺癌患者临床病例参数和生存资料,采用Kaplan-Meier 模型,对胰腺癌患者预后进行分析。

1.5 统计学分析

建立患者临床资料库,将患者年龄、性别、T分期、N 分期、M 分期、AJCC 病理分期、饮酒史、等级、癌症类型、组织学类型、原发部位和MTERF2表达水平等指标进行量化赋值,然后将全部资料输入计算机,用R 语言2.15.3 与GraphPad Prism 5软件进行统计学分析。采用Shapiro-Wilk 法检测胰腺癌组织中MTERF2 mRNA 表达水平不符合正态分布,所以胰腺癌组织中MTERF2 表达水平的比较采用Mann-Whitney U 非参数检验。临床病理参数相关性分析,组间比较采用卡方检验及Fisher 确切概率法,生存分析采用Kaplan-Meier,单因素和多因素分析采用Cox 比例风险回归模型,检验水准α=0.05。

2 结果

2.1 MTERF2在所有肿瘤类型中的表达

Oncomine v4.5 数据库中共收集了586 个不同类型的研究结果,其中关于MTERF2 表达有统计学差异的研究结果共58 个,MTERF2 表达增高的研究有26 个,MTERF2 表达降低的研究有32 个(表1)。在消化系统恶性肿瘤中,结直肠癌中高表达的研究有2 个、低表达的有3 个,胃癌中高表达的研究有3 个、低表达的研究有2 个,胰腺癌中高表达的研究有0 个、低表达的研究有3 个,肝癌中的表达没有报道。

2.2 MTERF2在胰腺癌中的表达结果

在Oncomine v4.5 数据库中,从2003年开始,共有9 个研究涉及MTERF2 在胰腺癌组织和正常胰腺组织中的表达(图1),包括226 个样本。文章分别发表于Hepatograstroenterology、Oncogenes、Am J Pathol、Cancer Sci、Cancer Cell。荟萃 9 个研究结果发现,与对照组相比,MTERF2 在胰腺癌中低表达,且具有显著性差异(P=7.34×10-6)。

2.3 MTERF2在不同胰腺癌研究芯片中癌组织和正常组织之间的表达差异

分析Oncomine 数据库中MTERF2 在不同胰腺癌研究芯片中的表达结果发现,相较于正常胰腺组织,胰腺癌组织中MTERF2 mRNA 均呈低表达(图2)。

2.4 MTERF2表达量与临床病理参数相关性

TCGA 数据集中共纳入161 例临床病理参数完整的病例资料,其中男性89 例、女性72 例,年龄35~88 岁,中位年龄65 岁。对该数据集中宫颈癌患者预后影响因素进行赋值,通过统计分析可知,MTERF2 mRNA 表达水平与胰腺癌患者的T分期、M 分期、癌症类型及原发部位显著相关(均P<0.05),而与患者的年龄、性别、N 分期、AJCC病理分期、等级、组织学类型及饮酒史无显著相关(均P>0.05)(表2)。

2.5 MTERF2的表达与胰腺癌预后的关系

MTERF2 在胰腺癌中表达水平降低,为了进一步明确MTERF2 表达与胰腺癌预后之间的关系,本研究在TCGA 胰腺癌数据集中提取了MTERF2 临床病理相关参数,运用Kaplan-Meier 模型进行分析。如图3所示,MTERF2 表达水平在总生存率(overall survival,OS)中与胰腺癌患者预后情况无关(Log-rankP>0.05),MTERF2 表达水平在无病生存率(disease-free survival,DFS)中与胰腺癌患者预后情况显著相关(Log-rankP=0.001)。MTERF2 高表达的胰腺癌患者无疾病进展生存时间比MTERF2 低表达的患者显著延长。

进一步对影响胰腺癌患者生存的因素进行单因素和多因素分析(表3)。单因素分析发现,N 分期和组织学类型与胰腺癌患者预后显著相关(均P<0.05),年龄、性别、T 分期、M 分期、AJCC 临床分期、等级、饮酒史和MTERF2 mRNA 表达量与胰腺癌患者总生存率无显著相关性(均P>0.05)。对影响胰腺癌患者生存的因素进行多因素分析,结果表明,组织学类型与胰腺癌患者无病生存率显著相关(均P<0.05)。无论Kaplan-Meier 模型还是COX 比例风险回归模型,结果都表明MTERF2 在胰腺癌中的表达量与患者的总生存率无显著相关。

表1 MTERF2在Oncomine数据库中所有人类肿瘤相关研究中的表达

3 讨论

图1 人MTERF2在Oncomine数据库中胰腺癌中的表达

胰腺癌是最具侵袭性的恶性肿瘤之一,其5年生存率低于7%,由于诊断不足和治疗效果不佳,严重威胁人类的健康[14]。胰腺癌发病率逐年提高,在未来10年内将发展成为人类癌症相关死亡的第二大原因[15]。目前治疗仍以争取手术切除为主,对不能手术者常做姑息性短路手术、化学疗法和放射治疗。然而,由于早期症状无特异性以及早期诊断手段不足,只有15%~20%的患者能够及时行根治性手术,而晚期病人生存率低于30%。与正常人相比,胰腺癌患者的预期寿命降低了98%[16]。如果能够早期发现胰腺癌,行根治性手术,病人的生存率将大幅提高[17]。因此,胰腺癌的诊治更加注重预防、早期诊断与治疗[1]。但是由于胰腺癌的自身特点,导致其早期诊断难,进展到晚期又缺乏有效的治疗手段,所以探索胰腺癌不同的分子标记物是胰腺癌预防、早期诊断及治疗的重要环节。

人MTERF 蛋白家族是一类高度保守的线粒体DNA 结合蛋白,广泛存在于后生动物与植物中,在人类线粒体基因表达调控方面具有重要作用。人 MTERF 蛋白家族有 MTERF1~MTERF4 等 4个成员,它们在线粒体基因复制、转录与翻译过程中发挥调控作用[4]。人MTERF2 是线粒体基因表达的调控因子之一,可以通过调控线粒体氧化磷酸化活性进而影响细胞增殖和生长[18]。线粒体功能障碍与恶性肿瘤、神经退行性疾病(帕金森症、阿尔茨海默症)、线粒体糖尿病、母系遗传性耳聋等多种疾病的发生和发展密切相关[19]。

图2 Oncomine基因芯片数据库中MTERF2在不同胰腺癌研究对列中的表达(*P<0.05,**P<0.01)

本研究首先利用Oncomine 胰腺癌数据分析MTERF2 在胰腺癌组织与正常胰腺组织中的差异性表达,发现MTERF2 在胰腺癌组织中呈低表达。这提示MTERF2 基因在肿瘤细胞内的作用可能类似于抑癌基因,低表达MTERF2 通过影响线粒体活性,进而促进肿瘤细胞的增殖和生长。同时,利用TCGA 肿瘤数据库中胰腺癌患者MTERF2的表达量与相匹配的临床数据参数进一步分析MTERF2 表达水平与胰腺癌病理特征及预后的关系。MTERF 表达水平与胰腺癌患者T 分期、M 分期、癌症类型及原发部位显著相关,具体机制尚不清楚,有待进一步研究。Kaplan-Meier 生存分析发现,MTERF2 表达水平与胰腺癌患者总生存率无关,与胰腺癌患者无疾病进展生存率显著相关。MTERF2 高表达的胰腺癌患者无疾病进展生存时间比MTERF2 低表达的患者显著延长。Cox比例风险回归模型分析再次证实,MTERF2 表达水平并未对胰腺癌患者的总生存时间造成影响。

本研究基于Oncomine 数据库与TCGA 癌症数据库,探讨了MTERF2 在胰腺癌中的表达及其预后意义,为进一步阐明MTERF2 在胰腺癌发生发展中的作用及其机制奠定了理论基础,也为临床胰腺癌的早期诊断和治疗提供潜在靶点。

表2 MTERF2表达水平与胰腺癌临床病理参数相关性分析(n=161)

图3 MTERF2表达状态与胰腺癌预后的关系

表3 影响胰腺癌患者预后的临床病理参数的单因素和多因素分析

猜你喜欢

胰腺癌线粒体生存率
线粒体自噬在纤维化疾病中作用的研究进展
胰腺癌治疗为什么这么难
棘皮动物线粒体基因组研究进展
线粒体自噬与帕金森病的研究进展
“五年生存率”不等于只能活五年
人工智能助力卵巢癌生存率预测
日本首次公布本国居民癌症三年生存率
“五年生存率”≠只能活五年
STAT1和MMP-2在胰腺癌中表达的意义
线粒体靶向递药系统的研究进展