7种数据库工具对MRPL13蛋白在乳腺癌中的表达、功能分析及预后价值研究*
2020-04-20袁永强
符 亮,袁永强,李 玲,王 科
(重庆医科大学附属永川医院检验科,重庆 402160)
无论是在中国还是欧美等发达国家,乳腺癌都是全球范围内女性最常见的恶性肿瘤。据全球癌症年报数据显示,2012 年全球共有170 万新发乳腺癌病例,2018年增加到了210万例,乳腺癌死亡病例数由2012年的52万增加到2018年的63万,乳腺癌的发病率和病死率都跃居女性恶性肿瘤中的首位[1-2]。虽然近年来以手术、化疗、放疗和内分泌治疗等综合治疗方法使乳腺癌的治疗取得了满意成效,但其病死率仍然居高不下,据统计,乳腺癌病死率比上世纪末增长了38.4%,乳腺癌已严重威胁女性健康,防治形势严峻[3]。现阶段乳腺癌患者疗效及预后情况仍不乐观。主要原因是缺乏早期诊断、治疗敏感和预后判断的特异性的分子生物标志物。随着精确医学时代来临,在分子层面有关乳腺癌早期诊断、治疗及与预后观察的分子标志物的研究日益增多,深入研究乳腺癌的分子病理生理机制,寻找一些新型分子标志物预测乳腺癌的发展和预后,指导个体化治疗,以期改善患者的预后,提高乳腺癌患者生存质量,引起研究者们极大的关注。
目前研究表明,线粒体核糖体蛋白(MRP)基因的表达差异和MRP基因改变介导的线粒体氧化磷酸化(OXPHOS)缺陷在肿瘤的发展中发挥着重要的作用[4]。MRPL13由核基因编码,位于8号染色体q24.12上,是MRP的主要组成部分,主要协助线粒体蛋白的生物合成。虽然已有多项关于MRP基因在不同类型肿瘤表达差异的研究,但目前关于MRPL13表达在乳腺癌中的相关作用尚未见报道。本研究通过利用Oncomine、cBioPortal和String等多个数据库探索MRPL13在乳腺癌组织中表达情况和生物学功能,预测其在乳腺癌中预后的价值,为乳腺癌预后判断及相关分子机制提供有力的数据和理论依据。
1 资料与方法
1.1Oncomine数据库 为获取MRPL13在乳腺正常组织及癌组织的表达差异,在Oncomine数据库(https://www.oncomine.org/resource/login.html/)设置搜索条件:(1)“Gene:MRPL13”;(2)“Analysis Type:Cancer vs.Normal Analysis”;(3)“Cancer Type:Breast Cancer”;(4)“Date Type:mRNA”;(5)“Sample Type:Clinical Specimen”,并进一步设置P=0.05,差异倍数:1.5,gene bank为前10%获取相关资料。
1.2cBioPortal数据库 利用癌症基因图谱(TCGA)的子数据库可视化在线数据库cBioPortal(http://www.cBioPortal.org/index.do)获取临床数据,搜索条件为“Breast Invasive Carcinoma(TCGA,Cell 2015)”子库数据,选定“Putative copy-number alterations from GISTIC、mRNA Expression,Select one of the profiles below:mRNA Expression z-scores(RNA Seq V2 RSEM)”,进一步通过“OncoPrint”、“Co-expression”和“Survival”分别获得“MRPL13”在乳腺癌组织中的表达情况和共表达相关基因,以及分析乳腺癌患者生存预后临床信息。
1.3癌症细胞系百科全书(CCLE) 通过利用CCLE(http://amp.pharm.mssm.edu/Harmonizome/resource/Cancer+Cell+Line+Encyclopedia)对MRPL13 基因进行组织细胞系分析,从而得到MRPL13基因在细胞系中的表达情况。
1.4String数据库与DAVID数据库 通过String数据库(www.string.org)获取这些共表达基因的互作用关系组并进一步确定共表达网络。接着利用DAVID(http://david.ncifcrf.gov/)数据库对MRPL13进行生物学和信号通路功能分析,功能富集采用基因本体论(GO)分析,信号通路采用京都基因与基因组百科全书(KEGG)数据库分析。
1.5The human protein atlas数据库 在The Human Protein Atlas数据库(http://www.proteinatlas.org/)内输入关键字 “MRPL13”,选择 “Pathology”模块,找到MRPL13抗体(No:HPA060899)在乳腺癌中的蛋白免疫组化实验展开分析。
1.6Kaplan-Meier Plotter在线分析工具 利用Kaplan-Meier Plotter在线分析工具[5](http://www.kmplot.com/)对乳腺癌患者总生存率进行分析,设置条件:(1)“Cancer type:breast cancer”;(2)“Gene:MRPL13”;(3)“Survival:OS”。
1.7统计学处理 在共表达基因相关性分析中,对Spearman相关系数>0.55的基因进一步筛选。关于功能及通路富集分析,P<0.05表示差异有统计学意义。生存分析采用Kaplan-Meier法,计数资料用n/%表示,用χ2检验,P<0.05表示差异有统计学意义。
2 结 果
2.1乳腺癌中MRPL13的表达情况 基于Oncomine数据库,获得了7项研究涉及MRPL13在乳腺癌组织和正常组织中的表达情况,共2 999个样本,其中包括不同临床类型的乳腺癌(乳腺小叶癌、乳腺浸润性导管癌、乳腺导管原位癌、乳腺小管癌等),结果显示相较于正常乳腺组织,MRPL13表达水平在不同类型的乳腺癌中均显著增高(P<0.05),见表1、图1。为了进一步证实MRPL13在乳腺癌组织表达上调,进一步从cBioPortal可视化在线数据库中获取了816例临床样本,在这些临床中43%的样本(348例)MRPL13基因表达上调或扩增。同时,继续从CCLE数据库里获取了37类人体肿瘤的相关数据,结果显示癌组织中MRPL13基因细胞系均具有不同程度的表达,其中乳腺癌排在第2位,显示在乳腺癌肿瘤组织中MRPL13基因高表达(图2)。因此从3个不同数据库(Oncomine 数据库、cBioPortal数据库和CCLE数据库)中获得了一致结果,MRPL13蛋白在乳腺癌组织表达上调。
表1 不同类型的乳腺癌组织与正常组织MRPL13表达差异
注:A来源于ZHAO乳腺癌数据集(Zhao breast statistics),是正常乳腺组织和乳腺小叶癌组织的MRPL13的表达水平的比较;B来源于ZHAO乳腺癌数据集(Zhao breast statistics),是正常乳腺组织和导管型乳腺癌组织的MRPL13的表达水平的比较;C来源于RICHARDSON 乳腺癌数据集(Richardson breast statistics),是正常乳腺组织和导管型乳腺癌组织的MRPL13的表达水平的比较。
图1 MRPL13在正常乳腺组织与癌组织中的表达差异
图2 MRPL13在细胞系中的分析
2.2MRPL13共表达网络的构建及功能分析 为了进一步探索MRPL13及其共表达基因在乳腺癌中可能发挥的作用机制,为科研及临床治疗提供线索,利用cBioPortal数据库前期筛选到与MRPL13共表达的基因,并选择中等程度以上共表达的基因,并进一步通过String数据库发现它们的共表达基因的互作关系组,节点共有71个,即共有71种蛋白质与MRPL13蛋白有着直接或间接的联系,蛋白网络图富集P为9.1×10-10,见图3。
通过利用DAVID数据库进一步探索MRPL13在乳腺癌中的生物学功能,生物学过程主要富集在细胞有丝分裂周期和减数分裂的调节,DNA代谢及重组修复、RNA加工修饰、RNA聚合酶Ⅱ启动子的转录起始、双链断裂修复、RNA转录起始点的调节、转录后的修饰与加工及蛋白质大分子复合体的组装;分子功能主要富集在转录因子与转录起始点结合的调控;这些功能的发挥主要依赖于核膜、核内腔、线粒体膜、核质、染色体、细胞器内膜、核糖体、核仁、氧化呼吸链及周期蛋白依赖性蛋白激酶全酶复合物等。KEGG通路分析主要富集在细胞周期、卵母细胞减数分裂等,见表2。
图3 MRPL13基因共表达网络图
表2 与MRPL13密切相关的基因及基因功能富集分析
注:BP为生物学过程;CC为细胞组分;MF为分子功能;KEGG为京都基因与基因组百科全书。
2.3MRPL13在乳腺癌中的蛋白表达情况 从The human protein atlas数据库中获取到12例乳腺癌组织的蛋白表达情况,共12例,包括9例乳腺导管癌和3例乳腺小叶癌,发现MRPL13在乳腺癌组织中呈现中等程度的阳性蛋白表达有10例(图4A),仅有2例呈现弱阳性蛋白表达(图4B),几乎全部集中表达在细胞质与细胞膜内。
注:A为乳腺癌组织中中等程度阳性的MPRL13蛋白的表达;B为乳腺癌组织中弱阳性MPRL13蛋白的表达。A和B均采用免疫组化染色,放大倍数×200。
图4 MRPL13在乳腺癌中蛋白表达情况
注:A是基于cBioPortal数据库的生存率图,1表示MRPL13低表达病例,2表示MRPL13高表达病例;B是基于网络在线工具Kaplan-Meier Plotter的生存率图,3表示MRPL13低表达病例,4表示MRPL13高表达病例。
图5 MRPL13表达量与乳腺癌患者总生存期的关系
2.4MRPL13高表达与乳腺癌患者预后关系 基于cBioPortal数据库,发现在814例乳腺癌患者中,低表达组的乳腺癌患者(348例)的平均生存期是140.18个月,而高表达组(466例)的平均生存期则是113.7个月,MRPL13高表达组乳腺癌患者的总生存时间较低表达组显著缩短,差异有统计学意义(P=0.001 01),见图5A。利用网络在线工具Kaplan-Meier Plotter分析1 402例乳腺癌患者与MRPL13表达总生存率的关系,结果也显示MRPL13基因高表达与乳腺癌患者总生存率下降,差异有统计学意义(P=0.011),见图5B。综上,两个数据库均发现MRPL13表达水平对乳腺癌患者的总生存时间有着显著影响,提示MRPL13高表达患者预后较差。
3 讨 论
近年来,乳腺癌患者的生存质量得到了很大程度的改善,但是发病率逐年升高,且仍有部分患者预后较差,因此深入研究乳腺癌发生发展的分子机制,寻找新的治疗靶点和预后标志物十分重要[6]。最近一项针对人类9种不同肿瘤的基因表达谱分析发现MRP基因在癌症组织中的表达存在显著差异[7]。然而,目前仍然不清楚OXPHOS缺陷在肿瘤中的发生发展作用机制。但是已有多项研究发现MRP基因表达差异和改变与OXPHOS损伤密切相关。例如,有研究发现MRPL11表达下调是OXPHOS表达改变和翻译缺陷的决定因素,并且在人体头颈部鳞状细胞癌发展过程中发挥着重要作用[8]。同时也有研究表明结直肠癌发生和进展中存在多个MRP基因的表达上调,其中MRPL21和MRPL16呈明显高表达,这些上调表达的MRP基因可作为结直肠癌潜在的预后标志物[9]。在一项裸鼠体内实验发现,MRPL28基因的表达差异直接影响线粒体代谢过程的改变,并且这种改变是胰腺癌侵袭进展的关键[10]。然而,将MRP改变与癌细胞活性联系起来的潜在机制仍有待阐明。
目前有研究发现,线粒体缺陷参与肿瘤细胞的生长及侵袭,并且肿瘤OXPHOS缺陷主要与人类线粒体DNA(mtDNA)缺失或点突变有关。mtDNA是一个双链环状DNA,可编码13种蛋白,并且这13种蛋白都是OXPHOS系统中有氧呼吸产生ATP的重要成分,而13种必需OXPHOS蛋白亚基的生物合成mtDNA编码合成的最终执行者依赖线粒体核糖体[11]。目前已有研究发现,由MRPL13介导的 OXPHOS缺陷可以通过增强CLN1表达来进一步增加肝癌细胞侵袭活性,导致肝癌患者预后不良[12]。但目前MRPL13在乳腺癌中的作用仍不清楚。肿瘤细胞的发生发展高度依赖OXPHOS,其在迅速形成结节肿块过程中会经历间歇性缺氧,因此以往人们认为OXPHOS缺陷是一种癌症伴随现象,然而近些年来多项研究支持OXPHOS损害与肿瘤侵袭密切相关[13-15]。线粒体内含13个编码线粒体OXPHOS的蛋白质,但只产生13个mtDNA编码的OXPHOS亚基,而线粒体核糖体才是合成必需OXPHOS蛋白的最终执行者[11,16]。人类MRP包括小的28S和大的39S亚基。小亚单位(MRPS)由30个有丝分裂核糖体蛋白组成,大亚单位(MRPL)由52个MRPS组成[17]。有研究表示线粒体功能障碍促进迁移和侵袭性肿瘤细胞活动,在许多癌症中通过活性氧生成或低氧诱导因子1α积累[18]。这些结果均表明,深入研究MRP与肿瘤进展之间关系,可能有助于理解肿瘤发生过程中涉及的新的分子和代谢机制。
在本研究中,首先利用Oncomine数据库分析获取了MRPL13在不同类型乳腺癌中均呈现表达显著上调的情况,然后再通过TCGA的可视化在线数据库cBioPortal和CCLE数据库获得一致结果,紧接着从The human protein atlas数据库中获取到MRPL13在乳腺癌组织中呈现中等程度的阳性蛋白表达。因此,从多种不同得数据库,不同的角度证实了MRPL13在乳腺癌组织表达上调。在此理论基础上,利用String数据库与DAVID数据库构建了MRPL13表达网络和GO分析及KEGG分析,通过对MRPL13共表达网络构建及分析发现其可能参与细胞有丝分裂周期和减数分裂的调节,DNA代谢及重组修复、RNA加工修饰、RNA聚合酶Ⅱ启动子的转录起始、双链断裂修复、RNA转录起始点的调节、转录后的修饰与加工及蛋白质大分子复合体的组装;并且对转录因子与转录起始点结合进行调控;这些功能的发挥依赖于核膜、核内腔、线粒体膜、核质、染色体、细胞器内膜、核糖体、核仁、氧化呼吸链及周期蛋白依赖性蛋白激酶全酶复合物等,同时也参与细胞周期、卵母细胞减数分裂所涉及的信号通路。最后,通过cBioProtal数据库进行生存分析发现MPRL13高表达组乳腺癌患者的总生存时间较低表达组显著缩短,提示乳腺癌患者预后不良;同时又利用了网络在线工具Kaplan-Meier Plotter进行分析,得到结论相一致。但仍需实验对MRPL13在乳腺癌中的表达及功能进行验证,深入探讨其功能和作用机制。
4 结 论
通过使用Oncomine数据库、cBioPortal、CCLE数据库和The human protein atlas数据库发现了一致的结果MRP L13在乳腺癌症组织中表达上调,并进一步通过蛋白水平发现MRPL13蛋白呈现中等程度表达且主要集中表达在细胞质与细胞膜内。最后利用cBioProtal数据库和网络在线工具Kaplan-Meier Plotter分析对MRPL13高表达组乳腺癌患者进行生存分析发现MPRL13高表达组乳腺癌患者的总生存时间较低表达组显著缩短,提示乳腺癌患者预后不良。MRP L13可以作为乳腺癌的一种潜在的新型分子诊断和预后评估生物标志物,该研究为科研实验和临床研究提供了线索,需实验对MRPL13在乳腺癌中的表达及功能进行验证,深入探讨其功能和作用机制。