APP下载

蛋白质组的黄金时代正在来临

2018-02-15采访王彦文受访

张江科技评论 2018年5期
关键词:组学基因组测序

■ 采访 /王彦文 受访 /丁 琛

精准医学的实现,离不开蛋白质组的发展,因为蛋白质组能够更加直观地反映我们身体的状况。

提到精准医疗,很自然联想到的一个词是基因测序,基因是生命的遗传密码,很多疾病都可以从基因层面得到解释和治疗。然而,人类个体的性状并不是只由DNA决定的,根据现代生物学的中心法则,遗传物质的编码信息是从DNA,通过RNA,最终翻译成蛋白质来体现的,蛋白质才是生命活动的最终执行者。蛋白质组能够更加直观地反映我们身体的状况,因此,精准医学的实现,离不开蛋白质组的发展。

遮盖在基因组背后的蛋白质组

一直以来,蛋白质组的发展,无论是基础研究还是技术应用都相对不够成熟,这也导致了蛋白质组一直被遮挡在基因组巨大的光环后。2001年,第一个人类基因组草图被描绘出来;2014年,蛋白质组草图绘制完成。蛋白质组的发展整整落后了基因组13年。无论是美国,还是中国,都把基因组作为精准医学的核心,以致于在很长一段时间中,蛋白质组学被称为“功能基因组学”,甚至“后基因组学”,当作基因组学的一部分而存在。

和基因组相比,蛋白质组要更加复杂,我们每个人的身体中只有一套基因组,蛋白质的数量却远远超过基因的数量。同一个基因,通过不同的剪接、翻译后修饰等可以形成多个不同的蛋白质,在不同的组织中、不同的生理条件下,蛋白质组的成分都是不同的。细胞中蛋白质的含量差距非常大,对于一些低丰度的蛋白质,现在的技术很难检测到,此外,蛋白质无法像基因组那样进行扩增,所以要实现蛋白质组测序的全覆盖是很困难的事情。如果不能做到深度覆盖,就无法像基因组那样去全面地了解健康和疾病状况下身体的差异。蛋白质组学发展的局限性,很大程度是受到技术发展的滞后性的影响。复旦大学生命科学学院丁琛研究员说,15年前,他开始做蛋白质组研究的时候,要对一个样本中的蛋白质完全进行检测可能需要小半年的时间。丁琛研究员一直深耕在蛋白质组学领域,致力于发展蛋白质组学新技术和新方法、蛋白质组的转录调控研究和高维度关系的解析。

“最近几年,技术滞后的问题已经在逐渐解决了,现在,质谱仪已经能够在一天之内完成一个样本1万多种蛋白质的检测,覆盖程度已经非常接近转录组。

蛋白质组迅速发展

“最近几年,技术滞后的问题已经在逐渐解决,现在,质谱仪已经能够在一天之内完成一个样本1万多种蛋白质的检测,覆盖程度已经非常接近转录组。”丁琛研究员介绍说,“当下,蛋白质组测序的瓶颈在于测序通量不够,还不能像基因组那样实现大通量测序。”

基因组学的迅速发展,得益于基因测序技术的进步。过去的20年间,质谱技术的高速发展也极大地推动了蛋白质组的发展。现在,新型的质谱仪一小时可以对6 000种蛋白进行检测,一个人类组织样本从进入机器检测到出结果只需要几个小时,对未知蛋白质的鉴定、靶向蛋白质定量、蛋白质降解的研究等都在走向临床。丁琛研究员介绍说:“虽然现在蛋白质组检测的通量还达不到基因组的水平,但是在检测速度以及深度上是完全没有问题的。”随着技术的进步,很多曾经只侧重于研究基因组的项目,也开始纷纷转向蛋白质组学。

2016年初,美国前总统奥巴马启动癌症“登月”计划(Cancer Moon Shot 2020),让精准医学正式落地。蛋白质作为生命活动的实际承担者和大多数药物的治疗靶标,在精准医学中的重要性不言而喻,越来越多的科学家呼吁将蛋白质组也列入计划之中。2016年7月,美国退伍军事事务部(VA)、美国国防部(DoD)和美国国家癌症研究所(NCI)三部门联合宣布将基因组和蛋白质组作为常规检测手段,对癌症患者进行个性化研究。2016年9月,7个国家和地区(澳大利亚、韩国、中国、中国台湾、瑞士、加拿大、德国)联合宣布加入“癌症登月计划”,合作开展大规模癌症样本的蛋白基因组研究。自此,蛋白质组学正式加入“癌症登月计划”。中国的精准医学重点专项,也包括很多蛋白质组的研究,2014年启动的“中国人类蛋白质组计划(CNHPP)”就试图在蛋白质水平上来解释肿瘤的分子机制。

2006年,NCI和美国人类基因组研究所(National Human Genome Research Institute,NHGRI)联合启动了美国肿瘤基因组图谱(The Cancer Genome Atlas,TCGA)项目,目的是通过对33种常见的癌症类型,超过11 000种肿瘤的基因组进行分析,来了解肿瘤产生的原因,帮助开发新的疗法。随后,NCI启动了临床肿瘤蛋白质组分析联盟(Clinical Proteomic Tumor Analysis Consortium,protein,CPTAC)项目,针对 TCGA项目中的肿瘤样本,使用标准化的前沿手段在蛋白质组层面进行分析。蛋白质组作为一种动态指标,能够更加精准地反映身体的状态,对疾病的发现和诊断提供直接的依据。

蛋白质组数据的大量产出对数据的分析提出了更高的要求,全面分析和处理数据成了蛋白质组技术应用的瓶颈。在此背景下,丁琛研究员课题组联合北京蛋白质组研究中心秦钧教授课题组、华东师范大学石铁流教授课题组建立了国际上最高效的蛋白质组深度覆盖平台和首个蛋白质组数据综合分析云平台Firmiana(梧桐树),该平台现在已有16个国家的180多个实验室在使用,能够完成质谱原始文件收集、数据处理、生物信息学分析、知识挖掘的一站式综合分析,使得蛋白质组的研究更加便捷。

蛋白质组的应用

基于蛋白质组研究技术上的突破和临床大数据的积累,蛋白质组在精准医疗方面的应用前景也日益清晰,在预后预测、精准分子诊断、用药效果、复发转移预测上,蛋白质组展现出其独特的作用。以当下大热的免疫检查点抑制剂PD-1为例,PD-1药物在多种实体瘤的治疗上展现出了良好的应用前景。2017年,美国食品药品监督管理局批准Keytruda可用于治疗实体瘤,前提是患者肿瘤组织需要有“错配修复缺陷”(dMMR)和“微卫星高度不稳定性”(MSI-H),然而,对于dMMR和MSI-H阳性的患者,PD-1药物在一些患者中的治疗效果也不尽人意。再例如,赫赛汀是HER-2阳性乳腺癌患者的特效药,但是,即便是HER-2阳性的患者,使用赫赛汀的有效率也只有50%。因此,仅仅依靠基因组数据而忽略了蛋白质组来对药物治疗效果进行预测是不全面的。蛋白作为“一线员工”,和基因并不是一对一的关系,仅凭基因组无法了解蛋白水平的差异,无法了解有哪些信号通路在辅助或者拮抗药物的作用效果。蛋白质组的临床应用对实现精准医疗的重要性不言而喻。

对简单的单基因遗传病,在基因组的基础上就可以做出很好的判断,而那些相对复杂的遗传病,比如高血压、糖尿病、癌症等,仅从基因组角度很难进行解释,需要多组学的合作进行确诊。

“未来,蛋白质组要广泛应用于临床可能还需要3~5年。”丁琛研究员说,“当下,蛋白质组的研究处于一个加速状态。很多产业园、公司都在投资蛋白质组的研究和临床应用,未来3年,肯定会有一些临床实践。”蛋白质组的研究相对基因组更加复杂,蛋白质的翻译过程,包括翻译后修饰、蛋白-蛋白相互作用、细胞内定位等都是基因组所没有的。受限于现在技术发展水平,蛋白质组在临床上的大规模应用,还未涉及这样高维度的形式,更多是从蛋白质的有和无,量的多和少来进行分析。

“基因组测序技术的大规模临床应用得益于全基因组测序价格的大幅度降低,相比基因组测序,蛋白质组测序的价格要高,但差距已在逐渐缩小。”丁琛研究员介绍说,“蛋白质组测序价格的降低是非常值得期待的。”随着技术的进步,他相信在3年以内,肯定会有大幅度的降低。

未来,基因组和蛋白质组都会成为了解一个人的重要数据,基因组提供遗传背景,蛋白质组提供人体的实时动态信息,两者共同推动精准医学的应用。

我们相信,蛋白质组研究已经在爆发的前夜!

推动人类表型组研究领域的发展未来(科学)论坛

丁 琛

2008年毕业于中国科学技术大学,细胞生物学博士。毕业后赴美国贝勒医学院从事生物质谱和蛋白质组学博士后研究工作。2012年全职回国在北京蛋白质组研究中心任副研究员、研究员。2014年入选“北京市优秀青年人才”。2015年起受聘为复旦大学生命科学学院研究员。

猜你喜欢

组学基因组测序
影像组学在肾上腺肿瘤中的研究进展
牛参考基因组中发现被忽视基因
东莨菪碱中毒大鼠的代谢组学
影像组学在核医学影像中的应用进展
外显子组测序助力产前诊断胎儿骨骼发育不良
科学家找到母爱改变基因组的证据
血清HBV前基因组RNA的研究进展
中草药DNA条形码高通量基因测序一体机验收会在京召开
基因测序技术研究进展
外显子组测序助力产前诊断胎儿骨骼发育不良