APP下载

大数据与精准医学

2020-04-14陈润生

中国信息化周报 2020年2期
关键词:组学基因组精准

精准医学已经在全世界得到了普遍的重视,我国领导人也多次对于其发展作出过重要的指示,在财政资金支持上也有具体体现。我今天主要谈精准医学的三个方面问题。

组学大数据

与临床医学的结合

精准医学的本质是什么,核心是什么?我看到国内有各种各样的评论,关于精准医学的内涵,各种观点都有。个人认为,精准医学的核心其实非常明确,就是组学大数据与医学的结合。说得更具体一点,就是组学大数据与临床医学的结合,把组学大数据用到临床的医学当中来,提高医疗诊断的准确度,提高治疗的效果。

这里有两个词的含义需要搞清楚,一个是组学大数据,另外一个是医学。其中组学大数据又包括两层含义,一个是组学,一个是大数据。近年来临床研究的不断发展,人类获得了越来越多以基因组为代表的分子水平的人类信息,这是前所未有的。随着以基因组为代表的组学数据的发展,人们越来越多地积累了以遗传密码为代表基因的信息,也包括蛋白质信息。之后人们发现,挖掘这些信息会得到很多的反映人类健康和疾病的信息。所以有人提出,如果把这些信息应用到临床医学中,一定会提高临床诊疗的效果。

但是,只获得遗传密码的信息是不够的。遗传密码即使能够获得也读不懂,因为只有四个字母(A、C、G、T),要读懂它,就要发展大数据分析的理论方法和技术。所以,要把这些组学数据用到临床当中,必须是组学数据和大数据分析方法的结合。一部分是组学大数据,一部分是医学,两者相结合就构成了精准医学的本质和核心。

关于精准医学命名,从上世纪90年代组学数据用到临床当中,发展转化成转化医学,个体化医学, 2011年有了精准医学的提法,不管怎么说,其本质是清楚的,就是组学大数据在临床医学当中的应用。

可能改变

医疗健康的基本概念

如果精准医学只是把医疗技术的精准度提高一点百分数,我想,它一定不会引起如此广泛的关注。从精准医学的内涵上看,其一定会引起医疗的本质的变化,这个变化是什么,用一句话来讲,是精准医学有可能改变医疗健康的基本概念,促使其从当前的诊断治疗转变成健康保证。

现在的医疗体系面对的是病人,主要是对病人的病情进行诊断和治疗,使病人恢复健康。但是,随着精准医学的不断深入发展,组学大数据的介入,会使得未来健康这一概念不仅是指向病人,而是指向全民。任何人在没有患病的时候通过测量其组学数据进行分析,就可以对其未来健康发展的危险因素做出评估。根据评估结果进行适当医疗干预,从而使一些疾病不再发展,一些疾病的危害程度大幅度减轻,一些疾病的患病风险被遏制,提高大众的生活质量,通过这样的手段将整个医疗健康体系的关口前移。

面对这样一个根本性的概念转变,可能导致大量相关新兴产业的出现。有人预估,与精准医学相关的概念转变将近2万亿元人民币的新价值,对GDP产生显著影响。

精准医学研究已成为新一轮国家科技竞争与引领国际战略的制高点。美国要测量100万自然人的遗传密码,欧盟也在积极推动精准医学的研究,日本也在进行精准医学相关的投入和计划。

四方面促使产业变革

仔细分析精准医学的概念,我们会发现其至少在四个方面可能促使相关产业的变革和发展。

一是可以促使海量的生物样本库和数据库的发展。由于精准医学的推动,需要测量百万人量级的组学信息,会涉及到巨量生物样品的获取,保管、提取,这将形成一个非常庞大的产业链。同时,百万人数量级样本数据一定会促进相应的大规模数据库的发展,保守估计,这个产业的规模可能是百亿数量级。

二是获得的样品要测量以基因组为代表的组学数据,测量内容包含了基因组、蛋白组、转录组等,这些测序的数据的价值,截止到2018年就已经达到近150亿美元的规模。有了样本库,有了组学数据的测量,接下来在海量数据挖掘的基础上,就可以促进生成大量新的分子诊断指标。这就会增加数量庞大的跟疾病相关的信息,这些信息当中,有很多都可以作为新的疾病的标记。同时,也可以发现很多新的药物设计靶点,这就促进了第三个相关产业的发展,就是分子诊断和药物设计靶点的相关产业。

四是伴随着精准医学概念而产生的新的医疗设施。例如成立一些健康源,增加一些健康师,从这些方面讲,可以和现在医院、医生相关的新兴产业大概会达到千亿数量级。这些产业必然会带来整个行业的剧烈变革,国内目前已经有所体现,有成百上千个小的公司不断地成立。

如何才能精准

要实现精准医学,要做哪些工作?做好哪些工作,才能做到精准?我觉得至少要具备两个条件,第一步要具备组学大数据的基础。精准医学就是把组学数据用到临床当中,首先要获取组学数据,就是要获取基因组,蛋白组、转入组、代谢组等这些相关数据。这些数据本身是没有用的,这就需要第二步,组学数据的挖掘。数据挖掘会用到大数据分析的理论和方法,包括人工智能、深度学习等,以获得在分子水平上跟疾病相关的知识。

掌握了这些分子知识和组学知识,想要运用到临床疾病当中来,还要建立第二个基础,就是搭建分子水平的以基因型为代表的信息核。建立这一桥梁之后才能有效地把分子水平的信息转化应用到疾病的诊断和治療当中来。这也同时要求我们建立生物信息学、生物网络、系统生物学等。

有了这两个基础,就可以更好地实现精准医学。当然,精准医学的发展,应当和当前的临床影象学、临床生化检验等很好地进行融合,把新的数据应用在原有的数据上,才能体现出精准医学推动产业更好地发展。

我们才刚上路

精准医学成为热词之后,有人认为现在什么都可以精准,医学很容易精准了。我个人的观点,精准医学虽然可能带来本质上的变革、可能引导规模巨大的新兴产业的发展,但是现在才刚刚上路。在精准医学这个概念下,我们用精准医学的核心来衡量,我们离这个目标很远,目前依然存在着巨大的挑战。

精准医学的基础是组学大数据,包括组学和大数据都存在着挑战。比如组学,我们很容易测量得到数据,但对数据的内涵大部分我们并不知道。大数据的挖掘本身也有很多问题,包括数据本身生物学含义的挖掘,包括数据样本、数据集本身的缺陷等都依然存在很多问题。还有数据共享的问题,我们知道要做大数据,现在每个医院都存在大数据,怎样在国家层面上数据共享,不仅是科学问题,还有管理问题、共享问题。没有大数据的共享,我们就是在大数据时代做小数据的工作。但从另外一方面讲这些问题同样也是机会,不管对技术研究还是产业发展都是巨大的机会,对非编码的研究无疑会对疾病的诊断治疗提供全新的方向,对药物的设计研发提供新的平台,对新物种、新性状的培育提供一个新的基础。

我们对于未知数据的研究,了解一点,就可以推进一点,然后应用一点,从而推动整个精准医学的发展。基于以上来看,精准医学其实才刚刚开始。

(本文根据陈润生院士公开演讲内容整理而成,未经本人确认。)

猜你喜欢

组学基因组精准
牛参考基因组中发现被忽视基因
精准防返贫,才能稳脱贫
口腔代谢组学研究
精准的打铁
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
精准扶贫 齐奔小康
精准扶贫二首
代谢组学在多囊卵巢综合征中的应用
基因组DNA甲基化及组蛋白甲基化
有趣的植物基因组