存好、管好、用好生命健康大数据
2018-05-12
《2018年国务院政府工作报告》提出,国家科技投入要向民生领域倾斜。全国政协委员、北京基因组所所长薛勇彪表示,生命健康大数据是关系到国家人口健康和生物安全的重要基础资源。目前,国内数据流失严重、主权丢失、安全无法保障、再利用效率极低,亟待加快建设国家级共享平台,存好、管好、用好宝贵的生命健康大数据。
“精准医学”的序幕已经拉开,生命健康大数据的有效利用有助于推动精准医学研究,催生医疗模式变革。“随着‘健康中国’战略的实施和健康医疗技术的不断发展,生命健康领域数据迎来爆发式增长,预计今后5年我国将产生300PB(1PB=1 024TB)以上的基因组数据。”薛勇彪说。
薛勇彪发现,我国生命健康数据面临两大“痛点”。一是流失严重。学术期刊通常要求论文递交者把数据在学界认可的数据库公开。由于国内缺乏生命健康大数据管理公共平台,我国学者只能将大部分的数据递交到美国NCBI和英国EBI等国际知名数据库。据估计,NCBI数据库中30%以上的数据来自中国。二是数据孤岛严重,利用效率低。由于缺乏管理共享机制,宝贵的生命健康数据都分散“沉睡”在实验室和机构内,形成数据孤岛,严重制约我国生物大数据的转化应用。
生命健康大数据是现代生命科学产生新知识、提出新假说、开发新应用的引擎,是支撑我国“健康中国”战略的重要基础性战略资源。薛勇彪呼吁,加快建立国家级生命健康大数据共享平台。这个共享平台应面向我国人口健康和经济社会发展的重大战略需求,通过多元主动的数据收集新方法、互利共赢的数据共享新机制、高效智能的数据解析新技术,建立生命健康大数据的汇交、管理、共享、应用体系,维护数据主权、保障数据安全和加速数据应用,服务科研院所、高校、医院、企业和广大人民群众,为我国经济社会发展和人民生活改善做出重大贡献。