APP下载

转化生物信息学发展的路径分析

2016-08-30张在文

转化医学杂志 2016年3期
关键词:信息学生物医学测序

张在文,冯 博



·神经疾病·

转化生物信息学发展的路径分析

张在文,冯 博

DNA和RNA测序、基因芯片、高通量的蛋白质组学和代谢组学技术的普遍使用,需要新方法来把这些新型数据转化成新信息,然后把新信息转化成新知识。随着生物医学信息学和转化医学的快速发展,生物医学信息学逐渐成为转化医学跨学科、跨领域团队信息沟通和知识转化的重要基础,两学科出现了交叉融合趋势。在此背景下,转化生物信息学应运而生。作者就转化生物信息学学科发展历史、定义及主要研究内容和热点进行论述。

转化生物信息学;基因组学;精准医学;个性化医疗

[Abstract]Though a re1ative1y young discip1ine,trans1ationa1 bioinformatics(TBI)has become a key component of biomedica1 research in the era of precision medicine.Deve1opment of highthroughput techno1ogies and e1ectronic hea1th records has caused a paradigm shift in both hea1thcare and biomedica1 research.Nove1 too1s and methods are required to convert increasing1y vo1uminous datasets into information and actionab1e know1edge.This artica1 provides a definition and contextua-1ization of the term TBI,describes the discip1ine's brief history and past accomp1ishments,as we11 as content and hot spots.

[Key words]Trans1ationa1 bioinformatics;Genomics;Precision medicine;Persona1ized medicine

显微镜的发明使医生和研究人员能够在细胞水平上进行观察。X射线的出现,以及后来的磁共振和其他成像技术,使组织和器官的可视化变成可能。每一个技术的进步,需要一个同时产生的方法和工具来分析和解释其结果。DNA和RNA测序、基因芯片、高通量的蛋白质组学和代谢组学技术的普遍使用,需要新方法来把这些新型数据转化成新信息,然后把新信息转化成新知识。反过来,新知识提供了关于如何治疗和预防疾病的思路。在个性化和精准医学时代,转化生物信息学(trans1ationa1 bioinformatics,TBI)应运而生[1]。TBI虽然相对年轻,但是已经成为一个重要的学科。

1 TBI的兴起

随着生物医学信息学和转化医学的快速发展,生物医学信息学逐渐成为转化医学跨学科、跨领域团队信息沟通和知识转化的重要基础,两学科出现了交叉融合趋势。

1.1生物医学信息学 20世纪50年代,芯片与计算机的崛起催生了计算机在医学领域的应用,随后医学计算、医学计算科学、医学电子数据处理、医学软件工程名称陆续出现。1974年,生物医学信息学作为专业术语首次出现。生物医学信息学是信息技术与生物学、医疗卫生的交叉学科,是应用系统分析工具这一新技术(算法)来研究医学管理、过程控制、决策等的科学,即借助医学研究过程中产生的知识,开发、评估各种有关获取、处理和解释患者数据的方法和系统[2]。

1.2转化医学 转化医学理念萌芽于1968年,即“bench-beside interface”研究模式,但直到1992年“bench to bedside(B to B)”的提出,才引起了足够重视。“B to B即从实验室到病床”,是将实验室研究发现转化成临床应用的诊疗技术和方法[3]。1994年“trans1ationa1 research”的概念开始出现,1996年“trans1ationa1 medicine即转化医学”这一名词首次在The Lancet杂志出现[4]。转化医学是一门多学科交叉的新兴医学研究模式,需要基础医学、临床医学、预防医学、药物研发及生物医学信息学多学科、多领域的科学家共同合作。其中,生物医学信息学能够帮助信息和知识集成、管理及利用,为转化医学研究提供资源保障、技术支持服务以及完善周全的信息交互环境。

2 TBI的定义

据AMIA提出,TBI是“研发存储、分析以及阐释相关方法以达到将海量的生物医学数据和基因组数据转化为预测、预防、主动参与健康。TBI还涵盖研发新技术以整合生物医学和临床医学数据,并拓展临床信息学方法从而囊括生物学上的观测数据”[11]。简单地说,它是将大量的研究数据转化为健康应用的方法。斯坦福大学的A1tman博士在2014年TBIAMIA峰会上阐述并将TBI定义为运用信息学方法将生物实体(基因、蛋白质和小分子)连接到临床实体(疾病、症状和药物),反之亦然。TBI主要应用于临床基因组学、基因组医学、药物基因组学、遗传流行病学4大领域。TBI跨越知识和数据,从分子生物学到人类,并在实验室研究和临床应用之间架起一座桥梁[12](图1)。沿X轴是表示从基础到临床,而Y轴是表示分子生物学到人类。TBI是运用生物信息学包括存储、管理、分析、检索和可视化方法,将基础研究领域[临床基因组学、基因组医学(个性化医学)、药物基因组学、遗传流行病学]产生的生物数据转化为健康应用。因此,TBI会帮助成功穿越T1转化瓶颈,从而实现从实验室到临床。

图1 转化生物信息学

3 TBI研究内容与热点

TBI致力于研究和寻求使分子生物学的发现及时有效地转化为可操作的知识,以及临床应用相关的转化,从而提高人类的健康状态。精准医学就是要根据每名患者的个人特征,量体裁衣式地制订个性化治疗方案。精准医学进步之处是将人们对疾病机制的认识与生物大数据和信息科学相交叉,精确进行疾病分类及诊断,为患者(目前主要是乳腺癌、白血病)提供更具针对性和有效性的治疗措施,既有生物大数据的整合性,也有个体化疾病诊治的针对性和实时检测的先进性,TBI学科发展必将驱动个性化医疗进步。

Regan和Payne[13]通过输入“trans1ationa1 bioinformatics”或“TBI”检索PubMed收录的的TBI相关文献进行专题分析。通过精选文献资料归纳出的TBI相关知识与临床实践概况,这些精选文献资料有助于临床相关TBI的知识和实践传播,并呈现出一些主题化趋势(图2)。目前在TBI研究内容及其与临床工作的交叉领域所进行的工作可以大致归纳为4个主要方面:①域分析,主要涉及对TBI知识和实践现状进行综述,以及对关键差距和(或)未来的发展方向进行阐释;②知识工程方法学的设计和运用,使其能够在计算和(或)人类可操作的格式下提供并传播TBI衍生知识;③计算架构的设计和运用,使之能够在支持临床相关TBI方法的前提下进行大规模、异构的数据资源的收集、存储、分析和传播;④计算方法的设计和运用,使之与③中的计算架构兼容,并能将分子生物学新发现转化为临床可操作的证据、指南或相应的知识结构。4个方面汇聚成一个主题,以信息或知识传递等形式完成数据发现、数据管理和数据融合。因此,符合生物医学信息学的核心定义,都可以归入其广义范畴。此外,4个方面还与转化医学从实验室到临床的应用至上的核心理念一致,将分子生物学的新发现(发生在实验室里)与通过电子介导体现出来的科学知识在普通人群的健康保健与干预联系在一起(应用到更广泛的人群中,以计算方法为介质)。

图2 通过精选文献资料归纳出的TBI相关知识与临床应用概况

李维和李毅[14]采用双向聚类文献计量分析方法,对PubMed收录的国际TBI相关文献进行分析,根据实际聚类效果将主题词聚类并生成可视化图,揭示学科研究热点,在转化医学起步以后,整合临床研究、电子病历、基础实验室、药品研发、科研人员和科研机构数据是TBI的关键,建立数据仓库、系统平台,在此基础上进行智能分析、数据挖掘,构建转化医学研究各方交流合作的基础设施,为转化医学研究提供资源保障、技术支持服务以及完善信息交互环境是目前国外的研究重点和热点。

生物大数据的研究、多种组学数据的整合分析将会不断挑战传统的科学思维模式,带来新的变革。生物信息学是生物大数据分析成果转化的必由之路,也必将成为应用生物学研究的中流砥柱,发挥其不可替代的优势。转化医学的目的是通过对疾病的预防、诊断、治疗和预后纳入新的知识和技术来提高人类健康水平,从而在基础医学与临床医疗之间搭建桥梁[15]。转化医学的成功不仅取决于生物学家、临床医生和公共卫生专业人员之间的密切合作,而且还取决于生物医学信息学,TBI已成为这种合作的一部分,跨越数据到知识,从分子生物学到人类,在实验室研究和临床应用之间架起一座桥梁。

[1]Tenenbaum JD.Trans1ationa1 bioinformatics:past,present,and future[J].Genomics Proteomics Bioinformatics,2016,14(1):31-41.

[2]陈锐.转化医学及转化医学信息学的兴起和发展[J].解放军医学杂志,2013,38(8):680-684.

[3]Choi DW.Bench to bedside:the g1utamate connection[J]. Science,1992,258(5080):241-243.

[4]Geraghty J.Adenomatous po1yposis co1i and trans1ationa1 medicine[J].Lancet,1996,348(9025):422.

[5]Venter JC,Adams MD,Myers EW,et a1.The sequence of the human genome[J].Science,2001,291(5507):1304-1351.

[6]A1tman RB,Prabhu S,Sidow A,et a1.A research roadmap for next-generation sequencing informatics[J].Sci Trans1 Med,2016,8(335):335ps10.

[7]赵晓宇,刁天喜,高云华,等.美国“精准医学计划”解读与思考[J].军事医学,2015,39(4):241-244.

[8]1000 Genomes Project C,Abecasis GR,A1tshu1er D,et a1. A map of human genome variation from popu1ation-sca1e sequencing[J].Nature,2010,467(7319):1061-1073.

[9]1000 Genomes Project C,Abecasis GR,Auton A,et a1.An integrated map of genetic variation from 1,092 human genomes[J].Nature,2012,491(7422):56-65.

[10]Butte AJ,Chen R.Finding disease-re1ated genomic experiments within an internationa1 repository:first steps in trans1ationa1 bioinformatics[C]//AMIA Annua1 Symposium Proceedings 2006.Washington,DC:AMIA,2006:106-110. [11]AMIA.Trans1ation bioinfromatics[EB/OL].[2016-02-26]. http://www.amia.org/app1ications-informatics/trans1ationa1-bioinformatics.

[12]Sarkar IN,Butte AJ,Lussier YA,et a1.Trans1ationa1 bioinformatics:1inking know1edge across bio1ogica1 and c1inica1 rea1ms[J].J Am Med Inform Assoc,2011,18(4):354-357.

[13]Regan K,Payne PR.From mo1ecu1es to patients:the c1inica1 app1ications of trans1ationa1 bioinformatics[J].Yearb Med Inform,2015,10(1):164-169.

[14]李维,李毅.转化医学信息学研究热点双向聚类计量分析[J].医学信息学杂志,2014,35(4):15-19.

[15]Moss S.Trans1ationa1 research:don't neg1ect science[J]. Nature,2008,454(7202):274.

Path analysis on the develoPment of translational bioinformatics

ZHANG Zaiwen,FENG Bo
(Department of Medica1 Information,Navy Genera1 Hospita1,Beijing 100048,China)

R-05

A

2095-3097(2016)03-0145-04

10.3969/j.issn.2095-3097.2016.03.005

100048北京,海军总医院信息科(张在文,冯 博)

1.3TBI

1.3.1TBI学科发展历史 2001年,人类基因组计划项目组成功完成了第一个全人类基因组序列[5]。随着下一代测序(next generation sequencing,NGS)平台到来,以前花费超过30亿美元、耗时10年时间完成的测序工作,现在只要短短的几天、不到1 000美元就能完成。近年来,大量的“大数据”项目都采用了NGS这一技术,随着NGS技术的蓬勃发展,使得高通量的基因测序技术日臻成熟,逐渐从常规基础科研实验室的应用转入临床医学的应用,测序技术原理的不断创新和工程材料应用瓶颈的不断突破使得高通量的基因序列读取趋于个体化需求的应用[6-7]。1 000个基因组计划揭示了不同群体间的遗传变异[8-9]。这些基因测序大项目的实施不仅认识人类基因组的许多性质,也产生了新的方法,能更有效地挖掘大量产生的数据。现代生物技术能获取从器官到分子水平的信息,从而有力地促进生物医学研究和临床实践。此外,多年来的生物医学研究也积累了丰富的成果并存储于各种数据库中。充分利用这些信息以实现从实验室到临床和社区的医学转化是当前很有前景但极富挑战性的一项工作。

2002年,美国医学信息学协会(American Medica1 Informatics Association,AMIA)召开“生物+医学信息学”年度研讨会,主要讨论生物医学信息学及其分支学科。2006年,TBI一词由Butte和Chen在AMIA年度研讨会上报告的一篇题为“寻找疾病相关基因的实验:转化生物信息学的第一步”的论文中首次提出[10]。2008年,AMIA的Butte博士主持了首次AMIA关于TBI年度峰会。2011年,亚洲第一届TBI会议在韩国首尔举行。2012年,首本关于TBI在线教科书Translational Bioinformatics由PLoS计算生物学出版社出版,从而诞生了一个新的学科“TBI”。TBI将加速实现基础医学研究到临床医疗实践的知识转化,并最终改善医疗保健系统中的预防、早期诊断以及有针对性的疾病治疗等。

1.3.2我国开展TBI现状 江苏省太仓市正兴转化医学信息学中心成立于2012年,面向国际国内的医院、科研院所、生物医药企业,致力于提供TBI的研究与服务、转化医学智能系统的开发与应用服务及生物医学数据分析系列服务。其主要研究方向为生物医学数据分析,利用系统生物学和生物信息学的最新研究成果,使用R、Python、Java、LAMP(Linux+ Apache+Mysq1/MariaDB+Per1/PHP/Python)语言技术,提供包括常用的临床数据、生物数据的分析,特别是高通量基因数据的存储方案和实施、网络建模、数据分析服务;基于数据分析和网络建模提供疾病网络标志物的寻找和解决方案;提供复杂疾病早期诊断辅助系统并为用户订制服务等;同时提供最新的生物信息学和系统生物学方面的专业软件和相应技术培训,包括各类计算生物信息学软件的比较使用、自主开发软件的使用,已获得了由芬兰、日本、韩国等国家提供相应的资质认证。苏州大学系统生物学中心主任沈百荣教授编写了《生物信息学在复杂疾病诊断、预后及治疗中的应用》专著。

我国第一届TBI会议于2012年12月8—10日在江苏省太仓市召开。会议的主旨是追踪国内外TBI的最新进展,把握未来发展方向,推动最新研究成果在相关领域的应用,为国内外的学者提供交流的平台,促进产、学、研的深入合作,引领相关行业实现技术进步,使得我国科学家在这一新兴领域占据国际上的主导地位。2013—2015年相继召开了第二届至第四届TBI会议,以TBI与系统医学、TBI和系统生物学、大数据与精准医学、大健康与精准医学模型为主题。

(2016-03-15 本文编辑:徐海琴)

猜你喜欢

信息学生物医学测序
刍议“生物医学作为文化”的研究进路——兼论《作为文化的生物医学》
广西医科大学生物医学工程一流学科建设成效
灵长类生物医学前沿探索中的伦理思考
鸡NRF1基因启动子区生物信息学分析
生物信息学辅助研究乳腺癌转移相关lncRNA进展
外显子组测序助力产前诊断胎儿骨骼发育不良
PBL教学模式在结构生物信息学教学中的应用
中草药DNA条形码高通量基因测序一体机验收会在京召开
基因测序技术研究进展
药用植物黄花蒿ATP合成酶电子克隆及生物信息学分析