王伟业:信息助力生物样本库
2016-12-17
本刊记者 黄 健
王伟业:信息助力生物样本库
本刊记者黄健
办公室工作照
在这个世界上,有一种“银行”,它储存的并不是物质财富,却是比金钱更珍贵的东西——健康财富,这一“银行”就是生物银行,通常称为生物样本库。生物样本库被世界各国公认为最有意义的“银行”。它不仅代表了生物医药领域的核心竞争力,还体现了一个国家的医疗水平。
近年来,中国的生物样本库事业发展飞速,但与欧美等发达地区和国家比起来,仍存在很多问题。值得庆幸的是,在中国追赶世界的进程中,有一批为推动中国生物样本库事业发展尽心竭力的人,归国助力的王伟业就是其中典型的一员。
将‘信息之风’带回中国——建设中国特色的生物样本库
2009年6月4日,中国医药生物技术协会组织生物样本库分会得到卫生部、民政部批复成立,这一事件被很多人视为中国生命科学研究、生物医药研发史上的里程碑事件。
彼时,正在大西洋彼岸美国的王伟业已经将兴趣投在样本库信息化发展方向。早在20世纪80年代末就跨出国门的他,先后在美国贝勒医学院、美国著名的辉瑞医药公司和美国威斯康星医学院等地深造和工作,在生物样本库方兴未艾的时候就早早地介入到这一行业中,置身国际潮流前端,亲身经历和见证了这一行业的成长和发展,并积累了宝贵的经验财富。凭借敏锐的洞察力,他感受到了中国在相关领域蓄势待发的勇气和决心。
于是在2012年,迎着国内生物样本库技术蓬勃发展的春风,在人才紧缺之时,王伟业义无反顾地回到祖国,作为国外引进的样本库信息化管理专家,加盟上海交通大学医学院,并作为转化医学研究院“985工程”生物样本库建设首席咨询专家,指导多家生物样本库建设工作,而他的工作重心,就是推动生物医学科研信息和生物样本库信息化发展,促进资源信息共享。
“生物样本不管储存有多大和多好,如果没有相应的信息,亦如空壳,几乎没有什么价值。一家信息管理做不好的样本库,亦如‘死库’,只能是浪费资源。”王伟业一语道破了自己关注生物样本库信息化的原因,而他所强调的信息化是运作管理信息化之外的样本信息化。
“现在国内业内人士在参观评价某个生物样本库时,总是以空间有多大,有多少冰箱,用什么仪器,有几个人,发了多少篇论文等来衡量样本库建设的好坏,信息化程度却很少有人关注。其实真正能够展示一个样本库价值的只有信息,一个有价值和管理规范的数据库才是能够物尽其用”。在国外从事相关行业多年,王伟业深刻体会到信息化之于一个现代生物样本库的重要性,回国后更是有感于国内在相关领域的欠缺,因而多方奔走,振臂高呼,尽心竭力终换来了行业面貌的改善和众人的逐步认可。
“其实,中国与国外相比并不是只有差距更有优势,中国这几年在相关行业里得益于一批领军人物卓有成效的工作,加之越来越多中坚力量和年轻人的加入,事业发展迅速,其样本资源的丰富是任何一个国家无可比拟的:有些疾病的病例数在我国一个月的就诊数量就相当于国外几个月积累,而整个欧洲的例数甚至可能少于我国一家三甲专科医院。”
在行业里摸爬滚打多年,经历多了,认识也变得深刻,王伟业将国内外相关领域的差距归结为:认识(理念)、模式、机制三方面的不足。认识方面除了上文提到的评价样本库建设好坏的标准偏差之外,还有很多譬如文化上的差异,导致样本库利用率不高、缺乏系统化的认识、设计和没有考虑好资源应用等,这些认识上的不足影响了模式和机制的发展。
“我个人认为模式不用担心,国外有好的生物样本库发展模式,我们可以借鉴与借用,再改良为适合我们的可行性模式,但机制不能借用,需要在我们的环境下适应性地产生。目前,我国生物样本库仍是分散、独立、无序的状态,各单位一直倾向于单兵作战为主流。在建设设计上都会包括整合与共享的目标,但是对共享方式的理解等同于是否给他人用自己拥有的资源,换句话说,还包括是否有合适或可以接受的利益交换为主导的理解。现实中可能大多还是采取防守的态度来回避这个问题,从而影响了共享模式和机制的探索。其实共享首先是系统资源的交流,也就是1+1之后可以共享2,而不是简单地两个1之间是否可以某种方式各自利用或者交换。那么明确地说关键是这两个1能否合并整合为一个新的资源而双方共同应用”。运作模式和机制的确立和完善是王伟业眼中中国生物样本库发展的瓶颈之一。
是闭关自守还是开放共赢?现代生物样本库的发展无疑应该选择后者,而信息化是带动中国生物样本库走向实质转变的引擎。王伟业深谙此意,为此他将这股国际前沿之风带回了中国,值得一提的是,他所倡导的信息化并不是一味照搬,而是充分考虑国内外优劣势的,属于中国自己的特色之路。这条路并不好走,因而他步步为营,走得坚定而扎实——
访问美国NCI的Dr.Marston Linehan教授
一步一个脚印——构建和完善“现代信息生物样本库伊甸园”
虽然回国的时间并不算很长,但是王伟业这几年稳扎稳打,做了不少卓有成效的工作。
他基于自己的研究与研发兴趣综合性归纳形成的系统性生物样本建设和运作理念,可以简单地概括为10个要素:信息化运作和管理样本库,了解相关疾病或健康信息,应用临床信息表达生物样本的生物特性,明确信息质量也是生物样本质量要素,以语义化方式描述生物特性,统一信息数据元素,基于临床电子化病历的信息应用,生物信息学必须结合临床信息,临床医生与科研人员之间的团队(Team-up)和技术+平台结构。
这几年以来,王伟业除了领导研发合作团队研发信息化管理系统,也作为技术负责人指导研发信息化共享平台,而他和他的团队走出的较关键性的一步就是建立统一信息管理系统。
2013年,他领导的IT合作团队完成了生物样本库信息化管理系统(BIMS系统)的建立,佐证了其力求打造统一、标准化信息化管理系统的决心和基础。BIMS系统目前已在多家样本库建设和管理者发挥作用。为进一步提高生物样本库信息化管理的需要,不久前,王伟业按照计划完成了新版本BIMS的设计和初期研发的研发,并取名为NGBIMS,体现为新一代的BIMS,并强调BIMS深意并不是字面上反映的那样(Biobank Information Management System),而是强调样本信息化的主题,即Biological Information Makes Samples——信息内涵决定了生物样本的价值。这一解释进一步强化了样本的真正价值在于其内涵的信息。
“样本库的发展,首先要建立,然后才能统一,也必须统一,最后才有可能发展为样本资源网络,这是国际样本库发展趋势中的三个里程碑。但是这里的‘统一’,并不是把资源放在一起整合储存那么简单,而应该是相同的资源在应用时具备相容性,可以用同一个标准和方式来评价其质量、价值和特性等。另外‘网络’也并非计算机网络那么简单,网络代表共享,包括信息和样本资源统一后的共享。”“信息交流越先进越好,最终理想是对同源信息能够有一致的/统一的(Harmonization)信息内容和采集方法,这才是需要的标准……”王伟业眼中,无论是数据的统一、样本资源网络的建立还是其他,他需要做的事情虽然细分为很多项,但是都是相互关联、相辅相成的。
强调生物信息应并面向应用是他关注的又一重要领域。“生物样本库的信息如果不考虑应用,将永远不能用于改善临床,发挥实际效用。举个通常的例子:现在我们的样本库主要以临床诊断作为样本的主要信息,比如某种肿瘤的临床诊断名称,而个体信息可能不全或不正确,收集了这些群体生物样本之后,只描述临床诊断是某种型肺癌,如果研究者是想用此样本来研究吸烟和肺癌发生的相关性,但是样本提供者的信息可能只是抽烟,但是其他相关信息都没有,何况与吸烟相关的参数多到好几十。这种情况或者说不全面和不正确的信息使研究人员无法确定样本资源是否能够符合研究需要,因此样本信息就无法得到很好的应用,这与我们相关行业的发展现状有关。”
据王伟业介绍,国外相关技术研究讲到应用很多是大型跨国医药公司在做,他们的应用方向很明确,我国则是以科研为主,科研和企业比较全面合作的少,这局限了生物样本库的应用。目前,他本人以信息化应用为主题的项目采用产学研结合的企业间合作和国际合作。
回国后,王伟业一直致力于利用自己多年积累的经验、人脉带动相关领域合作。近期,由他负责申报的两项信息化国际合作科研项目,已经获得上海科委国际合作项目和国家科技部国际科技合作专项的立项经费支持。项目的主要目的是探索应用统一多方数据元素的方法和数据屏蔽技术,建设信息共享机制和运作模式,促进国内国际合作研究。
譬如他所工作的新华医院开展了建设生命早期生物样本资源库工作,包括孕妇,新生儿和儿童随访的生物样本和相关信息资源,其基本目的是建设综合性的研究资源,由同一个研究资源开展不同方向的研究,儿童临床疾病研究可以在需要时追溯其胎儿期的生物样本和信息资源,有利于探索病因学研究。除此之外,他还规划开展关于临床电子病历信息应用于临床研究,“应用临床电子病历作为临床信息资源面临着两大主要问题,一是信息不全;二是信息可能不正确,所以完全依赖临床电子病历的信息开展临床研究定会存在着问题,我们应当采用国外临床相关的方式——专门补充临床研究的信息,将临床疾病信息库建立成临床研究信息库。”
与前来新华医院生物样本库学习的人员合影
“2015年初我去美国NIH的肿瘤研究所(NCI)拜访一位著名外科医生和研究者,获得的体会很深”王伟业说。通过建立完善的电子病历,研究者可以更容易地通过数据分析招募符合归纳入组条件的病人,把样本人群按研究设计分类分组开展研究。值得一提的是,这样的病历最好也应该建设成为能够为病人自己使用,可以进行个人健康和疾病恢复纵向比较,自身的健康状况和变化应该是最好的对照。”王伟业补充说。
除了国际间合作,国内各样本库之间的协作与联盟也是王伟业极力倡导的。“现在很多大小医院为顺应发展趋势都争相建立样本库,特别是小医院由于科研平台薄弱、缺乏资金和人力资源支持,最后可能发展为传统上的一个实验室有几个冰箱模式。一个全面自动化的平台可以在保证质量的前提下,完成相同的流程式操作,但资金分配后导致任何一家单位都承担不起,即使购买了设备,所需的试剂与耗材也会缺乏资金,或者有了设备,却因为本单位没有那么多需求而闲置,造成资源浪费。就像把需要一个拳头力量来做的事情分成单个手指去单独执行。”王伟业说。而解决统一和共享等方面认识和技术方面的系列问题,都是在为协作和联盟铺路。
与此同时,为样本库建设下一阶段的发展考虑,王伟业计划在条件许可的情况下,开展研究样本库信息资源的语义化描述/注解、语义化索引以及样本库资源语义化检索等方面的工作,为建设语义化的信息样本库做些探索性研究。他相信临床信息的应用将来必然会朝此方向发展,满足临床研究和生物样本库的应用需要。通过语义化注解,样本资源不但可以在信息表达方式上统一,同时更具专业和表达的逻辑性。可以通过一定的统计学分析来评估样本信息质量和相互之间的可比性和相似性,为判断资源共享的合理性提供一个可分析的方法。
大到平台系统的建立,小到关注样本库信息采集内容和方式……现在的王伟业,每天就像是一个不停转的陀螺,有很多事情要做,虽然很辛苦,但令他感到欣慰的是,越来越多人认识并认可临床信息对现代生物样本库建设与发展的重要性,一支越来越专业的生物样本库建设和管理人才正在我国形成,也有越来越多志同道合的人加入其中,形成行业之势——
经历转化为财富——培养后起新人
“我们现在需要的人员构成用个通俗的词语来形容就是‘混搭’,因为样本库涉及的知识范围很广,包括医学、生物学,分子生物学、冷冻保存技术、生物信息学和信息化管理学等,需要多学科交叉。现在国内对样本库信息化管理方面的认识还不够全面,很容易把一些问题归纳为计算机信息技术的问题。其实有不少需求或者问题不一定是计算机信息方面的问题,如样本库的信息标识,信息注解等,不能够只依赖IT方面人员,而是需要样本库工作人员去做。但从另一方面来讲,现在生物医学研究离不开数据收集,离不开信息化管理,数据处理、生物样本信息处理,完全用Excel格式或手工记录已经不能满足现代生物医学研究所产生的数据量和复杂性方面的需求,所以不少做分子生物研究的人,因为工作需要而去钻研信息相关方面的知识与技能。以我多年的工作经历和体会来看,我深感自己多年在生物信息化方面的积累加上我自己对计算机领域知识的爱好,跨学科知识与技能对我帮助很大……”
走过国内外很多相关学科研究殿堂以及实践的前沿阵地,王伟业早已习惯了将人生中的各种经历转化为自身宝贵的财富,并将这些精华细心收藏留作后用。
直到今天,他还一直对那些走过的路和那些遇到的人念念不忘:幼时一位乐于学习英文的好朋友影响他早期认识自身在英语方面的不足,促使他很好地掌握这一门与人沟通的工具,从此他有了更多与各种人沟通交流的机会;跨出国门后,他的研究生导师教他学会了如何提出问题以及思考问题,从此这一思维方式成了他开启科学研究大门的钥匙;而在贝勒医学院时曾经与美国斯坦福大学一位教授的一番对话,则让他学会了“要想做一件事情,首先要想到自己能不能做,先假设其他条件都满足的情况下,自己是否知道具体怎么做,而不是盲目地先抱怨没有环境条件等理由”,从此这一做事方式成为他通向成功的垫脚石……
“机遇总是会留给有所准备的人。”这句话用在王伟业身上再合适不过。多年前作为一名普通的留学生,他所学的专业原本只是生物化学和分子生物学,“那时我们做序列分析都是用手工做的,十几个KB的序列都是用眼睛读片子读出来的。”切身的辛苦体会让王伟业在网络计算机分析工具刚刚兴起的时候就对这一新鲜事物产生了浓厚的兴趣,因而逐步转向生物信息学,为他走在学科潮流前端奠定了基础。
之后,王伟业在大型跨国制药公司的经历中管理和经历工作流程规范方面历练了自己,而他与生物信息真正结缘的转折就是在这里开始的:当时很多人都是先学了计算机再学生物信息学,而他是借用自己工作时候的兴趣和自己工作的需要,作为既是生物学博士又掌握计算机知识的研究人员,有了从事生物信息学相关工作的机会。“既保证自己不离开生物医学这一主流,又能满足我运用计算机知识和技术方面的兴趣。”这是王伟业最理想的职业方向,且工作性质也十分符合他喜欢交流的性格。“人不可以放弃选择,但是可以选择放弃。”王伟业从不让机会在自己身边溜走,赢得了机会,也赢得了自己。
至今,王伟业依然感念国外多年对自己造成的影响,一是接触面的广泛;二是做事方式的培养。走过的路越多,他越能体会到经历是一种财富,正是这些宝贵的过程,帮助他完成了人生的蜕变。如今,回到中国的他也很想把自己多年的经验体会与年轻人分享后来人。以自己多年的亲身经历告诉他们该如何提出问题、思考问题,做事要注意思维方式;也告诉他们做事情之前首先要想到自己能不能做,具体怎么做……多年前他曾受益于这些财富的积累,多年后他将这些财富毫无保留地传给年轻人。
为带动一批生物样本库的年轻人成长,这几年来,王伟业致力于人员的培训,与以往主要采取学习班的方式不同,他倡导的是以进修的方式来达到掌握技能和管理的方式,“通过在实际工作中如果遇到问题,学习正确的思考和解决问题的方法是最重要的。通过做事,才能真正知道如何解决问题,才能把一套知识学会。目前在我的团队,我对他们的要求就是以‘进修’的方式,直接参与到日常工作中去……”
做专职易,做专业难。对王伟业来说,在中国的生物样本库信息化的发展之路任重而道远,技术人员的培养只是一方面。可幸的是,不管是认识、模式还是机制,近几年来都得到了极大的改善,尽管仍在路上,但他有理由相信,信息时代下的中国生物样本库必将不辱使命。