扬大数据之力 掘作物基因之密
——记北京市农林科学院研究员杨效曾
2019-09-09□王涵
□ 王 涵
杨效曾在实验室
和杨效曾研究员聊天,总会不经意间被他的热情所感染,也会经常被他对育种事业的深厚情感所感动。如果问起这位育种“工匠”究竟缘何能够坚持下来,又是怎样取得丰硕的成绩,总结下来也许只有对工作的高度坚守,对科研的低调谦逊,再加上不懈钻研的精神才足以概括。
如今在大数据时代,大数据分析已相继应用到工业、医疗等多个领域中,而在农业领域里,基因组测序、重测序、转录组、表观遗传组、蛋白质组等多种数据资源,也在逐渐推动着作物科学研究步入大数据时代。这与大数据在医学上的应用很相似,既然通过海量数据可以从基因组层面,对人体潜在的疾病风险提供预警。同理,将其应用在农业领域,便可以帮助研究人员在进行育种筛选时,得到品质良好的品系。
在黄土高原长大的杨效曾一直对土地爱得深沉,也对育种抱有浓厚的情感,多年来,他长期从事遗传学、生物信息学和生物大数据分析研究工作,并将其引入精准育种学领域里。在他看来,“这会为将来的育种工作提供非常有力的武器。”
破解生命奥秘
2004年,杨效曾并没有如其他科研人员那样继续选择校园生活,而是走出中国农业大学校门,步入社会参加工作,但在工作过程中,他切身感受到读书是一条没有止境的路,在生物学领域里,自己还需要有更多的学术积累。思来想去,杨效曾选择“走更远的路,看更广阔的天地”。于是,2008年,他来到美国弗吉尼亚大学攻读生物学博士,希望能够在生物学上有更多的建树。
博士期间,杨效曾开始对非编码RNA(ncRNA)领域产生研究兴趣,高通量测序技术引入后,需要对大规模的ncRNA进行鉴定,也需要通过各种方法来研究ncRNA的功能。已经有大量研究数据都表明,在高等生物中,有多达一半以上的DNA都会转录为RNA,其中绝大多数为ncRNA。但研究人员却对整个ncRNA世界了解甚少,每个细胞类型在特定时间内所有蛋白和所有ncRNAs的功能是什么?它们之间有什么相互作用?和DNA之间的相互作用又是什么?要弄清这些,揭示生命的奥秘,远比基因组计划更为艰巨。尽管道阻且长,但杨效曾并不曾有任何疑虑,博士毕业后他带着丰硕的科研积累进入美国陶氏化学工作,他缩小研究范畴,将重点集中于基因组非编码区域功能的解析上,并做出突破性的工作。
基因组非编码区域在作物中无处不在,它对植物的生长发育、外界环境响应等方面都有着重要的作用。为了鉴定和理解这些非编码区域的功能,一开始,杨效曾与团队先是借鉴了在动物领域中的研究方法,将其运用到植物领域中,但实验后却发现结果与设想的有很大出入。经过系统研究,他们决定通过高通量测序的方法,研究植物里这类非编码小RNA的特点。两年多的时间一晃而过,团队最终捕获了这些小RNA的特点,成功开发出研究小RNA的算法,并编写了相关的分析程序。“现在该方法在国际上基本成了通用的方法,目前有近50种植物用我们的方法鉴定小RNA。”杨效曾说。后来,杨效曾团队还在原方法基础上做了改进,使其更准确,效率更高,速度也变得更快。
在陶氏化学工作期间,杨效曾还主导设计了新精准育种方法,可以缩短育种周期、增加筛选力度与准确性,潜在的经济效益巨大。他研发的基于高通量测序技术筛查转基因优良品系的方法,被誉为转基因筛选品系方法的一次变革。此外,他还第一次全面阐释了miRNA和可变剪接之间的相互作用,发现了两种基因调控方式之间的新链接。
虽然来回穿梭于学校、社会中,但正是这样的经历让杨效曾收获颇丰。作为科研人员,他坦言:“不能只是纯粹地做科研,还要了解市场对科研的需求,将研究成果与实际需求结合,才是科研真正的意义。”
为了让研究落地,2017年,带着对祖国浓浓的思念及对农业的热爱,杨效曾毅然辞去美国的优异工作,来到北京市农林科学院,希望能将自己在种业领域里的研究经验应用在国内的育种事业上。
迈入新时代
近年来,在全球范围内,广泛存在着粮食需求日益增长与可用耕地面积越来越少之间的矛盾,这种情形下,以育种技术为核心的作物科学逐渐成为现代农业的核心。与此同时,高通量测序技术与各类基因型分析仪器的飞速发展,也加速推动了生物数据的爆炸式增长。从过去数年的数据资源来看,在水稻、玉米、小麦等主粮作物研究领域里已经积累了大量的基因组重测序、转录组、表观遗传组、蛋白质组等数据资源,使作物科学研究步入大数据时代。
进入大数据时代的作物科学,通过将大数据分析应用到作物农艺性状基因挖掘与基因功能研究、与育种实践相结合建立分子育种决策体系等一系列操作,成功推动了育种产业的变革,由传统的以表型观察为主的“经验育种”迈入新时代,转向现代的以基因型为指导的“精准育种”。
团队成员合影
在这种背景下,回国后的杨效曾,打算围绕精准育种展开研究,除了针对作物基因组学数据整合与基因功能关联网络解析、应用机器学习方法挖掘优异等位基因等方面展开研究,杨效曾预计还要建立精准育种标记集合,开发全基因组选择辅助育种模型,并且要建立作物分子育种标记数据库与育种决策应用体系,希望以此能够尝试指导新品种的选育。
他表示,首先要通过整合、构建主要作物基因组大数据库,来测试基于网络指导的基因挖掘算法,挖掘出与优良性状相关的基因,通过这种方法他预计能够发现一批与主要农作物重要性状相关的基因,进而可以提升北京市农林科学院在优势基因挖掘方面的储备,为北京市进一步培育优势品种奠定基础。接下来,他打算利用整合数据库分析工具对育种模型进行探索,对育种理论和方法进行创新,测试育种模型在不同作物中的应用,还要开发成熟精准的育种平台,并努力将该平台打造成为既可以为基础研究服务,也可以为育种实践提供决策服务的综合性育种平台。在此基础上,杨效曾表示下一步便可以通过将精准育种与育种实践相结合的方法,初步筛选出一批具有优势性状的种系。与此同时,他还不忘督促团队不断对精准育种的理论、方法和实践进行探索,要时刻保持北京市农林学院在种业领域里的创新优势。
杨效曾所做的一切,都是为了我国种业领域的未来着想,他始终坚信,我国农业的发展会大有作为,在他的带领下,团队也在时刻为我国赶超国际、成为该领域的领跑者而不断努力。