APP下载

中国基因组学与农业的交叉融合进展与思考

2023-10-19张保龙张学福

江苏农业科学 2023年18期
关键词:基因组学基因组测序

丁 倩, 吴 蕾, 张保龙, 张学福

(1.中国农业科学院农业信息研究所,北京 100081; 2.江苏省农业科学院卓越创新中心,江苏南京 210014)

基因组学作为生命科学领域蓬勃发展的新兴学科,通过研发基因组的结构、功能、进化、定位和编辑的进展与突破[1],在农业基础生物学研究中发挥着引领作用,同时也成为生物种业、植物保护、畜禽疫病防治的发展新引擎。目前,我国仍面临粮食安全、耕地水土资源制约、生态环境压力、新冠疫情肆虐等重压,急需在战略必争的农业基因组学等农业基础科学和前沿技术领域实现率先跨越,全面提升自主创新能力和转化水平,推动我国由农业大国向农业强国迈进。基因组学的基础研究和技术研发国际竞争激烈,与农业学科交叉融合越来越深入,通过分析论文、专利等数据思考我国农业基因组的研发态势具有现实意义。

本研究以全球发表的研究论文和相关专利为切入点,利用Web of Science数据库核心合集收录的SCI和SSCI论文数据合集和incoPat数据库收录的专利数据,检索时间为2022年1月,进而将基因组学基础研究中与主要农业具体学科的交叉融合作为交叉数据集,对其系统梳理,通过目标领域的研究活跃程度、论文总被引频次、研究影响力等分析其基本现状[2]。

1 我国农业基因组学在全球的占位分析

1.1 农业基因组学基础研究

经统计,2001年1月至2021年12月,世界农业基因组学发表在SCI和SSCI的论文共13 972篇。其中,我国以4 864篇的发文量排第1,占全世界的 1/3,但论文被引频次、高被引论文数量排名仅第2,且篇均被引频次仅排第9。美国发文量虽然排第2,但论文被引频次、篇均被引频次和高被引论文数量均排第1(表1)。表明我国在农业基因组研究活跃,受到世界同行的关注,但总体研究影响力不够。近些年,我国在基因与遗传学的论文竞争力排名第1,特别是关于水稻基因组学的研究高质量论文多,影响力较大。基因组学与农业领域的深度融合,在动植物生物育种和品种改良、生物防治、兽药与疫苗、食品安全等方面均取得了长足进展。

表1 农业基因组学领域主要论文产出情况

1.2 农业基因组学技术研发

通过incoPat专利数据库检索,2001年1月至2021年12月全球农业基因组相关专利申请12 710件,进行专利族合并后为6 490项专利族申请(单件专利的统计单位为件,专利族的统计单位为项,可包含多件专利),获得授权的专利共6 985件,总体均呈上升趋势。其中,中国专利申请7 054件,排名第1,授权专利4 318件(图1)。全球排前10的专利申请人有10家机构,其中1家为国外机构,其余9家均为中国机构。技术目标地方面,在中国申请的专利7 080件,其中,我国本土申请6 772件,国外来华申请308件,我国成为主要技术目标市场。中国申请人主要为科研机构和大学,国外申请人主要为陶氏杜邦、孟山都、巴斯夫、拜耳等涉及种子、农药、疫苗的公司。

获得授权且incoPat合享价值度(合享价值度主要依赖于合享新创自主研发的专利价值模型实现,该专利价值模型融合了专利分析行业内最常见和重要的技术指标,如专利类型、被引证次数、同族个数、同族国家数量、权利要求个数、发明人个数、涉及IPC大组个数、专利剩余有效期等)在 8~10分的专利称为高价值专利。将农业基因组方面的专利分为植物、动物、微生物进行进一步检索,结果显示,在中国涉及农业基因组的专利申请非常活跃,特别是授权高价值专利在上述学科方面全球排第1位,表明我国农业基因组技术研发和产业化工作正蓬勃开展(表2)。

表2 基因组学与农业各学科交叉专利产出情况 件

目前,我国农业领域中针对高通量测序(NGS)技术的研究包括:采用连接酶测序原理的PSTAR-Ⅱ系列测序系统、AG系列测序系统;采用焦磷酸测序原理的BIGIS系列测序系统,基于荧光标记焦磷酸发光原理研发的NGS技术及第三代测序技术[3];开展DNA分子标记技术、生物芯片技术、基因功能研究重要技术、基因组学信息技术等研究。

2 我国农业基因组学研究进展

根据农业基因组学主题聚类分析和主题时序演化分析,我国农业基因组学主题聚类和时序演化基本与世界同步,基因组主要交叉于作物和园艺、畜牧兽医、植物保护3个学科,聚集在基因组测序和数据库构建及基因组序列注释研究、遗传学和基因组学关联研究、复杂性状基因组特征模型分析、功能基因组学及基因组选择研究、微卫星DNA多态性标记研究、基因和基因组的起源与进化研究、全基因组选择中准确性的影响因素研究。在研究进程中,不同主题内部进行了融合,研究方向的相似性逐渐升高,但由于研究方法和手段不断进步,仍产生出一些新思路。

2.1 我国农业基因组学优势交叉领域

2.1.1 作物和园艺 世界农业基因组学发表在SCI和SSCI的论文共9 116篇。中国以3 158篇的发文量排第1,论文被引频次、高被引论文排第2,篇均被引频次排第9;德国的篇均被引频次、美国的高被引论文数量分排第1(表3)。此学科中国研究论文质量较高,中国农业科学院发文量在该领域全球最高,为57篇。

表3 基因组学与作物和园艺学科交叉论文产出情况

目前,我国基因组学在植物领域的研究多涉及水稻、小麦、玉米、大豆四大农作物,以及大麦、棉花、藜麦、黄瓜类等品种增产、抗病、抗逆、抗虫的育种改良[4]。2002年我国启动了主要作物功能基因组计划,在结构基因组学取得进展的基础上,多个作物全基因组测序已经完成,模式植物功能基因组研究取得突破性进展。我国水稻功能基因组学研究一直走在世界前列,从参加国际水稻基因组测序计划,独立完成了水稻第4染色体的测定,到领导完成3 000份水稻基因组的重测,并解析3 000份水稻核心种质资源的基因组变异,水稻是第1个完成基因组测序的作物,并已经成为作物功能基因组研究的模式植物[5]。如对籼稻品种蜀恢498进行测序和深入研究,组装成功高等动植物中质量最高的水稻基因组,并已建成较为完备的功能基因组研究平台和全球首张高密度育种芯片[6]。我国科研人员揭示了亚洲栽培稻全基因组功能单倍型自然变异特征。杂草稻对我国粮食安全的危害近年来日趋严重,通过水稻基因组研究进展可对国内的杂草稻起源与进化进行解析[7-8]。小麦基因组非常庞大且结构异常复杂,严重制约了小麦功能基因组学研究和育种工作的深入。我国已完成了小麦A、D基因组序列的测定,并绘制了完整的高精度图谱[9]。在玉米基因组学研究方面,组装出了较高质量的玉米Mo17和mexicana基因组,并深入研究以挖掘来自野生玉米材料中的优异基因[10]。在大豆泛基因组研究方面,在植物中首次实现了基于图形结构基因组的构建,被审稿人称为“基因组学的里程碑工作”[11]。在棉花基因组学方面,完成了棉花D、A、AADD、TM-1和ZM24基因组图谱,组装了草棉基因组,更新了亚洲棉(A2)和陆地棉(AD1)基因组,重测序了318份棉花品种[12];领衔绘制完成二倍体和四倍体棉花基因组图谱,解析了亚洲棉遗传多样性及生态演化的遗传学基础,揭示了陆地棉核心种质基因组变异及其影响纤维品质和产量的关键位点,为批量发掘棉花产量品质相关分子标记或基因奠定了基础[13]。

在蔬菜基因组测序研究方面,中国农业科学院、北京农林科学院、中国科学院遗传与发育生物学研究所和华中农业大学等科研团队,先后绘制完成了黄瓜、番茄、西瓜、大白菜、甘蓝等蔬菜园艺作物的全基因组序列图谱和变异图谱,并利用组学大数据挖掘重要农艺性状基因,克隆了控制果实品质与调控、株型建成、开花时间、抗病抗逆等重要性状的上百个重要基因,与世界领先国家处于同一水平。此外,我国科研团队完成首个毛竹全基因组测序,首次成功破解了2种棕榈藤全基因组数据,发布了最新毛竹高精度基因组数据,我国竹藤分子生物学研究始终处于世界领先水平;解析了黄瓜基因组序列特征,阐明了黄瓜驯化和分化的基因组学基础,发现黄瓜苦味物质合成和调控的机制以及性别决定的新基因[14];构建并升级补充了白菜泛基因组,构建了第1个萝卜属级的泛基因组;采用最新的测序技术和组装算法,成功实现了杂合二倍体马铃薯的基因组组装;在中国李、桃、铁观音茶树组装和深入研究方面也取得了进展。

2.1.2 畜牧兽医 世界农业基因组学领域发表的SCI和SSCI论文共7 127篇。中国以2 296篇的发文量排第1,论文被引频次、高被引论文排第2,篇均被引频次排第9;澳大利亚的篇均被引频次、美国的高被引论文数量分排第1(表4)。中国科学院发文量在该领域全球最高,达291篇。

表4 基因组学与畜牧兽医学科交叉论文产出情况

我国已完成猪、牛、羊等的参考基因组序列测定,在产奶量、对蛋白质的重视、产脂量、产蛋白量、乳腺炎症状、泌乳难易程度、肉质性状等生产性状,以及饲料效率、耐热性、疾病抵抗力、生育能力、寿命、甲烷排放等其他重要性状上陆续完成了一系列重要遗传学问题的解析工作。在牦牛基因组学方面,测定了牦牛的全基因组序列,为高海拔地区所特有的牛属家畜改良注入了活力[15]。在家猪方面,测定了五指山猪近交系个体的全基因组序列,对10个代表性猪种基因组序列进行策略组装,以形成一个更加完整的猪参考基因组[16]。山羊、绵羊的基因组测序和物种进化关联研究也取得了进展[17-18]。在家禽方面,公布了北京鸭、鹅的基因组草图,在基因水平上探索鸭、鸡对流感病毒的耐受性[19-20]。禽基因疫苗研究进展大,率先发现H7N9高致病性禽流感病毒,揭示我国H7N9病毒起源和进化规律,并研发出高效防控疫苗。水产方面,自主创新算法解析非洲肺鱼基因组,在遗传育种、疾病防治和医药等方面的研究应用也取得较大进展。

2.1.3 植物保护 世界农业基因组学领域发表的SCI和SSCI论文共1 039篇。中国以465篇的发文量排第1,论文被引频次、高被引论文排第2,篇均被引频次排第10;美国的篇均被引频次和高被引论文数量均排第1(表5)。中国科学院发文量在该领域全球最高,为54篇。该学科与作物和园艺、畜牧兽医相比,研究发文量少、论文影响力也低。

表5 基因组学与植物保护学科交叉论文产出情况

目前,在农业昆虫方面,已完成10余种与农业相关的昆虫基因组测序和组装,在基因水平上解析昆虫的遗传发育、取食迁飞、免疫防御等科学问题,为农业害虫的精准防治、分子设计抗病虫育种提供了新途径。在生物农药方面,建立了包括病毒DNA、dsRNA和Bt蛋白的基因水平的纳米材料载体杀虫技术平台,为核酸型农药的高效应用提供了新技术基础[21]。RNA干扰技术已广泛用于农业昆虫基因功能方面的研究[22]。突破全基因组扫描分子特征分析、高通量检测和溯源为转基因安全提供了保障。

2.2 我国农业基因组学潜力交叉领域

与欧美等发达国家相比,我国的农作物、畜牧业差距较大,原因之一在于种养殖技术落后,表现在品种品质、抗病性、成活率等方面。作为农业中“芯片”的种业,一些动植物种类由于种养殖品种非常依赖进口引入,面临着国外“卡脖子”的困境。如粮食作物中的大豆、玉米、马铃薯;蔬菜方面,胡萝卜引进品种达50%,番茄、萝卜、白菜等大众蔬菜达10%~40%[23]。

畜禽养殖中,由于我国猪种质资源缺乏,使得育种受限,至使猪品种长期依赖进口引入。水产动物(如虾、蟹)基因芯片技术等基因组方面研究还在启步阶段。微生物在关键菌种上缺乏拥有自主知识产权的核心菌种,关键原料和技术仍受制于国外。这些薄弱领域急需加强基因组学的研发,为其注入原创动力。

在新起步领域的潜力,如目前已绘制完成蒙古羊、蒙古牛、蒙古马和阿拉善骆驼4个物种的全基因组序列图谱,从比较基因组学角度分析了4种我国家养雉鸡的线粒体基因组特征,首次破译鹿科动物全基因组序列,组装出中国特有鲤科鱼类黑尾近红鲌的染色体水平基因组,这些研究成果为跃居世界领先水平打下了基础。

此外,目前构建完整植物基因组、复杂基因组和泛基因组方面仍具挑战。植物多倍化、杂合度、大基因组仍是植物基因组测序的主要障碍。在未来的几十年里,平均读长更长的测序技术、优化的组装算法和泛基因组分析工具等,将是未来的植物基因组测序需重点突破的方向。

3 结论及思考

近些年,世界农业基因组学研究与技术创新发展迅猛,基因组学加速向农业领域渗透,且融合度呈上升趋势。未来,农业基因组研发突破,并向产业应用加速,势将为生物种业、疫病防治、环境保护等带来颠覆性革命,全球竞争必将越演越烈。我国农业基因组学研发整体起步较晚,但我国高度重视,专门安排了研发计划,积极开展科研活动,在全球发文量排第1,被引频次、高被引论文排第2,专利申请量排第1,这些均反映我国农业基因组学研发取得了长足进步,在国际领域处于重要位置。但是,目前我国农业基因组学研发与国际领先水平有一定差距,论文影响力不强,缺乏领头性的重大成果;专利也是量大质低,突破性、重大性技术成果不多,且在国外布局少。因此,如何抢占这块高地需要从各个层面进行深入思考。

3.1 加强农业基因组研发,并与其他组学、新技术融合发力

基因组学的相关知识和系列研究方法显示出较强的交叉学科张力,但与农业各学科的融合度不一,在农业资源与环境、农产品加工等领域融合度还较低。基因组学实用技术创新与应用不足,且基因组学、生物信息学等基础研究成果与应用缺乏有机联系,现代分子生物技术与常规技术结合不紧密。未来我国需在测序技术、群体设计、表型测定、系统学研究方面发力,努力在基础研究中获取重大突破,提升我国农业基因组在国际上的影响力;加强农业基因组的新技术及其衍生技术的源头创新,实现跨越发展,提升国际地位,并持续推进技术优化和实用性改良,加强重要性状形成的遗传基础与调控网络研究,挖掘具有重大育种利用价值的基因,落地全基因组选择和分子设计育种,加强农业基因组与其他相关组学和农业基因组编辑技术、基因组学信息技术、农业合成生物学等新兴技术的深度交叉融合,在农业发展中发力;要在领跑领域突破跨越,在优势领域扩大优势,在弱势领域启动提速。

3.2 集聚优势,构建衔接融通农业基因组学研发创新应用链条

目前,我国农业基因组学基础研究、技术及转化资源,分别分布在高等院校、科研院所和企业,由于研发力量的切块,加上基因组学学科交叉性强,使得基础理论、技术创新研究到成果的落地,中间各环节脱节现象突出,形成不了无缝链条。基因组学研发领先国家,其成果应用目的性极强,陶氏杜邦、孟山都、巴斯夫、拜耳、瑞克斯旺种苗集团等跨国公司在专利技术来源的研发机构中名列前矛。未来我国需要统筹优化科技计划体系,实现创新链条上中下游有效衔接,注重企业超前融入,提升融合层次和深度,强化优势互补,需优化项目布局,加强在国外的申请,促进科技平台共建共享、联合完成重大科研项目、联合培养人才等,真正形成从理论、技术到产品的无缝对接。

3.3 强化基础支撑,打造高质量的平台和优美的环境

在基础支撑上,我国须强化体制机制、资金、平台、人才等科技资源的基础支撑,加大政策激励力,激发农业基因组学原创活力;探索参与农业基因组学研发的科研院所、高校、公司企业紧密结合、良性互动的有效机制,健全法律法规,重视基因组学技术产业发展;注重国际合作与交流;多措并举推动体制机制创新,探索适合农业科研规律和特点的组织方式和管理模式。基因组学属于资金技术密集型产业,需要国家、企业加大并持续稳定投入。在高质量平台建设上,我国须聚焦国家重大战略需求,强化统筹部署,建设新型高效协同创新平台体系;推动建设国家重点实验室,全面提升原始创新力;建设高质量创新创业共同体,推动资源聚集和优化配置。同时,我国须创造利于农业基因组学创新的人文环境,特别是加快建设农业基因组学人才队伍,着力培育领军人才、青年人才、创新团队,建设战略咨询专家库,为前沿预测与战略布局精准把脉;激励青年科技人才成长,对创新团队优化整合,对优势人才团队给与重点支持;积极培育基因组学技术开发与成果转化人才队伍,促进科技创新与产业发展有效衔接。

猜你喜欢

基因组学基因组测序
牛参考基因组中发现被忽视基因
基于基因组学数据分析构建肾上腺皮质癌预后模型
二代测序协助诊断AIDS合并马尔尼菲篮状菌脑膜炎1例
系统基因组学解码反刍动物的演化
基因捕获测序诊断血癌
单细胞测序技术研究进展
营养基因组学——我们可以吃得更健康
基因组DNA甲基化及组蛋白甲基化
有趣的植物基因组
基因组生物学60年