APP下载

中国玉米品种及其亲本系谱数据库的创建与利用

2020-09-11李建新席蒙慧张嘉玮席蒙娟田丁鲁懿哲陈晓阳李卫华张雪海汤继华

中国农业科学 2020年16期
关键词:子代自交系数据库

李建新,席蒙慧,张嘉玮,席蒙娟,田丁,鲁懿哲,陈晓阳,李卫华,张雪海,汤继华

(1河南农业大学农学院/省部共建小麦玉米作物学国家重点实验室,郑州 450002;2南阳师范学院化学与制药工程学院,河南南阳 473061;3新乡医学院管理学院,河南新乡 450003;4郑州工程技术学院中德学院,郑州 450000)

0 引言

【研究意义】玉米是世界上主要的粮食、饲料与工业原料,对保证全球粮食安全发挥了重要作用[1]。在玉米增产的诸多因素中,品种改良的贡献率约为35%[2],因此,新品种的选育与推广是促进中国玉米产量不断提高的重要因素。由于玉米是利用杂种优势的作物,优良自交系的选育是组配出强优势杂交组合的前提,而明确不同自交系的血缘关系是自交系改良与杂交组合组配的重要基础[3]。然而,中国玉米种质资源主要来源于外来种的引进。此外,随着中国种子法的颁布实施及玉米试验与审定制度的改革,玉米育种逐渐由科研单位主导的公益性研究向以企业为主的商业化育种模式转变,形成了科研单位、企业和独立育种人并行的局面。商业化育种在一定程度上限制了种质资源的交流利用,导致不同单位间选育的自交系系谱关系并不十分明确,已成为不同来源种质资源进一步改良利用的限制因素[4]。在自交系选系基础材料组配过程中,育种家如果想要了解基础材料的血缘与系谱关系,往往需要翻阅大量资料。另外,在种质资源交流与利用过程中,许多育种人员对自交系的来源与系谱关系并不一定全面了解,致使在基础材料组配过程中存在一定的盲目性,从而限制了育种效率的提高。【前人研究进展】随着计算机和互联网技术的快速发展,互联网思维逐渐渗入到育种行业[5],一些商业化育种软件及考种系统被逐渐开发。而在品种系谱数据库方面,目前,仅有水稻和花生两大作物构建了详细的品种系谱数据库[6-7],并且被广泛使用。而玉米上,仅有诸如种业商务网[8]、中国种业大数据平台[9]、第一种业网[10]、《中国玉米品种及其系谱》[11]等可以查询自交系或品种信息的网站或书本,未见可以查询自交系或品种详细系谱数据库的报道。【本研究切入点】玉米是中国第一大粮食作物,且播种区域跨度大,品种类型繁多,加之不同自交系之间相互杂交改良,亲缘信息没有得到有效梳理,造成很多自交系的系谱难以有效追溯,给自交系的进一步改良利用造成一定困难[12]。【拟解决的关键问题】本研究以现有玉米自交系及品种审定信息为基础,构建了中国玉米品种及其亲本系谱数据库,弥补了现有玉米品种信息数据库的不足,尤其是添加了系谱追溯、子代查询、定制化查询、纠错系谱信息及他人上传自交系及品种系谱信息等功能,供国内玉米育种及科研工作者共同使用、开发和维护。

1 材料与方法

1.1 数据来源

数据库以省级及中国农业农村部网站的玉米品种审定公示公告、引种公示公告、更名公示公告(仅有2017年及以后审定的品种信息)等信息作为第一数据源;以百度文库、种业商务网、中国种业大数据平台、第一种业网[8-10]的自交系及品种信息作为第二数据源;以书本[11-16]及相关文献[3,17-30]的自交系及品种信息作为第三数据源。

1.2 服务器环境配置和数据库结构设计

数据库采用基于LNMP(Linux系统+Nginx服务器软件+MySQL数据库管理系统+PHP超文本预处理软件)的服务器环境配置[31],相比于 Windows+IIS+SQL服务器环境配置,LNMP具有成熟、开源、稳定、免费等特点,已被各大网站广泛使用[32-34]。MySQL数据库根据《主要农作物品种审定办法》第五章第三十二条内容,通过查阅大量审定品种的详细信息并总结规律,确定了基本信息、特征信息和其他信息三张数据表。其中,基本信息表包括8个字段:品种名称(name)、审定编号(certification code)、审定年份(year)、审定地点(certification place)、审定单位(certification organization)、选育单位(breeding organization)、母本(mother)和父本(father);特征信息表包括5个字段:来源类型(origin)、种植区域(area)、特征特性(feature)、产量表现(yield)和栽培要点(point);其他信息表包括2个字段:数据来源(data source)和备注(note)。每个字段根据其文字数量配置不同的字段类型,确保数据库信息被充分利用。

1.3 数据库网络化管理

在服务器上运行织梦内容管理系统(DedeCMS),用于数据库管理、网站制作及对数据库进行快速操作[35]。系谱树的实现通过 AJAX(Asynchronous Javascript And XML)异步请求方式向服务器提交查询请求,经PHP处理后从数据库提取相关自交系及品种信息,并将处理后的信息以详细信息及系谱树返回给网页前端展现给用户(图1和图2)。

图1 客户端向服务端发送ajax请求后处理流程图Fig.1 The processing flowchart of an ajax request sent by the client to the server

图2 系谱树显示原理Fig.2 The principle of genealogical tree

1.4 数据库的维护

利用 DedeCMS管理并更新数据库,可实现玉米品种及自交系系谱信息的增加、修改、删除等操作。同时使用phpMyAdmin软件对数据库结构进行后期优化和新功能的添加,满足玉米育种及科研工作者的需求。

2 结果

2.1 数据录入及网页特点

第一数据源采用通配符、正则表达式等方式匹配并整合到数据库对应的字段中。第二和第三数据源因数据格式不统一,无法采用通配符和正则表达式等方式匹配数据,则采用人工录入整合到数据库。为方便第二、三数据源的录入,网页前端设置了数据提交入口(https://maizedata.cn/submit/genealogy/),采用前台提交数据,后台审核发布的方式将采集到的数据开放给用户浏览,访客也可自行通过该入口提交信息。目前总共收录玉米自交系及品种信息10 000余条,其中涉及自交系1 218个,杂交种7 823个,每个杂交种因审定编号不同,收录的品种信息从1至10条不等。

网站采用自适应页面,自适应不同屏幕尺寸的PC、手机及平板电脑端,无需安装客户端,即可快捷查询。此外,本网站(https://www.maizedata.cn)已被百度、360搜索、必应等搜索引擎收录;亦可通过小麦玉米作物学国家重点实验室(http://foodcrop.henau.edu.cn/)页面的常用网站链接进入。

2.2 关键词查询

网站首页搜索栏中输入自交系或品种名称,即可检索出相应自交系和品种信息;网页搜索栏下方为定制化查询板块(图 3)。“按关键词搜索”栏,可根据品种名称、审定编号、母本名和父本名等任意一条或多条信息组合,检索自交系和品种的系谱及信息;此外,在审定编号栏输入年份,即可查询该年份审定的所有品种及其系谱信息;输入父(母)本信息,可查询该自交系所有子一代品种及其系谱信息;按此方法循环查询该检索结果页面的所有品种信息,则可查询到一份既有亲代又有子代的完整系谱树。

2.3 审定年份查询

高级搜索板块“按时间跨度搜索”栏(图 3),访客可输入起始时间(左边输入框)和结束时间(右边输入框)或拖动输入框上方的滑块来确定查询时间区间,点击“提交”按钮即可查询到该时间区间内的所有自交系、品种及其系谱信息。

2.4 审定地点查询

在高级搜索板块“按地点搜索”栏中(图 3),用户只需点击相应省份或直辖市即可查询该地区不同时期的玉米自交系及历年审定品种信息。

2.5 系谱树查询

图3 高级搜索页面Fig.3 Advanced Search page

详情页可同时查看品种信息和系谱树,为节省服务器带宽,系谱树默认不展开(图4,以必祥101为例)。访客点击“”展开下一级系谱树(父母本缩进约2个字符);已展开系谱的品种左边显示为“”,再次点击即可收起。若品种左边显示为“□”,表示该品种已无父母本。点击自交系或品种名称即可查看其详细信息。

2.6 子代查询

子代查询模块位于详情页中系谱树模块下方,该模块列出了该自交系或品种的所有子代及子代的子代(图5,以黄早四为例,所有杂交种前面均注明杂交种,未注明的为自交系)。访客点击“”展开下一级系谱树(每一代缩进约2个字符),已展开系谱的自交系或品种左边显示为“”,再次点击即可收起。若用户点完“”,子一代左边显示为“”,但下一级却不显示,则表示数据库中没有该自交系或品种的子代。点击自交系或品种名称即可查看其详细信息。

图4 必祥101系谱Fig.4 Genealogical of Bixiang 101

图5 黄早四的子代及子代的子代Fig.5 Offsprings of Huang Zaosi and their offsprings

3 讨论

玉米品种及其亲本系谱数据库的创建,在一定程度上集合了更多的玉米自交系信息及品种审定信息,解决了系谱追溯困难等问题,节约了玉米育种及科研工作者查询玉米自交系和品种信息及系谱追溯的时间。截止到目前,本数据库收录的玉米自交系及品种信息最为齐全(10 000余条)。此外,本数据库的查询功能更丰富,拥有强大的系谱树组件、子代查询及定制化查询等功能。然而由于从网上及文献搜集的系谱信息有限,导致有些品种仅能查询到品种本身信息,无父母本信息,加之近几年玉米审定品种数量大幅度增加,部分品种信息可能未被及时收录。未来随着数据量的增多,仍有需要优化和完善的地方,比如品种权、推广面积等查询功能;或根据品种特征的定制化查询功能,如查询亩产大于特定重量或生育期低于特定天数的所有品种;或根据用户需求开发出满意且实用的功能等。鉴于此,呼吁玉米育种及科研工作者一起向数据库添加更多系谱数据,及时补充更新相关自交系及品种信息,完善数据库/网站,相信在用户+互联网+大数据的支持下,数据库会建设的更加完善。需要注意的是编写本网站采用的 css代码版本较高(frontawsome5.0,jquery1.9.8),使用IE浏览器浏览本网站时会出现模块无法加载的情况,故不兼容internet explorer全系浏览器,遇此情况,建议根据页面提示更换浏览器。

3.1 为用户提供自交系及品种信息

为明确不同自交系的血缘与系谱关系,育种工作者需要查阅审定品种信息、追溯亲本来源,特别是对亲本信息不详的品种需要查阅大量文献资料,而建立基于互联网的玉米系谱数据库可减少系谱查询时间,提高工作效率,为育种家在基础材料组配过程中选择合适的种质资源提供重要参考依据。本数据库在搜集、整合多个网站及文献中自交系和品种信息的基础上,通过完善并优化数据结构,可以为用户提供更完善的信息支撑。

3.2 提供系谱树,减少手工绘制时间

玉米自交系及品种的系谱来源及系谱树的绘制一般通过查阅系谱资料手工绘制,费时费力,不易保存且出错率高。现有玉米品种信息数据库均无系谱树功能,虽然某些纸质版文件提供系谱树,但查询不方便;单机版系谱查询软件存在数据更新不及时问题;本数据库添加了可快速对某一品种或亲本进行系谱追溯的系谱树功能,且系谱树和子代树均为系统自动生成,降低了错误率,保证了系谱的完整性及准确性。

3.3 解决纸质版系谱书籍查询繁琐、数据更新滞后等问题

传统纸质版系谱如《中国玉米品种及其系谱》[14],仅能通过目录查询相关自交系或品种的系谱,系谱树因纸质媒介而固定,可用性及灵活性不高,数据更新难度大,存在一定的滞后性。现今,新审定玉米品种数量飞速增长,纸质版系谱已无法满足育种需求,利用互联网优势构建的系谱数据库,更新速度快,可以显著提高查询效率。

3.4 定制化查询功能,快速检索有用数据

本数据库添加定制查询功能,用户可通过关键词、时间区间、审定地点、审定编号、模糊和自动分词查询等方式进行查询,方便用户快速查询所需品种信息。此外,还提供了用户上传、纠错系谱信息等功能,供国内玉米育种及科研工作者共同使用、开发和维护。

4 结论

基于LNMP服务器环境配置创建了中国玉米品种及其亲本系谱数据库(https://www.maizedata.cn);目前总共收录玉米自交系及品种信息10 000余条,其中涉及自交系1 218个,杂交种7 823个;实现了品种信息检索、系谱追溯、子代查询、定制化查询、用户上传及纠错系谱信息等核心功能。

猜你喜欢

子代自交系数据库
妊娠期高血压疾病与子代心血管疾病关系研究进展
孕前肥胖、孕期增重过度与子代健康
利用SNP 标记划分玉米自交系杂种优势类群
6个新选玉米自交系的配合力分析
十三份玉米新自交系的育种潜势分析
数据库
不同种源文冠果优良子代测定
玉米自交系保纯和提纯
数据库
数据库