APP下载

农作物品种试验数据管理平台设计与实现

2022-08-19于春花王玉玺王晓锋闫宝岐丁欢欢王开义

中国种业 2022年8期
关键词:汇总性状品种

于春花 王玉玺 邱 军 曾 波 杨 锋 王晓锋 闫宝岐 杨 硕 丁欢欢 葛 晓 王开义

(1 北京市农林科学院信息技术研究中心,北京 100097;2 全国农业技术推广服务中心,北京 100125)

国家品种审定制度是保障我国种源自主可控的重要支撑,也是农作物育种产业化应用的关键环节。品种试验作为国家品种审定的重要组成部分,是新品种审定与推广的基础和依据,有利于生产用种的安全[1]。品种试验包括区域试验、生产试验及品种特异性、一致性、稳定性测试(《主要农作物品种审定办法》)。每年度五大农作物大约有800 多个试验站承担公益性田间试验,从业人员包括数据采集人员、试验主持人等,流程上包括田间采集、数据保存、数据监管、数据汇总等环节,形成了复杂的数据收集体系。在数据采集层面,试验点对标准的理解及记载方法有差异,相同性状的单位或者分级不一致,导致底层数据不统一。在电子化保存方面,试验点数据的录入容易出错,Excel 也不能对数据正确性进行主动检验;在数据汇总时,要花费大量的时间核查试验点数据,重新整理数据,并在Excel 表中编写不同公式对多个试验点填报的性状数据进行计算、汇总,整个过程繁琐、效率低。在数据监管层面,数据分级报送方式,导致试验管理部门、试验执行部门很难查看即时数据,不利于品种试验过程的监管。因此针对以上问题,农作物品种试验数据管理平台(以下简称平台)的开发和应用,能够较好地推动品种试验信息化技术标准,提高品种试验质量,保障底层数据质量。

信息技术已经应用到农业很多方面。在育种方面,Han 等[2-3]基于云体系结构,研发了作物育种信息管理系统,可以高效地管理育种材料并进行家谱跟踪,进一步计算亲本的一般配合力和特殊配合力,为亲本选择和组合选择提供了依据。李建新等[4]基于LNMP(Linux 平台+Nginx 服务器软件+MySQL数据库管理系统+PHP 超文本预处理软件),创建了玉米品种及其亲本系谱数据库。在主要农作物品种审定、非主要农作物品种登记以及品种权保护方面,分别有品种审定数据管理系统、非主要农作物品种登记管理系统和植物新品种保护管理系统,实现了农作物品种保护、审定、登记的信息化管理。

但在品种试验方面,大部分的研究还集中在试验结果分析、试验设计优化等方面,利用信息技术实现品种试验全流程的管理很少。如刘太国等[5]、胡学旭等[6]、宋晓霞等[7]利用参试品种,在抗病性、品质变化、品种的主要系谱和生产潜力方面进行了分析研究。高辉明等[8]、姚金保等[9]利用多年区试中对照品种和参试品种的资料,研究了品种表现与环境之间的关系。许乃银等[10-11]采用GGE 双标图方法对皮棉产量、综合评价品种选择指数的鉴别力、代表性、理想指数等进行了分析和综合评价。张毅等[12]提出了北部冬麦区农作物品种区域试验的重复次数和试点数量的优化设计方案。刘哲等[13]利用区试数据和调查数据,在县域精细尺度下,研究作物品种种植适宜性精细区划方法。许乃银等[14]、冯勇等[15]利用Excel 自带的数据功能实现了试验点数据的规范以及汇总报告中“品种评述”的自动生成。王虎等[16]、叶思菁等[17]利用移动端、GIS 技术实现了作物大田测试数据、环境数据的采集。也有少部分学者利用信息技术研发了专门的系统,分别用于“品种评述”、试验数据预处理以及数据分析等环节[18-19],但是未涉及品种试验全流程的管理,普及度也不够高。

农作物品种试验数据管理平台将信息技术、数据库技术等运用到品种试验过程,构建品种试验信息化管理流程,实现品种试验的全流程可跟踪、数据可追溯、性状可重现,实时上报、实时监督,提升数据上报及时性和准确性,规范了试验数据。

1 品种试验信息化需求分析

1.1 品种试验管理模式品种试验由试验管理部门组织实施,试验点管理部门协助开展品种试验监督管理相关工作。试验方案执行部门负责协助制定试验实施方案、开展试验监督检查和技术培训,监督指导各试点品种试验,起草试验总结报告。试验点按照试验实施方案开展品种试验,接受试验管理部门、试验点管理部门和试验方案执行部门的监督指导,及时提交客观、准确的试验数据和总结报告,做好品种试验资料留档。

1.2 品种试验信息化流程分析根据品种试验管理模式,平台设置4 个角色类型,明确各角色职责范围的业务及业务流程:(1)试验管理部门:审核初试品种,制定试验实施方案,对品种试验过程、数据及汇总数据进行监督。(2)试验执行部门:评级已参试品种,制定生态区组方案,生成试验任务下发试验点人员进行数据录入,监管试验过程、数据并进行试验数据汇总,形成汇总报告。(3)试验点管理部门:监管权限内试验点。(4)试验点:根据下发的试验任务种植品种,采集性状数据、图片后上传,遇到试验异常情况报备给试验方案执行部门,试验结束后编写年终报告并提交。

2 品种试验数据管理平台设计

平台采用B/S 架构,以Oracle 关系型数据库、Java 语言为开发工具。平台不同角色的权限不同,登录平台后,不同角色看到的功能以及数据由权限决定。平台整体架构见图1,分4 层:(1)数据采集层,包括通过平台上传数据及田间采集设备(简称PDA)、考种设备等外接设备采集数据;(2)数据存储层:根据不同数据的特性分为参试品种数据、试验方案数据、品种性状数据、异常报备数据以及图片数据。(3)数据处理层:用户权限验证用于过滤不同角色的用户登录平台后使用的功能及数据;品种参试验证用于品种申报时品种信息的验证;试验方案制定、试验任务生成用于分配试验任务到具体试验点;试验数据上报用于试验点将性状数据、图片数据上传到平台;试验数据汇总用于多点数据的处理与分析。(4)数据应用层:包括试验性状和图片数据查询、试验过程监督、试验点年终报告和汇总报告的生成、试验数据的总体分析。

图1 平台架构

3 品种试验数据管理平台的实现

3.1 平台功能在平台架构设计基础上开发了一级功能模块8 个:(1)品种管理:管理参试品种的基本信息、评级信息,并实现品种查询。(2)方案管理:制定品种试验实施方案,包括各生态区组试验品种分组、大田试验的试验点、需要鉴定的抗性品质项目和鉴定单位以及试验任务生成。(3)数据管理:主要用于试验过程中品种性状数据和图片录入、查看、编辑;异常情况的报备与审核,试点报告提交与审核。(4)数据汇总:由试验执行部门对所管辖生态区组所有试验进行试点/品种剔除、数据处理、分析、汇总,最终生成汇总报告。(5)统计监督:用于品种试验过程进度把握及运行数据统计。(6)基础数据:用于支撑整个平台运行的基础类数据,包括性状、生态区组、试验点、性状单位、报告模板管理等。(7)系统管理:用于角色权限配置、用户信息管理。(8)培训资料:用于各角色操作手册上传、下载。

3.2 实现了品种试验标准的数字化品种试验的核心目标是获得多年多点品种的性状数据,以此数据来评价品种的产量、抗性、适应性等内容,因此高质量的数据是评价的保证。首先,对各作物品种试验技术规范、历史数据进行研究,梳理了各作物需要采集的性状以及不同生态区组间的操作差异,在作物范围内对相同性状进行名称、采集标准的规范统一,并对性状的数据类型、采集阶段、多点间性状处理等属性做了详细规定。其次,统一了多年数据处理、数据汇总的方法以及试验点、品种数据的质量指标。最后,统一了年终报告以及汇总报告的体例、展示内容。以上内容的统一,大幅度提高了数据的科学性、准确性,实现了不同生态区组间、不同年份间、不同试验点间在空间、时间维度上数据的统一。

3.3 实现了试验进度的监督管理在试验过程中,数据的及时上报与监督有助于管理层实时掌握试验情况,按照以往管理方式,方案执行部门和管理部门只有在试验点提交年终报告后才能看到试验数据。平台根据各区性状设置预警时间,在数据最佳上报时间跟踪提醒,促进试验点在各生育期采集数据后及时上报性状数据、图片以及田间施肥等栽培信息,管理层可在平台查询各生育期数据,实时掌握试验品种田间生长情况、各试验点数据的上报情况,及时给予相应指导,保证试验顺利实施。图2 为数据监督查看相关功能。

图2 数据监督查看

3.4 构建了品种试验全流程信息化管理体系在业务上,平台构建了从试验品种申请、品种审核、试验方案制定、田间数据填报、田间数据审核、数据处理分析、数据汇总的信息化全流程管理(图3),明确在各业务阶段不同角色的职责范畴,并根据不同角色职责分配相应功能权限以及数据权限。在品种试验周期上,构建了试验第1 年到完成试验程序多年试验流程以及各年度品种全生育期周期的性状数据、参试信息的信息化,实现了品种试验的全流程可跟踪、数据可追溯、性状可重现。

图3 信息化业务流程

4 品种试验数据管理平台的实施效果

4.1 平台运行数据农作物品种试验数据管理平台实现了从品种到试验方案,到数据填报汇总分析,再到数据监督的规范化、标准化、信息化管理。平台从2017 年开始示范实施,截止到2021 年,覆盖五大农作物全部生态区组,累计管理公益性试验参试品种5000 多个、试验点1000 多个,生成试验12224 条、试验点年终报告6422 份、汇总报告407 份,采集图片数超35 万张,采集性状数(包括公益性试验、联合体、绿色通道3 个渠道)约2000 多万条,构建了国内渠道权威、数据标准、管理规范的农作物品种表型数据库,为种业大数据的建设提供了重要支撑。

4.2 信息化流程的建立促进了业务流、数据流的优化农作物品种试验信息化的关键是构建业务流程和数据标准的统一。首先,研究试验的业务过程及关键阶段、角色划分、各角色功能和数据权限、应用场景,建立科学合理的阶段与角色职责,实现线下业务向线上业务的转变。其次,本平台在性状采集、图片采集、报告格式及报告内容、数据处理、数据分析方面建立了作物内统一的标准,性状标准、数据处理标准、数据分析标准使得性状数据在试验点间、年度间、不同区组间都具有可比性以及更好的分析性,显著提高了数据质量。通过平台的使用,把品种试验各环节对业务及角色的要求固化到平台,促进各角色理解各自的职责范畴,使得品种试验业务更为规范流畅,形成优质的业务流,进一步产生优质数据流,试验数据更加准确规范。

4.3 作为表型数据库参与种业大数据联合分析植物表型组学是在基因组水平上系统研究植物或细胞在不同环境条件下所有表型的学科,包括空间尺度以及整个生育期的时间维度上的信息[20]。品种试验采用多年多点方式,在多个年度间、多个地理环境下种植,可收集到品种在不同年度、不同环境下的品种个体、群体以及整个生育期的多维度的数据,加上平台对数据规范的硬约束,保证了数据的准确性、高质量,可作为表型数据库,具有很强的可利用价值。

在数据利用上,通过平台中品种在产量、抗性、品质等性状上的变化,研究品种审定的发展趋势,为育种家制定育种目标提供参考。此外,联合试验过程中气象试验站采集的环境气象数据,可进行品种环境适应性分析,为品种适宜推广区域做参考。结合基因型、环境数据进行联合分析,对揭示作物生命科学规律、提高作物功能基因组学和分子育种研究水平等具有重大意义[21]。

猜你喜欢

汇总性状品种
珠海长肋日月贝形态性状对体质量的影响
源流2020年目录汇总
“这小狗是啥品种?”
近两年来国务院及相关部门出台的促进消费政策汇总
甜玉米主要农艺性状的研究
2013—2017年市人大常委会执法检查项目汇总
分析次日必补跌品种盘口细节
交变电流基本知识汇总
北京植物园 国内首个月季品种测试园
四川省2009年主导品种集萃