云环境下作物育种信息化模型研究
2017-12-16刘忠强王开义赵向宇李民赞
刘忠强,王开义,赵向宇,李民赞
云环境下作物育种信息化模型研究
刘忠强1,2,王开义3,赵向宇4,李民赞1
(1.中国农业大学 现代精细农业系统集成研究教育部重点实验室,北京 100083;2.国家农业信息化工程技术研究中心,北京 100097;3.农业部 农业信息技术重点实验室,北京 100097;4.北京市农业物联网工程技术研究中心,北京 100097)
在种业体制改革和兼并重组加速推进、行业集中度大幅提升的大背景下,开展育种技术创新、加强资源交流与联合育种是广大中小型育种企业提升核心竞争力的必然选择。为此,首先介绍了国内作物育种信息管理软件的应用现状,对云环境下开展作物育种信息化建设的优势进行了深入分析;接着,以中小型育种企业育种信息化为业务基础,研究云服务模式与作物育种信息管理业务的契合点,提出了云环境下的作物育种信息化模型。模型充分考虑了作物育种信息管理平台在云服务模式下的个性化、一体化及差异性等特点,支持精量播种机、测产测水等农机设备的统一对接平台、面向用户特征的多层次服务提供策略和基于数据挖掘的作物育种决策支持等方案,对广大中小型育种企业、高校科研院所育种团队及专业测试机构等开展信息化建设,实现资源共享、协同育种与联合测试,进而推进现代种业全面均衡发展,具有借鉴意义。
育种信息化;育种软件;云服务;数据挖掘
0 引言
随着我国种业体制改革的加速推进,在兼并重组、行业集中度大幅提升的大背景下,种子企业特别是数量众多的中小型企业面临着前所未有的种业竞争和体制改革压力。在创新种质资源和扩大育种规模的同时,开展育种技术创新、加强资源交流共享、注重强强联合与协同发展是提升企业核心竞争力的必然选择[1-2]。
信息技术是提高育种效率、实现高效协同育种的重要技术支撑,育种信息化程度是衡量一个企业现代育种技术水平的重要标准[3]。杜邦先锋、孟山都、先正达等跨国种子集团均投入重金构建了依托商业化育种软件的育种管理体系,实现每年几十万的育种材料管理、基因型与表型数据协同管理,为海量育种数据的高效分析和充分利用提供了技术保障。
我国目前有种子企业4 400家多,育种科研单位及种业从业人员数量居世界第一位。但是,仅有隆平高科、山东圣丰种业[4]、中种集团、大北农集团等少数大型种业龙头企业搭建了育种信息管理平台,在种质资源管理、育种过程管理及数据管理分析等育种核心业务环节发挥了重要作用。绝大多数中小型种企、育种科研院所和高等院校仍然普遍采用人工测量、纸质记录、经验决策等传统工作方式,投入产出严重失衡,在很大程度上制约了我国现代种业的整体发展进程。
云计算技术具有低成本、易扩展、计算能力强等特点,交通云、医疗云、通讯云、教育云、气象云等产品已在各自领域切实落地并发挥着重要作用[5-6]。研究云服务模式与作物育种信息化管理业务的契合点,构建云环境下的作物育种信息管理平台,为广大中小型育种企业、育种科研院所、高校育种团队及专业测试机构等提供高效优质的育种信息化服务,推进现代种业全面均衡发展,是本文的研究重点。
1 作物育种信息管理软件应用现状
作物育种信息管理软件是现代育种企业技术链管理、资源整合与共享的基础,旨在通过数字化、标准化和规范化育种流程,全面、高效地集成管理全业务流程的各类育种信息和育种资源,实现育种效率的提升与辅助分析决策。
1.1 育种软件市场成熟度迅速提升,用户认可度普遍较高
目前,国内外市场上主流的商业化育种软件产品有10余种:国外有加拿大的AGROBASE、美国的PRISM和法国的DORIANE等;国内仅有国家农业信息化工程技术研究中心的金种子育种平台GSM和中农博思的农博士NBS两款。其中,AGROBASE应用最为广泛,金种子育种平台GSM在国内有成功案例。部分育种软件在国内的应用情况如表1所示。
表1 育种软件在国内使用情况(部分)
国家农业信息化工程技术研究中心历时3年打造了面向大型育种企业的国产商业化育种软件“金种子育种平台”,并在袁隆平农业高科技股份有限公司、山东圣丰种业科技有限公司等种业龙头企业进行商业化应用。金种子育种平台集成物联网、电子标签等技术,通过与企业商业化育种体系的深度融合,实现育种材料规范化管理、田间试验可视化设计、性状数据快速采集与无线传输、历史数据田间实时查询与系谱追溯及多维数据分析等功能,为国内种业提供了多个具有标杆意义的成功案例,也为育种软件的研发与实施积累了可借鉴的推广经验。
国外种业巨头多年的成功经验及国内少数大型种企的典型应用案例,对广大育种科研人员、育种企业管理人员深入认识信息技术对育种工作的促进作用起到了重要的引领和辐射效应,从业人员对育种软件的回报率有了更加清晰的认识,对信息化管理思想的认同度正在逐年提升[7-8]。随着我国商业化育种进程进入产业化升级新阶段,育种企业及科研单位迫切需要借助信息化手段,提升自身育种技术水平和市场核心竞争力[9]。
1.2 育种软件国内应用效果不显著,中小型育种企业和科研单位迫切需要适合自身特点的软件产品
国外作物育种软件的研发工作始于20世纪90年代,在育种工作中已经发挥着重要作用,产生的效益十分显著[6]。进入21世纪,国内种子企业开始尝试引进AGROBASE、PRISM等国外育种软件,但实际应用效果却并不理想。分析原因,除了设计思想不适用于国内种业现状及语言障碍之外,在现场实施能力及个性化开发服务方面的欠缺在很大程度上制约了国外育种软件的真正落地。
1)缺乏系统的产品售后服务,现场实施能力弱。商业化育种软件不同于普通的管理软件,具有很强的专业性和复杂性,各功能模块严格按照商业化育种体系设计,需要经过完整育种周期的现场实施培训并在实施中不断优化产品功能,才能实现软件与育种业务的深度融合并真正发挥作用。目前,多数国外育种软件在售后服务和现场实施方面普遍存在不到位、不及时、不专业等现象,许多用户难以自主、长期运营,进而导致软件买而不用、大量闲置和荒废。
2)功能无法支撑全业务链条,个性化定制开发成本高。不同作物间育种流程的差异性、不同育种家育种方法的多样性及不同育种企业管理模式的灵活性,决定了市场上的任何一款育种软件产品都不可能完全满足用户的需求,必须根据用户特点进行个性化定制开发。市场上绝大多数育种软件供应商基于成本考虑并不提供个性化开发服务,直接导致软件只在用户部分业务环节应用,或仅仅使用软件中的少数几个功能模块,无法充分发挥育种软件的最大功能,带给用户的辅助作用非常有限。
此外,育种企业需要培养具备信息技术与育种技术的混合型人才,以保障育种软件的长期自主运营。个性化开发、现场实施、人才培养、软件运行所需的服务器、防火墙等基础环境建设等费用,用户一次性投入至少在百万元级别,加上不定时的维护和升级费用,远远超出了大多数育种单位的承受能力。因此,面向中小型育种企业和育种科研团队提供全面的育种信息化解决方案咨询、灵活可定制的软件产品研发、持续专业的售后培训与实施服务等工作意义重大。
2 云环境下开展作物育种信息化建设的优势
云服务环境下构建作物育种信息管理平台,具有低成本、标准化、高性能、快速实施及易维护等多项共性优点。除此之外,基于云计算技术开展作物育种信息化建设仍具有以下显著优势。
2.1 快速推广现代育种新思路,引导育种企业构建现代育种技术体系
截至2015年底,国内种子企业中获得农业部颁发的“全国育繁推一体化企业”资质的企业不足100家,多数企业尚未建立健全商业化育种技术体系,从育种流程、管理模式、信息化、自动化水平方面不能满足大规模商业化育种的要求。通过数字化、标准化和规范化育种流程,将模块化、流水线式的现代育种思想和技术流程通过平台进行固化,利用云服务模式快速引导育种企业的育种行为由作坊式育种向商业化育种转变,由靠经验育种向靠数据育种转变,辐射带动广大种业从业人员提升数据标准化与操作规范化水平,以低成本、高效率的方式在全国范围内推动种业企业商业化育种技术体系的构建与升级。
2.2 促进行业规范发展,推动育种资源共享与联合协作育种
随着我国种业兼并重组业务的深入,能够最终发展成为种业航母的企业毕竟只占极少数,多数企业和科研单位将集中资源专注于种业链条的一个或几个环节,并最终通过业务转型和技术升级发展成为细分领域的专业机构,如种质资源改良、自交系选育、联合测试及分子检测等。在专业化分工和社会化协作的大趋势下,只有通过加强联合和优势互补,充分发挥各育种单位的优势,才能彻底摆脱各自为战的低端竞争困局,形成合力并具备竞争优势。
然而,长期以来由于国内众多种子企业多而分散,竞争激烈而缺乏交流,在数据标准、操作规范、管理理念等方面差异性较大,导致开展资源共享和联合协作存在诸多困难,资源的有效利用率不足1%[10]。借助云平台在育种资源多级加密、智能匹配推送、流程自动管控及材料多维度评价等技术优势,企业可以在内部建立共同的工作语言和标准的工作方式,实现育种资源和信息在各个环节的无缝流转。在此基础上,逐渐形成行业内普遍认同的标准和规范,推动育种资源在整个行业内的高度共享和循环利用,进而开展基于云服务的、广泛的协作育种,避免各单位间无效、低水平重复工作,优化资源配置,实现资源有效利用率最大化的同时,达到各方共赢的目的。
2.3 多维度数据联合分析,提升育种辅助决策力度
在日益激烈的市场竞争条件下,为了更高效地培育新品种,快速抢占市场,种企管理者及育种家对育种决策质量、决策速度提出了更高要求。借助育种数据分析挖掘工具辅助决策成为育种决策者的重要途径。但是,国内多数企业的育种数据仍以纸质或EXCEL形式存储,无法直接利用,即便少数企业使用软件进行数字化管理,采用的标准和数据结构也无法兼容整合,每个系统数据处理的维度固化,计算、存储等资源动态调整能力有限,不支持数据结构的横向关联,分析挖掘结果的参考价值十分有限。与此同时,不同育种家依据各自经验进行决策,导致同一资源的描述信息因观察能力、偏好等因素而产生较大的差异性,大幅降低了资源的可共享性和利用价值。
基于育种云平台完整产业链的业务数据,具备一致性、完整性、精确性及同一性等特征,每个育种单位的数据可以最大限度共享,能够在材料数、地点数、测试年度等方面实现数据的多维度扩增,通过集成利用大数据、数据挖掘、决策支持系统等技术和分析工具,实现跨企业数据的综合分析[11],从海量数据中挖掘知识、发现规律,“充分利用历史经验”为亲本杂交、组合测配、多点测试、品种推广等决策提供辅助指导,提升综合决策水平和预警能力。
2.4 资源高度共享,助推传统育种方法与现代生物技术深度融合
现代育种技术体系的建立需要常规育种、分子辅助育种、转基因育种及抗逆性检测多项关键技术的共同支撑[12],涉及多个交叉学科,需要强大的信息平台进行有效的数据组织和管理。例如,分子设计育种可以实现育种的定向变异、准确选择的目标,但是这一技术只有借助云平台强大的信息处理能力、共享机制及计算模拟集成技术才能更好地发挥作用。在云环境下,以育种目标为纽带,充分发挥信息技术的提升和串联带动作用,促进多种常规育种技术与生物育种技术在不同产业链环节的协同发展,形成合力,建立有明确育种目标的高效率的现代育种体系,共同促进现代种业的发展。
3 云环境下作物育种信息化模型构建
本文以中小型育种企业和育种科研院所的育种信息化管理为业务基础,深入研究云服务模式与作物育种信息化管理业务的契合点,充分考虑了作物育种信息管理平台在云服务模式下的个性化、一体化及差异性等特点,提出了云环境下的作物育种信息化模型,如图1所示。模型在遵循高可用、标准化、高性能、开放接口等基本原则的基础上,在行业规范性引导、专业性服务、可持续性运营机制、数据安全性保障等方面设立相应标准,以便更好地满足多用户多作物的育种信息化需求。
模型首先抽取不同作物、不同类型育种主体的业务流程,解析业务逻辑,然后通过控制器和协调器的共同作用,面向用户特征进行服务的筛选和整合,最后为各类型用户构建合适的育种信息化产品。
图1 水稻育种试验及材料信息表
3.1 第三方应用接口的统一接入方案
完整的云平台必然会接入第三方服务,接口设计的通用性、可扩展性和可维护性直接影响着云平台构建的质量。本文提出的作物育种云平台模型采用统一接入方式,将第三方服务的接入、管理、维护等工作交由一个独立的功能模块负责,极大地提高了模型的运行效率。模型集成接口控制模块,用来接入和管理第三方平台、系统或者服务,使云平台具有良好的系统扩展性和耦合性,采用加密的Web Service标准技术进行注册和服务调用。为了增强云平台的扩展性,允许用户定义服务接入开发模板,进行定制接口的接入。接口服务主要包括:性状数据采集设备、田间视频监控设备、生长环境信息采集设备、精量播种机、自动化考种系统、育种试验分析软件,以及支付系统等第三方应用接口的统一接入方案。
3.2 面向用户特征的多层次服务提供策略
育种云平台的用户既包括育种家个体,也包括中小型育种企业、育种科研院所及专业测试机构等群体,还可以是由产业链中多家育种单位组成的联盟或联合体等,每类用户的需求具有多样化、个性化、动态性等特点。模型在满足用户基本需求和共同需求的基础上,通过提供个性化、特色育种信息服务以增强服务方式,更好地满足不同用户的特殊需要。
个体用户具有专业性强、灵活性高、个体之间差异性大等特点,主要关注种质资源改良、系谱追溯、试验数据分析及分子标记检测等少数几个育种信息服务。针对个体用户,该模型采用主动性服务方式通过分析用户行为和需求,获取用户特征描述,有针对性地主动推送服务,随着用户特征模型的优化服务推送应具备动态性。
育种企业等群体用户业务较全面,具备很强的系统性和流程性,各环节分工明确,节点间信息流转频繁。针对群体用户,模型采用服务组合推荐方式,综合分析群体用户的业务链条形态类型,形成多种服务组合方案供群体用户选择,并允许用户根据自身业务调整情况对方案优化重组。
联盟或联合体是育种资源统一、集中、协同管理的有效手段,也是降低资源浪费、实现资源整合和高度共享的重要途径[5],一般由行业内的多家种业企业组成,业务覆盖全产业链条,联盟企业在联合协作的同时又具备各自业务的独立性和完整性。针对联盟用户,模型基于面向多任务的服务组合选择技术,构建全产业链条件下多层次一体化协同服务体系,既能满足企业内部的育种信息化需求,又可以在整个联盟间实现资源共享、协同育种与联合测试。
3.3 基于数据挖掘的作物育种决策支持
模型将大数据技术应用到作物育种决策支持系统中,并结合分布式技术、虚拟化技术形成了具有高可扩展性、高运算性、高实时性的作物育种决策支持系统平台架构。该架构以数据为驱动,充分发挥了“数据”在整个决策支持系统的核心地位,决策过程就是数据信息的交流过程,系统各个部件即相辅相成,又松散耦合。系统架构主要包括以下部分。
1)多维数据源:育种过程形成的大量的、体现育种现实过程的原始数据,包括多用户、多年度、多地点及多种形式的数据源头,如基因型数据库、表现型数据库、育种数据及环境数据等[13]。海量的原始数据是实现基于数据驱动的决策支持系统的基础。
2)数据转换平台:用于从原始数据源中采集数据,并对数据进行抽取、清洗和转换,最后将整理后的数据存储到数据支撑平台。
3)数据支撑平台:主要提供对数据的存储,数据可按照不同的格式,分别存储到数据仓库、分布式文件系统等不同存储介质中,用于支持大数据挖掘和分布式计算。
4)数据挖掘平台:核心模块,主要用于实现数据挖掘算法运算和联机分析处理(OLAP)的数据分析。模型内置常用挖掘算法和分析工具,同时提供运算接口,方便用户扩展现有系统的数据挖掘算法实现对新决策问题的自主分析。
该系统将数据仓库、数据挖掘与传统决策支持系统模型有机结合,具备以下特点:使用分布式文件系统、分布式数据仓库形成的数据支撑平台取代了单一的关系型数据库,使决策支持系统的存储能力在支持数据仓库的综合数据存储的同时支持海量数据的分布式集群存储,通过分布式并行运算,显著提高数据挖掘效率;摒弃了智能决策支持系统结构中的专家库和专家系统,完全使用OLAP和数据挖掘来主动获取知识。知识获取以数据为驱动,解决了专家系统获取专家知识困难、知识更新不及时以及知识中掺杂专家主观建议的弊端。为了能够实时响应客户需求,系统将获取知识和使用知识进行解耦,很大程度上提升了育种决策的响应速度。
4 结论
提出了一种适用于云环境下的作物育种信息化模型。该模型以中小型育种企业育种信息化为业务基础,通过研究云服务模式与作物育种信息管理业务的契合点,为中小规模的育种团队开展育种信息化建设提供可借鉴的技术方案,具有广阔的应用前景。下一步将选取开发技术进行模型实现,面向育种个体、群体和联合体用户开展应用验证。同时,在作物育种云平台的可持续性运营机制、专业化服务模式及数据安全性保障策略等方面进行深入探索。
[1] 杨晓东,余学科,黄玮琳,等.中国农作物商业化育种现状及发展对策[J].农学学报,2014,4(2):117-120.
[2] 张世煌.种业新政以后科研单位和中小企业的改革方向[J].种子科技,2011(5):3-4.
[3] 董春水,才卓.现代数字育种技术的研究进展[J].玉米科学,2013,21(1):1-8.
[4] 李洪杰,赵晋铭,张小燕,等.大豆商业化育种的探索与实践[J].中国种业,2015(1):28-30.
[5] 曹诚,唐卓浩.一种智能医疗云平台的构建方案[J].信息通信,2015(7):79-81.
[6] 苏显,陈捷.B/S 结构的种猪信息云服务平台构建[J].广东农业科学,2013(1):198-212.
[7] 孙海艳,李军民,刘哲,等.关于我国种业信息化建设的思考[J].中国种业,2014(6):1-3.
[8] 盖钧镒,刘康,赵晋铭.中国作物种业科学技术发展的评述[J].中国农业科学,2015,48(17):3303-3315.
[9] 刘明霞,李国威.种业新政下农业科研院所育种创新问题的思考[J].农业经济,2012(8):127-128.
[10] 李洪杰.种筹天下,打造农作物育种的3.0时代[J].中国种业,2015(6):5-7.
[11] 冯青,余隋怀,杨延璞,等.基于云服务的产品决策支持系统模型研究[J].中国机械工程,2013,24(15):2053-2059.
[12] 张世煌.现代种业的重大关键技术[J].农业科技与信息,2013(2):33.
[13] 樊龙江,王卫娣,王斌.作物育种相关数据及大数据技术育种利用[J].浙江大学学报:农业与生命科学版,2016,42(1):30-39.Abstract ID:1003-188X(2017)03-0007-EA
Research on Information Model of Plant Breeding under Cloud Environment
Liu Zhongqiang1,2, Wang Kaiyi3, Zhao Xiangyu4, Li Minzan1
(1.Key Laboratory of Modern Precision Agriculture System Integration Research,Ministry of Education,China Agricultural University, Beijing 100083, China; 2.National Engineering Research Center for Information Technology in Agriculture,Beijing 100097, China;3. Key Laboratory of Agri-informatics, Ministry of Agriculture, Beijing 100097,China;4.Beijing Engineering Research Center of Agricultural Internet of Things,Beijing 100097, China)
Under the background of seed industry structure restructuring,merger and reorganization accelerating and industry concentration increasing,to carry out breeding technology innovation, strengthen the resources exchanging and joint breeding is the inevitable choice of majority of small and medium enterprises to enhance the core competitiveness.Firstly,introduced currently application status of domestic plant breeding information management software,and discussed the advantages of information technology under the cloud environment.Next,researched the meeting point between cloud service mode and plant breeding information management business based on information of small and medium breeding enterprises,and proposed plant breeding information model under cloud environments.This model fully considered personalization,integration,differentiation and other features of plant breeding information management platform under cloud services mode,supporting unified docking platform of precision seeder, production and water test and other agricultural equipment,decision making of multi-level user-oriented features,and plant breeding decision support based on data mining, the main ideas are useful to the majority of small and medium enterprises,breeding team of research institutes and colleges,professional testing organizations to carry out information construction, resource sharing,cooperative breeding and joint testing,furthermore, to promote comprehensive and balanced development of modern seed industry.
information breeding; breeding software; cloud services; data mining
2016-03-14
北京市科技计划项目(D151100004215002,D15110000421 5004)
刘忠强(1983-),男,山东莒南人,博士研究生,(E-mail)liuzq@nercita.org.cn。
李民赞(1963-),男,河北藁城人,教授,博士生导师,(E-mail)limz@cau.edu.cn。
S126;TP319
A
1003-188X(2017)03-0007-05