基于大数据的种子生产体系建设与管理
2022-11-17何歆媛宋罗娜侯军岐
何歆媛 宋罗娜 侯军岐
(北京信息科技大学经济管理学院,北京 100192)
2015 年国务院印发《促进大数据发展行动纲要》,提出建设现代农业大数据工程。2021 年7 月9 日,中央全面深化改革委员会在审议通过《种业振兴行动方案》时指出,要推进重大育种项目协同应用一体化,在生产实践中迭代升级。在数据时代,大数据是推动经济发展的新型能源,已有文献资料对于农业及农业生产的信息化作出了丰富研究,提出并实践了智慧农业、精准农业、设施农业等新型生产方式。种子生产是将优良品种迅速扩大繁殖的过程,大数据等信息技术的综合利用,可以通过利用生产过程产生的数据规划生产、规范操作,从而高效高质地进行种子生产繁育工作。
大数据的概念最早由阿尔文·托夫勒在《第三次浪潮》中提出,目前学界没有明确的表述,但形成了大数据5V 基本特征[1],即规模化(Volume)、多样性(Variety)、高速率(Velocity)、真实性(Veracity)、有价值(Value)。并且,大数据是一种综合技术体系,包含对数据的获取、清洗、存储和挖掘应用。然而,种子生产作为良种繁育推广体系的重要组成部分,目前学界将种子生产与信息技术结合的研究不足,缺乏大数据理论和技术在种业方面的应用和实践[2]。
1 我国种子生产体系现状
自《种子法》颁布以来,我国种子生产体系的发展处于市场化阶段,形成了以现代种业企业为主体,以基础性研发与商业化育种相结合的创新育种机制为支撑,以政府扶持、监管为保障,以市场配置资源为主导的新型种子生产体系。当前,我国种子生产方式有企业繁育部门生产和委托基地公司生产两种生产方式。但是,总体来说,我国种子生产体系还存在以下几个方面的问题。
1.1 生产品种多、乱、杂,难以综合化随着我国品种审定制度的改革,品种多、乱、杂问题日益突出。选育的品种多、突破性品种少,大部分为低水平重复;审定的品种多、大面积种植的品种少;高产品种多,但综合性状好、品质高、抗逆性和适应性强的品种少;适合人工劳作的品种多、适合机械化栽培的品种少。由于市场终端数据的缺失,种子企业一味追求生产单一性状优势品种,而忽略了不同地区、不同生产条件消费者的栽培环境差异,不能很好地适应我国病虫多发、异常天气频发的现实情况,从而不利于产销结合。
1.2 育种科技含量不高,难以规模化国外的大型种业集团科研开发投入一般占其销售收入的 10%左右,有的甚至高达15%~20%。这些发达国家种子公司将现代技术与传统育种手段相结合,加快品种选育的速度并迅速实现产业化。而我国实行知识产权保护制度较晚,对于品种侵权行为监管不足,致使种子企业不愿在生产繁育环节进行投资。新品种选育和生产方式科技含量不高,现有品种产业化方面缺乏市场竞争力,最终制约种企的技术积累和规模化生产。
1.3 生产方式不统一,难以标准化种子质量是种子生产技术环节的重要组成部分,但由于我国种子企业的规模和经营能力存在较大不同,各类种子的生产过程中生产方式并不统一。生产基地由公司进行技术指导和全程管理,制种农户进行分散式种植,也有公司委托有制种技术及管理能力的大户生产。生产方式不统一也造成种企难以在各环节建立统一的质量检测指标与监管标准,从而难以有效保障种子生产的质量[3]。
2 基于大数据的种子生产体系的参与主体
政府部门、种业企业、科研院所、互联网科技公司联合建设与管理种子生产体系的大数据,能充分实现优势互补、利益共享、风险共担,为种子生产注入活力。并且大数据技术的优势能够有效整合分散于各参与主体的信息并互通有无,帮助各方作出科学的决策。
2.1 政府部门服务、监督政府部门以种子部门为主导,还包括气象、环保、国土、植保等涉农口的相关职能部门。其中种子管理部门负责种源管理和新品种试验、示范、推广的实施,并且能够更好地组织协调制种户的统一行动。政府部门掌握数据并参与管理,能够兼顾各方面利益从而使整个良种繁育有序地进行。未来,政府部门也将为成立国家级种业大数据共享联盟提供支持。
2.2 种业企业负责、实施种业企业中,大数据生产体系建设与管理主体离不开生产环节与其上下游部门,研发环节培育的新品种检验合格后进入生产环节需要标记信息,生产加工完成后,需要将数据传递给销售与流通环节,以实现种子售后质量追溯与销售情况的实时数据监控。对种子生产的连续性流水作业进行大数据建设与管理,有助于集约化、规模化进行种子生产[4],使科研育种成果及时转化为生产力,迅速占领市场,增强种子企业的竞争力,将大型企业加速打造成为龙头企业。
2.3 科研机构指导、支持建设涉农领域大数据离不开科研机构的支持,科研能为产业化奠定坚实的基础,产业化也促进了科研的可持续发展。科研院所与互联网科技公司主要为种子生产的大数据建设提供两大类技术支持:一是提供农业相关技术理论支持,通过良种筛选与培育、农业经济与管理等方面的专家确定种子生产过程中哪些数据具有价值并值得获取;二是提供大数据应用技术功能支持,通过移动互联网、物联网、云计算、传感器等方面的专家确定种子生产过程中如何获取数据、应用数据等。
3 基于大数据的种子生产体系建设与管理重点
3.1 搭建种子生产数据采集融合网络数据的获取和采集是数据处理和统计分析的前提,由于种子生产体系是一个典型复杂系统,种子生产过程中产生的数据具有种类多样、数据量大、非结构化等特征,且数据之间缺乏统一的标准和规范,导致这些数据的获取和融合十分困难。围绕种子生产各环节,以确保生产数据完整性为前提,依托数据库技术、传感器网络、物联网、网络爬虫等技术,建立种子生产数据采集系统。基于云计算架构和虚拟化数据融合等技术,对采集到的种子生产数据进行分类整合,制定统一的数据交换使用规范协议,建立种子生产数据融合系统。进一步将种子生产数据采集系统与种子生产数据融合系统结合构建数据采集融合网络,通过种子生产数据资源虚拟化建设,实现数据的逻辑抽象和一致表示,极大地提高种子生产数据使用效率,是支撑大数据平台建设的基石。
3.2 构建种子生产大数据信息处理平台种子生产大数据信息处理平台包括数据存储平台和数据处理平台,实现种子生产数据的高效存储管理和批量处理。存储平台以云计算架构和开放式中间件应用体系为依托,基于HIVE 数据仓库、Harbor 等技术构建分布式云存储平台,发挥云平台的动态可扩展、虚拟化、节约硬件资源等优势,实现对种子生产数据的资源统一接入,实现对图片、音视频、文档等不同格式数据的分类和集中统一管理。数据处理平台根据种子生产数据的不同模式,实现数据的批量处理、实时处理和关系数据处理等。在技术路线选择上可以基于MapReduce 模型和Spark 批量处理技术,快速生成种子生产环境监测报告、种子质量监测报告等。
3.3 优化种子生产数据分析评价体系优化基于数据挖掘和数据分析等技术的种子生产数据分析评价体系,主要对种子消费需求、种子生产管理等进行分析[5],对于检测种子生产体系中的短板弱项、提高种子生产效率、合理调配生产资源等有重要作用。通过对现有的数据挖掘方法和机器学习算法的改进优化,并将其应用到种子生产数据分析中,开发图嵌入、特异群组挖掘等高效数据挖掘技术,挖掘种子生产结构化数据中的隐性知识,构建数据分析评价指标体系,并且研发种子生产大数据可视化关键技术,支持各种结构化信息的表现方式,实现生产经营管理者对种子生产态势的全局把握。
大数据技术与种子生产体系相结合,可以同时实现“技术先进、经济合理”的目标,降低成本从而实现良性循环。未来的种子生产体系还要利用大数据技术加速新品种产业化、保持高产稳产性能,并纳入对种子经营者、用种者合法权益的保护,进一步扩展大数据、物联网、云计算等新型技术的应用领域,实现种业加速发展,保障国家粮食安全。