柑橘大数据研究与应用
2021-05-24温晗秋子郑永强
温晗秋子 郑永强 刘 杨
(1.北京大学大数据分析与应用技术国家工程实验室,北京 100871;2.西南大学柑桔研究所国家柑桔工程技术研究中心,重庆 400712;3.江西中新云农科技有限公司,赣州 341100)
1 引言
柑橘是世界第一大类水果作物和第三大贸易农产品,属芸香科下属植物,用作经济栽培的有3 个属:枳属、柑橘属和金柑属。中国和世界其他国家栽培的柑橘主要是柑橘属。柑橘属植物是柑橘类果树中最主要的一群植物,共有17个种,分成6个种群:大翼橙类、宜昌橙类、枸橼柠檬类、柚类、橙类和宽皮橘类。柑橘类水果包括柑橘、柑、柚子、枸橼、甜橙、酸橙、金橘、柠檬等种类。据国家统计局数据,2018 年我国柑橘总产量达到4138.14 万吨[1],首次超过苹果总产量成为我国第一水果作物;2019 年我国柑橘种植面积和总产量分别达到3925.95 万亩和4584.54 万吨[2],均居世界第一位。根据美国农业部网站公布的数据,2020 年由于疫情以及北半球干旱天气的影响,我国柑橘总体种植面积和产量都有所下降,分别为3800万亩及3560 万吨,但仍位居世界第一。柑橘产业在我国蓬勃发展的同时,也面临着产业基础薄弱、科技支撑不足、品牌建设缺失等问题和挑战。
近年来,大数据和人工智能等新一代信息技术蓬勃兴起,为农业产业结构优化和高质量发展提供了新的工具和机遇;传统农业的数字化转型也迫在眉睫,急需系统性的战略规划、人才培养和技术支撑。本文以柑橘产业链模型为基本框架,对柑橘产业的可利用数据要素资源、典型应用技术和代表性应用场景进行系统性梳理,深入分析数据要素和大数据技术在我国柑橘产业发展应用中所面临的挑战和机遇。
2 柑橘大数据定义与内涵
在2020 年3 月30 日发布的《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》中,首次把数据明确为一种新型生产要素,提出“加快培育数据要素市场,推进政府数据开放共享、提升社会数据资源价值、加强数据资源整合和安全保护”。[3]作为发展数字经济的核心战略资源,新型基础设施的基础生产资料,如何对数据要素进行定义、存储、应用、流通和增值等问题是当前各行业推进数字化转型和可持续发展所面临的主要挑战之一。
2015 年印发《农业部关于推进农业农村大数据发展的实施意见》以来,数据科技在农业产业的应用得到了大力的支持与推广。一般来说,农业大数据可以定义为“现代农业生产、经营、管理、销售、投资等各种活动中形成的具有高附加值的、多时空特征的海量数据,包括生物信息数据,资源环境数据,气象数据,作物生长监测数据,农业统计数据等”[4]。根据这一定义,农业大数据覆盖面非常之广,而我国地大物博,物产丰饶,在每一个细分农作物的领域,对这一概念内涵外延的解读和应用存在较大的差异,亟待建立更加明确的实践方法论。
对柑橘这一经济作物来说,当前亟需厘清的是对其产业数字化升级具有重要应用价值的大数据资源要素。因此,我们定义柑橘大数据为“柑橘产业链主要环节中的可利用数据要素资源”,从产业链[5]的角度对柑橘大数据进行梳理。产业链是产业经济学中的一个概念,其思想最早来源于西方古典经济学家亚当·斯密在《国富论》(1776)中对分工的论述,目前对其概念内涵尚未形成权威论断。本文采用郁义鸿(2006)提出的定义,产业链是指其从生产资源到成为产品并到达消费者等各个环节所构成的完整生产消费链条[6]。在这一定义框架下,如图1所示,柑橘产业链包括四个主要环节:生产资料,种植运营,加工储运,市场营销。在不影响整体分析框架的考量下,我们把存储和物流归类至加工环节以简化模型。在这一模型框架下,我们梳理产业链每一个环节的可利用数据要素资源,即现有技术可以采集且其价值可在产业升级和高质量发展中变现的数据(图2)。
2.1 柑橘生产资料数据要素
柑橘产业生产资料供给环节的可利用数据要素资源主要包括:
地理信息数据:即经纬度、海拔高度、种植面积、土壤和地形地貌等决定柑橘种植可行性和产出质量的重要变量。例如,柑橘对土壤的适应范围较广,满足pH 值4.5~8 均可生长,但是以pH 值5.5~6.5 为最适宜;另外,由于柑橘根系生长要求较高的含氧量,以土壤质地疏松,有机质含量2%~3%最适宜。地理信息数据是产地数字化的基础数据资源,一般可通过政府公共服务部门获取,其价值变现主要体现在产业布局等宏观决策方面。该类数据要素在应用中的常见问题为时间频度和空间精度较低,由于土壤等要素的空间变率较大,不能满足精细化的种植规划和管理需求。
气候数据:即产地的温度,光照和水资源等自然资源供给,是影响柑橘生长的最主要非生物因子,具体数据要素包括但不限于年平均温度、日最高温、日最低温、平均降水量和总降水量、风速风向、日照时数等。世界柑橘主要分布在北纬35°以南的区域,性喜温暖湿润,大面积水域形成邻近增温区时可向北推进到北纬45°,可见温度对柑橘的生长发育和果实质量尤为重要。气候要素是产业数字化的基础数据资源,其历史数据和预测数据都在发展产业过程中发挥着重要的作用,价值变现途径较多。例如,历史数据可用于评估方案的可行性,季节性和年际预测数据是灾害防治和应急管理的重要依据,年代际长期预测数据更关乎产业可持续发展的科学决策。气候数据要素可通过地方或国家气象局的数据开放共享平台获取,也可通过国际气象组织或气象服务机构免费下载资源,其时间分辨率可达每日或小时级,空间分辨率可达十公里以下。此类数据在应用中的常见问题是气候预测的准确度和多要素联合分析挖掘,是科学和技术层面仍需探索的难题。
图1 柑橘产业链模型Fig.1 Industry chain model for citrus
化学投入品数据:即化肥和农药的具体信息,包括但不限于成分构成、使用剂量和频次、单位价格、区域产能等要素。化学投入品的使用不仅关乎柑橘产量和品质,更是建设环境友好可持续型农业的重要关注点。此类数据要素资源主要由化学投入品生产企业掌握,其价值变现则主要体现在种植环节的节本增效和绿色种植。然而,由于市场份额分散、渠道良莠不齐等客观原因造成此类数据要素资源获取难度较大,且数据质量不易控制,因此难以应用于生产决策层面。
投资数据:即可用于柑橘种植加工的资金规模、资金来源、资金成本、投资收益以及宏观产业经济统计数据等。柑橘种植和加工是典型的投资行为,此类数据要素既包括支撑投资决策所需要的全球、国家和地区的宏观经济统计数据,也包括投资所产生的资金总量、资金成本、资金收益等金融指标。此类数据要素的价值变现主要体现在优化经营策略,稳定投资收益等方面。宏观经济统计数据可通过国内或国际公共服务平台获取,例如中国统计年鉴或美国USDA网站等;微观金融数据一般由投资者(柑橘种植户、农场或加工长)分散持有,流通共享难度较大。
2.2 柑橘种植运营数据要素
柑橘产业种植运营环节的可利用数据要素资源主要包括:
地理信息数据:种植环节使用的地理信息数据区别于生产资料环节的地理信息数据的核心在于精细化,即较高空间分辨率的地理信息数据要素才能在此环节实现价值变现。高分辨率地理信息数据是精准农业的基础数据资源之一,它包括果园边界的详细经纬度和海拔信息,高分辨率格点化土壤信息和地形地貌,以及每棵果树的精准位置。此类数据要素资源需要种植主体自主采集,采集方式包括人工测量、卫星图片反演、无人机采集、智能农机采集等,其变现价值主要体现在精准施肥、产量估计、产品溯源等环节。此类数据资源要素应用的难点在于资金投入和技术理解。
天气数据:天气指较小时空尺度上的大气运动现象,主要由大气自身波动驱动;而气候则是较大尺度上的气象特征,代表的是很长一段时间内的平均天气状况,是大气与海洋、地球、陆地和冰雪圈层等物质与能量交换的产物。因此,在种植生产环节,短时天气预报尤为重要,其价值变现主要体现在提高农业投入品或智能农机的使用效率、防治病虫害、应对自然灾害、产量和品质预测等方面。此类数据资源要素可通过公共服务平台、互联网应用等多渠道免费获取,但在应用中常面临时效性和准确性不足以满足生产需求的问题。特别是果园、农场一般地处偏远,地形复杂,气象观测数据较少,难以产出高质量的预报结果,尤其是对于极端天气灾害事件预报能力严重不足。种植主体可以通过安装物联网设备采集本地气象观测数据,结合高精度预报算法,获得定制化、更精准的天气预报服务。
种植日志数据:即对种植生产过程的记录,通常以文本、数字、图片和表格混合的形式呈现。该类数据资源要素是优化果园种植流程的重要基础资源,其变现价值主要体现在种植管理优化、化学投入品控制、智能装备效率提升、产品溯源等方面。此类数据资源要素获取以种植主体自主采集为主。一方面,虽然当前农业信息服务市场上可以找到很多免费的种植日志记录工具,但对采集的数据可操作性限制较大,不便于自主分析和利用;另一方面,自研和开发日志数据采集工具成本较高,对于种植主体的技术理解和使用能力要求较高,不易推广。
2.3 柑橘加工储运数据要素
柑橘产业加工储运环节的可利用数据要素资源主要包括:
存储数据:即柑橘仓储设施的地理位置、环境条件、规模容量等数据要素,其价值变现主要体现在节约运输成本、降低损耗、提高市场议价能力等方面。柑橘存储相关数据要素分布较为分散,所有者包括种植农场、加工企业、物流企业等多源主体,流通共享难度较大。但存储数据的价值变现高度依赖于数据共享,是数据资源要素流通促进增值的典型代表。
物流数据:物流指“物品从供应地到接收地的实体流动过程,根据实际需要,将运输、储存、装卸、搬运、包装、流通加工、配送、信息处理等基本功能实施有机结合”。因此,柑橘物流数据包括供应地信息、接收地信息、运输路线、搬运、配送等基本要素。此类数据要素主要由物流服务企业掌握,其价值变现对于物流企业来说可以体现在优化效率,降低成本,也可以体现在帮助生产者通过实时供求关系分析实现销售优化,增加收入。但对于柑橘生产者来说,此类数据要素资源获取成本较高,变现技术难度大。
加工管理数据:即柑橘深加工过程管理数据,此类数据一般由柑橘深加工的智能装备自动采集,其价值变现主要体现在保障深加工产品质量标准,减少人力,支撑定制化、小批量的产品生产。此类数据要素的采集前提是购建深加工智能装备,因此前期投入较大,而且智能装备的运维和数据要素的变现对管理团队的技术素养要求较高。
2.4 柑橘市场营销数据要素
柑橘产业的市场营销环节的可利用数据要素资源主要包括:
产量数据:柑橘的产量数据要素是供给侧的核心量化指标,主要包括产量统计和产量预测。产量统计数据要素是产业评估的重要依据,可从国家统计局等公共服务平台获取,其价值变现主要体现在产业优化等宏观政策制定层面;产量预测数据则对种植、加工和销售环节的微观经营决策都发挥至关重要的作用,获取途径主要包括经验估计和模型算法预测两种方式,其价值变现主要体现在销售策略优化,提高销售收入等方面。问题:主观经验预测准确度低,预测模型和算法还不完善,预测方法对数据和算力需求量很大。
市场数据:主要指柑橘的需求侧数据。包括大宗交易需求、批发价格以及零售价格的历史数据和实时数据等。此类数据获取途径多样,例如统计局、海关、行业协会、互联网电商平台等。此类数据变现价值主要在于帮助生产加工主体制定和优化销售策略,提高销售收入,优化种植结构等。其应用中常见的问题包括数据获取和技术分析难度较大。另外,随着自然语言处理技术的发展,互联网舆情数据的价值也被不断的挖掘。对于柑橘产业来说,产业相关主题词的舆情数据也是反应市场关注度、预测需求和价格的重要数据要素,其应用难点同样是获取和分析难度大,对非数据科学专业人员的可利用性较低。
消费者数据:随着生鲜电商的快速发展,特别是在突发疫情的背景下,水果的在线消费量呈爆发式增长,关于消费个体的信息实现了迅速的积累。柑橘消费者的地理位置、消费品类、消费频次、口味偏好等,在其常用互联网电商平台不断积淀。此类数据是互联网营销依赖的核心数据,以这些数据为基础,可以对用户进行分类和标注,结合基于深度学习等人工智能方法的推荐算法,实现精准的产品推送和广告投放,提高产销对接效率,是互联网电商平台的主要价值变现方式之一。此类数据的应用面临的最大问题是数据使用合规风险,随着我国对个人数据权属和使用相关法规的不断完善,有望得到更为广泛的应用。
3 柑橘大数据应用技术
自20 世纪80 年代美国提出精准农业的理念,信息技术在农业领域掀起了产业革新的浪潮。从微电子技术发展实现智能化农业监测,到全球定位系统和遥感技术助力精准化生产管理,再到近年来定制化农业气象和保险服务、无人机和智能农机的推广应用,数据及其相关分析应用技术在现代化农业中的核心地位逐步凸显和确立。十年前,数据就被称为是与土地、人力和资本并列的农业生产“第四要素”[7],并推动农业生产经营模式从PS 系统(physical-social-sys‐tem) 向CPS 系统(cyber-physical-social system)转型升级。与曾经的农业绿色革命相比,数字化给农业产业带来的转变是更加颠覆性的。
随着通讯技术的发展和人工智能的突破,农业数据的采集方式正在不断多样化。传统的人力采集方式正在被更高效易用的手机APP 等互联网工具替代。同时随着传感器和物联网成本的逐步降低,遥感技术和图像识别技术的不断进步,无人机和气象站等设备的逐渐普及,农业种植端数据的采集方式日渐完善和成熟,特别是在规模农业,大数据和其分析技术的价值不断得到证明。在近年来的农业产业实践中,大数据技术被期望实现三个主要目标:(1)品种选育和改良;(2)精准生产:更少的投入,更多的产出,环境代价可控从而保障可持续发展;(3)可追溯的安全食品。
在柑橘产业数字化进程中,大数据技术已应用于产品标准化、量化估产、预测害虫爆发来优化农药用量、指导销售策略、果品溯源等场景,为农民提供基于大数据的经营洞见并做出数据驱动的作物管理决策,为消费者提供安全有品质的柑橘产品。本节介绍支撑柑橘大数据应用的典型通用分析技术。
3.1 产品标准化
图2 柑橘大数据的基本要素Fig.2 Fundamental elements of citrus big data
产品标准化是现代化生产的必要条件,是保证产品质量的前提。但是对柑橘等生鲜农产品,“非标品”似乎是一个无法逾越的难题,例如,从同一家农场采购的橙子,今年和去年的口味、大小可能存在显著差异,特别是线上消费者对这种差异更加敏感,甚至转变为对商家诚信度的疑问。实际上,对柑橘的质量评估产生显著影响的除了生长期环境条件,测量方法和测量环境条件也是不可忽视的因素[8]。利用大数据技术为农产品建立一套筛选分级标准,是推进农产品标准化的重要手段。Rashidi 等(2011)提出了一种确定橘子尺寸和形状的定量分类算法[9]。研究基于120个随机购买的橘子,在扁椭球体的基本假设下,采集每个橘子的形状参数和质量,从质量和椭球体的长径比两个维度对橘子进行分类,实现对正常橘子和畸形橘子的有效区分。由于该研究样本量较小,分类粗略,结果并不具有推广价值。柑橘的标准化建模作为行业标准的重要组成部分,也是智能分选设备的核心算法之一,是发挥柑橘大数据价值的重要技术研究方向,通过相关数据的积累和三维重建技术的引入,有望实现技术突破。
3.2 图像识别
尽管柑橘产量由许多因素共同决定,例如柑橘树的数量、当年天气状况、病虫害发生情况、土壤肥力以及坐果率等,通过柑橘果花数量和坐果率来估计产量仍是业内常用方法。另外,水果识别也是水果自动采摘系统或采摘机器人的核心技术组成,因此采集果园图像并对果花和柑橘果开展识别研究是数字技术的重要应用场景。
Annamalai(2004)基于对美国弗罗里达奥兰多一个果园的98 棵柑橘树拍摄的图片开展研究,在RGB和HSI 色彩空间中给出了图片中不同类(柑橘、叶子和背景)的像素分布直方图,并基于HIS 色彩空间的像素分布确定识别柑橘类的阈值,该方法得到的结果与人工计数建立回归模型后得到的R2值约为0.79[10]。Patel(2012)提出一种可以应用于多种圆形或类圆形水果的图像识别方法[11]。该方法首先将RGB 空间的图像投影至L*a*b 空间以滤过不同光线条件对图片造成的影响,通过Sobel 算子确定目标边界并利用最小二乘法对边界进行圆形拟合以得到水果的位置和数目估计,实验中得到的平均绝对误差为31.4%。Dorj(2012)提出了一种基于颜色分类从图片中识别柑橘果花的方法,并在实验数据集中得到了平均绝对误差17%和决定系数R 平方值94%[12]。但是该方法的应用需要对图片进行人工筛选预分类,因此对大规模数据集实用性不强。Dorj (2017)在该方法的基础上,通过融合新的统计算法实现了产量评估,数值实验表明该方法的R平方值达到93%[13],具有良好的应用潜力。
随着算力的快速提升和数据的不断积累,机器学习特别是基于神经网络模型的深度学习方法掀起人工智能的热潮,尽管从数学和统计理论层面对其泛化能力和可解释性等关键问题的理解尚在研究探索阶段,但是深度学习已经在自然语言处理、计算机视觉、图像及视频识别等领域都取得了突破性进展。机器学习和深度学习方法已被广泛应用于农作物识别和产量预测工作中。大田作物常常采用基于遥感影像的深度学习方法,而对于柑橘等经济作物,遥感影像的时空精度和成本难以满足生产需求,无人机与AI算法相结合的解决方案被证明具有更好的应用前景。
近年来,无人机影像已经被用于柑橘果树的识别和数量估计,支撑精准产量估计和采摘机器人的研发[14][15][16]。YOLO[17]、R-CNN[18]等算法已被应用于柑橘树的检测工作中,研究证明其准确率和效率都得到了大幅提升,例如,在1800 多英亩的大型果园里,对175 977棵柑橘树的成功检测率可达97%以上[19]。
图像识别技术集成无人机在柑橘产业的另一个重要应用场景是病虫害识别。传统的传感技术依靠人工采样,既费时又费力,并且操作人员需要经过培训掌握专业知识,在实际中困难重重。配备RGB、多光谱和高光谱相机的无人机近年来成为快速、精确和无损现场侦察的灵活且经济高效的智能工具,特别是对于规模化种植的果园,它们可以帮助准确和及早发现病虫害,从而降低喷洒成本,人工成本和病虫害造成的水果损失。柑橘的主要疾病还包括叶病、土壤传播疾病(柑橘线虫等)、昆虫传播性疾病(黄龙病等)、移植传播性疾病(柑橘三叶病毒等)等[20]。近年来,基于无人机影像和机器学习方法的柑橘黄龙病[21]、溃疡病的检测研究工作都取得了一定的进展[22][23][24]。例如,美国弗罗里达大学的团队针对柑橘黄龙病的主要传播媒介——亚洲柑橘木虱ACP——研发了一套识别和定位装置,其软件的核心识别算法具有双层CNN 架构,在90 棵柑橘树上进行的实验结果表明查准率达80%,查准率达95%[25]。
3.3 气象预测
气象条件是影响作物生长和产量的最重要因素之一,“知天而作”是保障农业生产的重要手段。随着数值模拟技术的发展和观测方法的不断丰富,我国的天气预报水平逐年提高,但是对于经济作物的气象服务,由于其种植分散、观测覆盖不足、地势地形复杂等原因,仍面临精细化不足的挑战,特别是对于低温、飓风、冰雹等高影响灾害事件的预测技术仍亟待提升。以机器学习和深度学习为代表的人工智能技术给天气预报和极端灾害事件的预测提供了新的方法[26][27],与果园自主采集的近地气象数据有机融合,可以实现分钟级和百米级的精细化气象预报和灾害预警。
气象预测技术可以应用于柑橘产量和品质评估。柑橘果树生长发育与温度、日照、风、降水等气象条件紧密相关,对其产量和品质影响最大的是温度。在一定温度范围内,通常随温度升高,果品糖含量、可溶性固形物增加而酸含量下降,品质提升。对果园气象要素的精细化监测和预测,有助于对当年果品的品质实现预测和量化评估,是品质标准化体系建设的基础。气象要素也是柑橘病虫害预测模型的重要变量。基于温度、湿度、降雨量、土壤湿度、土壤温度、叶面积指数和叶绿素七个变量,分别利用支持向量机和多元线性回归方法建立了柑橘流胶病的预测模型,帮助农民及时的预测流胶病的发病时间和强度,从而采取措施提高产量[28]。
气象预测技术也可以应用于自然灾害的预警和应对。柑橘气象灾害主要包括冻害、高温低湿、挂果后干旱、高温日灼、连阴雨等[29]。冻害是其中较为多发,且常常造成大面积绝收,对果农种植积极性打击较大。例如美国德克萨斯州1951-1989 年间经历四次冻害打击后,柑橘种植面积减少了75%[20]。精细化的气象预报不仅可以帮助果农及时采取预防措施减少损失,而且也可以通过购买基于气象数据研发的柑橘冻害天气指数保险来应对灾害,保障收入[30]。
另外,气候是决定农业生产体系可持续性的最重要因素之一,气候变化对柑橘产业可持续发展的影响也是亟待研究的重大课题,不仅关乎全球柑橘产业的发展趋势,也是区域制定发展规划的核心科学依据。早在二十世纪九十年代,美国学者就研究了气候变化对柑橘产量的影响,通过不同二氧化碳排放情景和升温条件下的模拟,来预测柑橘产能的时空变化趋势[31]。当前气候变化的影响已经不断凸显,自然资源基础发生变化,极端灾害事件频发,监测和研究气候变化对柑橘产业的影响关乎产业的发展与存亡。
3.4 数据可视化
可视化是数据分析的必要手段,它借助图形化的方法,清晰、直观的表达和揭示数据中的规律和知识。特别是在海量数据汇聚的场景下,采取有效的方法和技术展示数据的特征、分布、交互等多种性质,是实现数据价值变现的第一步。数据可视化主要包括面向结构化数据的科学可视化、面向非结构化数据的信息可视化以及融合计算分析功能的可视分析三大方向。可视化展示形式包括单态图、统计图、分布图、关系图、地理空间图、动态仿真模拟等。提供公共服务和企业服务的大数据系统都离不开可视化技术的应用,其对数据价值的呈现和解释功能在农业产业尤为重要,因此也是柑橘大数据应用的典型技术。
3.5 数字化溯源
近年来,数字果园通过物联网、智能农机和手机终端等设备采集全流程生产过程数据,并将气象、水土、果树、种植过程等基础数据经可视化技术处理后生成集成信息存储于二维码中,是目前保障农产品安全可追溯的主要技术手段。数字化的农产品溯源技术,对增加消费者对产品生产过程的了解,提升信任和好感度发挥了至关重要的作用,已经成为当前农产品安全与品牌系统建设的有机组成部分。另外,随着区块链技术和产品的逐步完善,其在农产品数字化溯源领域和产业链管理方面也拥有着巨大的应用潜力。
4 柑橘大数据的代表性应用案例
4.1 可口可乐橙汁“黑皮书模型”
作为全球最大的饮料公司,可口可乐在全球拥有500 多个品牌和3500 多种产品,约250 家装瓶合作伙伴和900 家装瓶厂,在全球拥有70 多万名系统员工。这样一个极其复杂的跨国生产和运营系统,需要依靠强大的数据分析系统来预测供应和需求,以及严格管控产品质量来保持品牌价值。
橙汁是可口可乐的重要产品品类。可口可乐利用一种“黑皮书模型”的算法来控制橙汁的生产,以确保橙汁的口感全年一致。“黑皮书模型”融合了各种不同来源的数据集开展分析预测,包括天气日期、作物产量预估、卫星图像、地区消费者偏好、成本压力、橙子的600 种不同味道的详细数据等,为工厂生产全年口味完全一致的橙汁提供技术指导。可口可乐橙汁“黑皮书模型”的发明者鲍勃·克罗斯(Bob Cross)称之为“商业分析最复杂的应用之一。它需要成千上万个决策参数来保证无论自然界提供什么样的原料橙子,工厂都能产出始终如一的最佳风味”[32]。可口可乐在利用数据创造和获取价值方面取得了很大的成功,尽管由于商业原因,“黑皮书模型”的技术细节并未公之于众,但是这一典型柑橘大数据的应用思路值得更多的研究及推广。
4.2 重庆橘园“四情”感知大数据应用
“十二五”以来,中国农业科学院柑桔研究所柑橘栽培与智慧农业研究团队先后研发中柑所柑橘水分实时监控与旱情预警系统、山地柑桔园精准施肥决策系统、基于帝国CMS 的柑橘采收辅助决策支持平台和柑橘病虫害监控系统等专家系统,于重庆市忠县进行示范,初步实现橘园水肥药管理和果实优质化适时采收指导。针对目前橘园“四情”监测数据装备不一、汇聚困难的问题,2018 年开始与瀚云科技有限公司合作研制慧橘智能网关、橘园多要素采集器HWS2和慧橘高功率控制器HWS3(图3),实现“四情”监测装备模块化选择与汇聚。并先后构建柑橘高产和优质分时期叶片营养适宜标准CND 拐点值法自动生成算法、橘园树体营养状态DOP 诊断算法、基于图片识别的橘园果实膨大和挂果量识别算法(图4)和“以氮定肥和以果定量”的基于DOP 诊断结果推荐施肥方案矫正算法[33][34],集成建立橘园水肥耦合的四阶段决策算法(Citrus Four-stage Water-fertilizer Coupling Al‐gorithm,CFWCA)。另外,完成部署基于Faster-RCNN 病虫害检测与识别算法(Faster-RCNN Pest Detection and Identification algorithm,FPDIA)的病虫害识别服务器,实现大实蝇,小实蝇,木虱,星天牛,潜叶甲,白星花金龟,长吻蝽等15 种常见柑橘害虫识别。
目前正与重庆橘人科技有限公司利用大数据技术联合研发基于橘园“四情(气象、墒情、苗情和病虫情)”的慧橘大数据云共享与智慧决策平台,开展了橘园智慧化生产关键技术示范。其方法是基于橘园“四情”感知数据,利用慧橘云平台的CFWCA 和FPDIA算法,进行智慧橘园水肥药管理智慧决策、环境及灾害预警和装备化(水肥一体化、地面变量喷药等)实施,实现橘园省力化高效优质绿色生产。
重庆忠县国家农业科技园区、四川遂宁国家农业科技园区和四川省广安龙安柚现代产业园区参与了示范。其中,2019 年1 月至2020 年12 月在四川遂宁国家农业科技园区测试应用,结果表明,与相同条件下传统栽培对照相比,基于“四情”传感器监测与栽培优化决策方案可使果实挂果量提高55%,单果重提高28%(图5),固酸比提高17%,示范基地施肥量减少20%以上,灌溉用水同比降低30%。
4.3 赣南脐橙大数据应用
江西赣州,有着“世界橙乡”的美誉,脐橙种植面积、年产量稳居全国前列。2017 年,赣州市脐橙种植面积达155 万亩,占世界的17.2%,全国的44.7%;产量108 万吨,占世界的11.3%、全国的39.6%。柑橘大数据在赣南的应用正在如火如荼的开展中。
信丰县是赣南脐橙发源地,为了加快推进脐橙产业发展,2019 年以国家现代农业产业园为依托,抓住5G 正式商用的有利时机,着力建设了现代农业大数据平台,政府免费为果园架设一套互联网智慧果园视频采集系统(图6),实时采集果园空气湿度、光照强度、风速、土壤湿度等数据要素,以及果园从开花到结果的所有影像,用于建立果品安全溯源体系。消费者还能利用信丰脐橙app,基于影像数据实现身临其境的选购果园的脐橙。
赣县基于国家农业农村部数字农业项目重点打造了春秋农庄数字化脐橙产业园,部署了100多套物联网设施,包括小型气象站、高清摄像头、虫情测报灯、脐橙根茎叶果生理传感器、水肥一体化等软硬件设施,实现果园节约用水用肥20%以上,商品果率提升9.8%。在脐橙数字化分拣厂,对脐橙“大小、果径、糖度”等建立初步的数字化指标,并进行相应的分级。其中,一级果的标准为果径80~90mm、果糖度大于12.5度,零售价16.8元/斤,实现了初级农产品到商品的高溢价。
图3 慧橘智能网关(A)、多要素采集器(B)和高功率控制器(C)Fig.3 Intelligent gateway(A),multi−element collector(B)and high−power controller(C)for smart citrus agriculture
图4 柑橘果实膨大(A)和挂果量识别结果示意图(B)Fig.4 Identification diagram of citrus fruit enlargement(A)and fruit quantity(B)
图5 四川遂宁国家农业科技园区不知火传统栽培(AB)和智慧决策栽培(C-D)挂果量和果实大小情况Fig.5 The fruit bearing number and fruit size of traditional cultivation(A−B)and smart agriculture cultivation(C−D)of‘Shiranuhi’orchard in Suining National Agricultural Science and Technology Park,Sichuan Province
5 我国柑橘大数据应用发展前景
以人工智能,传感器和大数据的应用为代表的农业4.0 革新浪潮正在席卷全球,旨在实现更精细化的管理、更有效的决策,并推动产业链各环节提升效率。近年来,柑橘产业在我国蓬勃发展,已成为第二大支柱水果产业,但是产业现状仍然呈现大而不强的典型特征[35]。在柑橘研究方面,建国以来,我国柑橘研究经历了起步阶段(1949~1978)、稳步发展阶段(1987~2007),并于2007 年后进入快速发展阶段,在人才体系培养、基础研究和成果转化应用上都取得了长足进步。研究方向主要集中在种质资源与遗传改良、生理基础与栽培模式创新、病虫害防治、果园机械化和产业经济研究等方面[36]。大数据和人工智能等新技术的应用研究尚处在萌芽阶段。
当前我国柑橘产业经营管理方式普遍比较粗放,以小农户种植为主,集约化程度低;在产业布局上,局部地区盲目扩种,柑橘品质参差不齐;在生产管理上,仍存在化学投入品超标的问题,欠缺生态环境保护和可持续生产的意识;在防灾减灾上,黄龙病等主要灾害的防控形势亦然严峻,生产经营一线缺乏足够的抵御病虫害和气象灾害的科技支撑和保障制度;在市场营销上,缺乏商品意识和品牌意识,质量安全追溯体系不普及,销售手段单一。因此,产业发展壮大面临的主要挑战是如何提高种植技术水平和灾害防控能力、提升果品标准化程度和加强柑橘品牌建设等,这也是我国柑橘产业实现数字化转型需要攻克的重点与难点。以湖北荆门、广东云浮为代表的柑橘重要产区都已积极研究和探索产业的转型之道[37][38]。
柑橘大数据应用是解决当前产业此类问题的核心技术和重要抓手,能够在推动柑橘产业均衡发展、指导新品种培育、实现精准种植和品质认证、撮合交易以及保险保障等方面发挥重要作用。而且对于实现优质高产品种的自主研发这一产业核心竞争力上,随着组学大数据的释放,大数据技术有望与基因技术深度融合,为柑橘种质基础研究和产业发展带来革命性的变化。
图6 信丰县赣南脐橙智慧果园视频采集系统Fig.6 Video Collection System of Gannan Navel Orange in the smart crchard at Xinfeng County
柑橘大数据的应用当前也面临很多问题和挑战。例如:小种植户如何能够以可接受的成本参与到柑橘大数据的应用中来,共同分享数据时代的科技红利,目前还未形成可推广的方式方法;我国柑橘大数据各类要素资源分散在不同的政府机构、果园、企事业单位等中,如何打通这些“数据孤岛”,建立数据要素流动、加工和增值的良性循环仍亟待多方共同探索协商;数据要素基础的薄弱,也造成对核心算法和模型的研究严重不足,而这些是大数据价值变现的根本,更是制约品种选育、产业自动化和智能化装备自主研发的“卡脖子”问题,需要政产学研积极合作,实现创新突破。
“乡村振兴”是我国“十四五”农业农村工作的重点,数字农业农村也是国家大力发展的战略方向。我国大数据应用技术已经迎来发展的历史机遇,但是柑橘大数据应用尚处于起步阶段,面临着科技普惠、数据共享、算法模型研发等诸多挑战,亟待丰富数据采集形式,拓宽数据流通渠道,创新数据价值变现,发挥大数据及其分析应用技术在产业数字化转型和可持续发展中的科技引领作用。