大闸蟹养殖大数据分析模型和应用进展
2021-05-24段青玲刘怡然周新辉李道亮
段青玲 刘怡然 周新辉 任 妮 李道亮*
(1.中国农业大学国家数字渔业创新中心,北京 100083;2.中国农业大学信息与电气工程学院,北京 100083;3.北京市农业物联网工程技术研究中心,北京 100083;4.江苏省农业科学院农业信息研究所,南京 210014)
1 引言
大闸蟹,学名中华绒螯蟹,也称河蟹,是我国的特有名优品种,年产量超过80万吨,养殖面积达1000万亩以上。2016 年农业部印发《农业农村大数据试点方案》,将大闸蟹列为八个单品种大数据试点之一,提出开展大闸蟹全产业链大数据建设,结合物联网与电子商务,实现大数据共享,推广大数据应用,提供大数据服务。
大闸蟹养殖以相对开放的池塘养殖为主,随着信息技术在大闸蟹养殖过程中的深度应用,产生了海量的、动态的、具有潜在价值的数据,想要挖掘这些数据的价值,有赖于科学的分析方法和工具。模型是一种用于因果解释、预测趋势和检验理论的工具,其实用性和有效性决定了人们能否从数据中获取辅助决策信息[1-2]。因此,构建满足实际需求且高效的数据分析模型成为提升大闸蟹养殖产业效率的重要技术手段。然而,当前大闸蟹单品种大数据分析模型的研究还处于起步阶段,存在针对性差、实用性低和应用范围有限的问题。
本文系统综述了大闸蟹单品种大数据的数据分析模型和应用进展,重点梳理了大闸蟹养殖中水质预测与预警、水质调控、投喂决策、病害防治、行为分析与品质检测等方面的数据分析模型应用情况,总结了当前大闸蟹大数据平台的建设进展,并提出了大闸蟹养殖大数据分析模型和应用所面临的挑战和发展方向。以期推进大数据技术与大闸蟹全产业链的深度融合,使大闸蟹单品种大数据更好地服务于大闸蟹的养殖、经营主体和管理决策部门。
2 大闸蟹养殖大数据来源
大闸蟹养殖周期中积累了丰富的数据资源,如图1 所示,包括前期生产中积累的历史数据和大闸蟹养殖知识,育苗、投苗、投喂等生产环节和生产环境产生的数据,不同规格、不同品质、不同地域的市场价格数据。大闸蟹养殖大数据资源来源丰富、结构复杂,主要来源是互联网、物联网、产业管理系统和专业数据库,以及人工记录、纸质文献等传统数据源。
前期积累的大量数据可以用于养殖知识的挖掘,为新的养殖周期提供经验和依据,如养殖水质与养殖成果的关联分析模型[3];根据传感器采集的水质、气象等数据,可以建立实时的水质预测预警模型、水质调控和病害预测模型等[4];通过采集大闸蟹的图像,可以建立成品大闸蟹的新鲜度检测模型和品质检测模型,达到品质溯源的目的[5]。
3 大闸蟹大数据分析模型
图1 大闸蟹生产周期中产生数据的环节Fig.1 Data generation in Chinese mitten crab produc⁃tion cycle
大数据分析模型是借助统计模型、机器学习、深度学习和数据可视化等方式,对数据进行表示、搜索、挖掘和推理等计算[6-7]。与传统的数据分析不同,大数据分析并不是从命题、规则和定理出发,而是从数据中直接学习某种概念模式构建模型,然后使用模型对未知数据进行分析[8]。大闸蟹养殖大数据分析模型从过去的报表等简单的描述性分析为主,向关联性、预测性分析演进,最终向决策性分析技术阶段发展,如图2所示为大闸蟹大数据分析模型发展趋势。
图2 大闸蟹大数据分析模型发展趋势Fig.2 Trend of big data analysis model of Chinese mit⁃ten crab
3.1 水质预测与预警
温度、溶解氧、水位等水质因素直接影响了大闸蟹的生长速度、蜕壳次数和肉质口感,与其养殖经济效益息息相关。因此,对养殖水质预测预警的研究一直是大闸蟹养殖大数据研究的重点和热点,其中,溶解氧预测模型是最受研究者关注的研究,也有对水温、氨氮和酸碱度等水质参数进行预测的研究[9-11]。
表1 总结了近年来研究者对溶解氧预测分析模型的研究。根据考虑的影响因素个数可以将溶解氧预测分析模型分为两类:一是将溶解氧看作是一维时间序列,并将其自身历史数据作为输入参数进行预测的单因素模型;二是研究温度、酸碱度、光照强度等多种影响因素对溶解氧的影响,并将其作为溶解氧预测模型的输入参数的多因素模型。两者相较,多因素模型精度更高,是当前溶解氧预测的主要发展趋势。根据模型建立方法,可以将溶解氧预测分析模型分为模型驱动(机理)模型和数据驱动模型。模型驱动的模型根据池塘养殖中影响溶解氧的输入、输出和分布的物理、化学和生物因素间的关系进行模拟建模,是大数据时代来临之前的主要建模方法;而数据驱动的模型根据所采集的数据分布特征训练预测模型,而不是通过分析物理化学过程得出的[12-14]。两者相较,数据驱动的模型易于控制,精度也更高,是当前溶解氧预测模型的主流。按照监测点的个数和分布也可以将溶解氧预测模型分为两类:一是只基于一个固定观测点采集溶解氧,进行一维时序预测建模;二是考虑养殖水体溶解氧在水体中的不同层次和不同位置(三维空间)的含量不同,进行三维预测建模。水体溶解氧浓度易受多种生态环境因子的影响,呈现出三维立体分布特点,具体表现为池塘同一水平面上,不同位置的溶解氧浓度有所不同;在同一垂直面上,不同水层的溶解氧的浓度也不同。三维时空预测在大闸蟹养殖中更有指导意义,三维建模技术成为大闸蟹养殖溶解氧预测分析模型的趋势。
大闸蟹养殖水质预警通常是在水质预测的基础上进行的,分为单因子预警和多因子预警。单因子预警模型是根据各水质参数适宜大闸蟹生长范围建立的,当某参数的预测值超过阈值时,就发出警报;当某水质参数在短时间内产生较大变化时,也发出预警。多因子预警模型的研究仍处于探索阶段[26]。刘双印[27]等采用粗糙集方法将14 个初始预警指标约简到5 个核心预警指标,再构建SVM 模型分类进行预警。Liu 等[3]将河蟹池塘养殖水环境数据与生产效益数据关联,建立了基于Adaboost 的多模型融合水质评价模型。
表1 溶解氧预测分析模型分类及代表文献Table 1 Classification of prediction models of dissolved oxygen and representative references
3.2 水质调控
大闸蟹养殖对养殖水质的要求极高,如果池塘水质不达标,可能会胁迫其生长,甚至会造成大范围死亡。因此,建立智能化的养殖水质监测和控制系统,是确保大闸蟹健康养殖的重要举措。然而,我国大部分大闸蟹的养殖仍然采用较开放的池塘养殖方式,在水质调控过程过度依赖人工经验,造成人工成本高、资源浪费、管理不科学、养殖风险高等问题,已不能满足当前大闸蟹养殖对水质高标准的需求[28]。
目前,溶解氧的调控方式主要是基于阈值的开关定时控制,这种方法虽然可以在一定程度上节省电能,避免由溶解氧过低导致的养殖风险,但是无法满足溶解氧控制高精度的要求。于是模糊控制[29-30]、PID 控制[31]和模糊-PID 控制[32]等几种基于智能控制算法的控制器被应用在溶解氧调控中。这些控制方法首先需要搭建溶解氧控制系统硬件平台,然后确保系统各个硬件之间能够保持良好的通信,最后智能控制算法根据溶解氧实际值与理想设定值的偏差对增氧机进行反馈控制,调节增氧机工作功率大小,让溶解氧始终保持在理想设定值范围内。单一的控制器在响应速度与控制精度上还存在一些不足。针对这种问题,掌晓峰等[33]提出了一种基于模糊RBF 神经网络整定的自适应PID控制器,该控制器利用RBF神经网络对PID 的三个控制参数进行在线调整,以满足复杂多变的水产养殖溶解氧的控制需求,具有自适应能力强、响应速度快和控制精度高等优点。基于智能控制算法的反馈控制能够满足溶解氧控制高精度的需求,但是存在对养殖硬件设施要求高,增加养殖成本问题。
3.3 投喂策略
大闸蟹在食性方面有鲜明的阶段性特点,不同发育阶段因其消化器官的完善程度不同,食性和食量均有变化,且光照强度不同,食性和食量也会产生变化[34]。因此,如何进行精准投喂,是提高大闸蟹养殖效益的关键环节。
涵盖投喂频率、投喂量、作业方式的投喂策略是大闸蟹养殖过程中重要的生产管理要素,大闸蟹的养成规格、肉质风味等都与投喂密切相关[35-36]。研究者从大闸蟹的营养需求[37-39]和不同投喂模式对大闸蟹养殖性能的影响[40]两个方面进行研究,为设计饲料配方提供了知识库基础,一些学者在确定的饲料配方知识库的基础上对投喂作业方式进行了研究[41-42]。目前主要的投喂策略模型有基于线性规划的模型、基于规则的推理和基于案例的推理三种方法[43]。王志勇等[44]开发了基于.NET 的自动投喂决策系统,该系统结合养殖品种的生长数字模型和传感器测量的环境数据确定投喂时间和投喂量,形成自动投喂策略。徐丽英等[45]开发了基于PDA(Personal Digital Assis‐tant)的集约化水产饲料投喂决策系统,构建了水产养殖饲料配方模型和饲料投喂决策模型,实现了饲料配方设计、次投喂量、投喂时间、投喂次数的决策。其中,饲料配方算法将线性规划和遗传算法相结合,找出每一种饲料的日投喂量和饲料的最低成本。
3.4 病害防治
病害问题一直是大闸蟹产业的持续健康发展瓶颈。近年来,随着养殖规模的不断增大,单品种、集约化、高密度养殖模式的推广,导致大闸蟹颤抖病、“水瘪子”病、烂鳃、肠炎、纤毛虫等病害频发,严重制约了大闸蟹养殖业的健康发展[46]。大闸蟹病害有发病迅速,病因复杂和危害广泛的特点,如果没能及时找出病因并采取措施,养殖户将会面临灾难性的损失。然而相关领域的专家数量有限,多数情况难以亲临指导,通过大数据平台进行在线大闸蟹养殖病害防治成为促进大闸蟹养殖业健康发展的重要措施。
研究者从“防”与“治”两方面入手,分别开发了大闸蟹病害预测预警系统和大闸蟹养殖(病害诊断)专家系统。大闸蟹病害预测是对常见大闸蟹疾病的发病率进行监测和预测。陆军等[47]开发了大闸蟹生态养殖病害预警系统,通过对大闸蟹病害的流行和发生进行监测,为大闸蟹养殖户提供流行病预警、灾害性气候预报、大闸蟹养殖状况分析等信息服务。盖之华等[48]设计并实现了基于无线传感器网络的大闸蟹病原体监测系统,当病原体数超过阈值,则进行预警。Zhang[49]等采用正向推理和反向推理两种方法共同得到一个疑似疾病集合,并根据水质预测预测结果对疾病风险进行预警。在大闸蟹病害诊治方面,Yu‐an[50]等开发了基于分层规则的河蟹专家系统。阎笑彤[51]等采用TFIDF 加权算法和动态规划方法,结合余弦相似度模型,设计并实现了基于WEB 的水产养殖病害诊断专家系统,快速地对用户输入的病害症状进行正确诊断。当前已有基于计算机视觉的鱼病诊断方法[52-53],却未见在蟹病诊断方面的应用。
3.5 行为分析与品质检测
大闸蟹的行为分为个体行为和群体行为,个体行为主要包括摄食行为,蜕壳行为和活动行为等,群体行为主要包括格斗、集结和逃逸行为等。对大闸蟹行为的分析可以获知其生长状态、对环境适应性和病害感染等信息,从而提早采取预防措施,降低病害风险。当前研究主要有两种方法:一是观察不同水环境条件下大闸蟹的生理反应,并对水环境进行监控,当环境符合条件时,则可根据环境推测大闸蟹的特定行为[54-56];二是基于计算机视觉的大闸蟹行为分析技术,通过图像处理直接监测大闸蟹行为,这种方法不仅可以代替人工对大闸蟹池塘进行持续性监测,更可以捕捉到人眼容易忽略的活动信息。基于计算机视觉的大闸蟹行为分析技术主要涉及图像分割、目标检测和目标跟踪等技术。王斌等[57]结合Haar-like 特征和Adaboost 算法检测三疣梭子蟹的蜕壳行为,成功实现了无沙背景下蜕壳自动检测,准确率达97.9%。Jiang[58]等基于生物约束探针和重采样的粒子滤波算法,提出了一种研究螃蟹的行为方式与其生活环境之间的关系的路径追踪方法。
大闸蟹市场上因雌雄、重量、产地和上市时间等方面的不同,价格有较大差异,销售中需要进行品质鉴别。目前,人工筛选仍然是主要筛选方式,工作量大且效率低下。计算机视觉作为一种非破坏性方法,因其效率、客观性、一致性和可靠性,可以很好地解决大闸蟹品质鉴别问题[59]。朱艳[60]等使用Labview 软件平台对螃蟹进行雌雄识别,采用称重传感器对螃蟹进行重量标定。Han 等[61]使用聚类算法改进线性判别分析和二次判别分析法对班氏蟹、盲蛛蟹及两者杂交的螃蟹图像进行分类,为大闸蟹品种检测提供了参考。
4 大闸蟹养殖大数据应用与平台
大闸蟹养殖大数据在大闸蟹生产、经营、管理、服务等各个环节已有一些应用,将多种应用集成起来,贯通产业链数据,建成大闸蟹养殖大数据平台,能够进一步汇集数据资源,扩大应用范围,促进产业发展[50,62]。
目前已有的大闸蟹大数据平台主要有大闸蟹电子商务平台和大闸蟹生产管理平台。中国蟹库网经营成品蟹、蟹苗、蟹药等,提供了竞拍、众筹、团购以及期货交易等模式;一些大闸蟹品牌进驻了淘宝、京东等电子商务平台。政府的渔业产业管理平台采集全国定点县渔业生产基本数据、投入产出数据和存塘数据,并对采集来的数据进行对比分析、图表分析和汇总分析。大闸蟹企业生产管理平台集成了水质实时监控、设备管理、池塘管理、日常操作管理、库存管理、销售管理和专家咨询服务等应用[63]。刘雨青等[64]设计了一个基于物联网的螃蟹养殖基地监控系统,实现了对螃蟹养殖基地的本地和远程全方位智能监控。
当前,大闸蟹养殖大数据平台建设仍处于探索阶段,各个应用系统职能单一,互相封闭,缺乏行业全要素解决方案。
5 挑战与展望
尽管开展大闸蟹单品种大数据建设是促进大闸蟹产业链升级、推进农业供给侧改革的良好机遇,但是当前对大闸蟹单品种大数据分析建模的研究还处于起步阶段,在如何利用大闸蟹单品种大数据来解决实际问题方面仍然面临许多问题和挑战,主要包含以下几个方面:
(1)针对大闸蟹单品种的大数据分析模型的数量仍然较少。大多数研究对象为池塘养殖水产品,缺乏针对大闸蟹单品种特征的研究,如考虑大闸蟹蜕壳、食性方面特征。
(2)大闸蟹单品种的大数据分析模型的应用范围仍然较窄。当前研究集中在水质预测预警、水质调控方面,而对大闸蟹的投喂策略、病害诊断和品质检测等方面的研究数量较少。
(3)大闸蟹产业链大数据关联分析模型缺乏。大闸蟹养殖大数据平台建设尚未完善,平台数据存在质量低、整合不易、标准混乱问题,当前大多数分析仍然是对特定数据或者小样本的分析,难以做到关联性分析。
综合当前研究现状和面临的问题,提出一些大闸蟹单品种大数据分析可能的发展方向:
(1)随着计算资源的增加和深度学习技术的发展,大大丰富了对数据价值挖掘和利用的工具和手段,针对大闸蟹单品种大数据的分析模型数量会增加,其可靠性、实用性和应用范围也会逐步提升。如基于计算机视觉的大闸蟹的病害诊断和品质检测等研究,感知力强且贴合实际需求,是比较有潜力的研究方向。
(2)随着数据量的积累和针对大闸蟹单品大数据研究数量的增加,建设可靠的大闸蟹大数据平台是未来开展大数据技术在大闸蟹养殖产业应用的研究重点。区块链技术保障数据在不同组织间流通的安全性,数据可视化技术应对复杂数据分析结果的呈现,是大数据平台建设的重要技术工具。大闸蟹是季节性鲜活农产品,又在各产地有品牌效应,大闸蟹大数据平台建设在加固供应链管理,平衡供需关系方面具有较大潜力。
(3)随着大闸蟹单品种大数据平台的建设和完善,全产业链的数据资源逐步贯通,关联分析是大闸蟹单品大数据分析模型的重要发展趋势。当前图分析技术是大数据分析技术的新方向,借助图数据库、图计算引擎和知识图谱等技术,挖掘大闸蟹产业链上数据的未知关联是重要的研究方向。
6 结论
本文针对大闸蟹单品种的大数据,从大数据分析模型和应用角度,总结了大闸蟹养殖大数据的来源、分析模型和应用平台的研究进展,重点梳理了在大闸蟹养殖的水质预测预警、水质调控、投喂策略、病害防治、行为分析与品质检测等主要方向的研究和典型应用。综述结果表明,大闸蟹单品种大数据建设有一定的研究基础,在数据、技术和政策方面都有核心优势,但也面临诸多挑战。进一步深化大数据技术在大闸蟹全产业链的应用,能够促进大闸蟹产业向智能化发展,为大数据技术在其他农产品产业链的应用提供借鉴。