APP下载

农业信息处理技术研究与应用进展

2021-09-08欧非凡张超群

中国农学通报 2021年20期
关键词:信息处理数据处理数据挖掘

欧非凡,张超群

(1中国农业大学信息与电气工程学院,北京 100083;2广西民族大学人工智能学院,南宁 530006)

0 引言

农业信息处理技术是农业物联网的一项关键技术,指的是利用模式识别、复杂计算、智能处理等技术,对农业经营管理、生产、服务和战略决策过程中的有关信息进行搜集、存储、传递、处理及分析的技术总称,包括农业数据挖掘技术、农业数据处理技术、农业预测预警技术、农业人工智能技术等技术[1-3]。农业信息处理技术在农业物联网中的地位相当重要,它能够为农业的研究者和从业人员提供技术指导、资料查询、辅助决策及智能调控等各种服务,不仅是实现农业信息有效传递、分析转换、智能应用的重要手段,更是实现农业生产智能化的关键[4]。近20 年来,农业信息处理技术在国内已经得到了初步研究与应用。表1是基于中国知网(CNKI)中文文献检索数据,对近5 年农业信息处理技术专题的中文文献分类统计结果。

表1 近5年农业信息处理技术专题中文文献统计表 篇

检索结果显示,2016—2020年共发表农业信息处理技术论文826篇,其中农业人工智能技术文献最多,达到587 篇。从研究主题来看,农业数据挖掘技术研究主要涉及农业数据挖掘系统的设计,以及数据挖掘技术在农业信息化、农业机械质量控制、数字化农业生产、智慧农业生产、农业信息资源等领域的应用等[5-14];农业数据处理技术研究主要涉及农业物联网时序数据处理平台、智能农业图像处理系统、设施农业区多路数据采集处理软件、农业统计数据采集与处理系统、农业物联网大数据处理系统等的构建,以及农业经济调查数据的缺失值处理、农业WSN数据压缩处理、农业大棚数据融合处理、种植领域数据处理算法等[15-25];农业预测预警技术研究主要涉及农业气象、农田土壤、渔业水位水质、农作物病虫害、农产品产量、农产品价格等预测预警模型构建及预测预警方法等[26-41];农业人工智能技术研究主要涉及农产品价格主题搜索、农业信息搜索系统设计、垂直搜索引擎研究等农业信息搜索,玉米苗期杂草识别、果实簇识别、农业机械图像识别、猪体尺测量及行为识别、野生食用菌特征提取识别、农田苗带识别、叶菜质量识别系统研究等模式识别,农田保护知识图谱、植物领域知识图谱等知识表示,无人农场、耘农大脑管理系统的研究与应用,以及农业喷雾机器人、果蔬自动收获机器人、采摘机器人等农业智能设备的导航路径规划[42-68]。下面基于中国知网(CNKI)中文文献检索数据,对近年中国农业信息处理技术研究与应用的进展进行简要分析。

1 农业数据挖掘技术

农业大数据是由智能农业传感器收集到的农业信息,如土壤质量、作物生长进程、天气状况、动物健康状况等,主要用于跟踪农业的业务状况、员工表现、设备效率等,为生产操作和经营决策提供依据。农业大数据技术包括农业数据挖掘技术和处理技术,其中农业数据挖掘技术是指农业生产环境信息、农田变量数据、农业遥感信息、农产品市场经济信息、农业网络信息的采集,以及生物信息智能感知等方面的技术[69]。

近年来,随着各种传感器等新型物联网设备的普及使用,农业大数据呈现出快速爆发的趋势,海量农业数据日益表现出实时性强、模态多变、结构复杂等特征,以至于原有的农业数据统计方式越来越不能适应农业智能信息处理的特殊需要,亟须抽象数据对其描述,于是大数据挖掘技术成了必然且有效的选择[70]。农业大数据挖掘技术就是挖掘农业资源环境、生产、加工和营销等整个产业链的价值信息并对其进行抽象描述的高效工具。它借助于统计学的方法,量化农业的对象、行为和关系,挖掘农业数据之中蕴藏的价值。近年来,农业数据挖掘技术研究与应用得到了很多学者的关注。有的学者探讨了农业数据挖掘系统的构建与实现问题,如刘天垒[71]梳理了数据挖掘技术的常用算法,有选择地选取了常用算法予以计算机程序实现,并以实现的算法为核心,研发了基于Web的农业数据挖掘系统;侯亮等[72]分析了农业数据的特点、数据分析现状和大数据技术的优势,构建了基于Hadoop的农业大数据挖掘系统;柴进[73]选取中国农科院提供的农业数据作为研究对象设计出基于Hadoop 平台的农业数据挖掘系统,在系统架构方面设计了高效、易扩展的分布式数据挖掘系统框架,在系统算法层面对CART(分类回归树)算法进行了改进,在数据存储方面利用了HDFS 进行大数据的分布式存储;郭二秀[74]选取Hadoop 的分布式文件系统HDFS 来解决海量异构农业大数据的存储问题,并选取基于内存的Spark 计算框架,设计了基于Spark的农业大数据挖掘系统,实现了农业大数据的实时快速处理。有的学者侧重于从理论上探讨数据挖掘技术在农业领域的应用问题,如王文生等[75]从农业生产环境数据获取、农业生命信息感知等方面分析了农业大数据获取的途径,并从精准农业可靠决策支持系统、国家农村综合信息服务系统等方面对农业大数据的应用进行了展望;胡怡文[76]针对大数据技术在农业选育、农业栽培、农业病虫害防治等的应用进行研究和分析,建议应用大数据技术准确获取农作物生长情况并建立数据库,建立各类型的农业相关数据的知识库,建立专家资源库等;王志远[77]分析了农业信息服务的数据采集手段,提出了建立农业大数据中心模型的思路,并对数据挖掘技术在农业信息服务中的应用提出了建议;王磊等[78]对云环境下的农业服务模式、技术进行了分析,构建了云技术数据挖掘下的农业服务模型体系设计结构,并详细介绍了云技术数据挖掘功能在农业中的应用;刘剑洋[79]针对数据挖掘技术在农业机械质量控制中的具体应用进行了较为系统的分析,对其实现的方式和方法进行诠释。整体而言,中国农业数据挖掘技术研究与应用已经取得了一定的成绩,但其成果数量或水平还不尽如人意,主要表现在是理论探讨的多而实际应用的少,研究方法较为单一,特别是缺乏全面、深入、系统的探索。

2 农业数据处理技术

要想从种类繁多且体量巨大的农业数据中去伪存真、去粗取精,传统的存储和计算方式已经无法完成,数据的处理分析迫切需要由处理单一数据集向迭代增长数据集,由处理结构化数据向处理非结构化数据,由批处理向流处理,由验证性分析向探索性分析,由集中式分析向分布式分析的转变[80]。

由于农业物联网连接着若干个节点,在刚开始部署的时候需要精准确定每个节点的位置及其独特功能,但节点异构性和数据类型多样性给信息处理增加了难度[81]。因此,如何提高网络信息处理能力和网络性能受到了重视,路由、组网和信息机制相关的方法得到了关注及研究[82]。为了提高计算能力,计算技术已经由早期的并行计算发展到今天的云计算,农业云计算最早使用的模型Map-Reduce。Map-Reduce 是谷歌(Google)2004年提出的一种面向大规模数据处理的并行计算模型和方法,后来演变成为一种分布式编程模型,其“并行处理”理念已被广泛用于云计算的任务调度中,基本思路是在任务调度时,使用Map 程序将数据分片,发送到各个计算机进行处理,将得到的大量结果通过Reduce 程序收集并输出。然而原始的Map-Reduce架构在今天已经渐渐退出了开发一线,取而代之的是Hadoop 架构,它的基本思路和Map-Reduce 相同,还集成了GFS(Google 文件系统)、BigTable(Google 云存储技术)等引擎,能够更好地服务云计算。伴随着今天大企业对大数据处理的需求和降低成本的要求,Spark 架构开始盛行,Spark 同样基于Map-Reduce 模型,但更强调高速计算能力,它可以和Hadoop中的分布式文件系统配合使用,高效而低成本地解决农业数据处理问题,是未来发展的一个方向。

利用大数据处理技术捕获海量农业数据里面的有益价值关系,是破解农业变量强耦合、高维难题的主要渠道。农业大数据的优势,就在于可以依托大体量的农业数据及其处理方法,针对某个农业问题,解读剖析其数据变量之间的关系,研究提出具体的解决方案。农业大数据的多样性和容量决定了其复杂的程度,而农业大数据处理方法的真实性和速度则决定了其质量。借助农业大数据处理技术,认真剖析特定的农业数据,获取其潜在的有益价值,是农业物联网数据处理研究的重点[83]。

3 农业预测预警技术

农业预测预警技术是以农业物联网收集到海量数据和作物资料为依据,通过建立数学模型,对农业研究对象未来发展的可能性进行科学预测和评估,根据具体情况做出解读评价,对生态环境可能出现的不利于农作物或养殖对象正常生长的极端情景进行提前警示,最大程度地消除或减轻有可能遭受的损失。

农业预测预警是调节控制生态环境的前提和基础,而实现农业预测预警就是农业信息智能处理的重要应用。在国外,美国、日本等国家研发了大批的软件及预测模型和预警模型,并在实践当中加以应用[84]。在国内,张克鑫等[85]学者基于BP神经网络,对叶绿素a的浓度开展预测预警的研究,并应用于湖南镇水库当中;李道亮等[86]在集约化河蟹养殖水质预测模型和预警模型的研究和应用中,基于粒子群优化算法和最小支持向量回归机(PSO-LSSVR)开发了水质预测模型,基于粗糙集和支持向量机(RS-SVM)开发了水质预警模型。

4 农业人工智能技术

人工智能(Aritificial intelligence,AI)也可称为机器智能或人造智能,指借助计算机程序来模拟和实现人类智能的技术[87]。农业人工智能技术可以通过优化求解过程,促进农业生产过程智能化,对农业全过程实施动态管理,提升资源利用率和劳动效率,避免不必要的投入,减少生产成本和劳动强度[88]。Dempster/Shafer 证据理论、粗糙集理论、动态贝叶斯网络(Dynamic Bayesian Network,DBN)等人工智能理论为农业数据的挖掘和处理提供了方法,实现了感知预测,为农业决策提供了参考。人工神经网络(Artificial Neural Networks, ANNs)、进 化 算 法(Evolutionary Algorithms,EAS)、遗传算法(Genetic Algorithm,GA)等为农业物联网应用提供了非线性的机器学习方法,解决了农业数据处理现存的问题,是实现农业自动决策的必然选择[89]。

农业人工智能可分为农业信息搜索、模式识别、知识表示和智能规划等4 个研究方向,它们的研究对象分别为农业主题信息搜索、农业对象识别方法、农业知识数字化及决策支持、农业机械作业智能化等[90]。近年国内学者重点关注农业智能规划和农业模式识别等研究方向,农业智能规划的研究热点集中在建模与控制方法研究,农业模式识别的研究热点侧重于与深度学习算法相互结合;农业信息搜索的研究热点侧重在农业信息搜索引擎技术和网络爬取技术,农业知识表示的研究热点集中于知识图谱[91]。农业人工智能技术已经应用到农业产前、产中、产后、运维等各阶段[92]。在产前阶段主要应用于土地景观规划、土壤分析评估、河川日常径流量预测、灌溉用水供需分析以及种植品种鉴别等;在产中业务主要应用于水产养殖投喂管理、水质预测预警、田间杂草管理、插秧系统、作物种植和牧业管理专家系统等;在产后阶段主要应用于农产品的分类、收货、检验、加工过程控制,以及染料提取和蒸馏冷点温度预测等;在运维业务主要应用于农业设施装备的运行管控及其故障诊断等。目前,人工智能在农业领域的应用还处于初步探索的过程中,农业智能化程度还比较低,人工智能要想替代人类进行实际生产任重而道远,亟须进一步的技术突破[93]。

深度学习算法是人工智能的一个前沿技术,它的优越性在于能够自动提取数据当中蕴含的特征,并对高维复杂变量之间的相互关系进行数学表示。近年随着大数据技术的迅速发展,机器学习研究取得了积极的成果,深度学习算法已经在语音识别、图像识别和数据预测回归等得到了相对成熟的应用,在图像问答、图像内容的语义表达和自然语言处理等的特征抽取及建模方面持续获得新突破,为整合多源异构数据提供了更为可靠的解决方法。

综上所述,中国农业人工智能研究的侧重点正在从过去单纯的知识表示研究,向机器学习、模式识别和复杂系统规划研究转移;农业人工智能技术重点聚焦在农业的产中阶段,基于农业机器人的综合性业务研究还处在前期的探索性研究之中,而农业人工智能技术应用于农产品物流的研究则更加薄弱。深度学习研究的成果及其未来方向,对农业人工智能技术的发展将产生更为深刻的影响。由于农业业务变量之间的关系既复杂又相互关联,而且其未知变量比较多,在某个区域农业业务行之有效的农业人工智能技术对其他的区域并不能够替代人类自身在农业业务中的特殊作用。所以,通过全新的模式识别和机器学习技术,研究农业业务变量之间的特殊关系,全面提升基于农业人工智能的复杂系统在不同区域的适切性和兼容性,从根本上促进农业机器人技术相互整合,将是农业人工智能未来发展的主要方向。

5 结语

总之,农业信息处理技术的研究与应用,是现代农业发展的理性选择,也是未来农业发展的趋势及其发展水平的主要标志。随着人类社会进入全新的信息化时代,传统农业升级对农业信息处理技术提出了新的更高需求,研究农业信息处理技术在农业中的应用将具有更深远的探索意义,未来农业信息处理技术也将会呈现出集成化、专业化和智能化的发展趋势[94]。

猜你喜欢

信息处理数据处理数据挖掘
东营市智能信息处理实验室
认知诊断缺失数据处理方法的比较:零替换、多重插补与极大似然估计法*
ILWT-EEMD数据处理的ELM滚动轴承故障诊断
基于Revit和Dynamo的施工BIM信息处理
探讨人工智能与数据挖掘发展趋势
地震烈度信息处理平台研究
CTCS-3级列控系统RBC与ATP结合部异常信息处理
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
基于希尔伯特- 黄变换的去噪法在外测数据处理中的应用