软计算技术在农业生产中的应用研究进展
2021-12-14孙瑞志
田 野,孙瑞志
(中国农业大学 信息与电气工程学院,北京 100083)
随着我国经济的高质量发展,智慧农业作为一种高新技术与农业生产相结合的产业,是当前农业的发展趋势,并已成为合理利用农业资源、提高农作物产量和品质、降低生产成本、改善生态环境及农业可持续发展的前沿性农业科学研究热点之一。智慧农业发展过程中数据呈爆炸式增长,面对所产生的海量数据如何进行数据挖掘或数据分析是急需解决的问题之一[1-2]。新的信息和通信技术以及对农业生产大数据的分析,既可用于短期作物/农业生产管理,也可用于大规模的生态系统观测,可以针对具体的情况提高现有的管理和决策水平[3]。
软计算技术是通过对不确定、不精确及不完全真值的容错以取得低代价的解决方案和鲁棒性,运用模糊逻辑结合智能化技术解决复杂系统中带有不确定因素的问题,使之更接近客观事物的真实反映[4]。软计算技术是实现智慧农业的重要技术手段,是各种智能信息处理计算范式的统称,用于对自然和人工系统中的不精确、不确定、模糊等信息的灵活处理,以实现智能决策与人类决策的密切相似。软计算具有逼近性和倾向性,所涉及的主要技术包括机器学习、模糊逻辑、进化计算、群体智能和概率推理等[4]。其中,机器学习包括神经网络、感知器和支持向量机等[5],进化计算包括进化算法、遗传算法和遗传规划等[6],群体智能包括蚁群优化和粒子群优化等[4],概率推理包括贝叶斯网络和聚类算法等[7]。目前,软计算技术已经在农业生产中得到广泛应用,涉及农作物产量预测、杂草检测、土地利用和土地覆盖监测、作物物候、盐分检测等[8]。其中,农作物产量预测、杂草检测以及土地利用和土地覆盖监测与粮食安全生产密切相关,鉴于此,从这3个方面介绍软计算技术在农业生产中的应用研究进展,以期为粮食安全生产提供理论支持。
1 农作物产量预测
农作物产量预测是一个迫切需要解决的农业问题。作物产量预测是为了及时掌握生产动态,有利于粮食安全生产。早期的产量预测模型大多是静态模型,而静态模型通常不考虑植物的特性、气候变化以及其他限制性条件的变化[8]。其中的一些模型仅依赖于1 a或1个地区的数据,是利用单一区域或单一年份信息所生成的模型,应用必然会受到限制[9]。现实中,影响农作物产量的因素多且随着季节、年份的变化而变化,同时还受制于环境、气候性质和一些不确定因素(如病害、财力等)[10]。因此,一些研究者使用模糊逻辑建立了动态预测模型,用以处理引起产量变化的一些不确定情况[11]。预测过程中如果没有考虑影响预测准确性的重要参数,就会影响预测结果的有效性,导致不能合理预测作物的产量[12]。因此,许多科研人员试图建立新的模型来提高其准确性。
BOSE等[13]提出了一种基于时间的人工神经网络(Artificial neural networks,ANN)模型,用于分析标准对比植被图,从而进行作物产量预测,该模型利用中分辨率成像光谱仪测定和记录作物产量信息,然后将所获得的信息按照时间和空间顺序建模,训练ANN预测模型,进而实现作物产量的预测。将这种模型用于我国冬小麦主产区山东地区冬小麦的产量评估,可以在收获前1个半月左右准确预测产量。ORTUZAR-IRAGORRI等[14]使用叶绿素仪测量软红冬小麦在不同生长发育阶段的氮吸收量,从而预测作物产量。周亮等[15]针对传统的农作物估产方法过度依赖人工经验,以及实地采样成本高等问题,建立了基于卷积神经网络(Convolutional neural network,CNN)的冬小麦估产模型,利用2006—2016年我国北方冬小麦核心产区五省60个地级市的冬小麦生长季中遥感影像的时间序列数据作为数据源,对该模型的准确性进行检验,所得训练集和验证集的均方根误差分别为183.82 kg/hm2和689.72 kg/hm2,估产精度较高。然而,由于该模型没有考虑坡度、蒸散发、降雨等地理与气象数据,应用范围受到了一定限制。
2 杂草检测
杂草是影响作物产量的主要因素之一。随着电子信息技术的发展,机器视觉结合图像处理技术已成为一种有效的田间杂草和作物精确实时检测工具,能够为特定地点的杂草管理提供有价值的信息[16]。杂草检测的难点在于如何区分与作物有相似特性的杂草。一般情况下,生物形态学、光谱特征、视觉纹理和空间背景4类特征经常会被用来进行杂草检测。对于植物,生物形态是指植物任何部分的形状和结构。特别是形状特征,它对于识别植物物种具有重要价值,因此常被用于杂草检测的图像分析。对于不同叶色的植物,光谱特征是区分它们的有效方法。例如,由于大戟子杂草倾向于棕色,而水稻植株倾向于绿色,人们仅利用光谱特征就可以获得理想的分类结果。对于颜色非常相似的杂草和作物,仅仅利用其光谱特征很难获得满意的结果,需要利用杂草和作物的形态学等其他特征才能将它们精确地分离[17]。纹理特征是识别图像中目标或感兴趣区域的重要特征之一,对区分作物和杂草具有重要作用。在杂草检测中常用的纹理特征计算方法有统计特征、结构特征、模型特征和变换特征[16]。多数作物是按照预先设定的模式成排播种或种植的,故利用空间背景或位置等信息有助于提高杂草识别的准确性。对于大麦、小麦等粮食作物,由于相邻作物间有明显的间隔距离,两行之间的所有绿色植物都可以被认为是杂草,此时,通过识别作物行的中心线和边缘,就可以较为有效地检测出行间杂草。
近年来,机器学习算法被应用于植物分类研究,自然也被用于杂草检测研究。这种算法中应用比较广泛的是CNN模型。例如,POTENA等[18]利用2种不同的CNN处理红绿蓝和近红外图像,可快速准确地识别作物和杂草。轻量级的CNN可以用于快速植被分割,深度的CNN用于作物和杂草类别之间的分类提取。传统的CNN采用随机值对网络参数进行初始化,可能导致层间传播产生较大误差。为解决这个问题,TANG等[19]将K-means非监督特征学习作为预训练,取代了传统CNN参数的随机初始化权重,从而使杂草识别准确率提高到92.89%,高于随机初始化CNN 1.82个百分点和未经微调的双层网络6.01个百分点。然而,经过训练的CNN模型虽然具有较高的杂草检测精度,却有参数多、计算耗时等缺点。为了减少参数数量、加快处理过程,MCCOOL等[20]提出将多个轻量级模型组合为一个混合模型来增强性能,与单一模型相比,混合模型使用较少的参数,却可达到较高的检测精度和较快的处理速度(1.07~1.83 f/s)。
上述方法虽然提高了杂草识别的准确率,但在植物生长的后期常会发生叶片遮挡和重叠情况[21]。在这种情况下,由于叶片形状的变化不可预测,重叠的叶片往往被分割识别为一个物体,形态学特征也会表现欠佳。LOTTES等[22]曾使用一种基于关键点的方法处理重叠的植物叶片,但增加了计算量。为了平衡分类精度和速度,可以先在整个图像中应用基于对象的方法,将目标识别为杂草或农作物。然后,再针对不确定目标,采用基于关键点的方法提高分类精度。植物在不同的生长阶段,其叶片的形态、结构和光谱特性都会发生改变,因而会影响到分类模型的性能。目前,人们普遍采用的方法是用不同生长阶段的样本训练分类模型[23],该方法简单明了,但会影响分类精度,而且需要大量样本。因此,为提高分类模型的精度,常需用新样本重新训练分类模型以提高准确性,然而再训练过程既繁琐又耗时。为了解决这一问题,LOTTES等[24]开发了基于空间序列的CNN分类模型,该模型是编码器-解码器结构,能够进行背景、作物和杂草的逐像素语义分割,从代表部分作物行的图像序列中学习植物排列信息,将其与视觉特征融合,从而提高分类模型的性能和泛化能力。
除此之外,光照条件的不同往往会导致同一场景的颜色、噪声、阴影、反射、对比度、饱和度和亮度发生变异,造成分割(分类)算法,特别是基于阈值的分割(分类)算法的失败。为了提高算法在可变光照条件下的性能,可以采用不同的颜色空间模型。例如,TANG等[25]曾提出YCrCb颜色空间模型比较适合处理对光照变化敏感的图像,可将亮度和色度进行分离。但由于YCrCb颜色空间模型没有考虑绿色信号和光亮度的变异,需利用红绿蓝颜色空间转换来描述绿色作物的特征,采用贝叶斯算法对杂草和作物加以区分。AHMAD等[26]利用自适应分割来观测图像的平均强度值,动态计算每个图像的分割光学阈值,以实现光照对特征提取影响的最小化,进而利用叶片生长过程中所提取的局部形状和纹理特征有效地区分杂草种类。此外,还有一种减轻光照影响的方法是在获取图像时提高图像质量,如SUJARITHA等[27]在相机上固定了一个特殊的光圈,避免阴影或其他与照明相关的障碍物的干扰,提高了图像质量,提高了对作物和杂草的识别。
为了验证和比较新算法的性能,还需要注意2个要素。一个是含有足够数量样本和相应地面真值标注的图像数据集。在这方面,较权威的数据集,包括在胡萝卜[28]和甜菜[29]生长田地上采集的图像数据集,以及用于作物和杂草检测的模型所自动生成数据集[30]。这些数据集对于测试算法的确有价值,但它们仅覆盖专有作物和杂草,仅限于特定的生长阶段,有一定的局限性。另一个要素是图像的处理时间。复杂的算法通常能提供更好的检测结果,但因所需要的处理时间一般较长,又限制了剔除效率。所以,往往需要在准确度和效率之间寻求合适的平衡点[31]。
3 土地利用和土地覆盖监测
土地利用和土地覆盖的变化显著改变地球的能量平衡和生物地球化学循环,会导致气候变化,进而影响地表性质和生态系统。土地利用和土地覆盖监测的主要目的是了解不同时间段之间土地利用和土地覆盖的变化情况,并量化相应的变化区域。例如,1982—2016年全球森林覆盖面积增加了224万km2(比1982年增加了7.1%),而全球的裸地覆盖面积则减少了116万km2(-3.1%),其中,仅中国就减少了25万km2(-7%)。值得注意的是,变化最显著的区域是亚洲的农业地区。在所有这样的土地变化中,60%与人类直接的土地利用活动有关,40%与气候变化等间接驱动因素有关[32]。定期对变化进行监测和分析,可以及时对自然资源的退化和破坏采取必要的预防措施。同时,也有利于人类合理规划和利用各种自然资源,进而实现可持续发展[33]。
土地利用是一个动态的变化数据,以上海市4 a(2000年、2005年、2010年和2015年)的土地利用为例,农业用地、森林用地、草地、水域用地、城市用地和未利用地6种土地利用类型在4 a中发生了巨大变化[34]。其中,建成区面积迅速扩大,农业用地面积逐年减少。QIAN等[34]使用基于软计算的划分策略自组织映射(Self-organizing map)将整个监测区域划分为若干均匀的子区域,并进一步应用三维CNN提取时空邻域特征,相应的最佳时间步长与城市建成区面积的增长率具有正相关。然后,他们又建立了ANN模型,利用时空邻域特征和驱动土地利用的因素为每个子区域创建转换概率图。最后,他们将概率图、约束条件和随机因素进行融合,以生成整个研究区域的动态仿真结果。该仿真结果对土地的优化利用非常有用。
遥感辐射器或遥感器所采集的多光谱遥感影像(包括航空和卫星遥感影像)是土地利用和土地覆盖监测的主要数据来源。这些遥感影像往往需要进行分类处理才能获取所需要的有效信息[35]。高分辨率的卫星遥感影像淘汰了传统影像的处理算法,推动了新的优化算法的研发[36]。在这些新的优化算法中,软计算技术是遥感影像分类的重要工具。
特征提取是影像分类过程中的一个重要步骤。在机器学习、模式识别和图像处理中,特征提取的主要过程是从一组初始的测量数据开始,通过一定的技术手段,最终形成一个新的特征。这样得到或预测的新特征必须有用且非冗余[37]。目前,由于对输出的特征提取、图像融合和基本差分图像进行优化处理,人们在土地利用和土地覆盖的分类及变化的监测方面,取得了较好的效果[6]。JUNEJA等[38]比较了粗糙集、模糊粗糙分类器和ANN 3种软计算技术,认为粗糙集和模糊粗糙分类器优于ANN。PATKI等[39]通过对支持向量机(Support vector machine,SVM)与ANN、模糊逻辑、遗传算法,以及用于土地覆盖和土地利用分类的软计算技术的比较研究,认为SVM在小样本情况下,土地利用分类性能更优。一般而言,通过遥感影像对土地利用和土地覆盖分类与变化进行监测,需要对具体情况作具体分析,因为没有一种技术能够适合所有情况。但可以确定的是,特征提取方法和输入影像的分辨率在土地覆盖监测和变化检测中起着十分重要的作用。
TIAN等[40]提出了一种采用果蝇算法(Fruit fly optimization algorithm,FOA)对SVM参数进行优化的方法。即用果蝇算法对SVM参数进行动态优化,以提高SVM在网络多源异构数据中的分类精度。如果将FOA-SVM方法应用于土地利用分类,与其他算法优化的SVM相比,FOA-SVM能得到更高的分类准确率。尤其是在动态数据下,通过动态地获取参数不仅可以提高分类准确度还可有效地减少计算的迭代次数。
4 展望
随着我国农业的高质量发展,软计算技术不仅在农作物产量预测、杂草检测以及土地利用和土地覆盖监测等方面开展应用,相信未来在农业生态、农作物抗逆等其他领域也将发挥重要的作用。软计算技术已从单一发展到多种,从浅层到深度再到集成,为智慧农业提供了高精度的数据处理技术,更有利于粮食安全生产的智能决策。在大数据的环境下,软计算技术可有效地对不确定、不精确、模糊等信息进行智能化处理,为农业领域粮食安全生产的智能决策提供依据,是实现现代信息技术与农业生产相结合,并通过高科技投入和管理获取资源的最大节约和农业高产出的重要途径。