基于模糊神经网络的拖拉机耕作牵引阻力预测研究

2020-04-14张波周俊

甘肃农业大学学报 2020年1期

张波，周俊

(南京农业大学工学院，江苏省智能化农业装备重点实验室，江苏南京 210031)

土壤耕作是一项最为基本的田间作业，犁耕作业时农具需要的功率消耗将直接影响耕作的作业质量和拖拉机的使用性能，而功耗与牵引阻力和速度有直接的关系.影响耕作牵引阻力的因素却有很多[1]，所以构建牵引阻力模型，精准的预测出耕作牵引阻力的大小，这对功率消耗预测，农机具的保护，能量的合理分配等方面有重要意义[2].

研究结果表明，不同的土壤物理条件对机具所需求的牵引力有不同的影响[3].影响因素包括耕作深度、幅宽、土壤含水量、容重、圆锥指数和土壤结构等[4-5].Anpat等[6]在实验室内进行了耕作试验，结果表明耕作机具需要的牵引阻力均受速度、深度、幅宽、土壤含水量和土壤锥指数(CI)的影响.在美国农业生物工程师学会(ASABE)管理标准中总结出了不同的农具所需要的牵引阻力大小的数学方程[7]，但是在某些情况下，利用数学方程预测出来的牵引阻力和实际测量的牵引阻力之间差别比较大，因而利用ASABE公布的数学方程并不完全适用于牵引阻力的预测[8].

近年来，人工神经网络在实际应用中发展较为迅速[9].Loghavi等[10]将人工神经网络(ANN)和自适应神经模糊推理系统(ANFIS)计算机仿真框架的研究用于拖拉机耕作期间牵引效率的预测，验证了复杂的神经网络模型具有良好的非线性预测能力.Choi等[11]建立了1种时间滞后的递归神经网络(TLRNN)，表明人工神经网络模型是有效的计算动态牵引阻力的建模方法.Pieczarka等[12]通过基于反向传播(BP)学习算法的多层感知神经网络模型，研究了牵引阻力实测值和预测值相关性较大，其相关系数为0.927，但是却忽略了耕深对牵引阻力的影响.

模糊推理系统(FIS)方法是利用输入和输出数据之间的专家知识构建模型的1种建模方法.从与系统定义的模糊规则相对应的参数实际测量值中得到相关知识.与ANN相类似，FIS也能对多个输入和输出建模.Mohammadi等[13]通过试验研究证明FIS模型在耕作中对农具进行牵引阻力预测方案是可行的.

对于牵引阻力预测模型的现有研究手段大多是利用多层感知机或BP神经网络来构建牵引阻力模型，然而这种研究方法不可避免的需要大量的人工超参调整和需要足够多的训练数据，而且在训练过程中模型非常容易过拟合[14].Shafaei等[15]的研究证明了将模糊神经网络之一的ANFIS模型应用在耕作牵引阻力预测上的可行性，但在初始化模糊神经网络时仅仅利用了试凑法来确定输入隶属函数个数，每1次试验都需要训练整个模型，效率低下且浪费大量的计算资源.

本研究主要针对犁耕过程中能量利用率低、牵引阻力不明确的问题，提出了1种改进的模糊神经网络牵引阻力建模预测方法.选取耕深和速度2个最重要的因素为输入，以牵引阻力为输出，利用神经网络来自适应调整规则，完成牵引阻力预测模型的训练.试验证明该模型训练时间短，预测精度高，能够反映实际犁耕过程中牵引阻力变化.

1 耕作试验

1.1 试验原理

本文需要采集的数据包括速度、耕深和牵引阻力.将下拉杆、上拉杆与机架的连接处均用轴销式力传感器连接，安装位置和原理如图1所示.通过JHZX型轴销式拉压力传感器测量得到的拉力，根据工程力学的空间力系关系式(1)转换得到牵引阻力的大小和方向.

Fall=Fl+Fr+Fu×cosα

(1)

式中，Fall为悬挂系统受到的总牵引阻力；Fl为左下拉杆受到的牵引阻力；Fr为右下拉杆受到的牵引阻力；Fu为上拉杆受到的牵引阻力；α为上拉杆与水平面夹角.

耕深数据采集方法是利用位移传感器同步测量.提升油缸的位移量根据3点悬挂杆件的位置关系式(2)转换成农具处的实际耕深.

(2)

式中，Hall为犁体处实际耕深；H1为位移传感器测得提升油缸位移值；Ll为下拉杆长度；Lu为上拉杆长度；α为上拉杆与水平面夹角.

速度是利用华测生产的差分GPS，根据式(3)的测速原理测量得到的.农具选用的是潍拖牌1L-220铧式犁，耕作幅宽为40 cm.

(3)

A：传感器安装位置图；B：轴销式力传感器安装示意图；C：试验装置实物图.A：Sensor installation position；B：Pivot pin force sensor installation position；C：Experiment device.图1 悬挂试验平台Figure 1 Suspension experimental platform

1.2 试验设计

试验在南京农业大学农机实验室的土槽中完成.由于研究目标为30 hp以下小型拖拉机犁耕配套3点悬挂系统.根据研究和土槽试验设计规范可得，耕深选取3个水平(分别为120、180、240 mm)，速度选取3个水平(分别为2.0、3.0、4.0 km/h)，交叉组合共进行18次(9组耕深速度组合×2次/组)犁耕试验，每次试验时保证均匀采集20个点的数据，在线数据采集系统在负荷相对稳定的阶段采集数据.

1.3 数据采集

通过拉压力传感器得到的力值，根据3点悬挂的杆件位置关系间接得到牵引阻力的大小；耕深通过位移传感器值根据悬挂杆件相对空间位置关系换算得到；速度则是通过差分GPS测量获得.上述3个参数在悬挂试验平台处于相对稳定的情况下通过在线数据采集系统测量采集相关参数并将数据保存到本地.剔除了耕作始末误差较大的数据，最终，经过筛选后得到347组数据用来进行模型的训练和测试.按照训练集的数据占所有数据的70%划分构建数据集1，243组数据作为训练集用来建模训练，104组数据作为测试集用来检验预测模型的精确度和泛化能力.

2 基于DBSCAN聚类的模糊神经网络构建

2.1 ANFIS模型的构建

1种常用的模糊神经网络模型是1阶自适应神经模糊推理系统(ANFIS).ANFIS是1种将模糊逻辑和神经网络相结合的建模方法，其结构通常包括5层.其中，输出是关于2个输入变量进行计算预测的[16].ANFIS的输出必须只有1个参数，但输入的维度可以是多个，ANFIS的基本结构并非是唯一的.其中，第3层的归一化层可以与第4层的去模糊化层合并为1层，也可以和第5层的输出层合并，从而得到4层的ANFIS结构.只要模型遵循“精确输入-模糊输入-模糊输出-精确输出”的原则构建即可[17-18].

ANFIS经过不断的迭代训练，利用学习算法对模糊推理规则进行调整[19-20].本文使用BP算法和最小二乘法组成的混合学习算法来调整系统的前件和后件参数.在该混合学习算法中，前向阶段计算到第4层，然后用最小二乘法辨识后件参数.反向阶段用误差反向传播算法来更新前件参数.当前件参数不变时，用最小二乘法辨识后件参数.最小二乘法能够缩小反向传播算法的空间复杂度.因此，混合学习算法与反向传播算法相比，收敛速度更快，并且采用混合学习算法更容易找到全局最优点.ANFIS模型拓扑结构包括五层，图2为基于2条规则的ANFIS结构图.

ANFIS网络建模软件环境为MATLAB R2014b，操作系统是windows10.为了获得期望精度的ANFIS牵引阻力预测模型，需要不断迭代训练，当牵引阻力预测值和测量值的误差达到设定精度时或者达到最大迭代次数，训练完成，图3为ANFIS牵引阻力预测模型的训练过程伪代码.

图2 ANFIS模型结构Figure 2 Structure of the ANFIS model

图3 ANFIS牵引阻力预测的算法流程伪代码Figure 3 ANFIS draft force prediction algorithm flow pseudo code

2.2 牵引阻力模型的构建

ANFIS在建模前需要来确定模型结构和模糊规则数量，人工设定会引入不确定因素，因此，本研究利用DBSCAN聚类算法来自适应的确定模型结构.聚类样本集为耕深和速度在3种水平下试验得到的牵引阻力值.DBSCAN聚类算法是1种基于1组邻域来描述样本集的紧密程度的聚类算法，其最重要的两个参数(ε，min_sample)用来描述邻域的样本分布紧密程度.其中，ε表示样本的邻域距离的阈值，min_sample表示样本距离为ε的邻域中样本个数的阈值.DBSCAN聚类的效果受距离阈值和邻域样本数阈值的直接影响，经过调参将ε设置为0.4，min_sample设置为8.聚类结果与聚类中心如表1所示.根据ε和min_sample的参数定义可知，当采集范围更为广泛的速度或耕深时，将上述2个参数适当调整，DBSCAN聚类即可适用与数据相匹配的更大范围.

表1 DBSCAN密度聚类算法聚类中心

2.3 不同优化方法的对比

由聚类结果可知ANFIS模型的初始模糊规则数为9条.在训练集上利用DBSCAN聚类和减法聚类、模糊C均值和无优化方法对比，得到不同优化方法的ANFIS模型测试误差如表2所示.

表2 不同优化方法的ANFIS的测试误差对比

由表2可知，基于DBSCAN聚类优化方法的牵引阻力预测模型精度优良，操作方便.

综上所述，基于DBSCAN聚类的ANFIS模型可用来预测农具所需的牵引阻力，为后续预测模型提供了基础.

3 结果与分析

3.1 预测模型评价指标

本文选用均方误差(MSE)和平均相对误差(MRE)作为模型性能评价的标准，选择MSE、MRE能够反映实际牵引阻力和预测值之间的误差，可以评价实际数据的变化程度，当MSE、MRE的值越小，表明构建的预测模型描述实验数据具有更好的精确度.其中MSE、MRE分别为：

(4)

(5)

3.2 结果与分析

在训练模型时为了避免影响因素间量纲的不一致而对模型精度产生影响，对数据作归一化处理.基于自适应神经模糊推理系统的牵引阻力模型系统初始化参数设置如表3所示.

在目前的研究当中，构建预测模型的方法多种多样，除了ANFIS模型外还有支持向量机(SVM)和随机森林(RandomForest).SVM模型是对决策边界之间距离的最大优化.随机森林是1种运用集成学习的思想将多棵决策树集成在一起的算法.犁耕时速度和耕深对牵引阻力的影响较大，3种模型的训练阶段对实测值的拟合结果依据实测值升序如图4所示，图5为训练误差对比，可以发现ANFIS相较于其他两种预测模型预测效果最佳.

表3 ANFIS模型初始化参数

图4 训练阶段牵引阻力预测模型拟合结果对比Figure 4 Comparison of fitting results of traction prediction model in training stage

3种模型对试验值的拟合效果如图4所示.相对于SVM和RandomForest模型，ANFIS模型的拟合结果最优，模型训练结果和实测值偏差相对较小，故而ANFIS模型有相对较高的训练精度.

图5 训练阶段牵引阻力预测样本误差对比Figure 5 Comparison of error of traction prediction model in training stage

根据图5的训练误差对比可以发现ANFIS的训练误差波动相对较小，平均训练误差为1.31 N，相比SVM模型(平均训练误差为3.46 N)、RandomForest模型(平均训练误差为4.24 N)训练误差相对更低，所以ANFIS模型的训练精度高，能够较好的从试验数据中更新模糊神经网络的权重和模糊规则.

3.3 模型检验与分析

为了检验对比出ANFIS牵引阻力预测模型的有效性和指导意义，基于本试验平台进行的相关耕作试验，在试验数据的测试样本上分别利用3.2中训练好的ANFIS模型、SVM模型和随机森林模型预测的牵引阻力与实际测量牵引阻力对比，最佳预测模型的预测牵引阻力值应尽可能的落在斜率为1的直线上.其中ANFIS模型牵引阻力预测值与测量值的平均相对误差MRE为4.36%，如图6(1)所示.对比图6各模型可以发现，在对构建的牵引阻力模型检验时，ANFIS模型的预测精度最高，其次为SVM模型(MRE=6.04%)，最后为随机森林模型(MRE=6.76%).

图7为3种不同牵引阻力预测模型的测试误差对比.由图7可以发现ANFIS模型的平均测试误差相比于SVM和RandomForest较小，为1.77 N，比SVM模型和RandomForest模型分别低1.72、2.81 N.由此可见ANFIS模型预测精度较高，验证结果较好，在犁耕过程中能够精确预测牵引阻力变化，所构建的预测模型对实际耕作具有指导意义.

除数据集1之外，在总的347组数据不变的前提下，分别再构建了两个数据集，数据集2和数据集3，用来对比观察不同模型的性能表现[21].其中数据集2训练集为总数据量的随机174组数据，其余的173组数据作为测试集；数据集3训练集为总数据量的随机87组数据，剩下的260组数据作为测试集.3种模型方法分别在3个数据不平衡的数据集上训练的模型得到的预测误差如表4所示.

表4 不同数据集下各牵引阻力预测模型MRE对比

A：ANFIS模型；B：SVM模型；C：RandomForest模型.A：ANFIS model；B：SVM model；C：RandomForest model.图6 不同牵引阻力模型测试结果对比Figure 6 Comparison of verification results of different traction models

图7 测试阶段牵引阻力预测模型误差对比Figure 7 Comparison of error of traction prediction model in verification stage

从表4可以发现，在数据集训练样本减小的情况下，ANFIS模型虽然性能降幅增大，但是性能依然优于SVM和随机森林模型.这是因为ANFIS的模糊逻辑一定程度上弥补了神经网络非常依赖样本数量的缺点.

4 结论

本文以速度、耕深为输入，牵引阻力为输出，通过试验并根据DBSCAN聚类确定了ANFIS模型的初始参数，基于ANFIS构建了耕作牵引阻力预测模型.该模型训练时间较短、效率高，从预测的角度来看，基于耕深和速度的牵引阻力预测模型不但一定程度降低了模型的复杂度，而且还提高了该模型的预测精度.

基于DBSCAN改进的ANFIS模型与支持向量机、随机森林模型分别对犁耕时的牵引阻力预测对比，ANFIS具有良好的非线性模型拟合能力，精度也较之更高.在测试数据集上有优良的泛化能力，模型具有较好的预测效果(MRE=4.36%).所构建的模型可靠程度高，可以真实地反映犁耕作业时牵引阻力变化情况.

该研究为后续功耗预测、能量管理、农机具保护等方面提供了研究基础.由于犁耕功耗主要和牵引阻力和速度有关，从而依据本研究模型可以预测得出在犁耕时的功率消耗，进一步可以根据功耗大小统一调度，将发动机的功率合理分配给悬挂系统，节约能源；同时根据该牵引阻力预测模型可以判断农具是否满足使用特殊耕作场景中的强度要求，从而可以保护农机具.

该模型是利用数据采集系统将采集的数据离线训练建模的，建议后续的研究可以将采集的数据添加到数据库中并在线实时训练模型，进一步提升犁耕牵引阻力预测模型.