基于正则化TSVR的甘蔗收割机切割器入土切割负载压力预测研究*
2021-03-31麻芳兰罗晓虎李科王中彬申科邓樟林
麻芳兰,罗晓虎,李科,王中彬,申科,邓樟林
(广西大学机械工程学院,南宁市,530004)
0 引言
目前广西的甘蔗种植业发展迅速,其蔗糖总产量也逐步达到了全国糖产量的60%以上[1]。但由于机械化程度低,导致生产成本很高,严重制约了广西糖业的发展,因此实现甘蔗机械化收获具有重大意义[2]。在国外,甘蔗收割机类型主要有[3-6]:切断式甘蔗联合收割机和整杆式甘蔗收割机,其中凯斯A8800[7]已经实现了入土切割自动控制,从而提高了切割质量,降低了破头率,但由于该机型不适用于丘陵地区,在我国得不到广泛运用。而在国内,研究的主要类型同样是切段式和整杆式,但由于研究的相对较晚我国自主研发的甘蔗收割机仍存在一定问题,其破头率高、含杂率高导致我国甘蔗收割机难以得到很大的应用。
为解决破头率高的问题,我国也开始对甘蔗收割机入土切割过程进行了研究。周建阳等在研究切割深度对宿根破头率的关系中得出了甘蔗收割机刀盘的入土深度对甘蔗破头率有显著影响以及入土切割甘蔗宿根破头率比不入土切割降低了64%等重要结论。王增等[8]通过在物理样机上进行试验得出入土深度与系统负载压力的关系,并通过实验数据分析得到了切割器负载压力和入土深度的关系曲线。杨望等[9]对甘蔗—土壤以及刀盘之间建立仿真模型并利用LS-DYNA软件通过反求技术,得出了甘蔗的物理特性,同时通过改变土壤弹性模量来控制土壤的软硬程度从而得出了入土切割能够大幅降低破头率的结论。
为了实现自动控制切割器入土深度从而达到降低甘蔗破头率的效果,而由于入土深度很难在切割过程中很难实时进行测量,课题组前期对甘蔗收获机切割器入土切割时负载压力的影响因素进行探究[10],并且用基于粒子群算法优化的极限学习机模型对甘蔗收割机切割器入土切割负载压力进行预测。为了更准确、快速地对甘蔗收割机切割器入土切割时负载压力的预测,本文采用正则项孪生支持向量回归模型对负载压力进行预测,然后将仿真结果与其他模型进行比较分析,最后建立预测系统验证该模型的可行性。研究结果可为后续的切割自动控制系统设计提供参考依据。
1 构建模型
1.1 正则化孪生支持向量回归(ITSVR)模型
为了提高SVM的训练速度,Jayadeva等[11]于2007年提出了孪生支持向量机(Twin Support Vector Machine, TSVM)。这是一种在支持向量机基础上发展起来的学习算法。孪生支持向量机是通过建立一对不平行的超平面(即一组方程),从而达到预测目的。其原理是在一对超平面中的一个超平面尽量接近A类而远离B类;同理另一个超平面更为接近B而远离A类。到2010年Peng[12]在TSVM的基础上为解决回归问题而提出了孪生支持向量回归机(Twin Support Vector Regression, TSVR)。与TSVM[13-15]类似,也是生成一对相互不平行的超平面,对于这组相互不平行的超平面,通过对超平面即目标函数分别赋予不敏感损失函数,从而解决回归类问题。
对于非线性孪生支持向量机和传统非线性SVR一样,需引进核函数,从而解决低维线性不可分问题。类似非线性SVR,回归方程如式(1)和式(2)所示。
f1(x)=w1K(xT,AT)+b1
(1)
f2(x)=w2K(xT,AT)+b2
(2)
式中:w——惯性权重;
K——线性回归方程系数;
xT——样本数据;
AT——待估计参数;
b——回归参数方程的未知数。
(3)
(4)
式中:C——权重因子;
ζ,η——松弛向量;
e——单位向量;
ε——寻优参数。
为将原问题转化成对应的对偶问题,引入拉格朗日乘子α和γ,由KKT条件可知
(5)
设定H=[Ae],f1=Y-eε1,u1=[w1b1],则对偶解可得
u1=(HTH+C1I)-1HT(f1-α)
(6)
联立w1和b1的偏导,并将式(5)代入式(3),可得到二次规划形式,如式(7)所示。
(7)
同理可得式(4)的对偶二次规划形式,如式(8)所示。
(8)
其中f2=Y+eε2。
(9)
则可以通过下界函数f1和上界函数f2的回归函数得到式(10)。
(10)
在模型构建过程中,选取机车行进速度、刀盘入土深度、土壤密度、甘蔗密度以及土壤含水率为输入变量,并将各个数据进行归一化处理,将样本数据转换到[0,1]或者[-1,1]区间内,从而达到归一化的效果。训练的因素水平如表1所示。
表1 训练因素水平表Tab. 1 Training factors and level
样本输入集和输出集数据转换到[0,1]或者[-1,1] 区间的公式分别为
(11)
(12)
式中:xi——样本的输入数据;
xmax——样本集数据的最大值;
xmin——样本集数据的最小值;
不仅如此,恒轮机床在本次为期三天的汽车行业开放日活动中,还向大家展示了包括H系列、HF系列及RFK、RFN在内的多种加工中心及柔性制造系统,并在相应的展区进行了系统的介绍,每个展区、每台设备都具有极高的关注度。可以预见的是,恒轮机床将会始终如一地保持产品品质与服务水平,在这个充满变革的时代持续不断地为用户及市场注入活力,创造价值。
为了使输出数据体现真实值,在对样本输入数据进行归一化处理后,需对样本输出数据进行反归一化处理,并通过输入变量来预测切割器的负载压力。
(13)
1.2 基于遗传算法的粒子群优化算法
ITSVR模型需寻优的参数包括惩罚因子(C1和C3)、权重因子(C2和C4)、不敏感损失函数系数(γ1和γ2)和高斯核函数系数(ε1和ε2)4个参数。为保证模型预测的准确性,需寻找一个精确快速而稳定的算法来进行参数寻优,而粒子群算法相比于其他算法具有更快的收敛速度以及更适用于处理高维度的问题[18],因此本文基于粒子群算法优化ITSVR模型的参数。
粒子群算法[19-21]的原理是假定粒子为D维空间中的点且各粒子具有一定的飞行速度,粒子开始在搜索空间飞行前,需对各粒子的位置和速度进行初始化,然后各粒子的速度和位置通过迭代公式不断迭代,并求出对应适应度(fitness)值,通过适应度值判定每次初始化值的优劣。其中各粒子在飞行搜索过程中所获取的最优解Pi,称为个体极值;整个种群在飞行搜索过程中获取的最优解Pg,称为全局极值。在寻优过程中,各粒子的速度和位置通过迭代公式不断更新,公式如式(14)和式(15)所示。
Vid=wVid+c1×rand()×(Pid-Xid)+
c2×rand()×(Pqd-Xid)
(14)
Vid=Vid+Xid
(15)
式中:c——加速因子。
其中c1和c2为常量,取值范围为[-2,2];rand( )为[0,1]中的随机数;w决定了后代粒子对当前粒子速度的继承程度,从而使得粒子群算法在一定程度上控制算法的开发能力,同时在在避免早熟收敛问题上起到一定作用。
由于粒子群算法在全局搜索能力上的不足,本文引入遗传算法[22-24]的交叉和变异操作对粒子群算法进一步优化。其中交叉操作主要是通过个体之间交叉产生新一代粒子,而变异操作的主要作用是通过染色体变异加速向最优解的收敛过程和维持种群多样性。交叉和变异操作在操作的表现形式有很多,比如单点交叉、多点交叉、单点变异和多点变异等。由于单点交叉和单点变异已能满足本文全局搜索的目的,所以本文只采用单点交叉和单点变异。遗传算法有二进制编码和实值编码两种较为常用的编码方式,本文采用二进制编码,以突显交叉和变异的作用,从而增强全局搜索能力。
通过上述优化算法可以更好寻找ITSVR模型所需要的几个优化参数,拥有较好的搜索复杂区域的能力,找到ITSVR模型的优化参数的最优解后,便可以使ITSVR模型对甘蔗收割机的负载压力预测得更加准确。
1.3 模型评价
为了判断模型的性能,本文采用均方根误差(RMSE)、平均绝对误差(MAE)以及决定系数(R2)指标对所建立的模型进行评价,测试样本中RMSE和MAE的值越小以及R2的值越接近1,则说明模型的拟合能力和泛化能力越好。
由于本文所提出的模型是为甘蔗收割机切割过程刀盘入土深度自动控制奠定基础,所以本文将以模型最大预测时间作为模型辅助指标对模型进行评价。模型最大要求预测时间T计算公式如式(16)所示。
T=T1-T2-T3-T4
(16)
式中:T1——切割控制系统最少响应时间;
T2——原始信号采集时间;
T3——执行结构响应时间;
T4——控制单元响应最长时间。
由课题组前期研究[10]可知T1=750 ms;T2=2 ms;T3=151.292 ms;T4=463 ms,则可得出T=130.08 ms,则模型的预测时间应小于130.08 ms才能满足切割器切割过程的顺利进行。
2 仿真结果与对比分析
2.1 参数寻优
为获取ITSVR模型最优参数,以课题组前期研究[25]的27组正交试验数据为样本数据,通过归一化处理后进行随机划分为训练样本(18组)和测试样本(9组),训练样本如表2所示,利用添加了交叉和变异操作的粒子群优化算法通过训练样本获取最佳模型参数。令模型参数C1,C3∈[0.01,10],C2,C4∈[0.001,10],γ1,γ2∈[0,10],ε1,ε2∈[0,10],粒子群算法参数加速因子c1=c2=1.5,惯性权重w=0.72489,种群个数为10个,迭代次数为200,交叉和变异的概率分别为0.8和0.05,寻优的范围为{2i|i=-3,-2,…,9}。经过200次迭代后,得到模型的最佳寻优参数,C1=C3=8.040 26;C2=C4=0.005;γ1=γ2;ε1=ε2=9.455。其进化曲线图1所示,在迭代30次左右,模型趋于收敛,适应度接近平稳,可以看出基于遗传算法的粒子群算法优化ITSVR模型参数收敛速度快且稳定,适于对ITSVR模型进行寻优。
表2 训练样本Tab. 2 Training sample
图1 粒子群算法的进化曲线Fig. 1 Optimization curve of particle swarm optimization
2.2 ITSVR模型仿真结果
ITSVR模型的预测结果如图2所示,模型评价指标结果如表3所示。
(a) ITSVR模型预测值与实际值对比
(b) ITSVR模型预测结果绝对误差
表3 模型评价指标结果Tab. 3 Results of models
由图2可看出,ITSVR模型预测值与测试样本实际值相差很小且接近程度很高,其中最大的绝对误差值为11.3 kPa,有力说明该模型能较快速且准确地对甘蔗收割机切割器入土切割负载压力非线性曲线进行拟合。
由表3可知ITSVR模型的均方根误差RMSE为1.54 kPa,平均绝对误差MAE为1.08 kPa,决定系数R2为0.955 8,预测时间为5.9 ms远小于最大预测时间。
2.3 模型仿真结果比较分析
为研究在ITSVR模型较其他模型是否具有更好的性能,将ITSVR模型预测结果与传统的BP神经网络、SVR、ELM以及TSVR模型进行比较。模型评价指标结果如表3所示,可知BP神经网络、ELM、SVR、TSVR和ITSVR模型的预测时间分别为39.7 ms、4.4 ms、56.6 ms、4.8 ms和5.9 ms,模型的预测时间均小于最大要求预测时间,ELM、TSVR和ITSVR的预测时间均在10 ms以内,体现出较快的预测速度,其中ELM的预测时间最低;在RSME和MAE方面,TSVR模型都比ELM模型低,并且TSVR模型的R2比ELM模型的高出0.012 9,这说明TSVR模型比ELM模型具有更好的拟合泛化能力。
又可知,引入正则项的ITSVR模型在RSME、MAE方面比TSVR模型均有所减小,并且ITSVR模型的R2比TSVR模型的提高了0.073 4,这说明引入正则项对TSVR有较明显的改善。由上可知,引入正则项的ITSVR模型提高了预测的精度并且预测时间较TSVR模型有所增长但增长不多,则可说明在满足最大要求预测时间的情况下,ITSVR模型较其他模型能更快速、准确地对切割器负载压力进行预测。
3 建立预测系统验证模型可行性
3.1 验证试验数据
验证试验数据取自不同于训练样本和测试样本的8组均匀试验,重复四次并取平均值,以确保数据的准确性,并用平均负载压力作为验证数据。试验所使用的甘蔗及土壤均来自广西大学农学院甘蔗试验田,甘蔗均未做任何人工处理,其品种为新台糖22号,其中甘蔗直径为30±3 mm;试验平台为主要由土槽装置、甘蔗加持装置以及切割器试验平台等部分组成的物理试验平台;试验仪器为雷诺智能测试仪。
8组均匀试验数据如表4所示。
表4 均匀试验数据Tab. 4 Uniform test data
3.2 可行性验证
为了验证模型的可行性,建立预测系统将实际值与预测值进行比较分析。其中实际值与预测值对比结果如表5所示。由表5可知,对于ITSVR模型,8组数据的相对误差都没有超过10%,且只有3组数据的相对误差超过了5%,最高的相对误差只有8.567 5%; 在ELM模型方面,只有一组数据的相对误差超过了10%,3组数据超过了5%;而TSVR模型,有两组数据的相对误差超过了10%,3组数据超过了5%。因此可得,在以相对误差为10%作为合格评价指标时,ITSVR模型的预测准确度为100%,较ELM和TSVR模型都高;在以相对误差为5%作为合格评价指标时,ITSVR、ELM和TSVR模型的预测准确度均为66.7%。可知无论采取哪种模型对负载压力进行预测时均存在一定误差,但相对而言,ITSVR模型误差较小且分布相对平均,无较为明显的误差点,则说明ITSVR模型较其他模型具有更好的可行性。
表5 实际值与预测值对比Tab. 5 Comparison of actual results with predicted results
4 结论
1) 引入遗传算法的粒子群优化算法对ITSVR模型参数的寻优具有较快的收敛速度且较稳定。
2) 引入正则项改进的孪生支持向量回归(ITSVR)模型能较准确且较快地对负载压力与其他影响参数的非线性曲线进行拟合;其中测试样本中ITSVR模型的RMSE、MAE、R2分别为0.015 4、0.010 8、0.955 8,模型的预测时间为5.9 ms。在满足最大预测时间的条件下,针对甘蔗收割机切割器入土切割负载压力的预测,正则化孪生支持向量回归模型的预测精度较其他模型有显著提升。
3) 在以5%和10%相对误差作为合格指标模型评价时,ITSVR模型预测的正确率分别为66.7%和100%,有力证明了ITSVR模型对甘蔗收割机切割器负载压力预测的良好可行性。研究结果可为后续切割自动控制系统设计提供参考依据。