APP下载

基于遗传算法和GRNN的棉花流量检测模型研究

2013-06-15林昌建李彦明苗中华刘成良

机械与电子 2013年4期
关键词:训练样本标定交叉

林昌建,李彦明,苗中华,2,刘成良

(1.上海交通大学机械与动力工程学院,上海 200240;2.上海大学机电工程与自动化学院,上海 200072)

0 引言

随着我国棉花生产和加工的需要,直接在采棉、输棉机械上实现精确、高效、实时的在线流量检测,是发展精细农业的重要课题[1-3]。目前,无论是采棉机械还是棉花加工机械,均普遍采用管道气力输送棉花,这为在线非接触式测量输棉管内的棉花质量流量提供实现的可能[4]。结合其在管道内特殊的流动特性,光学法是当前检测这种稀相流动比较适合的非接触式测量方法,通过采集由已知光源发出的随之变化的光强度信号来反推流量[5]。新疆石河子大学对基于这种光学测量方法的静态检测模型做了研究,筛选出具有最佳衰减特性的光源[6]。然而实际收获生产中的实时棉花流量检测是针对动态变化的流动状态,管道气力输送使棉纤维流量密度与其随机概率分布相关,难以完全由棉纤维的静态消光特性推导出精确的测产数学模型。神经元网络建模不需要考虑机理,但BP神经网络权值调节采用的是负梯度下降法,存在收敛速度慢和局部极小值等局限性,在解决样本量少且随机噪声较多问题时效果并不理想[7],影响模型的实时性和精确性。

针对上述问题,提出运用广义回归神经网络GRNN,它有很强的非线性逼近能力及较高的容错性,能够很好地适用于小样本问题,并且其结构固定,可以更快地进行训练[8-9]。采用改进遗传算法来监督训练GRNN,确定决定网络性能的最佳参数,使GRNN在用于建立产量测量系统动态标定模型时拥有快速、精确的预测能力。

1 广义回归神经网络

GRNN通过执行Parzen非参数估计,从观测样本里求得自变量和因变量之间的联结概率密度函数之后,直接计算出因变量对自变量的回归值。通过不断增加训练样本(即使样本数量稀少),网络输出结果将渐近收敛于最优回归表面[10]。GRNN是一种前馈神经网络,其网络拓扑结构如图1所示。

图1 广义回归神经网络拓扑结构

输入层用于将输入数据向量输送到下一模式层结点,其所含结点的数量等同于训练样本输入向量的维数P。模式层所含结点数量与训练样本数量N相同,每个结点对应一个不同中心的核函数。模式层的传递函数通常采用高斯函数:

Xi为第i个核函数中心向量;x为样本的输入向量;σ为平滑因子;i=1,2,…,N。

加和层有2种单元,其一是计算模式层各单元输出的加权和,权值为yij,如式(2)所示,称为分子单元。其中j=1,2,…,q,q为输出向量的维数,yij为输入第i个训练样本时输出向量的第j个元素值。另一单元计算模式层各单元的输出之和,如式(3)所示,称为分母单元。若输出向量Y维数为q,加和层单元数应为q+1,即有q个分子单元,1个分母单元。输出层单元个数等同于输出向量维数,即分别计算加和层各分子单元与分母单元的商,得作为预测样本输出向量第j个元素的估算值,如式(4)所示。

由此可见,训练样本决定了所建立网络的基本结构。同其他神经网络技术一样,GRNN也需要教师式监督训练[10],它的非线性映射能力主要由隐层单元的核函数中心和平滑因子决定[10],需优化取值。Specht提出的GRNN对所有隐层单元的核函数采用同一平滑因子,网络的训练过程实质上是一维寻优过程[11]。考虑到各输入自变量的分布往往不同,需对GRNN提出改进,自变量的每维各采用1个平滑因子,因此,网络的平滑因子是一个向量。

2 改进遗传算法对GRNN的优化

搜寻GRNN的最佳网络参数是一个针对多维向量的多峰值优化问题。传统的确定性寻优算法在处理多峰值优化问题时常易收敛于局部最优[12]。基于仿生进化理论的概率搜索技术发展起来的遗传算法是训练神经网络的有效算法[13]。而简单遗传算法全局寻优效率较低,也易产生早熟[14]。因此,采用一种改进的遗传算法(MGA),来寻找模式层神经元核函数中心和平滑因子的全局最优解。

2.1 GRNN参数的编码

采用式(5)所示的m×(n+1)的矩阵C来描述个体染色体的编码结构。一个染色体编码对应特定结构的神经网络。其中m为每个输入样本向量的维数,n为模式层神经元的个数,即输入样本的个数。从而前n列向量表示n个核函数的中心,第n+1列向量对应输入向量各维的平滑因子。这种矩阵式的染色体结构有利于引进改进的交叉算子,即每个输入分量(对应矩阵的每个行向量)分别进行实数编码的算术交叉运算。

2.2 适应度函数的构造

为了确保网络的泛化性能,对训练样本采用缺一交叉预测方法,具体步骤为:

a.由种群的每个个体ak(k=1,2,…,np,np为种群规模)确定GRNN各参数的取值。

b.从训练样本中取出1个样本作为检测样本,其余的样本作为训练样本建立网络。

c.用构建的网络模型计算检测样本的绝对误差err,称其为检测误差。

d.重复b和c,直到所有的训练样本都有1次用于检测,求得检测误差的均方值MSE,如式(6)所示。并将其通过式(7)转换为搜优目标函数,即个体ak的适应度fk。

2.3 改进的遗传算子

2.3.1 自适应交叉率和变异率

简单遗传算法采用固定的交叉率Pc和变异率Pm。Pc和Pm越小,将不易产生新的个体,搜索过程缓慢或停滞不前;若越大,新个体产生的速度就越快,但遗传模式被破坏的可能性也越大,算法将退化成一般的随机搜索算法。根据式(8)和式(9)所示的自适应策略,对适应度低于平均水平的个体采用大的交叉率和变异率,反之根据其适应度的大小采用适合的交叉率和变异率。随着繁衍代数的增加,交叉率和变异率的取值趋于变小,有利于算法的收敛。

2.3.2 多维度交叉算子

常规实数编码的遗传算法采用算术交叉算子,产生的子代个体总体位于父代的连线上,子代的搜索空间将不断收缩,从而导致早熟[15]。故采用多维度交叉算子如式(10)所示,Cg,Cg+1分别为父代和子代染色体结构;˙A,˙B为各元素独立的随机交叉系数向量;α,β分别为其元素,分别与对应的染色体行向量作乘积运算。因此,父代染色体向量进行交叉操作时,各分量采用不同的随机参数,增加了子代搜索空间的维度,可有效避免早熟,提高全局寻优效率。

2.3.3 精英选择策略优化算子

通过引入精英选择策略,按一定概率将父代优良个体与通过交叉、变异产生的新一代群体共同组成子代种群。这样提高种群的鲁棒性,不会由于偶然产生较劣个体偏多时,影响进化的程度。

3 产量检测动态标定模型

基于光电转换原理的棉花流量在线测量系统的基本组成和原理如图2所示。光电探测输出的数字脉冲信号由前端模块采集、运算转换成相应数字信息,输出到控制器中的传感器动态模型进行标定运算,从而得到对真实流量的估计。

图2 棉花测产子系统基本组成

3.1 标定模型的构建及训练

测产系统流量传感器有5路信号采集单元分布于输棉管道侧面,分别传输到控制器作为标定模型输入量;另外引入管道风机转速F,预留为输送气力流速对流量的影响因素。因此,网络模型输入变量由6个作用分量组成,输出变量仅为流量。故取GRNN的输入层单元数P=6,输出层单元数M=1。在运用MGA优化网络参数时,设置操作参数为:种群规模np=100;最大进化代数genm=200;交叉率和变异率采用自适应调整,令常数(a,b)分别为(0.95,0.5)和(0.2,0.05)。部分训练样本如表1所示。在搭建的试验平台上,记录了固定风机转速下的75组流量的实测数据(共取25个流量值点进行标定,每个点进行3次试验)及对应计算流量值作为整个系统样本数据。取其中60组样本数据作为训练样本,15组样本数据作为验证样本。建立标定模型的主要步骤为:

表1 实测传感器输出及对应流量数据(部分)

a.生成规模为np的初始种群。

b.根据2.2节适应度函数的计算方法,计算每个个体的适应值。

c.采用精英选择策略,保留一定比例适应度值大的优良个体。

d.其余个体执行选择、交叉和变异操作,与保留的优良个体共同组成新一代种群。

e.判断是否满足终止条件,若是,求出最优解;或否,转至b。

算法程序整体流程如图3所示。最终根据MGA优化得到的参数建立GRNN动态标定模型。以上算法程序均在Matlab软件中编程实现。其中MGA的遗传算子程序采用在英国谢菲尔德大学提供的基础遗传工具箱,结合引进的染色体结构和改进遗传策略进行改编实现;GRNN建模部分程序参照Matlab自带的神经网络工具箱函数,按可变的基数中心和多维平滑因子进行改动编写。程序运行后得到种群进化情况如图4所示。可看出,经过约70代种群就已经进化到较高程度,增长趋于缓慢。

图3 算法流程

3.2 模型预测性能评估

用遗传算法优化后的GRNN模型和选作对比的BP神经网络模型(6-4-1网络结构,隐含层取4个节点,采用相同的训练样本),分别对15组验证样本进行了性能评估。此外还试验了3组随机流量试验的总量数据以检测标定模型对总质量的统计精度。试验对比结果如表2所示。从评估结果可以看出,运用GRNN模型建立的传感器动态标定模型对棉花流量输出检测的平均相对误差约为3%,略小于BP模型预测的相对误差,但误差均方值则远小于后者,可见其在多维输入和小容量样本下的精度和稳定性都优于BP模型。

图4 种群进化过程(终止条件设为达到最大进行代数)

表2 验证样本的预测精度评估

4 结束语

采用改进的遗传算法优化广义回归神经网络的核函数中心与平滑参数,并应用于棉花产量测量系统传感器动态标定模型中。经实际训练和应用结果的对比,表明所建立的标定模型具有良好的回归能力和测量精度,在棉花测产系统的进一步完善和产品化研究中显示了重大应用潜力,也为其他非线性关系的模型预测提供了新的思路。

[1]汪懋华.“精细农业”发展与工程技术创新[J].农业工程学报,1999,15(1):1-8.

[2]Yong Yan.Mass flow measurement of bulk solids in pneumatic pipelines[J].Measurement Science and Technology,1996,7(12):1687-1760.

[3]张彦娥,张 漫,张文革,等.采棉机测产系统数据采集与处理的试验研究[J].农业机械学报,2005,36(4):95-98.

[4]刘仁学,金 锋,陆增喜,等.单支管中气固两相流质量流量测量的新方法[J].东北大学学报(自然科学版),1999,20(4):369-372.

[5]Moody F H,Olson M W,Helming S L.Ag leader technology insight cotton yield monitor[R].USA:Beltwide Cotton Conferences,2007.

[6]安光辉,马 蓉,芦 帅,等.棉纤维质量密度光学检测模型的优化[J].农业工程学报,2012,28(10):253-258.

[7]刘开云,乔春生,刘保国.基于遗传-广义回归神经元算法的坞石隧道三维弹塑性位移反分析研究[J].岩土力学,2009,30(6):1805-1809.

[8]谷志红,牛东晓,王会青.广义回归神经网络模型在短期电力负荷预测中的应用研究[J].中国电力,2006,39(4):11-14.

[9]施 彦,韩力群,廉小亲.神经网络设计方法与实例分析[M].北京:北京邮电大学出版社,2009.

[10]Specht D F.A general regression neural network[J].IEEE Transactions on Neural Networks,1991,2(6):568-576.

[11]Tomandl D,Schober A.A modified general regression neural network with new efficient training algorithms as a robust‘black box’-tool for data[J].Neural Network,2001,14(8):1023-1034.

[12]郑启富,周兆良,徐明仙.遗传算法在环己醇/环己酮硝化氧化反应动力学模型参数估计中的应用[J].化工技术与开发,2002,31(4):5-7.

[13]Naveen N,Ravi V,Rao C R.Rule extraction from differential evolution trained radial basis function network using genetic algorithms[C].2009IEEE International Conference on Automation Science and Engineering,2009.152-157.

[14]王国昌,吕学菊.用广义回归神经网络和遗传算法分析产量递减[J].新疆石油地质,2006,27(1):90-93.

[15]田雨波.混合神经网络技术[M].北京:科学出版社,2009.

猜你喜欢

训练样本标定交叉
使用朗仁H6 Pro标定北汽绅宝转向角传感器
人工智能
“六法”巧解分式方程
基于匀速率26位置法的iIMU-FSAS光纤陀螺仪标定
宽带光谱成像系统最优训练样本选择方法研究
船载高精度星敏感器安装角的标定
融合原始样本和虚拟样本的人脸识别算法
连数
基于稀疏重构的机载雷达训练样本挑选方法
连一连