基于改进离散粒子群算法的青贮玉米原料含水率高光谱检测
2019-01-18田海清赵志宇张丽娜
张 珏,田海清,赵志宇,张丽娜,张 晶,李 斐
基于改进离散粒子群算法的青贮玉米原料含水率高光谱检测
张 珏1,2,田海清1※,赵志宇1,张丽娜2,张 晶1,李 斐3
(1. 内蒙古农业大学机电工程学院,呼和浩特 010018;2. 内蒙古师范大学物理与电子信息学院,呼和浩特 010020; 3. 内蒙古农业大学草原与资源环境学院,呼和浩特 010019)
快速、无损和准确检测青贮玉米原料含水率,对确保青贮玉米发酵品质、推动青贮产业健康快速发展有重要现实意义。为探究高光谱技术在青贮玉米原料含水率检测方面的可行性,研究通过高光谱成像系统获取青贮玉米原料高光谱图像并利用烘箱加热法测定实际含水率。在粒子更新方式和惯性权重2个方面对传统离散粒子群算法(discrete binary particle swarm optimization,DBPSO)进行优化,提出基于改进型离散粒子群算法(modified discrete binary particle swarm optimization,MDBPSO)的特征波段优选方法,并利用相关系数分析法(correlation coefficient,CC)、DBPSO和MDBPSO法提取原料含水率高光谱特征变量,基于全波段反射光谱(total spectral reflectance,TSR)和特征波段反射光谱建立青贮玉米原料含水率预测模型。结果表明,MDBPSO优选特征波段适应度函数的收敛精度和收敛效率较DBPSO法均有明显改善,最优适应度值由0.761 6提高至0.812 3,函数收敛迭代次数由280次降低至79次。MDBPSO-PLSR预测模型的建模精度和预测精度均高于CC-PLSR、DBPSO-PLSR和TSR-PLSR预测模型,其校正集决定系数R2和均方根误差RMSEC (root mean square error of calibration)分别为0.81和0.032,预测集决定系数R2和均方根误差RMSEP(root mean square error of prediction)分别为0.80和0.045。该研究表明,利用高光谱图像技术检测青贮玉米原料含水率具有较高的精度,研究可为后续开发青贮玉米原料水分快速检测仪器提供借鉴方法。
粒子; 水分; 光谱分析; 高光谱; 粒子群; 青贮玉米; 特征波段
0 引 言
青贮玉米是把玉米乳熟后期至蜡熟期收获的地上部分植株揉碎切短后,经过加工、密封、贮藏发酵后制成的1种营养丰富的饲料[1]。青贮玉米原料含水率影响整个青贮过程的排汁、压实程度以及微生物活动,进而影响青贮玉米饲料发酵品质[2],因此,准确、快速地进行原料含水率检测具有重要意义。
传统含水率检测通常采用电烘箱加热、红外加热、微波加热等物理干燥方法[3],该方法检测精度较高,但存在耗时费力、过程冗长繁琐、对样本有损、时效性差等弊端[4],且难以满足生产实践中对大范围玉米原料含水率实时、无损的检测需求。利用光谱技术进行含水率检测具有快捷、无损的优点,而传统的光谱监测方法均采用非成像光谱仪进行定量分析,该方法只局限于“点”尺度的研究,而以点代面采样方式无法准确反映整个样本真实信息[5]。
高光谱图像包含面层次的光谱信息与波段丰富的图像信息,目前国内外已有学者基于高光谱成像技术针对作物含水率进行了无损检测研究[6-10]。在应用高光谱图像技术进行参数反演时,由于高光谱数据存在信息量大、波段多且相邻波段信息相关性高等特点[11],特征变量的有效提取则成为模型预测效果优劣的关键环节。如何进行光谱特征变量的有效提取已经成为当前研究热点,如孙俊等[12]采用竞争性自适应加权算法进行高光谱特征波段选择,建立基于人工蜂群算法的油麦菜叶片水分含量预测模型,研究结果显示,该模型预测集决定系数2和均方根误差RMSE分别为0.921 4和2.95%。Digman等[13]将一台可移动的光谱仪集成到自动牧草收割机喷口中,现场采集牧草近红外反射光谱及水分含量,利用主成分分析法提取光谱特征变量,分别建立全株青贮玉米和紫花苜蓿含水率模型,研究发现,两种牧草交叉验证均方根误差RMSECV分别为3.3%和3.7%。Cozzolino等[14]采集400~2 500 nm青贮玉米样品的反射光谱,并利用标准正态变量结合去趋势法、多元散射校正等光谱预处理方法建立青贮玉米的干物质、粗蛋白、酸性和中性洗涤纤维等品质参数的偏最小二乘预测模型,研究表明,各品质参数预测模型决定系数2均在0.8以上。Zhou等[15]利用第4层小波分解提取特征波段建立莴苣叶片含水率偏最小二乘回归预测模型,有效实现了莴苣叶片含水率定量检测及分布可视化。
上述研究主要利用原始光谱或衍生变量进行特征变量选择,多采用“单向”方式提取特征变量,特征变量只会单方面影响模型的反演精度,预测结果的优劣却不能干预特征变量的选择,从而限制了光谱信息的有效提取,导致模型反演精度降低。因此,研究一种有效的“反馈型”特征变量智能提取方法,将模型的反演精度作为特征变量的提取标准,利用少数关键变量代替全谱段信息,既可降低模型运算量和复杂度,又可提高模型稳定性和准确性。
本文利用高光谱图像系统采集青贮玉米原料反射光谱信息,并对原料反射光谱进行标准正态变量校正。为提高特征波段提取效率,对经典离散粒子群算法(discrete binary particle swarm optimization,DBPSO)进行改进,建立基于改进型离散粒子群算法(modified discrete binary particle swarm optimization, MDBPSO)优选特征波段的原料含水率偏最小二乘回归[16](partial least-squares regression, PLSR)模型。对比采用相关系数分析法(correlation coefficient, CC)和DBPSO法优选出的特征波段对PLSR模型精度的影响,研究基于高光谱数据源的MDBPSO- PLSR模型在青贮玉米原料含水率反演中的适用性。
1 材料与方法
1.1 试验材料与水分测定
本试验以青贮玉米原料为研究对象,样品在2017年8月购于内蒙古呼和浩特市托克托县,玉米品种为佳良99号。将采集到的青贮玉米原料置于真空袋,放入冰箱冷藏,共制备样品238份。采用热烘箱加热法测定原料含水率,依据《饲料中水分的测定》[17]测定含水率。具体步骤如下:
1)将称量瓶放入103 ℃的干燥箱中,干燥30 min后取出,在干燥器中冷却至室温,记录称量瓶质量1;
2)称取5 g(2)青贮玉米原料,置于已烘干至恒质量的称量瓶内,放入103 ℃的干燥箱4 h,取出后将称量瓶放在干燥器内冷却至室温,记录称量瓶和试料干燥后质量;
3)将称量瓶再放入干燥箱1 h,冷却称其质量,如此重复,直至称量值的变化小于试料质量的0.1%。记录称量瓶和试料干燥后最终质量3。
青贮玉米原料含水率计算公式如式(1)。
式中1为称量瓶质量,g;2为试料质量,g;3为称量瓶和试料干燥后最终质量,g。
采用上述烘干法得到的青贮玉米原料整体含水率范围为26.09%~82.91%,平均含水率为67.02%,样本含水率值主要集中在65.62%~78.94%区间,占总样本数的78.65%。
1.2 高光谱图像采集
试验采用五铃光学(ISUZU OPTICS)高光谱成像系统,系统主要包括:高光谱图像光谱仪(ImSpector V10E型,Spectral Imaging Ltd, Oulu,芬兰)、CCD相机(IGV- B1620型,Imperx,美国)、2个150 W的卤素灯(3900型,Illuminatior,Illumination科技)、1个直流可调节光源(2900型,Illumination,美国)、移动控制平台(IRCP0076-1 COM, 台湾)和计算机等部件组成。高光谱摄像机光谱范围为383~1 004 nm,光谱分辨率为2.8 nm。
试验开始前,将系统预热30 min以消除基线漂移的影响,然后对光谱仪进行调焦。设置系统曝光时间为7.6 ms,电控移动平台速度为5.04 mm/s,高光谱图像采集时,将样本置于容器内摊平压实放在移动平台上,图像分辨率选择800×428像素,通过高光谱图像采集软件得到383~100 4 nm范围428个波段下的样本高光谱图像。
1.3 高光谱图像黑白校正及平均光谱提取
为减弱光照不均匀及相机暗电流对光谱信息的影响,在数据处理前对高光谱图像进行黑白校正[18]。于采集青贮玉米原料样本相同的环境条件下,借助反射率为99%的标准白色校正板采集全白标定图像光谱,封闭镜头采集全黑标定图像光谱,对原始图像光谱按照式(2)进行校正[19]。
式中为黑白校正后样本光谱反射率;I为原始样本反射的光谱强度;I为标准校正黑板反射的光谱强度;I为标准校正白板反射的光谱强度。
使用ENVI 5.3软件对采集到的高光谱图像进行光谱提取,设定叶片伪彩色图像选择谱的通道R为650 nm,G为550 nm,B为450 nm,避开样本边缘、反光严重及暗黑区域,手动选取大小为20×20像素的正方形区域作为感兴趣区域(region of interesting,ROI),区域内包括图1a所示的全株玉米老叶、新叶、嫩叶、秸秆表皮、破碎秸秆及籽粒等代表性部位。通过计算ROI内所有像素点的平均值,最终得到每个样本的平均高光谱数据,图1b为青贮玉米原料平均反射曲线。
1.4 数据预处理方法
标准正态变量校正(standard normal variate,SNV)方法是假设每个波段的光谱值均满足正态分布等标准数据分布,利用假设数据分布信息对已知光谱进行修正补偿,用于消除或减弱粒子散射对光谱数据产生的影响[20]。SNV变换公式如式(3)。
1.5 特征波段提取方法
1.5.1 相关系数(correlation coefficient,CC)分析法
CC分析法是一种常用的特征波段提取方法[21],将校正集光谱阵中的每个波长对应的吸光度向量与样本矩阵向量进行相关性计算,得到波长-相关系数的变化曲线,再选择一定阈值范围的极值点作为敏感波长。
1.5.2 离散粒子群优化算法及改进
粒子群算法是由J.Kennedy和R.C.Eberhart受鸟群觅食过程中的行为特征启发,于1995年提出来的1种群体智能随机搜索算法[22]。假设由若干粒子构成的1个种群在维空间搜索最优位置,每个粒子由其速度和位置2方面向量信息表示,第个粒子的速度和位置分别表示为v=(v1,v2,…,v),x=(x1,x2,…,x)。
算法采用适应度函数评价粒子当前位置的优劣,经过多次迭代后,找到最优解或近似最优解。粒子在其第(1≤≤)维的位置和速度的更新方式见式(4)、(5)。
式中为惯性权重;1、2为学习因子;1、2为0~1随机数;1、1分别为粒子在+1次迭代更新后的速度和位置;、分别为粒子在次迭代后的速度和位置;为第次搜索时粒子的历史最优解对应位置;为第次搜索时所有粒子全局最优解对应位置。
离散粒子群算法[23]的每个粒子均通过二进制编码表示,粒子速度决定粒子位置取0或1的概率,利用sigmoid函数将速度映射到[0, 1]区间计算对应位置状态的概率,(1)表示粒子位置取1的概率,(1)与粒子速度1的数学关系见式(6)。速度越大,粒子对应位置为1的概率越大,反之,对应位置为1的概率则越小。此时粒子速度更新公式不变,位置依据式(7)更新。
式中rand( )是产生(0, 1)随机数的函数。
DBPSO算法依靠群体之间的合作与竞争来迭代,一旦有粒子发现当前最优位置,其它粒子迅速向其靠拢,当粒子速度接近零时,种群多样性会逐渐丧失,粒子群陷入局部最优邻域后停止搜索其它区域,从而容易陷入局部最优,发生“早熟”收敛[24]。为克服传统DBPSO算法的上述劣势,保证优选特征波段更具针对性且更为有效,本文提出MDBPSO算法,分别从粒子位置更新方式和惯性权重2个方面对传统DBPSO法进行改进,具体思路如下:
1)动态调整粒子位置
为避免函数(1)靠近端点值出现“饱和现象”,须限定粒子飞行速度最大值max,将速度限定在[-max,max]区间范围内。当粒子接近最优解时,粒子速度1将趋向于0,(1)值接近0.5,此时算法按照纯随机性模式搜索,局部搜索能力变差,收敛效率降低。为克服传统算法的上述缺陷,在迭代后期对(7)式描述的粒子位置更新方式做如下改进:
设定粒子飞行速度[25]最大值max为4,当速度处于正负边界时,概率映射函数(1)则分别为0.982和0.018,函数值分别接近1和0;当速度介于-max和max时,概率映射函数为减函数,在(0,1)区间范围取值,特别地,当1为0时,映射函数(1)值为0.5。根据上述分析,sigmond函数和位置更新依照式(8)、(9)更新。
注设定边界条件后,当1≥4时,(1)为0.982;当1≤-4时,(1)为0.018。
在粒子接近最优解时,MDBPSO算法依据式(9)对粒子位置进行更新,压缩了粒子的运动空间,使粒子运动范围相对变窄,增强了算法的局部搜索能力,有利于算法实现快速收敛。
2)改进惯性权重
惯性权重[26]对平衡算法的全局搜索能力和局部搜索能力有显著作用,较大的惯性权重可加快粒子飞行速度,提高算法的全局搜索能力,但收敛性相对降低;较小的可减小粒子飞行速度,提高算法收敛效率,但容易陷入局部极值。
鉴于算法在运行前期注重全局搜索,后期需尽快收敛,现对进行线性递减动态调整,调整方式见式(10)。
式中max、min分别为的最大值与最小值,通常情况下,max和min分别取1.2和0.9[27];为当前迭代次数;max为最大迭代次数。
1.5.3 MDBPSO算法提取特征波段
1)粒子编码设计
MDBPSO算法对特征波段选择相当于粒子编码的过程,即把每个波长定义为粒子的一维离散二进制变量,粒子的长度与光谱数据维数相同。对每个粒子,其取值可能为1或0,1表示相应波长被选中,反之表明该波长未被选中,每个粒子的飞行位置即可代表波段选择的1个解。对任何1种波长组合,存在唯一的特征向量与之对应。
2)适应度函数设计
特征选择的目的是找出预测能力最强的特征组合,因此需要一个定量准则来度量特征组合的预测能力[28]。本文使用PLSR模型校正集决定系数2作为评判特征波段适用性标准,根据式(11)构造适应度函数,依照算法所处周期进行分段优化,提高搜索效率,实现波段的合理、高效选择。
3)算法流程
MDBPSO算法流程如图2所示,其搜索步骤简述如下:
①确定粒子群基本参数,包括种群大小、学习因子1和2、惯性权重max和min和最大迭代次数max;
③粒子个体适应度评估:对粒子进行解码,得到粒子个体对应的特征变量的解,将其作为PLSR模型的输入因子,并将校正集样本实测值和预测值的决定系数作为粒子的适应度函数值;
④根据粒子个体和种群历史最优适应值,更新个体粒子历史最优位置和全局历史最优位置;
⑤计算迭代次数=+1,更新粒子速度,并根据确定粒子位置更新方式;
⑥判断终止条件:若max,则跳转到步骤(3);若=max,则终止迭代,对全局粒子最优位置进行解码,得到特征波段提取结果。
上述流程中,为兼顾算法全局搜索能力及局部收敛效率,MDBPSO算法采用2种方式对粒子位置进行更新:当30%max,采用式(4)、(6)、(7)对粒子速度和位置进行更新;为保证算法收敛效率,当30%max 注:t为当前迭代次数;tmax为最大迭代次数。 为减少样本结构背景噪声、表面纹理等因素的影响,对采集的青贮原料高光谱图像原始光谱进行SNV预处理,图3为预处理后原始平均光谱响应曲线。由图3可知,青贮玉米原料光谱反射率在383~635 nm波段呈先降后升的趋势,随后谱线缓慢下降,于680 nm附近形成“红谷”。在680~780 nm的红边区域,光谱反射率迅速增加,并于780~890 nm近红外波段形成1个较高的反射平台,随后谱线下降至965 nm处再次出现吸收谷。 图3 SNV预处理后青贮玉米原料样本高光谱响应曲线 鉴于高光谱数据维数和冗余度较高,且波段间存在较强的相关性,需对全波段光谱进行降维处理。研究分别采用CC分析法、传统DBPSO算法和MDBPSO算法进行青贮玉米原料含水率特征波段的提取。 2.2.1 CC分析法提取特征波段 采用CC分析法对样本反射光谱与原料含水率进行相关性分析,找出相关特性曲线的全部极值点,结果如图4a所示。由图可知,386~560和711~923 nm的相关系数为正,562~710和924~1 000 nm的相关系数为负。选择相关系数绝对值高于0.4的极值点波长变量,如图4b所示,得到404、410 nm等25个特征向量作为特征波段变量。 图4 相关系数分析法提取特征波段 2.2.2 MDBPSO算法提取特征波段 利用MDBPSO法进行特征波提取,并与传统DBPSO法进行比较。具体设置参数如下:DBPSO惯性权重为1;最大迭代次数max为300;MDBPSO惯性权重max和min分别为1.2和0.9;max和-max分别为4和-4;最大迭代次数max为100。2种算法的粒子维数均为428,学习因子1和2均设为2。种群规模分别取20、30、40的条件下,算法均独立运行20次,表1统计了不同种群个数寻优得到最优适应度(optimum fitness value,OFV)的最大值、最小值及平均值,及获取到OFV最大值时算法的迭代次数。 由表1可知,2种算法的OFV值均随种群规模的增加而增大,且在规模值为40时可获得最优结果。程序独立测试运行20次后,DBPSO法最优适应度最大值OFVmax、最小值OFVmin和平均值OFVave分别为0.761 6、0.680 4和0.731 8,其中OFVmax对应的迭代次数为280次;算法改进后,MDBPSO法的OFVmax介于0.786 7~0.812 3之间,OFVmin范围为0.691 6~0.711 2,当为40时,OFVmax、OFVmin和OFVave分别为0.812 3、0.711 2和0.752 2,OFVmax对应迭代次数为79次。综上所述,相较传统DBPSO算法,改进后算法的OFV由0.761 6提高到0.812 3,迭代次数由280降低至79次,收敛效率提高了71.79%,表明MDBPSO的收敛精度和收敛效率均有明显改善。 对2种算法测试后,适应度收敛曲线如图5所示。相同参数下,MDBPSO算法适应度函数值在迭代前期迅速增大,由于迭代过程中通过对惯性权重的动态调整,改进后算法寻优曲线适应度函数值变化较快,在提高收敛精度的同时,寻优成功率亦显著提高,30次迭代后,适应度函数值已达到OFV的95%。在算法迭代后期,粒子群在局部寻找OFV值时,惯性权重和粒子位置的动态调整协同合作,压缩粒子的搜索空间,提高了函数的局部搜索能力,从而降低了算法的时间复杂度,促使适应度函数更为快速地收敛至最优值。算法迭代至60次时,适应度函数值已经基本接近OFV,可见算法改进后收敛效率得到显著提高。MDBPSO法求得函数最佳适应度值为0.812 3,大于传统DBPSO法的0.761 6,表明MDBPSO法优选特征波段对青贮玉米含水率具有较强的表征力。综上所述,MDBPSO算法能够兼顾函数最优适应度的全局搜索和局部准度和鲁棒性。寻优,可有效避免“早熟”现象产生,具有较高的精准度和鲁棒性。 表1 传统离散粒子群与改进离散粒子群算法寻优结果 注:OFVmax、OFVmin和OFVave分别为20次试验测试得到最优适应度的最大值、最小值和平均值。 Note: OFVmax, OFVminand OFVaveare the maximum, minimum and average of the optimal fitness respectively in the 20 test. 图5 DBPSO和MDBPSO算法适应度函数收敛曲线(种群个数为40) 通过DBPSO和MDBPSO法分别提取了188和62个光谱特征向量,2种算法优选特征波段及其位置分布统计分别如图6、7所示。分析发现,2种方法提取的特征变量均在421~520 nm范围分布最多,其次是571~670和871~920 nm。上述3个波段范围内,DBPSO法优选波段个数分别为51、45和15个。MDBPSO法优选波段个数分别为15、11和12个。由此可以推断,青贮玉米原料含水率在可见光区的敏感波段为421~520及571~670 nm,近红外区的敏感波段为871~920 nm。另外,算法优化后提取的特征波段在数量上有所减少,因此算法时间复杂度亦相应降低。 图6 DBPSO和MDBPSO算法优选特征波段 研究采用Kennard-Stone算法对样本进行筛选以划分校正集和预测集,167个样本为校正集,71个样本为预测集。分别以CC分析法、传统DBPSO和MDBPSO法优选特征波段与全波段光谱反射率(total spectral reflectance,TSR)为自变量,建立青贮玉米原料含水率CC-PLSR、DBPSO-PLSR及MDBPSO-PLSR、TSR-PLSR反演模型。绘制样本含水率实测值与预测值分布关系的散点图(图8),并根据校正集、预测集实测值与预测值的决定系数R2、R2和均方根误差RMSEC(root mean square error of calibration, RMSEC)、RMSEP(root mean square error of prediction, RMSEP)对各反演模型进行精度评估。 图7 DBPSO和MDBPSO算法优选特征波段分布 比较4个模型性能发现:TSR-PLSR和CC-PLSR 2个模型的拟合精度较低,校正集决定系数R2分别为0.69和0.70,预测集决定系数R2分别为0.67和0.64。DBPSO-PLSR模型较上述2个模型的性能指标有明显改善,其R2和R2分别为0.76和0.76,MDBPSO-PLSR模型拟合效果最好,散点分布相对贴近1﹕1线,校正集R2和均方根误差RMSEC分别为0.81和0.032,预测集R2和均方根误差RMSEP分别为0.80和0.045,相较其他3个模型在准确度(2)和精确度(RMSE)方面均有显著提高。 注:TSR为全波段光谱反射率,PLSR为偏最小二乘回归法。 青贮玉米作为中国“粮改饲”政策的重要推手,将玉米跨区销售转向就地青贮,极大提高了农业生产的利用效率[29]。原料含水率是青贮玉米品质优劣的关键影响因子,含水率过高容易导致可溶性营养物质随渗出的汁液流失,产生梭酸发酵,含水率过低则不易压实,导致靑贮环境空气含量超标且易发生霉变[30]。因此,建立快速、无损、准确的青贮玉米含水率测定方法,对推动青贮产业健康快速发展有重要意义。 本文提取青贮玉米原料光谱信息,分析不同特征变量提取方法对原料含水率反演模型精度的影响,研究基于改进型粒子群算法的PLSR模型在青贮玉米原料含水率反演预测方面的适用性。研究结果表明,利用全波段光谱和CC分析法建立PLSR模型的预测精度均比较低。分析认为,全波段信息来源较为全面,但波段信息重叠带来的繁杂冗余数据可能导致模型预测精度降低;CC分析法在很大程度上考虑了样本实测值与光谱信息之间的相关度,提取25个特征变量的波长范围比较集中且相邻间隔较小,波长反射率之间表现为极显著相关关系,相关系数最大可达0.996,由此可见,利用CC分析法提取的光谱特征变量之间存在多重共线性,降低了模型精度。此外,单一特征信息面窄且缺少互补信息,干扰信息对模型精度的影响也比较突出。粒子群算法将模型的反演精度作为特征变量的提取标准,能够更加“智能”地提取特征波段,相比原始光谱的428个波段,DBPSO提取的188个特征变量在很大程度上降低了模型的复杂度,但模型的OFV值较小且收敛效率颇低。本文提出的MDBPSO算法使用sigmoid映射函数,对粒子的飞行速度加以限制,根据算法所处周期动态调整粒子群惯性权重、改变粒子位置更新方式。研究表明,MDBPSO法提取特征变量个数由188减少至62个,OFV值由0.761 6提高到至0.812 3,对应迭代次数由280降低至79次。由此可见,算法优化后进一步降低了模型复杂度,在算法收敛效率和模型反演精度2个方面也均有显著提高。此方法较为全面地考虑各波段光谱信息对反演参数的贡献度,可在一定程度上克服或削弱利用传统光谱参数进行生化参数估测易受背景等干扰因素影响的弊端,提高参数反演模型的鲁棒性和准确性。 青贮玉米原料含水率是饲料发酵品质的关键影响因子,为快速、无损检测玉米原料含水率,本研究采集了383~1 004 nm范围青贮玉米原料的高光谱数据,采用SNV校正法对反射光谱进行预处理。分别以CC分析法、传统DBPSO和MDBPSO法优选特征波段与全波段光谱反射率为自变量,建立青贮玉米原料含水率CC-PLSR、DBPSO-PLSR及MDBPSO-PLSR、TSR-PLSR反演模型。研究特征变量提取方法对模型预测精度的影响,探索应用高光谱技术估算青贮玉米原料含水率的可行性,主要结论如下: 1)针对传统DBPSO算法存在收敛性差及容易陷入“局部最优”的缺陷,研究在粒子更新方式和惯性权重2个方面进行改进,提出了一种改进型离散粒子群算法。结果表明,MDBPSO法可有效提取青贮玉米原料含水率特征波段,算法优化后,适应度函数OFV值可由0.761 6提高到至0.812 3,对应迭代次数由280降低至79次,收敛效率提高了71.79%。由此可见,MDBPSO法在收敛精度和收敛效率2个方面均得到显著改善。 2)研究DBPSO和MDBPSO法优选光谱特征波段的分布特征发现,2种方法提取的特征变量均在421~520 nm范围分布最多,其次是571~670和871~920 nm。上述3个波段范围内,DBPSO法优选波段个数分别为51、45和15个,MDBPSO法优选波段个数分别为15、11和12个。综上所述,利用高光谱进行青贮玉米原料含水率反演在可见光区的敏感波段为421~520及571~670 nm,在近红外区的敏感波段为871~920 nm。 3)通过CC分析法、DBPSO和MDBPSO法优选原料含水率高光谱特征变量,建立基于全波段和特征波段反射光谱的玉米原料含水率PLSR预测模型。对比各预测模型性能发现,TSR-PLSR和CC-PLSR 2个模型的拟合精度较低,DBPSO-PLSR模型的性能指标稍有改善,MDBPSO-PLSR的建模精度和预测精度均高于其他3个模型,其校正集决定系数R2和均方根误差RMSEC分别为0.81和0.032,预测集决定系数R2和均方根误差 RMSEP分别为0.80和0.045,该模型在准确度和精确度方面均体现出显著优势。结果表明,应用高光谱图像技术进行青贮玉米原料含水率无损检测具有较高的可行性,研究可为后续物料水分快速检测仪器的开发提供理论依据。 [1] Ferraretto L F, Shaver R D, Luck B D, et al. Silage review: Recent advances and future technologies for whole-plant and fractionated corn silage harvesting[J]. Journal of Dairy Science, 2018, 101(5): 3937-3951. [2] Bruning D, Gerlach K, Weiß K, et al. Effect of compaction, delayed sealing and aerobic exposure on maize silage quality and on formation of volatile organic compounds[J]. Grass Forage Sci, 2018, 73: 53-66. [3] Pu Yuanyuan, Sun Dawen. Vis-NIR hyperspectral imaging in visualizing moisture distribution of mango slices during microwave-vacuum drying[J]. Food Chemistry, 2015, 188: 271-278. [4] 刘志刚,徐勤超. 基于高光谱技术的基质含水率快速测定方法[J]. 灌溉排水学报,2017,36(10):82-86. Liu Zhigang, Xu Qinchao. Rapid determination of matrix moisture content based on hyperspectral technology[J]. Journal of Irrigation and Drainage, 2017, 36(10): 82-86. (in Chinese with English abstract) [5] Zhu Yaodi, Zou Xiaobo, Shen Tingting, et al. Determination of total acid content and moisture content during solid-state fermentation processes using hyperspectral imaging[J]. Journal of Food Engineering, 2016, 174: 75-84. [6] Deng Shuiguang, Xu Yifei, Li Xiaoli, et al. Moisture content prediction in teal leaf with near infrared hyperspectral imaging[J]. Computers and Electronics in Agriculture, 2015, 118: 38-46. [7] Kobori H, Gorretta N, Rabatel G, et al. Applicability of Vis- NIR hyperspectral imaging for monitoring wood moisture content (MC)[J]. Holzforschung, 2013, 67 (3): 307-314. [8] Caporaso N, Whitworth M B, Grebby S, et al. Rapid prediction of single green coffee bean moisture and lipid content by hyperspectral imaging[J]. Journal of Food Engineering, 2018, 227: 18-29. [9] 吴见,谭靖,邓凯,等. 基于优化指数的玉米冠层含水量遥感估测[J]. 湖南农业大学学报:自然科学版,2015,41(6):685-690. Wu Jian, Tan Jing, Deng Kai, et al. Remote sensing monitoring of the corn canopy water content based on the optimized index[J]. Journal of Hunan Agricultural University: Natural Sciences, 2015, 41(6): 685-690. (in Chinese with English abstract) [10] 孙红,陈香,孙梓淳,等. 基于透射光谱的玉米叶片含水率快速检测仪研究[J]. 农业机械学报,2018,49(3):173-178. Sun Hong, Chen Xiang, Sun Zichun, et al. Rapid detection of moisture content in maize leaves based on transmission spectrum[J]. Transactions of the Chinese Society for Agricultural Machinery, 2018, 49(3): 173-178. (in Chinese with English abstract) [11] Yang Chen, Tan Yulei, Bruzzone L, et al. Discriminative feature metric learning in the affinity propagation model for band selection in hyperspectral images[J]. Remote Sensing, 2017, 9(8): 782-798. [12] 孙俊,丛孙丽,毛罕平,等. 基于高光谱的油麦菜叶片水分CARS-ABC-SVR预测模型[J]. 农业工程学报,2017, 33(5):178-184. Sun Jun, Cong Sunli, Mao Hanping, et al. CARS-ABC-SVR model for predicting leaf moisture of leaf-used lettuce based on hyperspectral[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2017, 33(5): 178-184. (in Chinese with English abstract) [13] Digman M F, Shinners K J. Real-time moisture measurement on a forage harvester using near-infrared reflectance spectroscopy[J]. Transactions of the ASABE, 2008, 51 (5): 1801-1810. [14] Cozzolino D, Fassio A, FernáNdez E, et al. Measurement of chemical composition in wet whole maize silage by visible and near infrared reflectance spectroscopy[J]. Animal Feed Science & Technology, 2006, 129 (3): 329-336. [15] Zhou Xin, Sun Jun, Mao Hanping, et al. Visualization research of moisture content in leaf lettuce leaves based on WT-PLSR and hyperspectral imaging technology[J]. Journal of Food Process Engineering, 2017, 41 (2): 1-7. [16] Waseem Amjad, Crichton S O J, Munir A, et al. Hyperspectral imaging for the determination of potato slice moisture content and chromaticity during the convective hot air drying process[J]. Biosystems Engineering, 2018, 166: 180-183. [17] 中华人民共和国国家质量监督检验检疫总局. 饲料中水分的测定:GB/T 6435—2014[S]. 北京:标准出版社,2014: 7. [18] Brook A, Polinova M, Bendor E. Fine tuning of the SVC method for airborne hyperspectral sensors: The BRDF correction of the calibration nets targets[J]. Remote Sensing of Environment, 2018, 204: 861-871. [19] 赵茂程,杨君荣,陆丹丹,等. 基于高光谱成像的青梅酸度检测方法[J]. 农业机械学报,2017,48(9):318-323. Zhao Maocheng, Yang Junrong, Lu Dandan, et al. Detection methods of greengage acidity based on hyperspectral imaging [J]. Transactions of the Chinese Society for Agricultural Machinery, 2017, 48(9): 318-323. (in Chinese with English abstract) [20] 孙红,郑涛,刘宁,等. 高光谱图像检测马铃薯植株叶绿素含量垂直分布[J]. 农业工程学报,2018,34(1):149-156. Sun Hong, Zheng Tao, Liu Ning, et al. Vertical distribution of chlorophyll in potato plants based on hyperspectral imaging[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(1): 149-156. (in Chinese with English abstract) [21] Sun Jun, Lu Xinzi, Mao Hanping, et al. Quantitative determination of rice moisture based on hyperspectral imaging technology and BCC-LS-SVR algorithm[J]. Journal of Food Process Engineering, 2017, 40 (3): 1-8. [22] Kennedy J, Eberhart R. Particle swarm optimization[C]// IEEE International Conference on Neural Networks, Perth, Australia, Proceedings, IEEE, 1995: 1942-1948. [23] Kennedy J, Eberhart R.A discrete binary version of the particle swarm algorithm[C]// IEEE International Conference on Systems, Man, and Cybernetics, Computational Cybernetics and Simulation, IEEE, 1997, 5: 4104-4108. [24] Yang Jun, Zhang Hesheng, Ling Yun, et al. Task allocation for wireless sensor network using modified binary particle swarm optimization[J]. IEEE Sensor Journal, 2014, 14(3): 882-891. [25] 孟常亮,李卫忠,廖勇,等. 基于改进离散二进制粒子群的SVM选择集成算法[J]. 计算机工程与应用,2011, 47(28):166-169. Meng Changliang, Li Weizhong, Liao Yong, et al. SVM selection ensemble algorithm based on improved binary particle swarm optimization[J]. Computer Engineering and Applications, 2011, 47(28): 166-169. (in Chinese with English abstract) [26] 胡清,张强. 基于改进二进制粒子群算法的配电网故障定位[J]. 南京工程学院学报:自然科学版,2016,14(3):77-81. Hu Qing, Zhang Qiang. Fault location of distribution networks based on improved binary particle swarm optimization algorithm[J]. Journal of Nanjing Institute of Technology: Natural Science Edition, 2016, 14(3): 77-81. (in Chinese with English abstract) [27] 刘朔,周康,张杰,等. 基于二进制粒子群的图像分割算法[J]. 武汉工业学院学报,2011,30(4):42-44. Liu Suo, Zhou Kang, Zhang Jie, et al. Image segmentation algorithm based on binary PSO[J]. Journal of Wuhan Polytechnic University, 2011, 30(4): 42-44. (in Chinese with English abstract) [28] 曹引,冶运涛,赵红莉,等. 基于离散粒子群和偏最小二乘的水源地浊度高光谱反演[J]. 农业机械学报,2018,49(1):173-182. Cao Yin, Ye Yuntao, Zhao Hongli, et al. Satellite hyperspectral retrieval of turbidity for water source based on discrete particle swarm and partial least squares[J]. Transactions of the Chinese Society for Agricultural Machinery, 2018, 49(1): 173-182. (in Chinese with English abstract) [29] 郭勇庆,曹志军,李胜利,等. 全株玉米青贮生产与品质评定关键技术[J]. 中国畜牧杂志,2012,48(18):39-43. Guo Yongqing, Cao Zhijun, Li Shengli, et al. Key technologies for silage production and quality evaluation of whole plant corn[J]. Journal of Animal Science Chinese, 2012, 48(18): 39-43. (in Chinese with English abstract) [30] Huart F, Malumba P, Odjo S, et al. In vitro and in vivo assessment of the effect of initial moisture content and drying temperature on the feeding value of maize grain[J/OL]. British Poultry Science, 2018, 1-11. http:// www.tandfonline. com/loi/cbps20. Moisture content dectection in silage maize raw material based on hyperspectrum and improved discrete particle swarm Zhang Jue1,2, Tian Haiqing1※, Zhao Zhiyu1, Zhang Lina2, Zhang Jing1, Li Fei3 (1.010018,;2.010020,; 3.010019,) Moisture content of silage maize raw material affects juice discharge, compaction degree and microbial activity during the whole silage process, and it has further influence on silage fermentation quality. Rapid, non-destructive and accurate detection of moisture content in silage maize raw material issignificant for ensuring the silage maizequality and promoting the silage industry healthy and rapidly. Hyperspectral imagesof silage maize raw material in the visible and near infrared (383-1 004 nm) regions were acquired by the hyperspectral imaging system, and then corresponding moisture content in silage maize raw material were obtained by oven heating method successfully. Thehyperspectral information was extracted from the images by selecting the region of interest (ROI) using the ENVI software. The standard normalized variate (SNV) was applied for eliminating or weakening the effect of particle scattering on original hyperspectral data. The hyperspectral imaging provides much more information including spectral and image information for all the samples of silage maize raw material, however, hyperspectral imagery contains more noise and redundancy. These disturbances made it difficult to meet the needs of fast and effective detection of certain objects. Therefore, it was difficult to apply online industrial applications in daily life directly, and the feature band effective selection for hyperspectral images was very critical. In view of the disadvantages as poor efficiency and easy premature, the traditional discrete particle swarm optimization (DBPSO) was optimized in terms of particle updating method and inertia weight. A modified discrete particle swarm optimization (MDBPSO) was proposed to extract the hyperspectral feature bands effectively. The hyperspectral characteristic variables of raw material moisture content were extracted using the correlation coefficient (CC), DBPSO and MDBPSO method. Partial least squares regression (PLSR) prediction model for silage maize moisture content was established by using full band and characteristic band. The results indicated that the convergence accuracy and efficiency of MDBPSO had a significantly improvement compared with the DBPSO method. When the population number was 40 and the program independent test ran 20 times, for DBPSO, the maximum value of optimal fitness (OFVmax), the minimum value of optimal fitness (OFVmin), and the mean value of optimal fitness (OFVave) were 0.761 6, 0.680 4 and 0.731 8 respectively, and the number of iterations corresponding to the OFVmaxwas 280 times. The OFVmax, OFVmin, and OFVavewere 0.812 3, 0.711 2 and 0.752 2 for MDBPSO, respectively, and the number of iterations corresponding to the OFVmaxwas 79 times. After the improvement of DBPSO method, OFV of the fitness function was increased from 0.761 6 to 0.812 3, the number of iterations was reduced from 280 to 79, and the convergence efficiency was increased by 71.79%. 188 and 62 eigenvectors were extracted by DBPSO and MDBPSO respectively. The characteristic bands selected by the DBPSO method were mainly distributed in 421-520 nm, followed by 571-670 nm and 871-920 nm, and the number of bands was 51, 45 and 15 respectively. The characteristic bands selected by the MDBPSO method were also mainly distributed in the above band, and the number of the wave segments was 15, 11 and 12 respectively. It could be inferred that the sensitive bands of moisture content of silage maize in visible light region are 421-520, 571-670 nm and 871-920 nm in near infrared region. Comparing the performance of the 4 models, the fitting accuracies of TSR-PLSR and CC-PLSR were lower, and the verification set determination coefficients (R2) were 0.69 and 0.70 respectively, and the prediction set determination coefficients (R2) were 0.67 and 0.64, respectively. The DBPSO-PLSR model was improved significantly, and theR2andR2was 0.76 and 0.76 respectively. The DBPSO-PLSR model performed better than the other 3 model: TSR-PLSR, CC-PLSR and DBPSO-PLSR, achieving the highest accuracy withR2of 0.81, RMSEC of 0.032,R2of 0.80, RMSEP of 0.045. The study demonstrated that the application of hyperspectral image technology to the nondestructive testing of the moisture content of silage maize raw material content had high feasibility, and could provide efficient guidance for rapid detecting instrument development. particles; moisture; spectral analysis; hyperspectrum; particle swarm optimization; silage maize; feature band 2018-08-13 2018-11-22 国家自然科学基金项目(41261084);内蒙古自然科学基金项目(2016MS0346) 张珏,博士生,主要从事基于光、电特性的农作物营养及农产品品质诊断研究。Email:zhangjue0428@163.com 田海清,教授,博士生导师,主要从事基于光、电特性的农作物营养、农产品品质诊断研究及农牧业机械智能化研究。Email:hqtian@126.com 10.11975/j.issn.1002-6819.2019.01.035 S816.5; TP391 A 1002-6819(2019)-01-0285-09 张 珏,田海清,赵志宇,张丽娜,张 晶,李 斐.基于改进离散粒子群算法的青贮玉米原料含水率高光谱检测[J]. 农业工程学报,2019,35(1):285-293. doi:10.11975/j.issn.1002-6819.2019.01.035 http://www.tcsae.org Zhang Jue, Tian Haiqing, Zhao Zhiyu, Zhang Lina, Zhang Jing, Li Fei.Moisture content dectection in silage maize raw material based on hyperspectrum and improved discrete particle swarm [J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(1): 285-293. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2019.01.035 http://www.tcsae.org2 结果与分析
2.1 青贮玉米原料反射光谱与预处理
2.2 特征波段提取
2.3 青贮玉米原料含水率预测模型的建立
3 讨 论
4 结 论