基于近红外光谱的陈化大米定性鉴别和掺假分析方法
2023-05-30倪金索丽敏刘海龙
倪金 索丽敏 刘海龙
摘 要:大米是我国主要的粮食之一。近年来将陈大米冒充新大米售卖的现象在市场上层出不穷,严重扰乱了市场秩序。该文基于近红外光谱与机器学习方法相结合,提供了一种陈化大米以及不同程度的混掺大米的定性定量检测方法。研究中将原始近红外光谱数据采用标准正态变量变换预处理后,建立核极限学习机分别用于陈化大米的定性判别和掺假大米的定量分析,其准确度和R2分别达到90%和0.889 2。引入北方苍鹰优化算法用于模型的两个重要参数寻优,结果表明北方苍鹰优化算法能有效提高核极限学习机的性能,测试集预测准确度和R2分别提高约5%和0.054 1,为陈化大米的定性定量鉴别提供了新方法。
关键词:陈化大米;掺假大米;近红外光谱;群体智能优化算法;机器学习
Abstract: Rice is one of the main grains in China. In recent years, the phenomenon of passing off old rice as new rice for sale has been rampant in the upper echelons of the market, seriously disrupting market order. This article combines near-infrared spectroscopy with machine learning methods to provide a qualitative and quantitative detection method for aged rice and mixed rice to varying degrees. After preprocessing the raw near-infrared spectral data using standard normal variable transformation, a kernel limit learning machine was established for qualitative discrimination of aged rice and quantitative analysis of adulterated rice, with accuracy and R2 reaching 90% and 0.889 2, respectively. Introducing the northern goshawk optimization algorithm for optimizing two important parameters of the model, the results show that the northern goshawk optimization algorithm can effectively improve the performance of the kernel limit learning machine, with a prediction accuracy and R2 improvement of about 5% and 0.054 1, respectively, for the test set. This provides a new method for qualitative and quantitative identification of aged rice.
Keywords: aged rice; adulterated rice; near-infrared spectroscopy; population intelligence optimization algorithm; machine learning
大米是我國主要的粮食作物之一[1]。随着社会经济的发展,大米的质量问题逐渐引起了人们的关注。其中,大米的陈化和掺假是一个突出的问题。传统的大米鉴别方法主要依赖于人工经验和化学分析技术,普遍存在分析周期长、操作复杂、成本高等问题[2-3]。因此,需继续探索更加准确、快速、稳定的大米鉴别方法[4]。
本文在基于近红外光谱数据的基础上采用北方苍鹰优化算法(Northern Goshawk Optimization,NGO)对核极限学习机(Kernel Extreme Learning Machine,KELM)的两个重要参数进行寻优并建立模型[5-6]。提出一种新的大米定性鉴别和掺假定量分析方法。通过验证,该方法在陈化大米的鉴别和掺假定量分析中取得了很好的效果,对于解决陈化大米鉴别和掺假问题具有重要的实际意义。
1 材料与方法
1.1 材料
实验样品为2017年和2022年水稻成熟后,于黑龙江省建三江市七星农场采用五点式随机采样法获取的五优稻4号,将其脱粒碾磨至精白米后作为研究样品。其中新大米样品为2022年收获大米,掺假大米样品为将2017年收获的大米按照不同比例(25%、50%、75%)掺入2022年收获的大米中,陈化大米样品为2017年收获大米。采用高精度电子秤(武义银利电子有限公司)取(5±0.02)g作为一份样品,共计新大米30份样品、掺假大米90份样品、陈化大米30份样品。
1.2 仪器与设备
TANGO近红外光谱仪,德国布鲁克(北京)科技有限公司。
1.3 实验方法
1.3.1 光谱预处理
对原始光谱数据进行标准正态变量变换(Standard Normal Variate,SNV)预处理,用于消除颗粒不均等原因产生的噪声信息,原理为样品光谱数据各波数点的吸光度符合一定分布,计算时将每个样品的原始光谱减去理想光谱,再除以标准差[7-8]。SNV公式为
1.3.2 模型的建立
极限学习机(Extreme Learning Machine,ELM)是提出的一种机器学习模型[9],由于其可以自动生成输入层和隐含层之间的权重和偏差值,省去了参数的设定和迭代试错,具有操作简单、建模速度快等优点。为进一步提高ELM的性能,在其基础上将核函数加入建模过程,构成核极限学习机(KELM),其原理是利用核函数代替ELM中隐含层的特征映射,达到将数据升维的目的,大幅提高了模型的计算精度与泛化能力,并且该模型在面对分类任务和回归任务时都能表现出较好的效果。但KELM对建模中的核函数γ与正则化参数C过分依赖,二者的取值对预测结果有决定性作用。目前γ与C值的设定多采用人工调参选取,严重降低了建模时的快速性和稳定性。为解决这一问题,该文引入北方苍鹰优化算法(NGO)对以上两个参数进行寻优。NGO是一种模拟的北方苍鹰捕猎行为的群体智能优化算法,其思想是在输入模式与目标模式之间显式地建立一个映射关系,通过不断迭代寻得最优的建模参数。该算法在弥补了原有不足的同时也提高了预测准确率和置信度。
1.3.3 基于NGO-KELM的陈化大米定性鉴别方法
分别建立KELM分类模型和NGO优化后的KELM分类模型。将新鲜大米30份、掺假大米90份以及陈化大米30份共计150份样本数据随机按照7∶3的比例分为训练集(105份)和测试集(45份)。采用训练集和测试集的预测准确度和F1值作为模型的性能评价指标,并绘制混淆矩阵。
1.3.4 基于NGO-KELM的陈化大米掺假定量分析方法
基于上文定性分析,分别建立KELM回归模型与NGO优化后的KELM回归模型,对掺假样品进行掺假量的定性分析,探讨KELM模型和NGO-KELM模型对新鲜大米中掺杂陈化大米量的预测能力。将新鲜大米30份(掺假量0%)、掺假大米90份(掺假量25%、50%、75%)、陈化大米30份(摻假量100%)共计150份样本按照7∶3的比例随机分为训练集(105份)和测试集(45份)。对于定量预测模型采用决定系数R2和RMSE作为性能评价指标,并绘制柱状图来反映预测结果。
2 结果与分析
2.1 定性实验结果分析
分别建立KELM模型和NGO-KELM模型,对比二者准确度和F1值并绘制混淆矩阵从而确定模型的性能,实验结果见表1。NGO-KELM模型的训练集和测试集准确度与F1值均高于未优化的KELM模型(NGO-KELM测试集的混淆矩阵见图1),其测试集准确度提高约5%,说明NGO能有效提高KELM模型的分类准确度。
2.2 定量实验结果分析
分别建立KELM模型和NGO-KELM模型进行实验发现,利用NGO优化的KELM模型的定量预测表现也有显著的提升,结果见图2。
NGO-KELM模型测试集决定系数R2和RMSE分别提升了0.054 1和0.023 3,得到了较理想的掺假率检测精度,见表2,该方法显著优于传统方法。
3 结论
基于NGO-KELM实现了陈化大米的定性鉴别和掺假定量分析。通过近红外光谱设备采集标准样品的信息,并采用NGO优化算法对KELM模型进行了优化。建立的模型具有较高的准确度和稳定性,可以有效鉴别陈化大米,同时能对其掺假进行定量分析,为陈化大米的定性鉴别和掺假定量分析提供了一种新的分析方法。
参考文献
[1]高杨,范必威.大米品质的评价及其主要影响因素[J].广东微量元素科学,2005(12):12-16.
[2]JIAMYANGYUEN S,WICHAPHON J, BOONMEEJOY J.Classification of rice cultivars by using chemical, physicochemical, thermal, hydration properties, and cooking quality[J].Food and Applied Bioscience Journal,2019,2:42-62.
[3]赵卿宇,王占占,陈博睿,等.大米储藏期间风味品质的变化研究[J].中国食品学报,2021(6):203-215.
[4]唐玮娜,刘静炎,陈志华,等.粮食收购中主要采用的新陈度检测方法[J].粮食与饲料工业,2016(10):61-62.
[5]DEHGHANI M,HUB?LOVSK? ?,TROJOVSK? P.Northern goshawk optimization: a new swarm-based algorithm for solving optimization problems[J].IEEE Access,2021,9:162059-162080.
[6]LIU X W,WANG L,HUANG G B,et al.Multiple kernel extreme learning machine[J].Neurocomputing,2015,149:253-264.
[7]RINNAN ?,VAN DEN BERG F,ENGELSEN S B.Review of the most common pre-processing techniques for near-infrared spectra[J].TrAC Trends in Analytical Chemistry,2009,28(10):1201-1222.
[8]BARNES R J,DHANOA M S,LISTER S J.Standard normal variate transformation and de-trending of near-infrared diffuse reflectance spectra[J].Applied spectroscopy,1989,43(5):772-777.
[9]HUANG G B,ZHU Q Y,SIEW C K.Extreme learning machine: theory and applications[J].Neurocomputing,2006,70(1/3):489-501.