APP下载

基于近红外光谱定量分析技术对大米年际的研究

2022-02-17王欣卉宋雪健

农产品加工 2022年1期
关键词:预测值预处理光谱

王欣卉,宋雪健

(黑龙江八一农垦大学食品学院,黑龙江大庆 163319)

近年来,发展最快的绿色分析技术之一近红外光谱技术(Near Infrared Reflectance Spectroscopy,NIRS) 以其快速、便捷、无破坏性等优点在诸多行业中被广泛使用[1-2]。在近红外光谱区内(780~2 526 nm) 隐藏着丰富的主体化学键的光学信息和含氢基团,如O-H、C-H、P-H 和N-H 等,由于物质分子中原子团的能级跃迁,引发近红外光以非谐振性振动而产生的倍频和合频光谱吸收区域,进而得到不同的近红外光谱数据[3-4]。近红外光谱图像会随着物质中分子间、分子内构造与成分含量的变化而改变,这样使每种物质具有稳定、独特的光谱特点。但是,其光谱会出现谱带叠覆等因素的干扰,稳定性、精度、灵敏度会大幅下降,因此通过与化学计量学、数学进行结合,对原始光谱进行处理可以改善这一问题。

化学计量学包括线性回归方法(主成分回归法、偏最小二乘法、多元线性回归法) 和非线性回归方法(ANN)[5],其中偏最小二乘法应用较为广泛。Das Bappa 等人[6]研究发现在多元模型中,偏最小二乘回归法对水稻作物叶片含水量的预测效果最好(训练和验证的RPD 分别为6.33 和4.06)。路辉等人[7]利用近红外光谱技术对有粳米、糯米和籼米的90 个大米品种的营养成分进行检测,研究表明大米直链淀粉、蛋白质、脂肪、水分含量的近红外光谱检测模型检测精度较高。王朝辉等人[8]利用近红外光谱技术结合偏最小二乘法对来自松原的368 个大米样品进行品种鉴别研究,结果表明5 个大米品种的正确识别率为100%。

采用近红外光谱技术结合偏最小二乘法对不同年份的大米进行检测鉴别,旨在为了快速高效地鉴别出不同年份的大米。

1 材料与方法

1.1 试验材料

试验于2019 年、2018 年、2017 年在水稻成熟后,在黑龙江省方正县采用5 点随机取样法进行采样,其中各年份的样品均为50 份,总计150 份。

1.2 仪器与设备

FC2K 型砻谷机,日本大竹制作所产品;VP-32型实验碾米机,日本山本公司产品;FW100 型高速万能粉碎机,天津泰斯特仪器有限公司产品;TENSORⅡ型傅里叶变换近红外光谱仪,德国布鲁克(北京) 科技有限公司产品。

1.3 试验方法

1.3.1 大米样品的前处理

为控制变量,将采集的稻谷进行统一的加工处理,经过晾晒、脱离、砻谷、碾米及粉碎,过100 目筛,备用。

1.3.2 样品的分类

分别随机将3 类样品的2/3 作为建模集合,1/3作为验证集合。

样品分类见表1。

表1 样品分类/个

1.3.3 大米原始光谱的采集

在环境温度为25±1 ℃,相对湿度为20%~30%的条件下,取100 g 大米于样杯中,置于近红外光谱仪进行光谱采集,扫描64 次,取平均值,分辨率8 cm-1,波数范围为12 000~4 000 cm-1。

1.3.4 检测模型的建立与验证

(1) 定量分析模型的建立。将2019 年的样品赋值为1,2018 年的样品赋值为0,2017 年的样品赋值为-1,对原始光谱的预处理方式有矢量归一化、减去一条直线、多元散射矫正、一阶导数+ 平滑(5,9,13,17,21,25,下同)、一阶导数+ 矢量归一化+ 平滑、一阶导数+ 减去一条直线+ 平滑、一阶导数+多元散射矫正+平滑、消除常数偏移量、最小-最大归一化、内部标准,化学计量学的方法为偏最小二乘法,其中根据均方根标准误差(Root Mean Square Error of Cross Validation,RMSECV) 越小建模效果越好,定向系数R2越大越好。

式中:Ai——大米样品比例的实际值;

Bi——近红外光谱法的预测值;

n——校正集样品数。

(2) 模型的验证。利用OPUS 7.5 软件的定量分析模块进行测定。

2 结果与分析

2.1 大米样品的原始光谱分析

大米样品的原始光谱图见图1。

图1 大米样品的原始光谱图

由图1 可知,波数在8 696~8 000 cm-1范围内的8 333 cm-1吸收峰是-CH 键二级倍频引起的。由-NH2的不对称振动所引起的7 000~6 500 cm-1处的吸收峰。在5 500~5 000 cm-1范围内的5 166 cm-1处吸收峰主要是糖类及蛋白等大分子中-NH 键、-CH键、-OH 键及C=O 键的合频吸收区间[9-10]。

2.2 大米样品的定量分析模型

在采集原始大米样品光谱图时,会受到高频率的噪声、基线漂移、散射及样品分布不均匀的因素影响,导致检测精度下降,因此需要对原始光谱进行预处理。为了使全波长(1 2000~4 000 cm-1) 范围内采集的信息较为全面地利用,试验采用在全波长范围内建模。

不同预处理方式对定量分析模型的影响见表2。

由表2 可知,在全波长范围内采用一阶导数+5点平滑的预处理方式结合偏最小二乘法建立的定量分析模型效果较好,其RMSECV 为0.087,R2为98.85,维数为7。

表2 不同预处理方式对定量分析模型的影响

大米的预测值与真实值相关图见图2,定量分析模型的RMSECV 与维数相关图见图3。

图2 大米的预测值与真实值相关图

图3 定量分析模型的RMSECV 与维数相关图

2.3 模型的验证

以大米样品的预测值在1±0.5 的区间内为2019年的大米,以此类推。由表3 可知,定量分析模型对2019 年和2018 年的大米样品进行验证的正确率高达100%,对2017 年大米样品的正确鉴别率为94.1%。

验证结果见表3。

表3 验证结果

3 结论

采用近红外光谱技术对2019—2017 年的150 份大米进行鉴别研究。结果表明,在全波长范围内采用偏最小二乘法结合一阶导数+5 点平滑的预处理方式建立的模型效果较高,对2019 年和2018 年大米样品的正确鉴别率高达100%,对2017 年大米样品的正确鉴别率为94.1%。因此,采用近红外光谱技术可以实现对大米新陈度的快速检测研究。

猜你喜欢

预测值预处理光谱
非水溶剂预处理木质纤维原料研究进展
不同预处理对铁皮石斛热风干燥特性及品质的影响
煤炭矿区耕地土壤有机质无人机高光谱遥感估测
手术器械预处理在手术室的应用
污泥预处理-厌氧消化体系的能源经济性评价
AI讲座:ML的分类方法
自体荧光内镜对消化道肿瘤诊断临床应用分析
郭守敬望远镜获取光谱数破千万
浅析光谱技术在200 nm以上和以下尺度范围内的不同
季节模型在某医院月门诊量预测中的研究与应用