APP下载

基于主成分回归分析和偏最小二乘回归法的樱桃糖度检测的研究

2016-10-16刘美娟

分析科学学报 2016年4期
关键词:糖度实测值预测值

原 帅, 张 娟, 刘美娟, 张 骏

(1.烟台大学文经学院信息工程系,山东烟台 264005;2.烟台汽车工程职业学院电子系,山东烟台 265500;3.烟台大学光电信息学院,山东烟台 264005)

烟台大樱桃已获得地理标志保护,其营养价值高,深受广大消费者喜爱。但现阶段对樱桃糖度的检测方法主要采用化学测定法,不能在线检测且效率低。近红外光谱技术能够实现无污染性和在线分析[1,2],在水果和蔬菜等产品的品质分析上被广泛应用。但是传统的傅里叶变换光谱仪体积大,移动很不方便,几乎不能实现野外检测。而便携式光谱仪方便快捷、费用低,已有文献报道在食品和农产品品质检测中得到广泛的应用[3,4]。

目前近红外光谱检测中常用的建模方法很多,最常用的有主成分回归(PCR)法[5]和偏最小二乘回归(PLSR)法[6,7]。国内利用可见-近红外光谱技术检测水果糖度的报道虽很多,但是基于可见-近红外光谱对樱桃糖度进行检测的方法研究很少。郭卫东等人[8]基于连续小波变换(CWT)和GRNN的可见-近红外漫反射光谱研究樱桃糖度,本文首先利用小波变换多尺度分析对樱桃可见-近红外光谱进行预处理(滤波去噪),然后分别采用PCR和PLSR法建立樱桃糖度预测模型,并对两种模型进行验证。

1 实验部分

1.1 实验材料

实验样品采自烟台福山大樱桃园,随机选取50个样本为校正集,20样本为验证集。对样品清洗后晾干,然后在实验室放置12 h以上,以使样品与光谱仪的环境条件相一致。实验前使用酒精消毒的刀片对每个样品切取2 mm左右的薄片,将它们分别编号后置于实验室内(室温20 ℃)备用。

1.2 光谱仪器与测定方法

AvaSpec-2048光纤光谱仪(荷兰,Avantes公司)。该光谱仪测量波段为600~1 100 nm,且体积小、使用灵活,可快速测量。系统采用与光谱仪配套的AvaSoft-Basic标准版软件进行光谱采集。在每个切片样品表面不同点扫描3次求平均值,并作为一次测定的数据。采集完光谱后,将每个切片样品榨汁,采用折射式糖度计进行糖度测定。

1.3 糖度校正模型的建立与评价

本文采用PCR法和PLSR法来建立校正模型。用相关系数(R)、校正均方根误差(RMSEC)和预测均方根误差(RMSEP)来评价该两种模型性能的优劣[9]。

2 光谱数据预处理方法

2.1 极差标准归一化

本文采用极差标准归一化[10]的方法对原始光谱数据进行预处理。归一化处理后,能使每条光谱数据值限定在(0,1)之间,数据分布更加均衡,为样品的特征提取提供可靠的数据源[5,9,10]。极差为每一条光谱的最大值和最小值之差:

(1)

利用极差将原光谱数据进行标准化处理:

(2)

2.2 小波滤波[5,10,11]

由于各种干扰的存在,樱桃光谱特征很微弱且不稳定。为了抑制噪声干扰,本文采用小波变换多尺度分析对樱桃光谱进行滤波,以增强樱桃光谱的内在特征。本文采用小波Daubechies5滤波器对极差标准归一化后的光谱数据进行处理。

3 结果与讨论

3.1 实验数据预处理与分析

图1是样本校正集中某一样品的原始反射率光谱图,由于噪声的存在,很难辨别出樱桃的特征光谱。利用光谱预处理方法对原始光谱进行预处理。如图2所示,预处理后的樱桃光谱比较平滑,光谱形状没有改变,噪声被很好地抑制,樱桃样品光谱的内在特征被很好地反映出来。从图2中可以看出,在630 nm、970 nm附近有明显的特征峰值。

图1 樱桃的原始反射率光谱Fig.1 The original reflectance spectrum of cherry

图2 樱桃光谱归一化后小波分解的第6阶信号Fig.2 The sixth order signal of normalized wavelet decomposition for cherry spectrum

3.2 光谱主成分分析

要利用PCR进行建模,必须将预处理后的光谱进行主成分分析,以降低光谱数据的维度、简化识别模型。主成分分析的结果显示:前4个主成分的方差贡献率分别为58.92%、39.59%、1.26%、0.19%。由此得知,前3个主成分的累计贡献率已达99.77%,能够很好地表征原光谱的信息。因此本文利用前3个主成分得分值来建立主成分回归方程。

3.3 樱桃糖度校正模型的建立

分别利用PCR法和PLSR法建立樱桃糖度校正模型,通过Matlab编程[12],校正集50个样品糖度的预测值与实测值的对应关系如图3所示,其中图3(a)为PCR所建模型的相关图,图3(b)为PLSR所建模型的相关图。从两图中可以看出,由两种方法建立模型所得的预测值和实测值具有较好的相关性,各点均匀的分布在趋势线两侧,而且两个图形非常相似。通过计算得出,由PCR得出50个集样品的糖度预测值与实测值的R为0.9394,RMSEC为0.1384;而由PLSR所建模型的R为0.9396,RMSEC为0.1382。显然这两种方法得出的结果很相近,PLSR模型的性能稍微优于PCR模型。

图3 校正集样品的主成分回归(a)与偏最小二乘回归(b)模型糖度的预测值与实测值相关图Fig.3 Calibration sample sets predicted sugar degree of correlation diagram and the measured value based on PCR (a) and PLSR (b)

3.4 樱桃糖度校正模型的验证

将20个预测样本的光谱数据导入所建的校正模型中以预测其糖度,用来验证该模型的稳定性和可靠性。图4为20个预测样品糖度的预测值与实测值的对应关系。其中,图4(a)为PCR所建模型的相关图,图4(b)为PLSR所建模型的相关图。从两图中可以看出,两种方法得出的模型相关图非常相似,预测值和实测值具有较好的相关性。由PCR得出20个预测样本的糖度预测值与实测值的R为0.9071,RMSEP为0.1495;由PLSR得出的R为0.9074,RMSEP为0.1492。从数据上可以看出,PLSR模型的性能稍微优于PCR模型。通过分析3.3与3.4节可知,利用PCR和PLSR建立的樱桃糖度校正模型是稳定且可靠的,能够较好地预测樱桃糖度。

图4 预测样品集的主成分回归(a)与偏最小二乘回归(b)模型糖度的预测值与实测值相关图Fig.4 Prediction samples set predicted sugar degree of correlation diagram and measured values based on PCR (a) and PLSR (b)

4 结论

本文利用极差标准归一化方法和小波滤波对原始反射率光谱进行预处理,分别利用主成分回归(PCR)法和偏最小二乘回归(PLSR)法建立了基于可见-近红外光谱测定樱桃糖度的定量分析模型。结果表明,利用便携式可见-近红外光谱技术对樱桃糖度进行检测是可行且可靠的;两种方法所建模型都能很好地预测樱桃糖度,但是PLSR模型性能略高于PCR模型。总之,便携式可见-近红外光谱技术由于其无污染、快捷、轻便等特点为野外检测樱桃糖度提供了可能,并为野外在线动态检测其它水果的内在品质奠定基础。

猜你喜欢

糖度实测值预测值
糖度高、类型多、瓜味足 “炫彩”系列小西瓜 亩产值3.5万元
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
常用高温轴承钢的高温硬度实测值与计算值的对比分析
法电再次修订2020年核发电量预测值
市售纯牛奶和巴氏杀菌乳营养成分分析
一种基于实测值理论计算的导航台电磁干扰分析方法
甜菜块根糖度检测使用重复检测进行质量控制的方法
基于不同物候期苹果树叶片光谱特征预测果实糖度
全国首条蜜橘糖度分选机落户南丰