基于近红外光谱分析技术的食品包装塑料的定性分析
2020-11-09王晓娟齐文良梁振楠
田 静,王晓娟,齐文良,梁振楠,陈 斌*
(1.江苏大学 食品与生物工程学院,江苏 镇江 212013;2.宁波海关技术中心,浙江 宁波 315048)
随着塑料化工技术的迅速发展,塑料制品在生活中的应用愈发广泛,食品和药品会直接接触到大量塑料制品,因此塑料制品的安全性将会直接影响消费者身体健康[1-3]。聚乙烯(Polyethylene,PE)和聚丙烯(Polypropylene,PP)是最广泛应用于食品、药品直接接触的塑料制品,但由于PE和PP的耐热性和拉伸强度等性质相差较大,故两者的适用场合和成本差异较大。不法厂商为节约成本,使用不符合国家标准的塑料制品作为食品和药品的内包装材料,严重威胁消费者健康,因此对食用级塑料包装材料的鉴别尤为重要。
目前,对塑料制品种类的判别方法有燃烧法、溶解法、静电法、光学法、热分析法等[4-6],但这些方法在时间、工序及成本上存在很多不足。近红外光谱技术具有快速、绿色、无损、成本低等优点,被广泛应用于聚合材料以及农产品的品质检测[7]。近红外光谱区是含氢基团(C—H、N—H、O—H)的倍频与合频吸收区,利用该区域的吸收信息可进行含氢基团物质的定性定量检测[8],将近红外光谱与化学计量学方法结合建立定性定量模型,可快速判别塑料原料的种类和制品品质[9-10]。本研究基于近红外漫反射光谱分析技术,对食品和药品的外包装常用塑料材料PE和PP进行定性判别,通过选取不同波长范围、不同光谱预处理方法,在主成分分析的基础上,采用多种模式识别算法,建立了定性校正模型,并通过比较各个模型性能的预测效果,优选出最佳预测模型,以期为塑料及塑料制品材质的种类快速鉴别提供参考。
1 实验部分
1.1 实验材料
塑料样品(包括PP和PE)共100个,由宁波市检验检疫局提供。其中,PP新生料17个,PP再生料15个,PE新生料36个,PE再生料32个,样品分类情况见表1。
表1 塑料样品类别个数统计表Table 1 Statistical table of plastic sample categories
1.2 仪器与光谱采集
S450近红外光谱分析仪(上海棱光技术有限公司),仪器内置聚四氟乙烯参比模块,可自动完成参比校正和波长监控,并配有聚四氟乙烯积分球漫反射系统和样品旋转装置,适合粉末状、颗粒状样品的测量。
在室温(25 ℃)条件下,将装有塑料样品的样品杯置于采集窗口进行光谱采集(波长范围900~2 500 nm),取每个塑料样品扫描3次的平均光谱进行后续数据分析,共采集100个样品的近红外光谱。
1.3 样品集划分与光谱预处理
塑料样品采用Kennard-Stone(K-S)方法进行样品集划分,校正集与预测集比例为70∶30。
在采集塑料样品光谱图的过程中,为减少塑料样品密度与形态不同以及表面特征不均匀等因素的影响,并降低干扰因素产生的噪声,通常需对光谱进行预处理,以提高定性校正模型的预测精确性。采用矢量归一化、标准正态变量变换(Standard normal variate transformation,SNV)、中心化、滑动均值滤波(Moving average filtering,MAF)、多项式平滑滤波(Savitzky-Golay filtering,SGF)、一阶微分方法对光谱预处理[11-16]。
1.4 数据分析及评价指标
使用江苏大学近红外研究小组自主开发的NIRSA4.5数据处理软件进行光谱预处理和定性校正模型的建立。
采用主成分分析结合簇类的独立软模式方法(Soft independent modeling of class analogy,SIMCA)、贝叶斯判别(Bayes discriminant analysis,BDA)、K-近邻(K-Nearest neighbor,KNN) 3种方法建立两类塑料样品的定性校正模型。主成分分析是通过线性变换来提取近红外光谱中主要特征分量的数据降维方法,SIMCA方法是一种建立在主成分分析基础上的模式识别方法,根据模型的拟合结果对其判别归类。贝叶斯判别是通过计算总体各自出现的概率大小,对未知类别样品进行归类,将未知样品归属于出现概率最大的一类。K-近邻是直接利用已有的带有类别标记的样本集(称为训练样本集)分类待分样本(训练样本集中观察到的邻近样本)。正确识别率(CRR,%)是用于评价定性校正模型精度的指标,CRR越高(越接近100%)表明模型的判别精度越高,具体计算公式为:CRR=m1/m2×100%,式中m1为正确识别样品数,m2为样品总数。
图1 塑料样品的原始近红外光谱图Fig.1 Raw NIR spectra of plastic samples
图2 原始光谱前10个主成分的累计贡献率趋势图Fig.2 Cumulative contribution rate trend of the first 10 principal components extracted from the original spectrum
2 结果与讨论
2.1 塑料样品的近红外漫反射光谱
2类4种PP与PE塑料样品的近红外漫反射原始光谱图如图1所示。由图可见,PE和PP塑料的新生料近红外光谱图无太大差异,均在1 213 nm和1 394 nm处有较强吸收峰,这可能由样品中C—H基团、C—H2基团的倍频和合频振动造成。但两类塑料的再生料与新生料在1 000~1 800 nm 波段范围内的原始光谱吸光度相差较大,可能由于再生料因反复使用夹带了一定的杂质。因两类塑料的吸收峰形和位置均较为相似,无法通过近红外图谱直观鉴别,需将样品的光谱数据结合化学计量学方法进行分析及判别。
2.2 塑料样品近红外光谱主成分的提取
在主成分提取中,累计贡献率能够反映前n个主成分对原始数据的信息表征能力,塑料样品近红外光谱的前10个主成分(PC1~PC10)的累计贡献率趋势图见图2,图中可见前3个主成分(PC1、PC2、PC3)的累计贡献率为99.22%,已接近100%,表明前3个主成分已可表征大部分光谱信息,因此数据分析均选取塑料样品前3个主成分数建立各种判别定性校正模型。
2.3 3种分类定性校正模型的精度分析
2.3.1 波段对定性校正模型判别精度的影响不同的波长范围所含有的塑料样品属性信息不同,建立的定性校正模型判别精度也不同。塑料样品原始光谱选取不同波长区域的3种分类方法建立的模型预测结果见表2。由表中数据可见,在不同波长区间内,3种方法建立的定性校正模型均在1 050~1 550 nm波长范围内的效果较好,此区域内SIMCA方法校正集和预测集的正确识别率分别为91.4%和86.7%,贝叶斯判别的校正集和预测集的正确识别率分别为74.3%和63.3%,K-近邻方法的校正集和预测集的正确识别率分别为100%和100%。
表2 原始光谱不同波长区间的3种分类定性模型分类错误的样品数统计分析Table 2 Statistical analysis of the number of wrong samples of three classification qualitative models with different wavelength intervals in the original spectrum
(续表2)
2.3.2 预处理方法对定性校正模型判别精度的影响在优化得出的最优波长区域内,使用SIMCA方法和贝叶斯判别2种识别方法结合不同预处理方法建立定性校正模型,比较不同光谱预处理方法对定性校正模型判别精度的影响,进一步提高模型的判别精度。表3为1 050~1 550 nm波段范围采用不同光谱预处理方法的上述2种方法定性校正模型的统计分析结果。由表中数据可见,SIMCA方法结合SNV+5点MAF平滑、SNV+5点SGF平滑或者SNV+5点SGF平滑预处理方法预测模型判别精度最好,预测模型精度得以显著提高,样品校正集和预测集的正确识别率分别为95.7%和93.3%,表明该预处理方法可提取样品近红外光谱中的有效信息,减少了噪音干扰,提高了预测模型精度;贝叶斯判别结合SNV+5点MAF平滑光谱预处理的预测模型判别精度最好,其中样品校正集和预测集的正确识别率分别为97.1%和93.3%。
表3 不同预处理方法的2种分类定性模型的分类错误的样品数统计分析Table 3 Statistical analysis of the number of wrong samples of two classification qualitative models with different pretreatment methods
2.4 最优定性校正模型分类错误的样品数统计
表4为3种分类方法在不同波段范围、不同预处理方法下得到的最优定性校正模型的各类样品分类错误的样品数统计。由表4数据可见,在1 050~1 550 nm波段范围内,SIMCA方法采用SNV+5点MAF平滑或者SNV+5点SGF平滑光谱预处理方法的预测模型对于PP新生料与再生料样品区分效果较好;贝叶斯判别采用SNV+5点MAF平滑预处理方法的预测模型对于PP新生料与再生料区分效果较好;K-近邻方法采用原始光谱建立的预测模型对2类4种PP与PE塑料样品的分类效果最好。
表4 3种分类方法的最优定性校正模型分类错误的样品数统计Table 4 Statistics of the number of misclassified samples of the optimal qualitative correction model under the three classification methods
3 结 论
本研究采用主成分分析法结合3种不同模式识别方法(SIMCA、贝叶斯判别、K-近邻)建立了PP和PE定性校正模型,结果显示:3种模式识别方法在1 050~1 550 nm波长内建立的定性模型判别精度最好;采用矢量归一化、标准正态变量变换、中心化、滑动均值滤波、多项式平滑滤波、一阶微分6种光谱预处理方法和上述3种模式识别方法对塑料样品近红外光谱进行数据处理发现,在1 050~1 550 nm范围内未经光谱预处理,前3个主成分空间下的K-近邻定性校正模型判别精度最好,样品校正集和预测集的正确识别率均接近100%。该检测方法具有结果准确、耗时短、无损等优点,可为食品包装材料聚乙烯、聚丙烯的快速鉴别提供新方法。