基于小波变换的乳酪制品智能鉴别技术
2021-05-11黄文萍赵依琳杨如玲张正勇
黄文萍,赵依琳,杨如玲,韦 涛,孟 玥,张正勇
(南京财经大学 管理科学与工程学院,江苏 南京 210023)
在全面建设社会主义现代化国家的新征程中,人们日益增长的高品质食品需求与潜在的制假售假间的矛盾成为食品质量安全管理领域关注的核心问题之一,鉴别技术是解决这一问题的关键支撑。乳制品作为食品的重要组成部分,受2008 年三聚氰胺等事件影响,时至今日,其仍旧是质量安全监管部门和消费者关注的重点对象[1-2]。现有的鉴别方法主要包括以下4 种类型:① 感官检验,主要是依靠人的感觉器官进行判断,具有一定的主观性;② 理化检测法,主要依据一些物理特性值如旋光性[3],或者一些特征化学成分如氨基酸、同位素[4-7]进行鉴别;③ 生化检测法,主要是依据乳品基因序列进行判别[8-9];④ 计算机智能鉴别算法与谱图数据相结合进行模式识别[10-12],较之前的3 种方法,计算机辅助鉴别技术具有运算速度快、结果评价客观等优势,成为鉴别技术研发的热点。
谱图数据可以表征乳制品的化学质量特性,并作为智能鉴别算法的数据输入,经过判别函数运算构建鉴别模型,用以未知样品类别归属测算。本实验选用可以高效表征乳制品分子振动特性并具有采集速度快、可无损检测等优势的拉曼光谱,开展谱图数据小波变换处理等研究,以期为挖掘谱图数据信息,提高鉴别模型适应性提供技术参考。
1 材料与方法
1.1 材料
实验用乳酪制品均购置于南京苏果超市,原味口味,选取3 个品牌,分别标记为品牌xx(a),品牌yy(b)和品牌zz(c),每个品牌25 个样品,共计75 个样品。
1.2 仪器与设备
Prott-ezRaman-D3 型激光拉曼光谱仪:美国Enwave Optronics 公司;96 孔板:美国Corning Incorporated 公司。
1.3 数据采集与处理
取一定量的乳酪制品置于96 孔板的各独立小孔内,使得小孔恰好被样品充满。将激光拉曼光谱仪的探头固定于小孔上方(恰好直射样品)。激光拉曼光谱仪控制参数:激光波长为785 nm,激光最大功率约为450 mW,CCD 检测器,温度为-85 ℃,样品采集积分时间为80 s,扫描次数为1 次,光谱波数收集范围为250~2 000 cm-1,光谱分辨率为1 cm-1。
测试获得样品谱图数据后,使用光谱仪自带的SLSR Reader V8.3.9 软件进行基线校正,校正后的谱图数据归一化处理使用mapminmax 函数,归一化至[0,1]区间。小波软阈值降噪使用wden 函数,小波增强使用wavedec 函数进行谱图数据小波分解,而后使用waverec 函数进行小波重构。小波变换处理、归一化、k 近邻算法的运算平台采用Matlab 软件(美国MathWorks 公司,版本为2016 a)。
2 结果与讨论
2.1 乳酪制品的拉曼光谱表征分析
实验采集的乳酪制品为乳黄色含水分的近似固体,可以直接上样测试,无需样品前处理,且由于水分子的拉曼散射界面较小,无明显拉曼信号也不影响拉曼测试。实验采集的3 种不同品牌乳酪制品的拉曼光谱图如图1 所示。由图1 可以看出,3 个品牌乳酪制品的拉曼光谱在同一个波数附近都出现了波峰,起伏程度也十分接近,且有相似性,结合已有文献报道[13-15]可知,该类波峰的产生主要源于乳制品中糖类、脂肪、蛋白质分子相关的变形振动、伸缩振动与扭曲振动等。3 个品牌乳酪制品的拉曼光谱在800~1 800 cm-1区间振动较为剧烈,出峰明显。其中:与糖类有关的拉曼谱峰有850 cm-1,源于C—C—H 变形振动和 C—O—C 变形振动;940 cm-1处的峰,源于C—O—C 变形振动、C—O—H 变形振动以及C—O 伸缩振动;1 079 cm-1和1 145 cm-1处的峰,源于C—O—H 变形振动、C—O 伸缩振动以及C—C 伸缩振动;与脂肪有关的峰有1 314 cm-1,源于脂肪酸的—CH2扭曲振动;1 760 cm-1处的峰,源于C ═O 伸缩振动;与蛋白质有关的峰有1 019 cm-1处的,源于苯丙氨酸的环振动即环内C—C 对称伸缩振动;最高峰1 457 cm-1则是源自糖类和脂肪分子—CH2变形振动;以及1 670 cm-1是源自蛋白质的酰胺I 键C ═O 伸缩振动和不饱和脂肪酸C ═C 伸缩振动。可见,拉曼光谱表征出丰富的乳酪制品分子信息,但由于谱图信号较为相似,仅凭裸眼难以实现高效分类鉴别,需要借助计算机识别算法开展进一步判别分析。
2.2 基于乳酪制品拉曼光谱的小波降噪分析
将采集获得的乳酪制品拉曼光谱数据导入k 近邻算法,判别条件为马氏距离,k = 1,随机选择80%的样品数据为训练集,余下20%的样品数据为测试集[16],重复随机循环测试100 次,计算得出测试平均值,记为识别率,结果为82.27%。由于实验样品的拉曼谱图较为相似,直接使用原始数据进行类别判别,识别率有限;而且拉曼光谱原始数据中含有随机噪声、冗余信息,制约了鉴别模型的准确性。因此,实验进一步运用小波变换方法的多尺度、多分辨特性,首先进行了小波降噪处理,基本思路是将拉曼光谱信号进行小波分解,保留高于阈值的小波系数,滤除小于阈值的噪声系数,而后通过逆小波重构获得降噪后的谱图数据。实验采用wden 函数,综合比较分析了小波基(wname)、分解尺度(n)、阈值处理噪声水平(scal)、函数选择阈值使用方式(sorh)以及阈值选择标准(tptr)参数条件下的模型识别率。实验采用小波软阈值去噪法,因此在考虑阈值使用方式(sorh)时,设定sorh = s,(注:sorh = s,为软阈值;sorh = h,为硬阈值)。设置tptr 的变量为4 个,分别为:rigrsure、heursure、sqtwolog 和minimaxi;设置scal 的变量为3 个,分别为:one、sln 和mln;设置分解尺度为5个,即n=1、2、3、4、5,研究了4 类小波中各5 个常见小波基,分别为Biorthogonal 小波系中bior1.1、bior1.5、bior2.2、bior2.4 与bior3.1,Coiflet 小波系中的coif1、coif2、coif3、coif4 与coif5,Daubechies 小波系中db1、db2、db3、db4 和db5,Symlets 小波系中sym1、sym2、sym3、sym4 和sym5。最终选择了tptr= heursure,sorh = s,scal = mln,n = 4,wname = coif1为小波降噪条件,降噪后的乳酪制品拉曼光谱结果如图2 所示,识别率为86%。此结果表明,运用合适的小波降噪方法,可以有效降低随机噪声,改善谱图质量,还可以减少噪声对模型识别效果的影响,一定程度上提高了分类算法的准确率。
2.3 基于乳酪制品拉曼光谱的小波增强、融合分析
小波降噪后分类算法识别率有所上升,提示谱图各波段对于识别结果的影响有所不同,进一步开展特征提取实验。首先采用小波增强方法,增强有效贡献信号,基本思路是采用小波函数对谱图数据进行分解,而后对分解系数进行选择性增强与削弱,再通过小波重构获取处理后谱图。选用sym5 小波函数对前述拉曼光谱数据进行了2 层分解,对于>100 的小波分解系数赋予2 倍增强,对于≤100的小波分解系数赋予0.5 倍削弱,在融合后系数基础上进行了谱图重构,结果如图3 所示,识别率为87.07%。此结果表明,小波增强法进一步凸显了特征波段,一定程度上提高了识别率。进一步将图3所示谱图波段划分为10 个特征波段区间,计算得到对应的识别率如表1 所示。各波段对识别率影响不同,进一步开展融合分析。将10 个特征波段区间融合,识别结果为86.8%。而当1 240 ~1 400 cm-1与1 595 ~1 710 cm-1波段融合后,识别率可以达到88.6%,运算时间由全波段数据小波增强处理后的1.15 s 减少到0.60 s,提高了约48%的运算效率。
2.4 基于乳酪制品归一化拉曼光谱的小波增强、融合分析
表1 基于乳酪制品拉曼光谱的特征波段及对应识别结果
实验进一步研究了归一化处理对模型识别效果的影响,通过归一化处理可以消除量纲的影响,减少数据的分散性,提高识别效率[17]。k 近邻算法设置同前,乳酪制品拉曼光谱数据经coif1 小波降噪及归一化处理后导入分类算法,实验数据归一化至[0,1]区间,识别率为93.73%,识别率较前有较大提高。进一步进行小波增强,实验条件为选用sym5 小波函数对拉曼光谱数据进行了2 层分解,对于>0.2 的小波分解系数赋予1 倍增强,对于≤0.2的小波分解系数赋予0.5 倍削弱,在融合后系数基础上进行谱图重构,识别结果为94.4%。进一步将小波增强后的拉曼光谱谱图波段,划分为10 个特征波段区间,计算得到对应的识别率如表2 所示。结果也表明不同波段对识别率的影响不同,且经过归一化后,识别率最高波段为波段1 595 ~1 710 cm-1不同于未做归一化处理时的波段1 240 ~1 400 cm-1。进一步开展融合分析,将10 个特征波段区间融合,识别结果为92.6%。而当1 415~1 515 cm-1与1 595~1 710 cm-1波段融合后,识别率可以达到95.4%,运算时间也减少到0.60 s。
表2 基于乳酪制品归一化拉曼光谱的特征波段及对应识别结果
3 结论
实验采集了不同品牌乳酪制品的拉曼光谱数据,与k 近邻算法联用,研究讨论了不同谱图处理条件下鉴别算法的识别准确率,并建立起了一套基于谱图数据处理的鉴别算法优化流程。研究结果表明,小波变换处理可以有效实现谱图数据的噪声滤除与特征信号增强。拉曼光谱数据未经处理时,鉴别算法识别率仅为82.27%;经coif1 小波降噪处理、归一化处理、sym5 小波增强以及波段1 415~1 515 cm-1与1 595 ~1 710 cm-1融合处理后,识别率可达到95.4%。