基于高光谱和极限学习机的冷却羊肉表面细菌总数检测
2018-02-13郭中华
魏 菁, 郭中华, 徐 静
(宁夏大学物理电气信息学院,宁夏银川 750021)
羊肉因富含蛋白质,肉质鲜美,在肉类消费中占有较大比例。同时,随着生活水平的不断提高,食品健康与安全问题也日益受到重视,为确保肉品新鲜,销售冷却肉成为了肉类市场的主流方向,冷却肉是严格地按照卫生标准屠宰的畜禽类胴体,要在24 h内使温度降至0~4 ℃,并在后续的一系列加工环节中始终保持在该温度范围条件下的肉。尽管冷却肉可以在一定程度上延长保存期,但是牲畜在屠宰、加工和运输的过程中同样会受到污染,产生细菌微生物[1],导致其加速腐败和变质,最终影响冷却肉的品质。细菌总数(total viable count,TVC)是评价肉类品质的重要指标[2],肉类新鲜度可依据其表面的细菌微生物总数反映出来,对冷却肉表面细菌总数进行准确地检测,可及时对肉品新鲜度作出客观评价,确保“放心肉”的流通与销售。传统的细菌检测大多是基于物理和化学相结合的方法,如三磷酸腺苷光技术、基于快速测试片技术、电阻抗技术[3]等,不仅操作繁琐,耗费时间长,还容易对样本结构造成破坏,因此无损检测技术显得尤为重要。
近年来,高光谱技术[4](hyperspectral technique)已经广泛应用于食品无损检测中,它融合了光学、信息学、计算机技术等多种学科,是将二维图像技术和光谱技术结合起来的一种先进技术。由于特定波长的图像会对样品的某个特征有较显著的反应,通过图像维,可以清晰地看到表征样品外观性质,而通过光谱数据,可获取样品的内部信息,如物质组成和结构等。高光谱技术作为基于光学的无损检测新技术,相比于传统的检测技术,体现了较大的优势。高光谱技术也广泛地应用于对农畜产品品质的无损检测中。在国外,Qiao等结合高光谱技术和人工神经网络对猪肉品质进行了分级[5-6];Naganathan等利用400~1 100 nm波长范围高光谱成像系统对牛肉嫩度进行了分级[7-8];Chao等利用高光谱成像技术对整条鳕鱼的新鲜度进行了检测[9]。在国内,吴建虎等开发出1组高光谱散射成像系统,通过多种特征指标对牛肉品质进行了预测[10-11];高晓东利用光谱覆盖范围为400~1 100 nm的高光谱成像系统对牛肉的大理石花纹进行检测[12];文东东以3个不同品种(黄陂黄牛、恩施山地水牛、西门塔尔奶牛)牛肉样本为研究对象,分别利用近红外光谱技术和高光谱技术,建立不同品种牛肉新鲜度定量检测模型[13]。本试验基于高光谱技术结合极限学习机(ELM),对冷却羊肉表面细菌总数进行无损检测,并通过算法优化,实现了3种建模方法。
1 材料与方法
1.1 试验仪器
试验采用的仪器包括:Hyper VNIR高光谱成像系统,其光谱覆盖范围为400~1 100 nm,由美国的Headwall Photonics公司生产;生化培养箱(LRH-150B);立式压力蒸汽灭菌锅(LDZM-80KCS);超净工作台(HDLAPPARATUS)以及培养皿、移液皿、电子天平等。
1.2 材料与高光谱数据采集
将从农贸市场买回的新鲜羊肉切割成长度、宽度、厚度分别为5 cm、5 cm、2 cm的肉块,总共85个,试验期间(共计 17 d),每天从4 ℃恒温冰箱中取出5个待测样品,至于室温下30 min之后采集高光谱图像,为确保图像的保真度,对高光谱系统的参数设置为:曝光时间和速度分别设置为10 ms和15 nm/s,步进速度为0.17 mm/s,扫描宽度为80 mm,同时为了校正相机暗电流和室外照明对图像的影响,采集图像前先进行黑白校正。
R=(R0-D)/(W-D)。
(1)
式中:R0为原始图像,R为校正后的图像,W为白板图像,D为暗图像,待85个样本的高光谱图像采集完成,使用ENVI 4.8软件进行数据分析,先对每个图像提取表面感兴趣区域(region of interest,ROI),然后提取反射光谱值,作为样本的原始光谱数据。
1.3 样本表面细菌微生物检测
按照食品安全国家标准[14],采用平板计数法对85个样本表面细菌微生物进行采集,先将样本剪碎置于均质袋中拍打,加入灭菌生理盐水,采用均质器处理1 min,按1 ∶10比例梯度稀释,选取2个合适的稀释度倒平板,每个稀释度倒2个平板作为平行,随后将其置于36 ℃恒温,并取对数值作为试验参考数据。随机取训练样本数60个,预测样本数25个,接近3 ∶1的比例进行建模。
1.4 光谱数据预处理
在采集到的原始光谱数据中,由于受外界因素的干扰,使得信息中还包含着大量噪声信号,因此需要对原始数据进行预处理,提高信噪比,以减小噪声对数据分析带来的影响。试验采用标准正态变量变换(SNV)融合sym4小波函数的方法,对原始数据进行预处理。
1.5 建模方法
极限学习机[15-16](extreme learning machine,ELM)是一种单隐层前馈神经(SLFN)网络学习算法,相比于传统的神经网络算法,其优势有以下几点:(1)不会陷入局部最优;(2)无需迭代,一次求解;(3)无需设置复杂的参数。对于1个训练样本,(xj,tj),j=1,…,N,xj,tj∈RN,xj是输入数据,tj为目标输出,可知具有L个隐含层神经元的单隐层前馈神经网络输出表达式为:
(2)
公式(2)可简化为:Hβ=T,βi表示的是第i个隐含层输入神经元和输出神经元之间的连接权值,其表达式为:
(3)
式中:C是惩罚系数,T=[t1,…,tN]T为输入样本目标值向量。根据Mercer条件,定义一个满足该条件的核函数:
(4)
(5)
通常选择径向基函数(RBF)作为核函数,其表达式为:
K(x,x1)=k(‖x-xc‖)=exp{-‖x-xc‖2/(2×σ)2}。
(6)
式中:σ为控制宽度的核参数。
遗传算法(genetic algorithm,GA),又称基因进化算法,是由Holland等于1975年提出,它源于达尔文进化论,借鉴生物进化过程而产生的一种寻优算法,其原理是通过复制、交叉、突变等操作产生下一代的解,并逐步淘汰掉适应度函数值低的解,增加适应度函数值高的解。KLEM模型中的2个参数惩罚系数(C)和核参数(σ),C起着调节结构风险和经验风险之间平衡的作用,而σ控制着函数的径向作用范围,二者是影响KELM性能的2个主要因素。在参数设置过程中由于人为设置因素的影响,导致了模型的精度不够理想。因此,本研究提出遗传算法优化核极限学习机的方法,通过对C和σ进行寻优,而减少因核函数存在而导致参数设置敏感的问题。
2 结果与分析
2.1 光谱数据预处理
本试验采用Matlab 2012a软件进行数据分析,绘制原始光谱曲线图(图1)。采用sym4小波函数,分解尺度分别为2、3、4、5情况下的融合方法对原始数据进行预处理,通过预测模型指标反应,得出最佳预处理方法为分解尺度为4的sym4小波函数融合标准正态变量变换(SNV),具体见图2。
2.2 模型建立及结果分析
2.2.1 ELM模型 参数设置为:隐含层激励函数选择sigmoid函数,隐含层节点数为10,仿真结果见图3。
2.2.2 KELM模型 选择RBF函数作为核函数,参数范围设置为:C∈[0.1,10],σ∈[1,1 000],为了观察到取不同参数值的不同效果,在参数设置中加入随机数,以便观察到多种结果,经过多次试验,取C=4.5,σ=990可得到最优结果,仿真结果见图4。
2.2.3 GA-KELM模型 参数设置为:种群规模sizepop=80,迭代次数为maxgen=50,交叉概率为0.5,变异概率为 0.02,可知当迭代次数接近于15时,适应度曲线趋于稳定,预测结果和适应度曲线见图5和图6。由表1可知3个模型预测结果的对比情况。以训练集和预测集的相关系数(R)和均方根误差(RMSE)作为评价指标,并且以预测集指标为主。可以看出3种建模方法中,采用GA-KELM模型的冷却羊肉表面细菌总数(TVC)预测模型效果最好,4个指标值分别为0.930 6、0.001 6、0.983 7、0.001 6;相比之下,ELM模型的预测效果较差,各指标值分别为0.907 4、0.237 7、0.970 5、0.189 6。其中均方根误差较大,这是因为ELM输入节点权重和隐元偏置是随机赋值,导致ELM的输出不稳定,泛化性能差,精度较低。因此,得出冷却羊肉表面细菌总数(TVC)预测最佳建模方法是分解尺度为4的sym4小波函数融合标准正态变量变换(SNV)的预处理方法结合GA-KELM预测模型。
3 结论
表1 3种模型预测结果对比
对冷却羊肉表面细菌总数进行无损检测,通过高光谱成像系统提取样本的高光谱信息,采用分解尺度为4的sym4小波函数融合标准正态变量变换(SNV)的预处理方法,结合ELM、KELM及优化算法GA-KELM分别建立预测模型,相比于传统的检测方法,此方法快速有效且通过优化算法进一步提高了检测的准确性, 也为下一步开发冷却肉制品细菌微生物无损检测平台提供了理论基础。但不足之处是光谱波段范围较为局限和单一, 仅限于400~1 100 nm,在下一步工作中,考虑在多种高光谱波长范围内进行试验对比,确定1种最佳建模的波长范围。