高光谱特征的人造肉中低色度差异物检测
2022-04-06石吉勇刘传鹏李志华黄晓玮翟晓东胡雪桃张新爱邹小波
石吉勇, 刘传鹏, 李志华, 黄晓玮, 翟晓东, 胡雪桃, 张新爱, 张 迪, 邹小波
江苏大学食品与生物工程学院,江苏 镇江 212013
引 言
大豆蛋白肉又称人造肉,是一种高蛋白、低脂肪且有类似动物肉口感的仿生食品,随着人们健康理念的转变,这种低脂高蛋白食品越来越受到消费者的喜爱[1]。 大豆原料从农场运输过程中容易混入石头、枝叶等异物,机械自动化包装过程中也大大增加了金属、塑料包装等异物混入的概率。 异物的存在严重损害人体身心健康。 因此异物检测在食品行业显得尤为重要。
常规的食品异物检测方法主要有X射线法和计算机视觉法[2]。 X射线检测法是一种利用X射线在穿过不同密度的物体时会产生不同反射强度的性质对异物进行检测的方法,当食品自身密度和异物存在差异时, 其透过率也会有差异,这种差异可以用不同的灰度值反映在图像上,利用此方法可以实现高密度异物的检测[3]。 然而,其对吸收量较低的低密度异物检测效果不佳,如塑料、硅胶等。 计算机视觉检测法主要利用异物与食品颜色的差异,结合图像分割技术实现异物的检测,具有快速无损、易在线等优点,已经广泛应用在食品表面异物、缺陷的检测[4]。 但是此方法十分依赖异物与背景之间的高色度差异,当异物颜色与背景相近或者相同时计算机视觉检测法检测效果大大降低,无法准确分割低色度差异物和背景,导致异物漏检和错检等食品安全事故的发生。 常规检测法很容易检测出诸如金属、石头等坚硬非透明异物,至于软质、浅色、半透明或透明异物等污染来源,有待于开发一种准确性更高的方法来检测。
提出了一种高光谱检测法来检测食品中低色度差异物。 高光谱成像技术近些年来被广泛应用于食品、农产品检测领域。 许多研究表明,光谱特征对农产品的化学成分敏感,可见(VIS)[5]、近红外(NIR)[6-7]和中红外(MIR)光谱[8-9]已成功用于定性分析食品中的化学成分。 异物和人造肉在化学组成成分、内部组织结构等方面的差异表现在特定波段会产生不同的反射比。 因此,利用光谱特征来识别人造肉中的低色度差异物是可行的。
综上所述,本研究旨在开发一种用于人造肉中准确分离低色度差异物的方法。 利用高光谱图像的光谱信息,建立模式识别模型,再利用高光谱图像的图像信息,对存在光谱差异的像素点进行定位,最后完成低色度差异物的分布可视化。 以此来解决计算机视觉技术对食品中低色度差异物检测效果不佳的缺陷。
1 实验部分
1.1 样品制备
选取了食品生产加工过程中常见的三种低色度差异物原料: 塑料、硅胶和玻璃。 塑料具体分为聚碳酸酯(PC), 涤纶树脂(PET)和聚氯乙烯(PVC)三种, 塑料和硅胶均购买自山东优索化工科技有限公司, 玻璃购买自当地五金店, 人造肉为齐善食品公司定制。 分别将PC、PET、PVC、硅胶和玻璃五种低色度差异物混入人造肉肉糜后, 模拟工业压片制作流程, 制备混有异物的人造肉片, 如图1所示。 分别设置包含五种异物的人造肉为F组、空白组为M组, 每组30个样品,共180个样品。
图1 低色度差异物及含异物人造肉样本
1.2 高光谱图像的采集与标定
高光谱成像系统由江苏大学自主开发组装搭建完成,主要零部件示意图如图2(a)所示。 该系统的高光谱摄像机为线阵摄像机,曝光时间设置为50 ms,电控移动平台水平运动速度设为90 μm·s-1,分辨率为775×1 628,光谱仪的波长范围为432~963 nm,共618个波段,数据维度如图2(b)所示。
图2 (a)高光谱成像系统;(b)高光谱三维数据1: 计算机;2: 高度调节杆;3: 光谱仪;4: 镜头; 5: 暗箱;6: 载物台;7: 电控移动平台;8: 光源Fig.2 (a) Hyperspectral imaging system; (b) Hyperspectral 3D data
1: Computer; 2: Height adjustment lever; 3: Spectrometer; 4: Lens; 5: Dark box; 6: Stage; 7: Electronically controlled mobile platform; 8: Light source
数据采集过程中,由于光照强度不均匀、传感器暗电流波动等现象会导致在光照强度较弱的波段形成较大的噪声,因此高光谱图像采集完成后需要对图像进行黑白板校正,校正公式如式(1)所示
(1)
式(1)中:Iλ为λ波段原始反射强度;Bλ为黑板图像反射强度;Wλ为白板图像反射强度;Rλ为λ波段校正后的反射强度。
1.3 光谱信息的提取与预处理
采用ENVI 4.5软件对标定后的高光谱图像进行光谱提取,其中F组高光谱图像分别选择100×100像素矩形异物区域为感兴趣区域,M组选择100×100像素表面均匀平整处矩形区域为感兴趣区域,提取感兴趣区域内所有像素点的光谱值,取其平均值后得到每个样品一条原始平均光谱数据,以此方式得到180个样本共180条原始平均光谱数据。
采集感兴趣区域得到的原始光谱数据由于受到环境、机器运行状况等非样本信息的影响,除了携带表征样本的有利的信息外,还会包含一些无用信息和噪声干扰信息,如基线漂移、高频噪声等,因此有必要对原始光谱数据进行一系列的预处理来除去无用信息,以提高后期建模的准确性和稳定性[10]。 采用标准正态变量变换(standard normal variate transformation, SNVT)、卷积平滑 (Savitzky-Golay, SG)、矢量归一化(vector normalization, VN)一阶导数(first derivatives, 1stDER)、二阶导数(second derivatives, 2ndDER)、多元散射校正(multiplicative scatter correction, MSC)6种方法对光谱进行预处理,并根据建模效果从中优选最佳光谱预处理方法。
社会实践是高等教育中不可缺少的组成部分。学校应该充分认识大学生社会实践的意义,了解社会实践在人才培养、社会发展中的作用,并有效地开展相关活动。在组织社会活动的过程中,学校应该广泛征求各方意见,尤其是学生意见,结合社会需求和学生自身特点,来确定实践活动的形式、内容。此外,学校对于大学生的社会实践活动应该给予经费和政策的支持,并动员专业教师积极参与学生社会实践,担任指导教师。社会实践常常涉及到专业知识的运用,因此吸纳经验丰富专业教师作为指导老师非常有必要。此外,还可以邀请企业专家加入,采取联合指导制度,经常开展交流、学习和研究,解决学生所学理论知识与实践工作结合不紧密的问题。
1.4 判别模型的建立和像素级异物可视化
异物识别模型和异物可视化步骤的流程如图3所示。
1.4.1 光谱特征变量的提取
高光谱成像系统可以同时获取样本几百个波段的光谱信息,数据明显冗余,为此对预处理后的光谱信息做进一步处理来减少冗余数据,获取特征光谱信息,对后期建立稳定高效模型至关重要。 光谱信息经主成分分析(PCA)后[11]消除了众多相互堆叠信息,最大程度的保留对原数据有贡献的特征。 连续投影算法(SPA)[12]是一种前向特征变量选择方法,增强了数据处理的速度和建模效果。
图3 人造肉中低色度差异物检测流程图Fig.3 Detection flow chart of low-chromatic aberration foreign matters in soy protein meat
1.4.2 定性模型的建立
选用最小二乘支持向量机(least square support vector machine,LS-SVM)[13]、人工神经网络(back propagation artificial neural network,BP-ANN)、K最近邻法(K-nearest neighbors,KNN)[14]和线性判别分析(linear discriminant analysis,LDA)[14]四种定性模型,分别以全波段光谱、PCA处理后的主成分变量和SPA处理后的特征波长作为模型输入变量。 LDA模型的定性结果取决于主成分数。 KNN模型的定性结果取决于主成分数和选择的K值。 BP-ANN模型的输出层单元设置为2个(异物类别1和人造肉类别2),选择双曲线正切函数为模型的传递函数,初始权重设定为0.9,动量因子和学习因子都设置为0.1,收敛误差设置为0.000 2,训练迭代次数设置为2 000次。 SVM模型通过交叉验证和网格搜索法确定最优的径向基核函数正则化参数Y和基于REF核函数的参数σ2分别为2.33和2.15。
1.4.3 异物可视化
遍历高光谱图像中每一像素点的光谱数据,代入优选的模式识别模型中,如果该像素点判断为异物,则设置像素灰度值输出为1,如果判断为人造肉则设置像素灰度值输出为0。 最终生成二值图像,其中0灰度级区域代表人造肉区域,1灰度级区域代表异物区域,从而实现人造肉中低色度差异物的可视化。
2 结果与讨论
2.1 含异物人造肉片的光学特征
图4(a)表示的是含异物人造肉彩色图像。 彩色图像在RGB三个波长处的灰度图像如图4(b, c, d)所示,其中,异物区域的灰度值显著接近人造肉区域,这是因为RGB三处的波长在穿过透明异物时被吸收和反射的很少,直到在人造肉处发生反射,使得在RGB三处波长下异物区域和人造肉区域反射强度差异很小。 这表明通过常规的计算机视觉技术区分此类异物和人造肉是困难的。
图4 含异物人造肉片的光谱/图像特征(a): 含异物人造肉片的彩色图像; (b): 彩色图像的R灰度图像; (c): 彩色图像的G灰度图像; (d): 彩色图像的B灰度图像; (e): 人造肉片和异物的平均光谱数据Fig.4 Spectral/image features of artificial meat sliceswith foreign matters
(a): Color images of soy protein meat with foreign matters; (b): R gray images of color images; (c): G gray images of color images; (d): B gray images of color images; (e): average spectral data of soy protein meat and foreign matters
从含异物人造肉片的高光谱图像中提取的异物区域和人造肉区域的平均光谱数据如图4(e)所示,从图中可以看出,F组和M组光谱曲线在700~900 nm处趋势大致相同,但是M组光谱曲线在460~960 nm波长处强度明显高于F组,有较大区分度。 F组中不同种类异物的光谱曲线相互交织。 造成F组和M组光谱读数和光谱曲线的变化是由于人造肉片和异物之间的化学组成成分种类及其含量不同导致此波段下吸收强度的差异引起的。 异物和人造肉之间的光谱差异表明采用光谱特征将异物和人造肉进行区分是合理的。
2.2 特征变量提取
PCA处理后前三个主成分得分图如图5所示,它代表样本点在三维空间上的投影,前三个主成分贡献率分别为92.93%,4.95%和1.37%,累计贡献率达到99.26%,从图中可以看出,经主成分分析后的玻璃样本可以直接被区分开,而其他异物和人造肉样本之间相互重叠,难以直接区分,因此需要建立识别模型进一步区分人造肉和异物样本。
图6(a)为SPA算法的均方根误差曲线(RMSE),从图中可以看出,特征波长数为10时RMSE有极小值,提取特征波长的目的是更好的实现异物和人造肉的分类,所以应选取尽可能少的特征波长。 最终筛选出对异物分类结果贡献最大的特征波长为573.724 9,445.943 0,443.456 7,446.772 1,457.565 6,450.920 1,442.628 2,447.601 4,959.813 0和436.833 9 nm。
图5 主成分分析前三个主成分得分图Fig.5 Scores of the first three principal componentsof principal component analysis
图6 特征波长筛选结果(a): 均方根误差曲线;(b): 特征波段示意图Fig.6 Screening results of characteristic wavelengths(a): Root mean square error curve; (b): Schematic diagram of characteristic wavelengths
2.3 基于光谱特征构建异物识别模型
建模前为了优选出最佳预处理方法,将F组和M组预处理并经PCA分析的光谱作为输入变量,构建LDA模型。 表1为各预处理光谱建立的LDA模型预测结果。 通过比较SNVT,SG,MSC,VN, 1stDER和2ndDER六种预处理方法对模型准确率的影响,发现SG在消除噪声等干扰信息方面效果最佳,本研究均采用SG法作为光谱预处理方法。
将F组和M组共180个样本的高光谱数据采用K-S算法按照2∶1比例划分为120个训练集和60个预测集,经SG预处理后,分别以全波段光谱、前10个主成分变量和特征波长作为模型输入。 选择最优参数下的模型识别结果如表2所示。 总体而言,PCA主成分变量建模的识别率要优于特征波段建模效果,这表明主成分变量代表的全波段光谱信息量多于特征波段。 全波段建模效果最差,说明全波段承载大量冗余信息,降低了建模的效果。 比较不同的识别模型,BP-ANN模型具有最佳的分类效果。 在PCA主成分变量为模型输入下,校准集和预测集的识别率分别为97.50%和98.33%。 这可能是由于融合数据之间的非线性数据强度变化高于线性数据,并且在处理非线性数据时,BP-ANN模型要优于其他模型。 KNN模型准确率低于其他模型,分析原因可能是KNN模型中F和M两组样本都交错聚集在样本间距K附近,难以通过固定的K值区分。 上述结果表明,使用基于主成分变量优化的BP-ANN模型成功表征了异物或人造肉样本对应的光谱特征。
表1 六种预处理方法下LDA模型的识别率(%)Table 1 LDA classification results of differentspectral preprocessing methods
表2 不同模式识别模型异物识别率(%)Table 2 Foreign matters recognition rate of differentpattern recognition models (%)
2.4 高光谱法与计算机视觉法异物检测结果对比
通过1.1节中所述方法,采集混有异物的人造肉片高光谱图像,分别用计算机视觉法和高光谱法对异物区域从人造肉背景进行分割,结果如图7所示。
图7 高光谱成像技术和计算机视觉技术进行异物检测
图7(c)为人造肉片感兴趣区域的灰度图像,使用OTSU算法,通过计算类间最大方差来确定灰度图像分割阈值的阈值为142,使用常规计算机视觉法在此阈值下进行异物区域分割的二值图像结果如图7(e)所示,经过处理后,包埋在人造肉片中的异物区域无法识别,异物暴露区域面积检出率在20%~30%之间,检测效果不佳,相反人造肉片的缺陷区域(标有红色方块区域)得到较好的分割,对异物区域的判别造成严重干扰,容易造成误判,异物识别效果较差。
提取图7(d)高光谱数据块中每一像素点的光谱数据,提取特征信息之后代入2.3节中优选的BP-ANN异物识别模型,异物区域像素灰度值输出为1,人造肉区域像素灰度值输出为0,每一像素点的属性类别都得到可视化显示。 结果如图7(f)所示,异物与人造肉片区分明显,异物面积检出率大于90%,效果显著优于计算机视觉法,且缺陷区域没有对结果造成干扰。 这些结果表明,尽管异物颜色和人造肉片颜色相近、色度差很低,但是高光谱特征仍可将异物与人造肉片区分开。
2.5 验证试验
为了验证优选模型的识别效果, 将生活中常见的瓶盖碎片(PC), 饮料瓶碎片(PET), 塑料袋碎片(PVC),硅胶手套碎片和玻璃片设置成3 mm×3 mm,5 mm×5 mm和10 mm×10 mm三个尺寸梯度。 每个尺寸制备50个异物样本和50个无异物样本进行验证试验,含异物样本定义为“阳性”,无异物样本定义为“阴性”。 计算了预测结果的灵敏度(Se)和特异性(Sp),并将其用于估计最佳校准模型的能力。 结果如表3所示。
表3 含异物人造肉BP-ANN验证结果Table 3 BP-ANN verification results of artificialmeat containing foreign matters
结果显示,3×3尺寸下,一个无异物人造肉样本被误判,三个含异物人造肉样本被误判为无异物,总体识别率达96%。 5×5尺寸下,无异物人造肉被全部识别, 有两个含异物人造肉样本被误判为无异物,总体识别率达98%。 10×10尺寸下,一个无异物人造肉样本被误判,两个含异物人造肉样本被误判为无异物,总体识别率达97%。 从结果看,异物尺寸对模型准确率几乎没有影响,准确率没有大的变化,同时也验证了高光谱成像技术结合模式识别模型对人造肉中低色度差异物检测的可行性。
3 结 论
以人造肉生产加工过程中常见的低色度差异物(塑料、硅胶和玻璃)为研究对象,利用高光谱成像技术结合模式识别模型算法建立了异物的判别模型,并实现异物位置的可视化。 结果表明SG光谱预处理方法在光谱数据降噪方面效果最佳,主成分变量结合BP-ANN模型在低色度差异物识别中稳定性和识别率效果最佳,异物的尺寸对模式识别模型稳定性的影响有限,对最终判别结果的影响可忽略不计,对于人造肉中的低色度差异物,高光谱法检测准确率显著高于计算机视觉法。