一种基于高光谱图像的熟牛肉TVB-N含量预测方法
2016-02-18田卫新何丹丹陆安祥
田卫新 何丹丹 杨 东 陆安祥,
(1. 三峡大学计算机与信息学院,湖北 宜昌 443002;2. 北京市农林科学院北京农业质量标准与检测技术研究中心,北京 100097)
一种基于高光谱图像的熟牛肉TVB-N含量预测方法
田卫新1何丹丹1杨 东2陆安祥1,2
(1. 三峡大学计算机与信息学院,湖北 宜昌 443002;2. 北京市农林科学院北京农业质量标准与检测技术研究中心,北京 100097)
传统肉制品新鲜度检测方法具有耗时费力、效率低、有损等缺陷,提出利用高光谱成像(HSI)技术预测熟牛肉新鲜度指标挥发性盐基氮(TVB-N)含量。首先通过HSI系统获取熟牛肉样本的高光谱数据,并进行黑白校正。进而采用移动平均平滑和多元散射校正对高光谱数据进行预处理。最后采用支持向量回归(SVR)方法分别建立基于全光谱特征、单一光谱特征、单一纹理特征、主成分分析(PCA)融合特征对TVB-N含量的预测模型。结果显示,使用PCA融合特征的SVR模型,对新鲜度的关键指标TVB-N含量的平均预测准确度(APA)可达到85.13%,表明高光谱成像技术与信息融合技术相结合能够提升模型准确度。
高光谱成像;TVB-N含量;特征融合;支持向量回归;熟牛肉
新鲜度是评估肉类品质安全最重要的参数,熟牛肉制品的新鲜度受微生物过程、物理化学过程的影响[1]。在其腐败变质过程中,碳水化合物、蛋白质以及脂肪等主要成分在微生物分泌的酶和加工后二次污染菌的作用下分解,如细菌、霉菌、酵母菌等,产生碳氢化合物、醇、醛、氨、硫化氢、乙醛等挥发性有机物,引起熟牛肉制品内部成分等化学特性发生变化,同时也使牛肉制品的颜色、纹理等物理特性发生相应的变化。相比单纯基于光谱特征[2]和基于纹理特征[3]的方法,HSI技术由于能将光谱和图像结合以提供更多的信息,成为研究热点[4-7]。
高光谱图像技术在生鲜肉品检测方面已有较多研究。Cheng Wei-wei等[5]研究将光谱和纹理数据整合对于增强猪肉K值高光谱预测能力,通过SPA提取光谱特征和GLCM提取纹理特征,使用特征级融合整合光谱和纹理数据并建立基于特征融合的最小二乘回归预测模型,相比于单一光谱数据或纹理数据,性能有17.5%的提升;Khulal Urmila等[6]对鸡肉的TVB-N含量进行预测,分别从气味传感器和光学传感器(HSI)获得气味数据和光谱图像数据,融合后生成特征数据集,使用该数据集所建模型比单一特征数据集使用PCA结合BPANN所建模型体现更好的预测性能,其预测模型的决定系数(RP)为0.865 9,预测标准偏差(RMSEP)为4.587 mg/100 g,经过皮尔森相关分析、消除无关变量及改良多级别数据融合方法后,RP提高到0.881 9,RMSEP降低到4.313 7 mg/100 g。相比生鲜肉制品,熟牛肉储存时,变质速度及纹理变化过程具有不同特点,当前利用高光谱图像预测熟牛肉TVB-N含量的文献报道比较少。
本研究拟提取熟牛肉高光谱图像数据中的光谱特征与纹理特征后,利用主成分分析(PCA)方法融合生成特征集,采用SVR方法建立熟牛肉新鲜度指标TVB-N含量的预测模型,并与基于单一特征的预测模型进行对比。
1 材料和方法
1.1 样本准备
试验中的熟牛肉来自北京稻香村食品有限责任公司,购买当天同一批次的熟牛肉样本,存储于(4±1) ℃的保温箱内在30 min内运到实验室进行后期处理。将同一批次熟牛肉切割制作成尺寸为长5 cm,宽3 cm,厚1 cm的91个切片样本,每个样本约为10 g。用无菌均质袋将样本密封放在恒温(4±1) ℃的冰箱内保存。分别在第1、4、7、10、13、16、19天取13个样本进行试验。每次试验时,将装有样本无菌均质袋打开,在空气中暴露30 min,待表面水分蒸发后,进行高光谱数据采集。
1.2 高光谱图像获取及TVB-N测定
试验所用的高光谱成像系统见图1。将待测样品1放置在载物台2上,调整载物台与聚焦镜头5的垂直距离与标准位相一致;仪器启动后,由精密步进电机3(EZHR17EN, AllMotion, Inc., USA)控制载物平台水平移动,确保待测样品可以被全面扫描;一套150 W稳定输出卤素灯光源4(3900-ER, Illumination Technologies,Inc., USA)发出入射光,经待测样品吸收、散射、漫反射等作用后,待测样品表面反射光经聚焦镜头聚焦,然后被光谱仪6(ImSpector VNIR-V10E-EMCCD, Spectral Imaging Ltd., Oulu, Finland)分光后,再由面阵近红外相机7 (Andor Luca EMCCD DL-604M, Andor Technology PLC, Belfast, UK)进行成像,最终由CCD控制器将采集到的肉样高光谱图像数据传送到计算机8 (Dell E6520, Intel Core i7-2620M@2.70 GHz,RAM 4G)中,进行后续的分析与处理。除计算机外,整套系统被放置在一个暗箱9当中,避免外界杂散光的干扰。
高光谱成像设备采集光谱范围320~1 100 nm的高光谱图像,光谱分辨率为2.8 nm。入射光的夹缝宽度为30 μm,相机曝光时间为22 ms,载物台的移动速度为0.85 mm/s,肉样与聚焦镜头的距离为480 mm。
对已得到高光谱图像的熟牛肉样本,立即进行化学试验。通过半微量凯氏定氮法(GB/T 5009.44-2003)测定其挥发性盐基氮(TVB-N)含量,仪器采用SPD60自动凯氏定氮仪(北京三品科创仪器有限公司)。
1.3 高光谱图像黑白校正
高光谱成像系统在数据获取时,由于不同的相机,不同的高光谱成像系统的配置参数,导致所得到光谱存在一定差异,即使是相同的参数设置,相同的样本,在非同一成像系统中获得的未经校正的辐射值也会存在不一致的现象[8]。故当需要样本对象的反射值时,图像辐射校正是必须的。在校准时,设置好成像系统的参数不变,对反射率为99%的标准白色校正板分别在灯光源镜盖全打开和全关闭状态下,取得全白标定图像Iwhite和全黑标定图像Idark,最后根据式(1)计算校正后图像I。
1. 待测样品 2. 载物台 3. 精密步进电机 4. 卤素灯光源 5. 聚焦镜头 6. 光谱议 7. 面阵近红外相机 8. 计算机 9. 暗箱
图1 高光谱成像系统
Figure 1 Hyperspectral imaging system
(1)
式中:
I——校正后的图像;
Iwhite——全白标定图像;
Idark——全黑标定图像;
Iimg——高光谱图像获得的原始光谱数据;
DN——亮度最大值,取4 096。
1.4 感兴趣区域(Region of Interest,ROI)识别及光谱提取
为了能够准确地反映熟牛肉在(4±1) ℃的存储条件下品质信息,利用图像分割技术将校正后的高光谱图像划分成50 px×50 px的肌肉子样本ROI图像。去除脂肪和其他结蹄组织(原因在于实际化学试验测量TVB-N时,需要将二者剔除)。将选取的子样本图像进行特定光谱下的均值处理,得到每一个样本在特定波段下的光谱值。该步骤在软件ENVI 5.1上操作实现。
1.5 特征波长选取
通过光谱范围在320~1 100 nm内的高光谱成像系统(分辨率约为2.8 nm)获得的每一个样本高光谱图像均是一个三维立方体数据,该立方体数据包含了278个波段的高光谱图像(数据处理软件ENVI中显示光谱增量约为0.7 nm的1 000个连续波段),且在连续波段间的信息具有冗余性、多重共线性等特征。然而这些特征会导致在提取光谱特征中耗时,并严重影响高光谱图像处理的计算速度,故必须加入光谱校正处理。因此,为了减轻数据处理的负担,对高光谱数据进行波长特征提取是十分有意义的[9]。本研究采用连续投影算法(successive projection algorithm,SPA)[10]进行特征波长提取。SPA是一种前向循环选择方法,在多元校正的变量选择上,SPA被证明是有效的,并被广泛用于波长特征提取。它从一个波长开始计算,每次循环计算它在未选入波长上的投影,将投影向量最大的波长引入到波长组合中去,且每一次新选入到波长组合中的波长,均与前一个的线性关系最小。本研究中,SPA算法的处理过程在软件MATLAB R2014a上编程实现。经过多元散射校正和移动平均平滑法预处理后,共得到基于光谱增量约为0.7 nm、波长范围为320~1 100 nm 的连续波段中的1 000个波段。为了降低光谱数据的维度和处理数据所用的时间,采用SPA算法进行光谱特征的选取。最终得到10个光谱特征,波长分别为424,552,573,624,702,732,762,787,984,1 023 nm。
1.6 纹理特征提取
灰度共生矩阵(GLCM)是一种有效的统计纹理分析技术,对图像的所有像元进行统计调查,以便描述其灰度分布[11]。 本试验应用灰度共生矩阵建立4个特征向量:对比度(CON)、相关性(COR)、熵(EN)和同质性(HOM)从0°,45°,90°,135° 4个方向和距离为3的灰度共生矩阵进行提取,然后将4个方向上的特征向量先求和,再取其均值。这4个参数根据以下方程[12]给出:
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
式中:
X——图像的行数,这里取50;
Y——图像的列数,这里取50;
i——GLCM的行数;
j——GLCM的列数;
g(i,j)——GLCM函数。
为了降低高光谱图像数据量大而导致的计算量大这一问题,本试验只选取之前提取的特征波段下的高光谱图像进行纹理特征提取来简化计算复杂度,图像层采用灰度共生矩阵(Gray Level Co-occurrence Matrix,GLCM)在10个光谱特征下的灰色图像进行纹理特征提取,共提取40个纹理特征。GLCM方法的实现在软件Matlab R2014a上实现。
1.7 特征融合
对于光谱数据和纹理信息两种不同类型的特征变量,采用了两种不同的基于PCA融合方案。方案一:分别对光谱特征、纹理特征进行主成分分析(PCA)得到8个基于光谱特征的,以及30个基于纹理特征的PC得分变量;方案二:将光谱特征和纹理特征合并后,再应用PCA方法,同样也得到38个得分变量。Dasarathy模型将信息融合分为5种类型,本文采用的方法属于其中的FEI-FEO类型[13]。PCA算法的处理过程在软件MATLAB R2014a上编程实现。
1.8 数据预测模型建立与评价
采用SVR方法建立熟牛肉中TVB-N 的预测模型,支持向量回归通过ε不敏感函数的引入,运用支持向量机(SVM)学习方法可以实现具有较强鲁棒性的回归分析,且回归分析估计是稀疏的,保留了SVM的原有优点[14]。Liu Peng等[15]在基于电子鼻技术的鸡蛋中TVB-N含量预测模型验证了与反向传递神经网络相比,SVR展现出更好的预测精确和泛化能力。
为了对所建TVB-N预测模型进行评估判定,使用留一法交叉验证[16],每次留出一个来自校正模型的测试样本,随后基于剩下的校准样本建立预测模型,来预测先前预留的测试样本。模型的性能指标采用平均预测精度(The Average Predicting Accuracy,APA),均方根误差(The Root Mean Square Error,RMSE)进行评估。APA和RMSE通过式(6)~(7)[15]计算。
(10)
(11)
式中:
N——样本数目,根据样本集不同,取值不同;
bi——样本TVB-N含量的实测值,mg/100 g;
bip——样本TVB-N含量的预测值,mg/100 g。
2 结果与讨论
2.1 TVB-N含量变化
在熟牛肉储存期间,TVB-N含量的变化:从第1天的8.480 mg/100 g逐渐增加到第19天的28.495 mg/100 g,新鲜度则是随着TVB-N含量的增加而降低。变化趋势见图2。
2.2 光谱特征分析
在320~1 100 nm波长区间内,使用ENVI选取1 000个波段。分别储存1,4,7,10,13,16,19 d的熟牛肉样本的平均反射光谱见图3。由图3可知,随着储存时间的增加,光谱反射值在梯度上有明显减少。这些变化可能是由于熟牛肉在冷藏期间,其物理属性和化学成分变化(微生物腐败、酶活性)引起。此现象在Xiong Zhen-Jie等[17]应用高光谱成像系统监测鸡肉的脂质氧化中也观察到,并得到认同。光谱反射值在波长430,550,580 nm有明显的波段特征,可能是色素(例如肌红蛋白、血红蛋白)的吸收引起;光谱反射值在波长780 nm和970 nm也被指出可能分别对应O—H键的三级倍频和二级倍频。基于以上分析,熟牛肉样本在不同存储时间获得的反射光谱均值具有明显的梯度差异以及复杂的形态变化。因此,为了能够更好地发掘熟牛肉高光谱图像中与TVB-N 含量相关的有用信息,对熟牛肉进行化学定量分析是十分必要的。
图2 TVB-N含量变化趋势图
在第600波段处,从上至下依次为存储1,4,7,10,13,16,19熟牛肉的光谱均值
图3 不同存储时间的熟牛肉平均光谱图
Figure 3 Mean spectra of cooked beef with different storage time
2.3 数据预处理
高光谱数据除了含有熟牛肉样本自身信息外,还包含有其他无关信息和噪声(电噪声,样品背景等)。为了降低噪声的影响,对高光谱数据进行预处理操作,具体步骤:
(1) 矢量归一化:将其数值转换到[-1,1]区间,以便减少后期计算量。
(2) 移动平均平滑:采用滑动窗口大小为5,提高数据的信噪比。
(3) 多元散射校正:消除固体颗粒分布不均匀及颗粒大小产生的散射影响。
光谱预处理结果见图4。
2.4 模型构建和预测
随机将91个样本中的2/3为训练集(61个),其余为测试集(30个)。对经过预处理后的全光谱特征采用多元线性回归方法和支持向量回归方法建立熟牛肉TVB-N含量的定量预测模型。支持向量回归方法使用默认参数。由表1可知,在SVR使用默认参数的情况下,其多项式核函数的模型性能最优,性能指标APA达78.84%。
对光谱图像特征分别经过两种方案融合后,使用表1中结果最优的多项式核函数SVR模型,对SVR内置参数惩罚因子c,epsilon损失函数参数,以及多项式核函数的内部参数gamma选用网格搜索和十折交叉验证进行参数寻优,对应参数c= 2,epsilon = 2-5,gamma =22时,模型性能最优。结果见表2。
由表2可知,在平均预测精确度APA这一指标上,基于特征方案一所建立的SVR预测模型性能最佳,其次是基于特征方案二的,基于全光谱的。结果显示基于Dasarathy’s 分类模型利用PCA对特征集进行分析,无论是方案一还是方案二对特征进行整合,熟牛肉TVB-N含量预测模型的性能指标参数APA均有一定程度的提升。而根据方案一所建立的SVR模型在APA这一模型性能指标上,其值从82.24%增加到85.13%;方案二所建立的SVR模型在APA这一模型性能指标上,其值从82.24%增加到83.77%。采用图像纹理特征信息对肉品品质进行分析与评价的研究早有报道,Huang等[3]利用纹理特征对猪肉的新鲜度进行预测,其预测模型相关系数达到83.25%,而本试验中基于纹理特征的SVR预测模型性能与其相比,预测模型性能偏低。其原因可能是试验研究所选用的样品是熟肉,在储存期间,肉质腐败过程中,其纹理变化不是很明显,而生肉在腐败过程中,肉质会糜烂,纹理变化更为突出。
图4 光谱预处理前后对比图
Figure 4 Comparison of the spectra before and after the spectral pretreatment (left is the original spectrum, right is the post-pretreatment spectrum)
表1 不同核函数SVR模型及多元线性回归模型性能对比
Table 1 SVR model of different kernel functions and multiple linear regression model performance comparison
SVR训练样本RMSEAPA测试样本RMSEAPA线性核函数3.2478.293.9675.96多项式核函数3.3782.944.0378.84径向基核函数(RBF)3.7177.164.1873.08Sigmoid核函数4.1872.344.6969.92多元线性回归3.1678.374.1774.12
表2 不同特征下的多项式核函数SVR模型性能对比
Table 2 Comparison of SVR model performance for polynomial kernel functions with different features
特征类型训练样本RMSEAPA测试样本RMSEAPA单光谱特征 1.7182.572.3480.27单纹理特征 3.8775.914.5373.16光谱纹理特征1.5484.272.1282.24全光谱特征 2.1484.572.8182.61特征方案一 1.2686.941.9185.13特征方案二 2.3184.642.8483.77
3 结论
本试验表明,通过整合HSI系统的光谱图像信息,熟牛肉中TVB-N含量预测模型在APA这一性能指标下从82.35%增加到85.28%,同时也能得出数据融合技术在无损检测中不应被低估。两种基于PCA的融合方案对比显示:对单一特征集分别进行PCA分析再进行融合比对特征融合后再进行PCA分析所建模型性能更优。整合HSI系统的图谱信息并结合信息融合技术能够进一步提升所建模型的准确性。在今后的试验工作中,对Dasarathy’s分类模型的中间分析步骤进行其他相关分析,最终确定最优的特征分析算法。
[1] HUANG Lin, ZHAO Jie-wen, CHEN Quan-sheng, et al. Nondestructive measurement of total volatile basic nitrogen (TVB-N) in pork meat by integrating near infrared spectroscopy, computer vision and electronic nose techniques[J]. Food Chemistry, 2014, 145(7): 228-236.
[2] DAI Qiong, CHENG JUN-hu, Sun Da-wen, et al. Prediction of total volatile basic nitrogen contents using wavelet features from visible/near-infrared hyperspectral images of prawn (Metapenaeus ensis)[J]. Food Chemistry, 2016, 197(Pt A): 257-65.[3] HUANG Qi-ping, CHEN Quan-sheng, LI Huan-huan, et al. Non-destructively sensing pork’s freshness indicator using near infrared multispectral imaging technique [J]. Journal of Food Engineering, 2015, 154(116): 69-75.
[4] 刘燕德, 张光伟. 高光谱成像技术在农产品检测中的应用[J]. 食品与机械, 2012, 28(5): 223-226, 242.
[5] CHENG Wei-wei, SUN Da-wen, PU Hong-bin, et al. Integration of spectral and textural data for enhancing hyperspectral prediction of K value in pork meat[J]. LWT - Food Science and Technology, 2016, 72: 322-329.
[6] KHULAL Urmila, ZHAO Jie-wen, HU Wei-wei, et al. Intelligent evaluation of total volatile basic nitrogen (TVB-N) content in chicken meat by an improved multiple level data fusion model[J]. Sensors & Actuators B Chemical, 2016, 238: 337-345.
[7] 思振华, 何建国, 刘贵珊, 等. 基于高光谱图像技术羊肉表面污染无损检测[J]. 食品与机械, 2013, 29(5): 75-79.
[8] SUN Da-wen. Hyperspectral imaging for food quality analysis and control [M]. Massachusetts: Academic Press, 2010: 56.
[9] ANDERSEN C M, BRO R. Variable selection in regression: a tutorial [J]. Journal of Chemometrics, 2010, 24(11/12): 728-737.
[10] MOREIRA E D T, PONTES M J C, GALVO R K H, et al. Near infrared reflectance spectrometry classification of cigarettes using the successive projections algorithm for variable selection[J]. Talanta, 2009, 79(5): 1 260-1 264.
[11] LIU Dan, PU Hong-bin, SUN Da-wen, et al. Combination of spectra and texture data of hyperspectral imaging for prediction of pH in salted meat[J]. Food Chemistry, 2014, 160(10): 330-337.
[12] HARALICK R M, SHANMUGAM K, DINSTEIN I. Textural features for image classification [J]. IEEE Transactions on Systems, Man, and Cybernetics, 1973, 3(6): 610-621.
[13] DASARATHY B V. Sensor fusion potential exploitation: Innovative architectures and illustrative applications [J]. Proceedings of the IEEE, 1997, 85(1): 24-38.
[14] VAPNIK V N. The nature of statistical learning theory[M]. New York: Springer, 1995: 156-160.
[15] LIU Peng, TU Kang. Prediction of TVB-N content in eggs based on electronic nose [J]. Food Control, 2012, 23(1): 177-183.
[16] ELMASRY G, WOLD J P. High-speed assessment of fat and water content distribution in fish fillets using online imaging spectroscopy [J]. Journal of Agricultural & Food Chemistry, 2008, 56(17): 7 672-7 677.
[17] XIONG Zhen-jie, SUN Da-wen, PU Hong-bin, et al. Non-destructive prediction of thiobarbituric acid reactive substances (TBARS) value for freshness evaluation of chicken meat using hyperspectral imaging [J]. Food Chemistry, 2015, 179(1): 175-181.
A method for predicting TVB-N content of cooked beef based on hyperspectral image
TIAN Wei-xin1HEDan-dan1YANGDong2LUAn-xiang1,2
(1.CollegeofComputerandInformationTechnology,ChinaThreeGorgesUniversity,Yichang,Hubei443002,China; 2.BeijingResearchCenterforAgriculturalStandardsandTesting,BeijingAcademyofAgricultureandForestrySciences,Beijing100097,China)
Based on the shortcomings of the traditional detection methods for meat freshness, such as time-consuming, laborious, low efficiency, loss and other defects, and put forward using hyperspectral imaging (HSI) technology to predict cooked beef freshness index of volatile basic nitrogen (TVB-N) content. Firstly, the hyperspectral data of cooked beef samples were obtained by HSI system, and the black and white correction was carried out. And then, the hyperspectral data was preprocessed using the moving average smoothing and the multiple scattering corrections. Finally, the support vector regression (SVR) method was used to establish the prediction model of TVB-N content based on the whole spectral feature, single spectral feature, single texture feature and PCA fusion feature. The experimental results showed that the Average Predicting Accuracy (APA) for the TVB-N content index of freshness could reach 85.13% by SVR model with PCA fusion feature, also showed that hyperspectral imaging technology combined with information fusion technology could improve the prediction accuracy of the model.
hyperspectral imaging; TVB-N content; feature fusion; support vector regression; cooked beef
10.13652/j.issn.1003-5788.2016.12.015
国家科技支撑项目(编号:2014BAD04B05-2)
田卫新,男,三峡大学计算机与信息学院副教授,博士。
陆安祥(1980-),男,北京市农林科学院北京农业质量标准与检测技术研究中心副研究员,博士。 E-mail: luax@brcast.org.cn
2016—10—25