一种基于高光谱图像的熟牛肉TVB-N含量预测方法

1 材料和方法

1.1 样本准备

试验中的熟牛肉来自北京稻香村食品有限责任公司，购买当天同一批次的熟牛肉样本，存储于(4±1) ℃的保温箱内在30 min内运到实验室进行后期处理。将同一批次熟牛肉切割制作成尺寸为长5 cm，宽3 cm，厚1 cm的91个切片样本，每个样本约为10 g。用无菌均质袋将样本密封放在恒温(4±1) ℃的冰箱内保存。分别在第1、4、7、10、13、16、19天取13个样本进行试验。每次试验时，将装有样本无菌均质袋打开，在空气中暴露30 min，待表面水分蒸发后，进行高光谱数据采集。

1.2 高光谱图像获取及TVB-N测定

试验所用的高光谱成像系统见图1。将待测样品1放置在载物台2上，调整载物台与聚焦镜头5的垂直距离与标准位相一致；仪器启动后，由精密步进电机3(EZHR17EN, AllMotion, Inc., USA)控制载物平台水平移动，确保待测样品可以被全面扫描；一套150 W稳定输出卤素灯光源4(3900-ER, Illumination Technologies，Inc., USA)发出入射光，经待测样品吸收、散射、漫反射等作用后，待测样品表面反射光经聚焦镜头聚焦，然后被光谱仪6(ImSpector VNIR-V10E-EMCCD, Spectral Imaging Ltd., Oulu, Finland)分光后，再由面阵近红外相机7 (Andor Luca EMCCD DL-604M, Andor Technology PLC, Belfast, UK)进行成像，最终由CCD控制器将采集到的肉样高光谱图像数据传送到计算机8 (Dell E6520, Intel Core i7-2620M@2.70 GHz，RAM 4G)中，进行后续的分析与处理。除计算机外，整套系统被放置在一个暗箱9当中，避免外界杂散光的干扰。

高光谱成像设备采集光谱范围320～1 100 nm的高光谱图像，光谱分辨率为2.8 nm。入射光的夹缝宽度为30 μm，相机曝光时间为22 ms，载物台的移动速度为0.85 mm/s，肉样与聚焦镜头的距离为480 mm。

对已得到高光谱图像的熟牛肉样本，立即进行化学试验。通过半微量凯氏定氮法(GB/T 5009.44-2003)测定其挥发性盐基氮(TVB-N)含量，仪器采用SPD60自动凯氏定氮仪(北京三品科创仪器有限公司)。

1.3 高光谱图像黑白校正

高光谱成像系统在数据获取时，由于不同的相机，不同的高光谱成像系统的配置参数，导致所得到光谱存在一定差异，即使是相同的参数设置，相同的样本，在非同一成像系统中获得的未经校正的辐射值也会存在不一致的现象[8]。故当需要样本对象的反射值时，图像辐射校正是必须的。在校准时，设置好成像系统的参数不变，对反射率为99%的标准白色校正板分别在灯光源镜盖全打开和全关闭状态下，取得全白标定图像Iwhite和全黑标定图像Idark，最后根据式(1)计算校正后图像I。

1. 待测样品 2. 载物台 3. 精密步进电机 4. 卤素灯光源 5. 聚焦镜头 6. 光谱议 7. 面阵近红外相机 8. 计算机 9. 暗箱

图1 高光谱成像系统

Figure 1 Hyperspectral imaging system

(1)

式中：

I——校正后的图像；

Iwhite——全白标定图像；

Idark——全黑标定图像；

Iimg——高光谱图像获得的原始光谱数据；

DN——亮度最大值，取4 096。

1.4 感兴趣区域(Region of Interest，ROI)识别及光谱提取

为了能够准确地反映熟牛肉在(4±1) ℃的存储条件下品质信息，利用图像分割技术将校正后的高光谱图像划分成50 px×50 px的肌肉子样本ROI图像。去除脂肪和其他结蹄组织(原因在于实际化学试验测量TVB-N时，需要将二者剔除)。将选取的子样本图像进行特定光谱下的均值处理，得到每一个样本在特定波段下的光谱值。该步骤在软件ENVI 5.1上操作实现。

1.5 特征波长选取

通过光谱范围在320～1 100 nm内的高光谱成像系统(分辨率约为2.8 nm)获得的每一个样本高光谱图像均是一个三维立方体数据，该立方体数据包含了278个波段的高光谱图像(数据处理软件ENVI中显示光谱增量约为0.7 nm的1 000个连续波段)，且在连续波段间的信息具有冗余性、多重共线性等特征。然而这些特征会导致在提取光谱特征中耗时，并严重影响高光谱图像处理的计算速度，故必须加入光谱校正处理。因此，为了减轻数据处理的负担，对高光谱数据进行波长特征提取是十分有意义的[9]。本研究采用连续投影算法(successive projection algorithm，SPA)[10]进行特征波长提取。SPA是一种前向循环选择方法，在多元校正的变量选择上，SPA被证明是有效的，并被广泛用于波长特征提取。它从一个波长开始计算，每次循环计算它在未选入波长上的投影，将投影向量最大的波长引入到波长组合中去，且每一次新选入到波长组合中的波长，均与前一个的线性关系最小。本研究中，SPA算法的处理过程在软件MATLAB R2014a上编程实现。经过多元散射校正和移动平均平滑法预处理后，共得到基于光谱增量约为0.7 nm、波长范围为320～1 100 nm 的连续波段中的1 000个波段。为了降低光谱数据的维度和处理数据所用的时间，采用SPA算法进行光谱特征的选取。最终得到10个光谱特征，波长分别为424，552，573，624，702，732，762，787，984，1 023 nm。

1.6 纹理特征提取

灰度共生矩阵(GLCM)是一种有效的统计纹理分析技术，对图像的所有像元进行统计调查，以便描述其灰度分布[11]。本试验应用灰度共生矩阵建立4个特征向量：对比度(CON)、相关性(COR)、熵(EN)和同质性(HOM)从0°，45°，90°，135° 4个方向和距离为3的灰度共生矩阵进行提取，然后将4个方向上的特征向量先求和，再取其均值。这4个参数根据以下方程[12]给出：

(2)

(3)

(4)

(5)

(6)

(7)

(8)

(9)

式中：

X——图像的行数，这里取50；

Y——图像的列数，这里取50；

i——GLCM的行数；

j——GLCM的列数；

g(i,j)——GLCM函数。

为了降低高光谱图像数据量大而导致的计算量大这一问题，本试验只选取之前提取的特征波段下的高光谱图像进行纹理特征提取来简化计算复杂度，图像层采用灰度共生矩阵(Gray Level Co-occurrence Matrix，GLCM)在10个光谱特征下的灰色图像进行纹理特征提取，共提取40个纹理特征。GLCM方法的实现在软件Matlab R2014a上实现。

1.7 特征融合

对于光谱数据和纹理信息两种不同类型的特征变量，采用了两种不同的基于PCA融合方案。方案一：分别对光谱特征、纹理特征进行主成分分析(PCA)得到8个基于光谱特征的，以及30个基于纹理特征的PC得分变量；方案二：将光谱特征和纹理特征合并后，再应用PCA方法，同样也得到38个得分变量。Dasarathy模型将信息融合分为5种类型，本文采用的方法属于其中的FEI-FEO类型[13]。PCA算法的处理过程在软件MATLAB R2014a上编程实现。

1.8 数据预测模型建立与评价

采用SVR方法建立熟牛肉中TVB-N 的预测模型，支持向量回归通过ε不敏感函数的引入，运用支持向量机(SVM)学习方法可以实现具有较强鲁棒性的回归分析，且回归分析估计是稀疏的，保留了SVM的原有优点[14]。Liu Peng等[15]在基于电子鼻技术的鸡蛋中TVB-N含量预测模型验证了与反向传递神经网络相比，SVR展现出更好的预测精确和泛化能力。

为了对所建TVB-N预测模型进行评估判定，使用留一法交叉验证[16]，每次留出一个来自校正模型的测试样本，随后基于剩下的校准样本建立预测模型，来预测先前预留的测试样本。模型的性能指标采用平均预测精度(The Average Predicting Accuracy，APA)，均方根误差(The Root Mean Square Error，RMSE)进行评估。APA和RMSE通过式(6)～(7)[15]计算。

(10)

(11)

式中：

N——样本数目，根据样本集不同，取值不同；

bi——样本TVB-N含量的实测值，mg/100 g；

bip——样本TVB-N含量的预测值，mg/100 g。

2 结果与讨论

2.1 TVB-N含量变化

在熟牛肉储存期间，TVB-N含量的变化：从第1天的8.480 mg/100 g逐渐增加到第19天的28.495 mg/100 g，新鲜度则是随着TVB-N含量的增加而降低。变化趋势见图2。

2.2 光谱特征分析

在320～1 100 nm波长区间内，使用ENVI选取1 000个波段。分别储存1，4，7，10，13，16，19 d的熟牛肉样本的平均反射光谱见图3。由图3可知，随着储存时间的增加，光谱反射值在梯度上有明显减少。这些变化可能是由于熟牛肉在冷藏期间，其物理属性和化学成分变化(微生物腐败、酶活性)引起。此现象在Xiong Zhen-Jie等[17]应用高光谱成像系统监测鸡肉的脂质氧化中也观察到，并得到认同。光谱反射值在波长430，550，580 nm有明显的波段特征，可能是色素(例如肌红蛋白、血红蛋白)的吸收引起；光谱反射值在波长780 nm和970 nm也被指出可能分别对应O—H键的三级倍频和二级倍频。基于以上分析，熟牛肉样本在不同存储时间获得的反射光谱均值具有明显的梯度差异以及复杂的形态变化。因此，为了能够更好地发掘熟牛肉高光谱图像中与TVB-N 含量相关的有用信息，对熟牛肉进行化学定量分析是十分必要的。

图2 TVB-N含量变化趋势图

在第600波段处，从上至下依次为存储1，4，7，10，13，16，19熟牛肉的光谱均值

图3 不同存储时间的熟牛肉平均光谱图

Figure 3 Mean spectra of cooked beef with different storage time

2.3 数据预处理

高光谱数据除了含有熟牛肉样本自身信息外，还包含有其他无关信息和噪声(电噪声，样品背景等)。为了降低噪声的影响，对高光谱数据进行预处理操作，具体步骤：

(1) 矢量归一化：将其数值转换到[-1,1]区间，以便减少后期计算量。

(2) 移动平均平滑：采用滑动窗口大小为5，提高数据的信噪比。

(3) 多元散射校正：消除固体颗粒分布不均匀及颗粒大小产生的散射影响。

光谱预处理结果见图4。

2.4 模型构建和预测

随机将91个样本中的2/3为训练集(61个)，其余为测试集(30个)。对经过预处理后的全光谱特征采用多元线性回归方法和支持向量回归方法建立熟牛肉TVB-N含量的定量预测模型。支持向量回归方法使用默认参数。由表1可知，在SVR使用默认参数的情况下，其多项式核函数的模型性能最优，性能指标APA达78.84%。

对光谱图像特征分别经过两种方案融合后，使用表1中结果最优的多项式核函数SVR模型，对SVR内置参数惩罚因子c，epsilon损失函数参数，以及多项式核函数的内部参数gamma选用网格搜索和十折交叉验证进行参数寻优，对应参数c= 2，epsilon = 2-5，gamma =22时，模型性能最优。结果见表2。

由表2可知，在平均预测精确度APA这一指标上，基于特征方案一所建立的SVR预测模型性能最佳，其次是基于特征方案二的，基于全光谱的。结果显示基于Dasarathy’s 分类模型利用PCA对特征集进行分析，无论是方案一还是方案二对特征进行整合，熟牛肉TVB-N含量预测模型的性能指标参数APA均有一定程度的提升。而根据方案一所建立的SVR模型在APA这一模型性能指标上，其值从82.24%增加到85.13%；方案二所建立的SVR模型在APA这一模型性能指标上，其值从82.24%增加到83.77%。采用图像纹理特征信息对肉品品质进行分析与评价的研究早有报道，Huang等[3]利用纹理特征对猪肉的新鲜度进行预测，其预测模型相关系数达到83.25%，而本试验中基于纹理特征的SVR预测模型性能与其相比，预测模型性能偏低。其原因可能是试验研究所选用的样品是熟肉，在储存期间，肉质腐败过程中，其纹理变化不是很明显，而生肉在腐败过程中，肉质会糜烂，纹理变化更为突出。

图4 光谱预处理前后对比图

Figure 4 Comparison of the spectra before and after the spectral pretreatment (left is the original spectrum, right is the post-pretreatment spectrum)

表1 不同核函数SVR模型及多元线性回归模型性能对比

Table 1 SVR model of different kernel functions and multiple linear regression model performance comparison

SVR训练样本RMSEAPA测试样本RMSEAPA线性核函数3.2478.293.9675.96多项式核函数3.3782.944.0378.84径向基核函数(RBF)3.7177.164.1873.08Sigmoid核函数4.1872.344.6969.92多元线性回归3.1678.374.1774.12

表2 不同特征下的多项式核函数SVR模型性能对比

Table 2 Comparison of SVR model performance for polynomial kernel functions with different features

特征类型训练样本RMSEAPA测试样本RMSEAPA单光谱特征 1.7182.572.3480.27单纹理特征 3.8775.914.5373.16光谱纹理特征1.5484.272.1282.24全光谱特征 2.1484.572.8182.61特征方案一 1.2686.941.9185.13特征方案二 2.3184.642.8483.77

3 结论

本试验表明，通过整合HSI系统的光谱图像信息，熟牛肉中TVB-N含量预测模型在APA这一性能指标下从82.35%增加到85.28%，同时也能得出数据融合技术在无损检测中不应被低估。两种基于PCA的融合方案对比显示：对单一特征集分别进行PCA分析再进行融合比对特征融合后再进行PCA分析所建模型性能更优。整合HSI系统的图谱信息并结合信息融合技术能够进一步提升所建模型的准确性。在今后的试验工作中，对Dasarathy’s分类模型的中间分析步骤进行其他相关分析，最终确定最优的特征分析算法。

[1] HUANG Lin, ZHAO Jie-wen, CHEN Quan-sheng, et al. Nondestructive measurement of total volatile basic nitrogen (TVB-N) in pork meat by integrating near infrared spectroscopy, computer vision and electronic nose techniques[J]. Food Chemistry, 2014, 145(7): 228-236.

[2] DAI Qiong, CHENG JUN-hu, Sun Da-wen, et al. Prediction of total volatile basic nitrogen contents using wavelet features from visible/near-infrared hyperspectral images of prawn (Metapenaeus ensis)[J]. Food Chemistry, 2016, 197(Pt A): 257-65.[3] HUANG Qi-ping, CHEN Quan-sheng, LI Huan-huan, et al. Non-destructively sensing pork’s freshness indicator using near infrared multispectral imaging technique [J]. Journal of Food Engineering, 2015, 154(116): 69-75.

[4] 刘燕德, 张光伟. 高光谱成像技术在农产品检测中的应用[J]. 食品与机械, 2012, 28(5): 223-226, 242.

[5] CHENG Wei-wei, SUN Da-wen, PU Hong-bin, et al. Integration of spectral and textural data for enhancing hyperspectral prediction of K value in pork meat[J]. LWT - Food Science and Technology, 2016, 72: 322-329.

[6] KHULAL Urmila, ZHAO Jie-wen, HU Wei-wei, et al. Intelligent evaluation of total volatile basic nitrogen (TVB-N) content in chicken meat by an improved multiple level data fusion model[J]. Sensors & Actuators B Chemical, 2016, 238: 337-345.

[7] 思振华, 何建国, 刘贵珊, 等. 基于高光谱图像技术羊肉表面污染无损检测[J]. 食品与机械, 2013, 29(5): 75-79.

[8] SUN Da-wen. Hyperspectral imaging for food quality analysis and control [M]. Massachusetts: Academic Press, 2010: 56.

[9] ANDERSEN C M, BRO R. Variable selection in regression: a tutorial [J]. Journal of Chemometrics, 2010, 24(11/12): 728-737.

[10] MOREIRA E D T, PONTES M J C, GALVO R K H, et al. Near infrared reflectance spectrometry classification of cigarettes using the successive projections algorithm for variable selection[J]. Talanta, 2009, 79(5): 1 260-1 264.

[11] LIU Dan, PU Hong-bin, SUN Da-wen, et al. Combination of spectra and texture data of hyperspectral imaging for prediction of pH in salted meat[J]. Food Chemistry, 2014, 160(10): 330-337.

[12] HARALICK R M, SHANMUGAM K, DINSTEIN I. Textural features for image classification [J]. IEEE Transactions on Systems, Man, and Cybernetics, 1973, 3(6): 610-621.

[13] DASARATHY B V. Sensor fusion potential exploitation: Innovative architectures and illustrative applications [J]. Proceedings of the IEEE, 1997, 85(1): 24-38.

[14] VAPNIK V N. The nature of statistical learning theory[M]. New York: Springer, 1995: 156-160.

[15] LIU Peng, TU Kang. Prediction of TVB-N content in eggs based on electronic nose [J]. Food Control, 2012, 23(1): 177-183.

[16] ELMASRY G, WOLD J P. High-speed assessment of fat and water content distribution in fish fillets using online imaging spectroscopy [J]. Journal of Agricultural & Food Chemistry, 2008, 56(17): 7 672-7 677.

[17] XIONG Zhen-jie, SUN Da-wen, PU Hong-bin, et al. Non-destructive prediction of thiobarbituric acid reactive substances (TBARS) value for freshness evaluation of chicken meat using hyperspectral imaging [J]. Food Chemistry, 2015, 179(1): 175-181.

A method for predicting TVB-N content of cooked beef based on hyperspectral image

TIAN Wei-xin1HEDan-dan1YANGDong2LUAn-xiang1,2

(1.CollegeofComputerandInformationTechnology,ChinaThreeGorgesUniversity,Yichang,Hubei443002,China; 2.BeijingResearchCenterforAgriculturalStandardsandTesting,BeijingAcademyofAgricultureandForestrySciences,Beijing100097,China)

Based on the shortcomings of the traditional detection methods for meat freshness, such as time-consuming, laborious, low efficiency, loss and other defects, and put forward using hyperspectral imaging (HSI) technology to predict cooked beef freshness index of volatile basic nitrogen (TVB-N) content. Firstly, the hyperspectral data of cooked beef samples were obtained by HSI system, and the black and white correction was carried out. And then, the hyperspectral data was preprocessed using the moving average smoothing and the multiple scattering corrections. Finally, the support vector regression (SVR) method was used to establish the prediction model of TVB-N content based on the whole spectral feature, single spectral feature, single texture feature and PCA fusion feature. The experimental results showed that the Average Predicting Accuracy (APA) for the TVB-N content index of freshness could reach 85.13% by SVR model with PCA fusion feature, also showed that hyperspectral imaging technology combined with information fusion technology could improve the prediction accuracy of the model.

hyperspectral imaging; TVB-N content; feature fusion; support vector regression; cooked beef

10.13652/j.issn.1003-5788.2016.12.015

国家科技支撑项目(编号：2014BAD04B05-2)

田卫新，男，三峡大学计算机与信息学院副教授，博士。

陆安祥(1980-)，男，北京市农林科学院北京农业质量标准与检测技术研究中心副研究员，博士。 E-mail: luax@brcast.org.cn

2016—10—25