基于BP和Adaboost-BP神经网络的羊肉新鲜度高光谱定性分析
2018-03-13范中建朱荣光张凡凡姚雪东邱园园
范中建,朱荣光,张凡凡,姚雪东,邱园园,阎 聪
(1.石河子大学机械电气工程学院,新疆石河子 832003;2.石河子大学动物科技学院,新疆石河子 832003)
0 引 言
【研究意义】在贮存过程中羊肉新鲜度逐渐降低,挥发性盐基氮(TVB-N)含量常作为评价肉类新鲜度的重要指标,通常以TVB-N<15 mg/100 g、15 mg/100 g
1 材料与方法
1.1 材 料
试验肉样取自20只当天宰杀的小尾寒羊外脊部位,购于新疆石河子市农贸市场。将羊肉置于4℃冷藏箱运回农畜产品实验室,切片处理成大小约4 cm×4 cm×2 cm的羊肉样品共72个,使用保鲜袋密封、编号后于4℃恒温箱中贮藏1~14 d,每隔24 h随机取出5个样品进行羊肉高光谱图像采集和新鲜度指标TVB-N值的测定,其中第7 d测7个样品。
1.2 方 法
1.2.1 高光谱图像采集系统
高光谱图像采集系统主要包括:图像光谱仪(ImSpector V10E-QE,芬兰)、CMOS相机(MV-1024E,Rocketech科技)、两个150 W的光纤卤素灯(3 900 Illuminatior, Illumination科技)、暗箱、电控位移平台和控制计算机等。该光谱仪光谱范围为400~1 000 nm,光谱分辨率为0.63 nm。为确保采集的图像清晰,经反复实验确定相机曝光时间为10 ms,样品与镜头间距为38 cm,位移平台移动速度为1.25 mm/s。
为去除相机中的暗电流以及不均匀光强对图像的噪声影响,需对高光谱图像进行黑白校正。校正公式R=DN×(Rraw-Rdark)/(Rwhite-Rdark)[6],其中R为校正后图像;Rraw为原始图像;Rwhite为标准白板扫描图像;Rdark为黑板参考图像;DN是亮度最大值,取4 095[7],由于高光谱系统输出为12位,因此数值DN范围为0~4 095。
1.2.2 TVB-N测定及羊肉新鲜度评价
采集完样品高光谱图像后,按照GB/T 5009.44-2003中半微量定氮法测定TVB-N值[8],为保证实验结果的一致性,实验前先对样品集中进行预处理,将滤液保存在冰箱中待测,每个样品作2次平行实验,取平均值作为最终测定结果。依据测定结果将羊肉新鲜度划分为3个等级:新鲜(TVBN≤15 mg/100 g),次鲜(15
1.2.3 光谱特征提取
为了有效处理数据,需对数据进行压缩。目前压缩波段有两种方法:1.从众多波段中选择感兴趣的若干波段进行分析;2.利用所有波段通过数学变换进行数据压缩。连续投影算法(SPA)是一种简单、快速的特征变量选择方法,基于光谱变量之间的投影分析提取含有最低限度冗余和最小共线性影响的特征变量组,最大程度地减少信息重叠[9];主成分分析(PCA)是通过数据转换将原始变量化为较少几个综合指标的降维方法,可以利用少数几个主成分来反映原始数据中的大部分信息,通常取累计贡献率在85%或90%以上的前几个主成分进行分析[10]。
1.2.4 分类模型及模型参数设置
反向传播(BP)神经网络是一种误差逆向传播算法,通过不断调节网络权重,使网络的最终输出与期望输出尽可能接近,具有良好的非线性逼近能力,但由于BP神经网络初始权值和阈值一般随机选择,模型易陷入局部极小值[11,12]。模型以SPA、PCA提取的特征作为输入、新鲜度等级为输出,优化隐含层神经元个数,参数设置如下:训练函数选择‘trainlm’,隐含层和输出层传递函数分别为‘tansig’、‘logsig’,网络训练目标误差设为0,学习速率为0.1,训练最大步数设为1 000。
自适应提升BP算法(Adaboost-BP)是以BP神经网络作为弱分类器,经过多次训练BP神经网络预测样本输出,通过Adaboost算法组合多个BP神经网络弱分类器构建的强分类器。其核心思想是通过在迭代过程中改变训练样本的权值分布,对训练的BP网络得到的多个分类结果,采用加权投票法组合决定最终的分类,具有适用性强、精度高的优点。具体计算过程参见文献[13]。Adaboost-BP参数设置如下:BP弱分类器个数设为10,训练函数选择‘trainlm’,隐含层和输出层传递函数分别为‘tansig’、‘logsig’,网络训练目标误差设为0,学习速率为0.1,训练最大步数设为20。
1.3 数据处理
高光谱图像的采集基于Spectral Cube软件平台,高光谱数据的分析与处理使用ENVI 4.8(Research System,美国)、Matlab R2010b(Mathworks,美国)软件完成,模型效果主要依据预测集准确率进行评价。
2 结果与分析
2.1 羊肉新鲜度等级划分
实验共计72个羊肉样品,其中新鲜肉20个、次鲜肉26个、腐败肉26个。以试验测得的TVB-N理化值浓度排序,按隔三选一法划分为54个校正集样品和18个预测集样品,校正集样品用于建立模型,预测集样品用于验证所建模型的准确性,列出羊肉新鲜度等级划分结果。表1
表1 不同新鲜度等级的样品集划分
Table 1 The sample set division results of different freshness levels
样本集Sampleset新鲜Fresh次鲜Sub-fresh腐败Corrupt总数Total校正集Calibrationset15192054预测集Predictionset57618
2.2 高光谱数据的提取与预处理
采用波段加减法运算、二值化和掩膜法[14]依次去除羊肉样品高光谱图像的背景、阴影、脂肪、亮点和结缔组织,获取与羊肉TVB-N值相对应的纯肌肉部分提取光谱数据,72个羊肉样品的代表性原始平均光谱为,采集的高光谱数据由于受到仪器电噪声和样品粗糙导致的散射干扰,谱峰之间信息相互掩盖,需进行预处理以去除干扰,提高模型预测能力。研究采用1阶导数、15点S-G平滑和中心化相结合的方法对光谱进行预处理。图1
图1 羊肉样品原始光谱
Fig.1 The original spectrum of mutton samples
2.3 高光谱数据降维
由于全波段变量较多、冗余度大,分别采用SPA提取特征波长,PCA降维提取主成分信息。以预处理后的光谱数据和新鲜度类别赋值进行SPA特征波长选取,波长变量数设为1~20。绘出SPA提取的各特征波长分布图,最终得到6个特征波长为:589.56、600.81、611.45、627.13、833.88和949.57 nm。绘出数据经PCA降维后各主成分的累计贡献率,选取前7个主成分时累计贡献率已超过90%,已能够代表原始数据的大部分信息,因此,研究选取前7个主成分信息作为后续模型的输入。图2,图3
图2 SPA选择的特征波长分布
Fig.2 Characteristic wavelengths selected by SPA
图3 PCs累计贡献率
Fig.3 The cumulative contribution rates of PCs
2.4 羊肉新鲜度判别模型
为比较BP和Adaboost-BP的模型效果,分别以SPA提取的6个特征波长和PCA降维的7个主成分作为BP、Adaboost-BP模型的输入变量,羊肉新鲜度等级作为输出变量,建立羊肉新鲜度判别模型,并对模型效果进行验证,建模和预测。
研究表明,采用SPA特征波长提取、PCA降维所建立的BP模型校正集准确率均为100%,对于预测集的18个样品,采用SPA提取特征波长建立的BP模型1个次鲜羊肉样品被误分为新鲜,2个腐败肉被误分为次鲜,采用PCA降维建立的BP模型1个新鲜羊肉样品被误分为次鲜,1个次鲜肉被误分为腐败,1个腐败肉被误分为次鲜,二者准确率均为83.33%。发生误判主要集中在两新鲜度级别之间,原因可能在于相邻新鲜度某些样品TVB-N指标十分接近,其类间差异较小,判别时相互影响从而造成错分。
采用SPA、PCA建立的Adaboost-BP模型各有一个样品产生错分,预测集准确率均为94.44%。相比BP分类结果,Adaboost-BP模型预测集分类准确率提高了11.11%,模型分类更加准确且稳定性更好。试验表明,Adaboost-BP算法改善了常规BP神经网络泛化能力低的不足,提高了模型预测精度。表2
表2 不同羊肉新鲜度等级的模型判别结果
Table 2 The model discriminant results of different freshness levels
降维压缩方法Dimensionlitycompressionmethod建模方法Modelingmethod网络结构Networkstructure校正集准确率Calibrationsetaccuracy(%)预测集 Predictionset新鲜Fresh次鲜Sub-fresh腐败Corrupt准确率(%)AccuracySPABP6-8-11006848333Adaboost-BP6-8-11006669444PCABP7-10-11004868333Adaboost-BP7-10-11005859444
3 讨 论
根据羊肉新鲜度分类结果,从数据降维与压缩的角度分析,采用PCA变换提取了反映羊肉新鲜度的有效信息,采用SPA从原始特征中挑选到了具有代表性、分类性能较好的波段特征,两种降维方法均可以用于羊肉新鲜度特征信息的获取;从BP和Adaboost-BP模型分类效果分析,BP模型预测集准确率较低为83.33%。在实际建模过程中,由于BP网络权值和阈值的选取是随机初始化的,造成每次训练学习的预测结果都不稳定,且由于BP网络是在梯度法基础上推导出来的,对初始权值的选取极为敏感,在训练过程中收敛速度慢,容易陷入局部最优。通过合并多个BP弱分类器检测结果构成的adaboost-BP强分类器克服了传统BP网络的局限性,能够提高BP网络的分类精度,使分类结果更加准确可靠。经验证Adaboost-BP分类结果优于多个BP网络的简单均值结果。
4 结 论
通过提取不同新鲜度的羊肉样品纯肌肉光谱并进行预处理,采用SPA、PCA两种压缩降维方法和BP、Adaboost-BP两种建模方法开展羊肉新鲜度的快速无损检测研究。两种压缩方法下Adaboost-BP模型检测效果均优于BP模型,建立的Adaboost-BP模型校正集准确率均为100%,预测集准确率均为94.44%。利用高光谱图像技术结合Adaboost-BP方法对羊肉新鲜度等级进行分类判别是可行的。
)
[1] 杨东, 陆安祥, 王纪华. 高光谱成像技术定量可视化检测熟牛肉中挥发性盐基氮含量[J]. 现代食品科技, 2017, 33(9):1-7.
YANG Dong, LU An-xiang, WANG Ji-hua, et al. (2017). Quantification and Visualization of the Total Volatile Basic Nitrogen of Cooked Beef Based on Hyperspectral Imaging Technique [J].ModernFoodScienceandTechnology, 33(9):1-7. (in Chinese)
[2] 郭培源, 林岩, 付妍, 等. 基于近红外光谱技术的猪肉新鲜度等级研究[J]. 激光与光电子学进展, 2013, 50(3):183-189.
GUO Pei-yuan, LIN Yan, FU Yan, et al. (2013). Research on Freshness Level of Meat Based on Near-Infrared Spectroscopic Technique [J].LaserandOptoelectronicsProgress, 50(3):183-189. (in Chinese)
[3] 成军虎. 基于高光谱成像鱼肉新鲜度无损快速检测方法研究[D]. 广州: 华南理工大学博士学位论文, 2016.
CHENG Jun-hu. (2016).Non-destructiveandRapidDetectionofFishFreshnessusingHyperspectralImagingTechnique[D]. PhD Thesis. South China University of Technology, Guangzhou. (in Chinese)
[4] Crichton, S. O. J., Kirchner, S. M., Porley, V., Retz, S., Gersdorff, G. V., & Hensel, O., et al. (2017). High ph thresholding of beef with vnir hyperspectral imaging.MeatScience, (134): 14-17.
[5] 朱荣光, 姚雪东, 段宏伟, 等. 羊肉挥发性盐基氮的高光谱图像快速检测研究[J]. 光谱学与光谱分析, 2016, 36(3):806-810.
ZHU Rong-guang, YAO Xue-dong, DUAN Hong-wei, et al. (2016). Study on the Rapid Evaluation of Total Volatile Basic Nitrogen (TVB-N) of Mutton by Hyperspectral Imaging Technique [J].SpectroscopyandSpectralAnalysis, 36(3):806-810. (in Chinese)
[6] 樊阳阳, 裘正军, 陈俭, 等. 基于近红外高光谱成像技术的干制红枣品种鉴别[J]. 光谱学与光谱分析, 2017, 37(3):836-840.
FAN Yang-yang, QIU Zheng-jun, CHEN Jian, et al. (2017). Identification of Varieties of Dried Red Jujubes with Near-Infrared Hyperspectral Imaging [J].SpectroscopyandSpectralAnalysis, 37(3):836-840. (in Chinese)
[7] Wang, W., Li, C., Tollner, E. W., Gitaitis, R. D., & Rains, G. C. (2012). Shortwave infrared hyperspectral imaging for detecting sour skin ( burkholderia cepacia )-infected onions.JournalofFoodEngineering,109(1): 38-48.
[8] GB/T 5009.44-2003. 肉与肉制品卫生标准的分析方法[S].
GB/T 5009.44-2003.MethodforAnalysisofHygienicStandardofMeatandMeatProducts[S]. (in Chinese)
[9] 田卫新, 何丹丹, 杨东, 等. 一种基于高光谱图像的熟牛肉TVB-N含量预测方法[J]. 食品与机械, 2016, 32(12):70-74.
TIAN Wei-xin, HE Dan-dan, YANG Dong, et al. (2016).A method for predicting TVB-N content of cooked beef based on hyperspectral image [J].FoodandMachinery, 32(12):70-74. (in Chinese)
[10] 罗微, 杜焱喆, 章海亮. PCA和SPA的近红外光谱识别白菜种子品种研究[J]. 光谱学与光谱分析, 2016, 36(11):3 536-3 541.
LUO Wei, DU Yan-zhe, ZHANG Hai-liang. (2016).Discrimination of Varieties of Cabbage with Near Infrared Spectra Based on Principal Component Analysis and Successive Projections Algorithm [J].SpectroscopyandSpectralAnalysis, 36(11):3,536-3,541. (in Chinese)
[11] 刘思伽, 田有文, 张芳, 等. 采用二次连续投影法和BP人工神经网络的寒富苹果病害高光谱图像无损检测[J]. 食品科学, 2017, 38(8):277-282.
LIU Si-jia, TIAN You-wen, ZHANG Fang, et al. (2017). Hyperspectral imaging for nondestructive detection of Hanfu apple diseases using successive projections algorithm and BP neural network [J].FoodScience, 38(8):277-282. (in Chinese)
[12] 梁栋, 张凤琴, 陈大武, 等. 一种基于决策树和遗传算法-BP神经网络的组合预测模型[J]. 中国科技论文, 2015, 10(2):169-174.
LIANG Dong, ZHANG Feng-qin, CHEN Da-wu, et al. (2015). A composite prediction model based on decision tree and GA-BPNN [J].ChinaSciencepaper, 10(2):169-174. (in Chinese)
[13] 王军, 费凯, 程勇. 基于改进的Adaboost-BP模型在降水中的预测[J]. 计算机应用, 2017, 37(9):2 689-2 693.
WANG Jun, FEI Kai, CHENG Yong. (2017). Prediction of rainfall based on improved Adaboost-BP model [J].JournalofComputerApplications, 37(9):2,689-2,693. (in Chinese)
[14] 段宏伟, 朱荣光, 王龙, 等. 感兴趣区域对羊肉pH高光谱检测模型的影响研究[J]. 光谱学与光谱分析, 2016, 36(4):1 145-1 149.
DUAN Hong-wei, ZHU Rong-guang, WANG Long, et al. (2016). Effects of regions of interest (ROIs) on Detection Models of Mutton pH Based on Hyperspectral Imaing [J].SpectroscopyandSpectralAnalysis, 36(4):1,145-1,149. (in Chinese)