基于多数据融合技术的腊肉品质分级方法
2014-01-17王昕琨郭培源
王昕琨,郭培源,林 岩
(北京工商大学计算机与信息工程学院,北京 100048)
基于多数据融合技术的腊肉品质分级方法
王昕琨,郭培源,林 岩
(北京工商大学计算机与信息工程学院,北京 100048)
针对近年来备受关注的腊肉酸价和过氧化值超标、褪色、出油、发黏等品质问题,提出一种快速、准确、实用的检测技术。首先利用自组织特征映射网,对生化实验测得的酸价、过氧化值以及微生物菌落总数数据,在相关国家标准的基础上将样品腊肉的品质等级划分为4级:放心食用、可食用、不推荐食用和不可食用。在此基础上采用近红外光谱技术对腊肉的酸价与过氧化值进行检测,用遗传算法优选后的波长建模所得预测均方根误差分别是用优选前建模的41%、57%,所用波长数约为整个波段波长数的1/3。采用显微图像技术获得腊肉的菌斑信息,极大的改善了传统细菌总数检验方法操作复杂、主观性强、耗时长等问题。最后采用支持向量机对近红外光谱数据和显微图像数据进行多数据融合,建立腊肉可食用等级快速判别模型。
近红外光谱;多数据融合;支持向量机;腊肉
腊肉是一种悠久历史、具有特有风味的传统肉制品,是我国珍贵饮食文化遗产的重要组成部分[1]。酸价和过氧化值常用来衡量占腊肉成分30%~40%的脂肪油脂的酸败、氧化程度,是评价腊肉品质的主要指标。食用酸价和过氧化值过高的腊肉会导致人体肠胃不适、腹泻并损害肝脏[2]。微生物对腊肉风味形成起着重要的作用,在腊肉的贮藏销售期,如果微生物增多,酸价和过氧化值就会增加,腊肉会加速变质,丧失营养价值,食用后可能引起呕吐、腹泻等症状,危害人体健康安全。我国现行标准只对腊肉的酸价和过氧化值设置阀值,将其分为超标与未超标2类。实际生活中,在不利贮藏环境条件影响下,当腊肉酸价与过氧化值还未超标时,微生物菌落总数可能已经超标。此时,未超标的腊肉也会有明显的感官特征,如酸味、发黏等,不能满足人们对食品品质日益增长的要求[3-4]。因此,需要融合酸价、过氧化值以及微生物菌落总数信息来评价腊肉品质并进一步细化分类等级。由于传统理化检验操作耗时,不能快速进行现场实时检测,因此,迫切需要一种快速、准确、实用的检测技术对腊肉品质及分类进行检测。
国内近红外光谱(near infrared spectroscopy,NIR)技术在肉制品中的应用研究起步较晚。王多加等[3]总结了近红外光谱检测技术在农业和食品分析上的应用。屠康[4]对肉类品质无损检测技术的研究进展进行了总结和报道。朱迅涛[5]用近红外检测了火腿肠中的蛋白质、脂肪和水分的含量。对未知样品的细菌总数检验,国内外研究和使用较多的方法主要是微菌落技术、SimplateTM全平器计数法、阻抗法、纸片法。微菌落技术在培养后,需对菌落染色、固定、过滤,操作繁琐[6];SimplateTM全平器计数法进一步简化了操作,但仍需24 h[6];基于阻抗技术的自动检测仪器可缩短检测时间,但成本昂贵,不适于基层单位和中小型食品厂[7];纸片法 虽然简便经济,但在检测时间上与平板计数培养基法相比无明显优势[7]。
目前偏最小二乘法是最常用的光谱数据量化分析方法之一[8-10]。偏最小二乘法能克服光谱数据间的共线,对用于建模的波长数没有限制,甚至可用全部光谱数据建模,以免丢失光谱信息。然而研究发现,用信噪比(RSN)高的波段比用信噪比低的波段建立的偏最小二乘法校正模型的预测能力明显较强[11],因此建立校正模型之前应该进行波长选择。迄今为止,已有许多方法用在波长选择上,其中遗传算法以其全优、易实现的特点在其应用中作用明显[12]。
本研究在国家相关食品标准的基础上,研究并对腊肉品质等级重新划分,利用近红外光谱检测、数字图像处理及多数据融合技术,通过支持向量机(support vector machine,SVM)数据分类器对样品腊肉品质等级进行模式识别及快速判别,以满足实际应用需要。
1 材料与方法
1.1 材料与试剂
不同批次、共计10个腊肉样品购于嘉兴市正泰食品有限公司、广州皇上皇集团有限公司、凤凰县松桂坊民族食品开发有限公司。
1.2 仪器与设备
FoodScan近红外全光栅透射光谱分析仪 瑞士Foss公司;BI-2000医学图像摄像电子显微镜(分辨率1 280×1 024,130万像素) 成都泰盟科技有限公司。
1.3 方法
1.3.1 样品制备
样品粉碎成肉糜状,18 ℃恒温箱保存。每隔12 h进行数据采集,采集12次,共得到120个包含生化、光谱、显微菌斑图像信息的样本数据。
1.3.2 腊肉制品的酸价、过氧化值以及微生物菌落总数的检测[13-15]。
GB 2730—2005《腌腊肉制品卫生标准》[13]作为检测指标。按GB/T 5009.37—2003《食用植物油卫生标准分析方法》[14]测定样品酸价与过氧化值;按GB 4789.2—2010《食品微生物检验菌落总数测定》[15]测定样品微生物菌落总数。
1.3.3 基于遗传算法的近红外光谱区选择
遗传算法是建立在自然选择和进化概念基础上的一种非导数的随机优化方法[16],将其应用在近红外光谱波长选择中的主要步骤为:
1)编码:每个波长为1个基因,对基因进行0、1二进制编码,若基因编为1,建模时包括此波长;若为0,不包括此波长。1种0-1编码组合称为1条染色体,染色体长度为被编码的波长数。2)选择初始群体:假如初始群体包含N个个体,每1个体的染色体长度(波段的波长数)为m,则初始群体的选择方法为:随机产生N个m位的0-1二进制数作为初始群体。3)适应值函数:本研究采用交互验证法评价模型的预测能力。评价指标为预测均方根误差(root mean square error prediction,RMSEP),RMSEP值越小,则校正模型的预测能力越好。为使遗传算法对适应值较高的个体有更多的生存机会,对评价指标变换,得到适应值函数为:
4)复制:复制的策略是以“轮盘赌”的方式进行正比选择。5)交叉:本研究普通单点交叉方式。6)变异:变异方式是以一定概率产生发生变异的基因数,用随机方法选出发生变异的基因。如果所选的基因的编码为1,则变为0;反之编码为0,则变为1。重复4)~6)至最大繁殖代数停止。
本研究将该方法用于腊肉酸价和过氧化值检测基础研究。光谱范围为860~1 048 nm,分辨率为2 cm-1,每个样品连续扫描32次,取平均值。
1.3.4 基于图像形态学背景估算菌斑面积
GB 2726—2005《熟肉制品卫生标准》[17]中明确规定,腊肉食品的菌落总数要小于等于30 000 CFU/g才为食品合格。本研究提出一种利用计算机视觉获取显微菌斑图像的方法,具体流程如图1所示。
具体操作如下:
1)选取合适的结构元素:本研究选取菱形结构元素[16]。2)利用确定的结构元素对原图像进行连续7次的膨胀操作(图2a),再进行连续7次的腐蚀操作(图2b),该图像即为对原图像背景的估计图像。3)将原图像与对背景的估计图像进行减操作(图2c)。4)采用阈值25对减掉背景的图像进行分割(图2d)。图中黑色部分即为提取到的菌斑点。5)统计图像中菌斑的面积[18-19]。将图像转换为二值图像,利用Mat Lab函数bwarea()求出黑色点所代表的菌斑点的总面积。
图1 菌斑信息提取流程图Fig.1 Flowchart of plaque extraction
图2 图像形态学提取菌斑面积操作过程Fig.2 Operation procedures for the extraction of plaque area by image morphology
1.3.5 基于支持向量机的腊肉模型建
将近红外光谱检测到的酸价、过氧化值数据和表面菌斑总面积作为特征向量,采用支持向量机进行多数据融合[20-22],建立腊肉食用度识别模型。对腊肉的品质等级进行快速识别。图3是分类预测模型结构图。
图3 支持向量机分类预测模型构建Fig.3 Support vector machine (SVM) prediction model
在Mat Lab1012b中,将采集到的数据生成.mat文件,在120个样本数据中,随机抽取80个作为预测模型的训练集,40个作为预测集。采用Libsvm工具箱建立SVM分类模型[23-26]交叉验证下不同参数。
2 结果与分析
2.1 等级划分和集合划分
在Mat Lab2012b中对样本数据序列进行训练。自组织特征映射网设计如图4所示。重新划分等级前后酸价、过氧化值以及微生物菌落总数范围如表1所示。
图4 食用程度等级划分自组织特征映射网络结构图Fig.4 Self-organizing feature map network structure for edibility classification
表1 腊肉品质等级重新划分前后酸价及过氧化值Table1 Acid value and peroxide value of bacon before and after quality grading
GB 2730—2005《腌腊肉制品卫生标准》[13]中明确指出酸价大于4.00 mg/g、过氧化值大于0.25 g/100 g以及微生物菌落总数大于30 000 CFU/g的腊肉属于超标。本研究将酸价大于3.85 mg/g、过氧化值大于0.24 g/100 g以及微生物菌落总数大于30 000 CFU/g的样本划分为不可食用一类,这与GB 2730—2005的划分标准相同;而将未超标样本细化成了3类:安全食用、可食用和不建议食用,不仅符合国标,而且可精细划分腊肉可食用等级。按照该分类结果,将对应的样本分类,每1类30个,4类共120个样本数据,以备之后的研究使用。
2.2 基于遗传算法的近红外光谱谱区选择
表2 遗传算法选取前后的矫正和预测结果Table2 Calibration and predictive results before and after selecting wavelengths by the genetic algorithms (GA)
表2列出了腊肉酸价和过氧化值用遗传算法优选前后的波长建立的偏最小二乘法校正模型(交互验证),表中校正均方根误差(root mean square error correction,RMSEC)和RMSEP分别用来评价模型的拟和能力和预测能力。结果表明:用遗传算法优选波长后建立的偏最小二乘法校正模型的预测能力有很大提高。用遗传算法优选后的波长建模所得酸价、过氧化值的RMSEP值是优选前RMSEP值的41%、57%,所用波长数约为整个波段波长数的1/3。可以看出遗传算法对波段进行波长选择后模型精度提高、建模所用波长数减少。
由于遗传算法为一种非导数的随机优化算法,其中群体的选择、交叉、变异都带有很强的随机性,所以每一次选择的波数组合不会完全相同,其RMSEP也有所不同,但所选波长的位置大体相同,结果相差很小。
2.3 基于图像形态学背景估算菌斑面积
腊肉样品第1、7天和第10天,所获得的脂肪组织显微图片及进行图像处理后得到的菌斑图片,见图5。
图5 光电显微图像及菌斑提取结果Fig.5 Optical microscopic images and plaque extraction results
图6 10个样品的光电显微图像与采样时间关系Fig.6 Relationship of optical microscopic image and sampling time for 10 samples
随着采样时间的推移,部分样品光电显微图像上菌斑像素数的变化情况(图6)可以看出,在样品变质过程中,显微图像中代表菌斑面积的像素数在不断增加,与生化法检中样品细菌含量不断增加的结论是一致的。因此菌斑统计可以描述腊肉变质过程,实现腊肉品质中细菌含量的快速检测,避免耗时的生化方法检测。
2.4 基于支持向量机的腊肉模型建立
为了得到较准确的模型,选取惩罚参数c和核函数参数g时,采用交叉验证的方式可以有效的避免过学习和欠学习,得到较理想的准确率。选择结果如图7所示。最佳的参数为:惩罚参数c=0.707 107,核函数参数g=1.414 21。其运行结果如图8所示,在多次训练中,分类准确率为97.5%,实现了对腊肉品质的快速判别。
图7 最佳参数选择结果Fig.7 Selection of optimum parameters
图8 支持向量机分类预测模型预测结果Fig.8 Predicted results from the support vector machine (SVM) prediction model
表3 对随机抽取的40个样本的预测结果Table3 Prediction of 40 random samples
对预测集40个样品采集的数据进行预测,结果如表3所示。将表3与表1结果进行比较研究可知,利用近红外光谱获得酸价与过氧化值、计算机视觉技术获得微生物菌斑面积、支持向量机神经网络进行数据融合的技术对腊肉品质进行分级预测的结果与使用生化方法对腊肉进行分级预测的结果相同,证明所建支持向量机预测模型可以通过近红外光谱数据和显微菌斑图像的多数据融合,完成对腊肉进行准确的分类识别。
3 结 论
本研究提出一种快速、准确、实用的检测技术。首先利用自组织特征映射网以及生化实验测得的酸价、过氧化值以及微生物菌落总数数据,将样品腊肉的品质等级在相关国家标准的基础上划分为4级:放心食用、可食用、不推荐食用和不可食用。这既符合GB 2730—2005《腌腊肉制品卫生标准》所规定的卫生标准[13],又细化了分类等级,符合人们生产生活的实际需要。在此基础上采用近红外光谱技术对腊肉的酸价与过氧化值进行检测、用遗传算法优选后的波长建模所得RMSEP分别是用优选前建模RMSEP值的41%、57%,所用波长数约为整个波段波长数的1/3。采用显微图像技术获得腊肉的菌斑信息,极大的改善了传统细菌总数检验方法操作复杂、主观性强、耗时长等问题。最后采用支持向量机对近红外光谱数据和显微图像数据进行多数据融合,建立腊肉可食用等级快速判别模型。
本方法可以实现对腊肉可食用程度的快速、准确判别。卫生检疫部门及相关肉品厂家可以采用这种快速、准确、实用的检测技术,保证消费者的食用安全。
[1] 周光宏. 畜产品加工学[M]. 北京: 中国农业出版社, 2003: 126-129; 112-123.
[2] 董寅初. 现代肉类科技对中国传统风味腊肉品的影响[J]. 肉类研究, 1999, 14(1): 3-6.
[3] 王多加, 周向阳, 金同铭, 等. 近红外光谱检测技术在农业和食品分析上的应用[J]. 光谱学与光谱分析, 2004, 24(4): 125-137.
[4] 屠康. 肉类品质无损检测技术的研究进展[J]. 西北农林科技大学学报: 自然科学版, 2005, 33(1): 45-49.
[5] 朱训涛. 近红外分析技术在火腿肠检测中的应用[J]. 肉类研究, 2002(2): 68-72.
[6] 于瑞雪, 郭培源. 基于光电显微技术的猪肉新鲜度智能检测[J]. 北京工商大学学报: 自然科学版, 2007, 25(4): 34-38.
[7] 毕松, 郭培源. 基于细菌菌斑变化的猪肉新鲜度检测方法研究[J].农机化研究, 2009, 31(5): 67-71.
[8] 孙通, 徐惠荣, 应义斌. 近红外光谱分析技术在农产品/食品品质在线无损检测中的应用研究进展[J]. 光谱学与光谱分析, 2009, 29(1): 122-125.
[9] 赵丽丽, 张录达, 宋忠祥, 等. 近红外光谱定量检测腌腊肉制品品质的研究[J]. 光谱学与光谱分析, 2007, 27(1): 46-49.
[10] 徐云, 吴静珠, 王一鸣, 等. 基于近红外光谱的未知类别样品聚类方法[J]. 农业工程学报, 2011, 27(8): 345-349.
[11] MOUAZEN A M, KAROUI R, BAERDEMACKER J D, et al. Classification of soils into different moisture content levels ba sed on VIS-NIR spectral[C]//Proceeding of the 2006 ASABE Annual International Meeting. Portland: American Society of Agricultural and Biological Engineers, 2006: 896-905.
[12] 郭培源, 陈岩, 薛红, 等. 猪肉新鲜度智能检测装置: 中国, 101144780A[P]. 2008-03-19.
[13] 中华人民共和国卫生部, 中国国家标准化管理委员会. GB 2730—2005 腌腊肉制品卫生标准[S]. 北京: 中国标准出版社: 2005.
[14] 中华人民共和国卫生部, 中国国家标准化管理委员会. GB/T 5009.37—2003 食用植物油卫生标准分析方法[S]. 北京: 中国标准出版社, 2003.
[15] 中华人民共和国卫生部, 中国国家标准化管理委员会. GB 47892—2010 食品安全国家标准 食品微生物学检验: 菌落总数测定[S]. 北京: 中国标准出版社, 2010.
[16] 王加华, 韩东海. 基于遗传算法的苹果近红外光谱分析[J]. 光谱与光谱学分析, 2008, 28(10): 2308-2311.
[17] 中华人民共和国卫生部, 中国国家标准化管理委员会. GB 2726—2005 熟肉制品卫生标准[S]. 北京: 中国标准出版社: 2005.
[18] GONZALEZ R C, WOODS R E.. Digital image processing[M]. San Francisco: Pearson Education, 2005: 254-284.
[19] 王树文, 闫成鑫, 张天序, 等. 数学形态学在图像处理中的应用[J].计算机工程与应用, 2004, 40(32): 90-92.
[20] 史峰, 王小川, 郁磊, 等. MATLAB神经网络30个案例分析[M]. 北京: 航空航天大学出版社, 2011: 118-132.
[21] 李静, 查明, 郭元玲, 等. 光谱成像信息的数据融合技术在存储表征中的应用[J]. 光谱学与光谱分析, 2011, 31(10): 2639-2642.
[22] 张学工. 关于统计学理论与支持向量机[J]. 自动化学报, 2000, 26(1): 32-42.
[23] LINA J. Image processing with complex wavelets[J]. Journal of Mathematical Imaging and Vision, 1996, 7(3): 2543-2560.
[24] 陈纯. 计算机图像处理技术与算法[M]. 北京: 清华大学出版社, 2003: 86-107.
[25] SHCAKELFORD S D. Color image analysis technique for measuring of meat[J]. Meat Science, 2007, 65(3): 125-138.
[26] KLEYNEN O, LEEMANS V, DESTAIN M F. Development of a multi-spectral vision system for the detection of defects on apples[J]. Journal of Food Engineering, 2005, 69(1): 41-49.
Quality Grading of Bacon Based on Multi-Data Fusion Technology
WANG Xin-kun, GUO Pei-yuan, LIN Yan
(College of Computer and Information Engineering, Beijing Technology and Business University, Beijing 100048, China)
In recent years, problems with the quality of Chinese bacon such as acid value and peroxide value exceeding the standards, fading, oil exudation and sticky feeling to the touch have received growing attention. A fast, accurate and practical detection technology was developed to evaluate Chinese bacon quality. According to the relevant national standards as well as the results of acid value, peroxide value and total bacterial number in bacon samples measured by biochemical methods as the input of self-organizing feature map, the bacon samples were divided into four categories: safe to eat, edible, not recommended to eat and inedi ble. The acid value and peroxide value of bacon were detected using near infrared spectroscopy. The root mean square error prediction (RMSEP) results after the selection were 41% and 57% of those before selecting wavelengths by the genetic algorithms. The selected number of wavelength was 1/3 of the total number of the whole wavelength. Plaque area information was obtained by microscopic imaging technology, which has greatly improved many problems with traditional testing methods for the determination of total bacterial numbers, such as complex operation, subjectivity and time consuming. Finally, a quick discriminant model for grading the ed ibility of Chinese bacon was established using the support vector machine approach based on the near-infrared spectral data and microscopic image data.
near infrared spectroscopy; multi-data fusion; support vector machine; Chinese bacon
TS251.6;O433.4 ;TP391.4
A
1002-6630(2014)02-0217-05
10.7506/spkx1002-6630-201402042
2013-06-05
北京市自然科学基金资助项目(4122020)
王昕琨(1989—),女,硕士研究生,研究方向为肉类品质。E-mail:wangxinkun218@163.com