APP下载

基于SVM方法的猪肉新鲜度分类问题研究*

2011-11-28刘静管骁

食品与发酵工业 2011年4期
关键词:新鲜度肉品猪肉

刘静,管骁

1(上海海事大学信息工程学院,上海,200135)2(上海理工大学医疗器械与食品学院,上海,200093)

基于SVM方法的猪肉新鲜度分类问题研究*

刘静1,管骁2

1(上海海事大学信息工程学院,上海,200135)2(上海理工大学医疗器械与食品学院,上海,200093)

文中采取减压贮藏方式对新鲜猪肉进行了贮藏实验,测定了不同贮藏时间样品的挥发性盐基氮含量(TVB-N)、细菌总数、pH值及感官评价数据,并运用支持向量机(support vector machine,SVM)对这些样本数据进行训练,选取不同的核函数,得到SVM神经网络模型,随后利用此模型对测试数据进行猪肉新鲜度分类预测。实验表明,根据样本特性进行数据预处理,且选取合适的核函数后,SVM神经网络能得到极高的猪肉新鲜度正确分类率。

支持向量机,猪肉新鲜度,分类

随着人们生活水平的不断提高,大众的健康意识不断增强,食品安全问题也得到越来越多的关注。肉品作为人们餐桌上的常见食物之一,其品质关系到广大人民群众的食肉安全。肉品的卫生质量常用新鲜度来衡量,在我国常分为新鲜、次新鲜和腐败3个等级,快速准确地评价肉品的新鲜度对食肉安全具有十分重要的意义。长期以来,众多学者对鲜肉的新鲜度检测进行了多方面的深入研究,并建立了一些主要的、为人们普遍采用的测试指标,包括挥发性盐基氮含量(TVB-N)、菌落总数、pH 值、感官检测等[1-2],有的甚至纳入了国家标准。然而,肉品的变质受诸方面因素的影响,任何单一指标都不能全面代表鲜肉的新鲜度卫生状况[2],必须经过专业人士对多个指标进行综合评价后才能对肉品新鲜度给出准确的结论,这对于从事大量肉品检验工作的政府部门或企业而言无疑是一项极其繁琐的任务。因此,在对肉品有了基本的检测指标测定后,还需要开发一种快速、准确、智能的综合评价方法去代替人工方式对肉品的新鲜度进行判定。

人工神经网络是在生物神经网络基础上发展而来的交叉学科,它在自动控制、机器人、模式识别等领域都已有广泛的应用。目前已有将后向传播(back propagation,BP)神经网络应用于肉品新鲜度分类的相关报道[3-5],但是,BP 神经网络存在初始化权值难以确定,容易出现过拟合现象降低预测能力,且适合样本趋于无穷的情形;然而,在实际情况中很难得到海量样本。统计学习理论是一种专门研究小样本情况下机器学习规律的理论,它根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷,以获得最好的推广能力。支持向量机(support vector machine,SVM)神经网络就是这样一种基于统计学习理论的新的学习方法,具有很好的泛化能力,且能够较好的解决小样本、非线性、高维数等实际问题,目前已成为机器学习领域的研究热点[6-7]。

基于此,本文以常用的几项评价肉品新鲜度的指标为属性,在Matlab开发环境下应用SVM对肉品新鲜度进行智能化综合预报。

1 材料与方法

1.1 实验材料

鲜猪肉样品取自当地农贸市场,生猪屠宰后4 h内取猪臀部肌肉。

JYL2型减压冷藏库,上海善如水保鲜科技有限公司;主要技术参数:有效容积2 m3,极限压力200 Pa,精度25 Pa;温度0~20℃可调,温差0.1℃;功率2.1 kW。

1.2 实验方法

将猪肉样品切分为约80 g的小块,分别装入标记好的保鲜袋中,置于减压冷藏库开始储藏。减压冷藏库的条件设置为:温度2℃、压力(600±50)Pa、换气速率1个库体积/h、相对湿度90%。贮藏过程中每隔3 d取4份平行样品按测定项目检测并记录,如测定结果显示某批次样品明显劣变时停止储藏实验。

1.3 分析指标及测试方法

1.3.1 挥发性盐基氮(TVB-N)含量测定

采用国标GB/T 5009.44-2003《肉与肉制品卫生标准的分析方法》中规定的“半微量定氮法”进行。

1.3.2 细菌总数测定

采用GB/T 4789.2-2008《食品卫生微生物学检验——菌落总数测定》中规定的“平板菌落计数法”进行。

1.3.3 pH值测定

将待测样品绞成肉泥后,准确称取10 g,置于盛有100 mL双蒸水的烧杯中,浸泡并不时振摇15 min后,过滤取滤液,采用pH计测定。

1.3.4 感官测定

感官评定小组由10人组成,采取10分制评分标准。依据猪肉感官指标的设置对不同样品从色泽、气味、弹性、黏度等4个方面进行评分,权重分别设置为0.2、0.2、0.3、0.3,感官评定得分取 10 人的平均值。感官评分细则如表1所示。

表1 猪肉感官评定评分细则

2 结果与分析

2.1 猪肉贮藏期间品质的变化

TVB-N是国家食品法规规定的检测肉类新鲜度的重要指标之一,按照GB2722-51规定,TVB-N含量对应于肉类新鲜度等级为:新鲜肉<15 mg/100 g,次鲜肉15 ~25 mg/100 g,腐败肉 >25 mg/100 g。尽管TVB-N是目前肉品新鲜度检测中最重要的判定依据之一,但同时也存在其局限性,因该指标一般适用于正常气体环境储藏条件下的肉品的检测[5,8]。细菌总数指标也常用来鉴别肉的新鲜度,一般认为新鲜肉细菌总数<1×104个/g,次鲜肉1×104~1×106个/g,腐败肉>1×106个/g。肉品腐败时,由于肉中蛋白质被分解为氨和胺类等碱性物质,所以使肉趋于碱性,pH值会显著增高。因而,pH值也可作为检查肉类质量的一个指标,有研究表明,鲜肉pH值 <6.2,次鲜肉 pH值 6.2~6.7,腐败肉 pH值 >6.7[9-11]。

根据以上分析,对共28份猪肉样品进行了为期19 d的减压储藏实验,期间共抽检了7次,每次4个平行样本,检测的理化指标包括TVB-N,细菌总数和pH值,实验数据如表2所示。由表2的理化检测结果,结合感官评分可知1~7 d减压储藏期的样品(共计12份)质量保持较好,属新鲜肉,第10天和第13天的样品(共计8份)为次鲜肉,第16天和第19天的样品(共计8份)肉品已经变质,为腐败肉。

表2 不同贮藏时间的猪肉样本的理化指标与感官评分结果

由表2的结果可知,在对肉品新鲜度进行分类研究时,若单独使用TVB-N为评价指标,仅有17份样品分类正确,正确率仅达60.7%,特别是对第16天和第19天的样品分类完全错误。肉品中TVB-N的来源主要是微生物对猪肉中含氮有机化合物的分解作用,而不同类型微生物降解蛋白的能力差异较大,所以样品的TVB-N含量的高低,不仅与微生物污染和生长繁殖的程度有关,而且主要取决于生长的微生物的种类[2],在减压储藏这种对微生物种类有很大影响的特殊环境下以此指标来判定猪肉新鲜度难免会有失偏颇。同样,若单独以pH值为评价指标,只有19份样品分类正确,正确分类率也仅达67.9%。感官评定中我们以得分在8分及其以上的样品评判为新鲜肉,6~8分的为次鲜肉,低于6分的为腐败肉,但感官评定结果也存在评定小组成员的主观因素,导致有2份样本的判定出现了偏差,分类正确率为92.8%。

2.2 利用SVM对猪肉新鲜度进行分类

基于以上分析,对肉品新鲜度分类不能单独依据某一项指标结果,必须综合考虑理化检测结果与感官评价结果,因此,本实验提出将SVM思想引入到肉品分类问题中来:即新鲜度的分类基于TVB-N、细菌总数、pH值和感官评分这4个属性,分类至3种标签:新鲜、次新鲜和腐败。利用SVM对数据进行分类,是一项渐进的、泛化的、易于操作的、全局最优的方法。它不像传统的人工神经网络,模型完全基于分层网络,且需要考虑多少节点比较适合。SVM的模型来自于样本本身。实验者可以自由地将数据分类,将训练集的属性值和标签作为已知量,选取不同的核函数和归一化方式,训练出匹配的模型。与此同时,加入交叉验证,可以使数据得到最充分的运用,在最优参数下得到的模型为最终用于分类的模型。这个模型基本涵盖了训练集的所有信息,可以说是较为完善的、体系的模型。最后以这个模型来对测试集进行分类可得到很高的分类准确率。

2.2.1 SVM基本思想

SVM是由Vapnik提出的一种全新的机器学习方法,其分类算法的基本思想是找到一个最优分类超平面,使两类样本的分类间隔最大化。设给定数据样本:(x1,y1),Λ,(xl,yl)∈Rn×{+1,01};最优超平面方程为:w×x+b=0,其中w×x表示输入向量与加权向量w的内积,b为一常数偏差,分类间隔为2/‖2‖,则最优超平面的确定即是求解:minw‖2,s.t.yi[(w×x)+b]≥1 。这是一个二次凸规划问题,根据优化理论,存在全局最小解。通过Lagrange优化方法可将其转化成相应的对偶问题,即在约束条件,=0,αi≥0(i=1,...,n) 下求解下列函数 Q(α)=iαjyiyj(xi·xj)的极大值,其中 αi为每个样本对应的Lagrange乘子,其对应的样本即为支持向量,可得到最优超平面决策函数为f(x)=sgn{w* ×x)+b*}=sgn(yi(x×xi)+b*)。

对于非线性问题,支持向量机解决思路是通过一个非线性映射将样本映射到一个高维的特征空间中转化成线性问题。相应的决策函数为f(x)=sgn{w*·φ(x))+b*}=sgnyi(φ(x)·φ(xi))+b*,在此寻优问题中只涉及样本间的内积运算,为此引入核函数理论。只要核函数满足Mercer条件,即K(xi,xj)=(φ(xi)·φ(xj)),则决策函数可改写为f(x)=sgn{(w*·φ(x))+b*}=sgn((x,xi)+b),引入核函数有效地解决了样本高维和计算复杂度之间的矛盾。选择不同的核函数就构成不同的支持向量机,目前常用于SVM的核函数主要有:

线性核函数(Linear):K(xi,xj)=

多项式核函数(Polynomial):K(xi,xj)=(γ,γ >0;径向基核函数(RBF):K(xi,xj)=exp( - γ‖xi-)2,γ >0;两层感知器核函数(Sigmoid):K(xi,xj)=tanh(+r)。

使用核函数向高维空间映射后,若样本仍然存在线性不可分的情况,可引入松弛变量ξ≥0,相应的二次凸规划问题转化为minw‖2+C,s.t.yi[(w ×x)+b]≥1其中 C 为惩罚系数,它可以控制对错分样本ξi> 惩罚的程度,同时也反映支持向量机模型的复杂度。总之,SVM处理样本数据线性不可分的优势主要通过松弛变量和核函数技术体现,这在下面的仿真实验中也有充分的体现。

2.2.2 SVM模型建立

本文的分类问题采用的总体技术路线是:从28个原始数据里把训练集和测试集提取出来,然后进行数据归一化和数据交叉验证的预处理,随后使用训练集对SVM进行训练得到预测模型,再对测试集进行分类。

2.2.3 实验数据设置

表2中的28个样本中,样本序号1~12属于类别1,样本序号13~20属于类别2,样本序号21~28属于类别3,数据清单见表3。现将每个类别分成2组,一部分作为训练集,一部分作为测试集。

另外,由于样本数据较少,为有效地避免过学习和欠学习状态的发生,本文将对数据采用交叉验证的思想选取SVM模型的惩罚参数和核函数参数,最终对于测试集合的预测得到理想的准确率。

表3 数据清单

2.2.4 实验结果

SVM神经网络分类预测实验对猪肉样本数据分别从核函数、归一化方式角度获取分类结果。

在不进行归一化时,考虑到不同核函数下的分类情况,包括Linear核函数、Polynomial核函数、RBF核函数和Sigmoid核函数,通过正确分类率来衡量其分类状况,且记录错误分类个数,使得结果更明朗,其实验结果见表4。

表4 不归一化伴随各核函数的分类情况

在归一化至[0,1]时,考虑到不同核函数下的分类情况,包括Linear核函数、polynomial核函数、RBF核函数和Sigmoid核函数,通过正确分类率来衡量其分类状况,且记录错误分类个数,使得结果更明朗,其实验结果见表5。

表5 归一化至[0,1]伴随各核函数的分类情况

在归一化至[-1,1]时,考虑到不同核函数下的分类情况,包括 Linear核函数、polynomial核函数、RBF核函数和Sigmoid核函数,通过正确分类率来衡量其分类状况,且记录错误分类个数,使得结果更明朗,其实验结果见表6。

表6 归一化至[-1,1]伴随各核函数的分类情况

经过以上实验,验证了猪肉样本在不同的归一化条件下,选择不同核函数的分类情况,现将数据进行汇总,详情见图1。

图1 猪肉分类结果

通过以上实验可知,对于本次样本,Linear核函数和RBF核函数表现比较理想,在肉品的分类结果中,都处于较高的分类率状态,但需注意的是RBF核函数对归一化方式较为依赖,明显看出,在归一化至[-1,-1]时它的分类率较高,但是其他情况时分类率有所降低;Polynomial核函数比较合适不进行归一化;最后,Sigmoid核函数的表现则不太理想,不太适合于本次分类。

3 结论

本论文采用TVB-N、细菌总数、pH值以及感官评分为评价指标,通过SVM神经网络方法成功完成了对猪肉新鲜度的数据分类预测,特别重点关注了归一化方式和核函数选取对分类结果的影响,得到以下结论:

(1)对猪肉新鲜度分类仅靠某单项理化指标或感官评价均难以得到正确结果,需综合考虑TVB-N、细菌总数、pH以及感官评分等指标。

(2)采用SVM神经网络方法在肉品新鲜度分类领域是一种快速、有效、智能的方法,其中核函数和归一化方式的选择是至关重要的。Linear核函数在猪肉新鲜度分类中表现十分优良,不管规一化方式如何,均能达到100%分类率;RBF核函数分类情况在归一化至[-1,1]时效果很好;Polynomial核函数次之,均能高概率正确分类,但表现出的不足是波动性较大;Sigmoid核函数则不适合于本次数据,仅在归一化至[-1,1]时能分类。

[1] 曲世海,郭培源.基于多信息处理的肉类新鲜度检测方法研究.北京工商大学学报:自然科学版,2006,24(5):26-30

[2] 贾英民,王玲,张子德,等.牛肉新鲜度检测与指标分析[J].肉类研究,1998,2:45-47

[3] 郭培源,曲世海,陈岩.猪肉新鲜度的智能检测方法[J].农业机械学报,2006,37(8):78-81.

[4] 郑丽敏,田立军,朱虹.基于MATLAB的BP神经网络在猪等级评定中的应用研究[J].计算机应用研究,2008,25(6):1 642-1 644.

[5] 王笑丹,孙永海,胡铁军.基于神经网络的冷却猪肉新鲜度测定[J].分析检测,2005,26(5):173-175.

[6] Vapnik V.Statistical Learning Theory[M].New York:John Wiley& Sons Inc,1998.

[7] Nicolas H B,Manuel A D,Victor A S et al.Chilean wine classification using volatile organic compounds data obtained with a fast GC analyzer[J].IEEE Transactions on Instrumentation and Measurement,2008,57(11):2 421 -2 436.

[8] Lawrie R A,Ledward D A.编,周光宏译.Lawrie's Meat Science(第七版)[M].北京:中国农业大学出版社,2009.

[9] 李彬.生鲜猪肉新鲜度的检测及贮藏品质评价[J].商洛学院学报,2007,21(2):57-59.

[10] 黄蓉,刘敦华.猪肉新鲜度评价指标、存在问题及应对措施[J].肉类工业,2010(6):43-46.

[11] Hendrickx M,Ludikhuyze L,Van den Broeck I,et al.Effects of high pressure on enzymes related to food quality[J].Food Biotechnology,1999,13(1):13-32.

Studies on the Classification of Pork Freshness by SVM

Liu Jing1,Guan Xiao2
1(College of Information Engineering,Shanghai Maritime University,Shanghai 200135,China)2(School of Medical Instrument and Food Engineering,University of Shanghai for Science and Technology,Shanghai 200093,China)

The pork freshness is a big safety issue on people's health.In this paper,fresh pork samples were stored in decompression storage room.The TVB-N content,total bacterial count,pH value and sensory scores of the samples were determined at different storage stage.SVM neural networks models were obtained by training the sample data with different kernel functions and cross-validation.Furthermore,the test data were used to predict the freshness of pork sample by SVM neural network.The experiment results suggested that the SVM neural networks obtained higher correct classification rate of pork freshness with the right kernel function and cross-validation according to the sample performance.

support vector machine,pork freshness,classification

博士,讲师(管骁博士为通讯作者,E-mail:gnxo@163.com)。

*上海市晨光计划项目(2008CG055),上海市教委科研创新项目(10YZ113)

2010-12-18,改回日期:2011-02-15

猜你喜欢

新鲜度肉品猪肉
肉品中水分检测方法研究进展
猪肉将降到白菜价
近期猪肉价格上涨动力减弱
猪肉价格要回归正常了?
猪肉卷
浅析影响肉品质量安全的几大因素和对策
新形势下畜禽屠宰检疫与肉品品质检验
高密度二氧化碳杀菌技术及其在肉品工业中的应用
基于TTI的冷鲜羊肉新鲜度研究
不同新鲜度金枪鱼肉蒸煮品质的研究