基于贝叶斯网络的猪肉合格率的模型构建
2012-11-02张方怡董庆利黄宋琳黄勋娟王文迪
张方怡,董庆利,黄宋琳,黄勋娟,王文迪
(上海理工大学医疗器械与食品学院,上海200093)
基于贝叶斯网络的猪肉合格率的模型构建
张方怡,董庆利*,黄宋琳,黄勋娟,王文迪
(上海理工大学医疗器械与食品学院,上海200093)
我国是猪肉消费大国,其卫生情况对人民关系重大。近年来肉制品的微生物污染现象不容乐观,所以建立一个行之有效的猪肉追溯系统有利于更好地控制猪肉质量。本文根据现有的猪肉卫生标准,选出猪肉的四种优势致腐菌:大肠杆菌、单增李斯特菌、沙门氏菌以及金黄色葡萄球菌,以贝叶斯网络为理论依据,利用Hugin Lite软件拟合出合格率模型。结果表明,基于贝叶斯网络可通过改变菌体数据快速求得猪肉的合格率,大大缩减检验时间,为猪肉卫生合格率的质检工作提供理论依据。
贝叶斯网络,肉,追溯模型
肉是人类可以食用的动物的骨骼肌,它的生物学组成致使其很容易腐败[1]。冷却肉同热鲜肉、冷冻肉相比,具有柔嫩多汁、新鲜味美、营养、安全、卫生等优点。由于其含有丰富的营养成分,且水分活度高,是微生物生长和繁殖的理想培养基,所以很容易受到微生物的侵袭,所以极易发生腐败变质[2]。一般肉类制品最容易感染沙门氏菌和致病性大肠杆菌。另外,志贺菌、李斯特菌、空肠弯曲菌、变形杆菌、葡萄球菌、肉毒梭菌(一般熟肉制品)等都是引起肉制品污染的致病微生物[3]。随着经济的发展和社会的进步,消费者对肉与肉制品的质量和安全都提出了更高的要求,但是目前市场上的肉与肉制品却在养殖、屠宰、加工和流通等各个环节都存在不安全的因素[4]。近年来,肉类食品中毒、污染而造成重大损失和危害的报道常见于报端。目前对于猪肉制品采取的是辐照技术、定期抽查检测等。但是这些措施只能在猪被屠宰后或猪肉制成成品后采取控制的措施,无法从根源上解决猪肉的安全问题。如果能够利用电脑软件,快速检测出猪肉中微生物的含量,通过其含量得到货架期内猪肉的质量的变化,从而达到溯源的效果,可以从源头上提高猪肉的质量;同时也可以在短时间内快速有效地检测猪肉的合格率,为各大机构卖场提供猪肉质检的理论依据。食品工业从生产到消费是一个复杂的过程,食品加工系统具有大量相互作用,包括微生物、物理、化学等组成部分,而这些作用又可以归结为线性和非线性[5]。其中也包括诸多不确定性因素,例如各种食品微生物在不同加工、储藏和流通条件的存活情况。贝叶斯网络模型提供了一种实用的数学形式,依赖于概率的图形化模型,能够描述复杂的动力系统,可用来反映食品加工过程中的不确定性。贝叶斯网络已成功运用于药品不良反应信号检测方法研究[6],以及农产食品贸易的质量风险控制[7]的食品工业研究中,但在肉制品微生物安全控制方面的研究较少。运用贝叶斯网络,可在不进行微生物检测分析的前提下,建立食品溯源系统,能够判断食品内主要腐败微生物死亡的全过程、残存和增值的动态变化,从而对食品安全做出快速评估的预测和控制方法,更好的确保食品安全。本文以猪肉为例,利用贝叶斯网络建立数学模型表示猪肉溯源系统,模拟不同微生物在猪肉中的交互作用。
1 建模方法与参数设置
1.1 贝叶斯网络简述
贝叶斯网络(Bayesian network)是一种概率网络,它是基于概率推理的图形化网络,其概率网络的基础则是贝叶斯公式。其是Pearl于1988年提出的一种不确定知识表达模型。一个贝叶斯网络是一个有向无环图(Directed Acyclic Graph,DAG),由代表变量节点及连接这些节点有向边构成。节点代表随机变量,节点间的有向边代表了节点间的互相关系(由父节点指向其后代节点),用条件概率进行表达关系强度,没有父节点的用先验概率进行信息表达。适用于表达和分析不确定性和概率性的事件,应用于有条件地依赖多种控制因素的决策,可以从不完全、不精确或不确定的知识或信息中做出推理。图1给出了一个简单的6个节点的贝叶斯网络示例(未包含条件概率分布)。其中V1、V2,…,V6分别表示代表变量的节点,箭头方向表示节点间的互相关系(由父节点指向其后代节点),用条件概率进行表达关系强度。
图1 一个简单的贝叶斯网络Fig.1 A simple example of Bayesian network
一般来说,一个具有N个节点的贝叶斯网络可用N=〈〈V,E〉P〉来表示,其中包括两部分:a.〈V,E〉表示一个具有N个节点的有向无环图[10]G。节点V ={V1,V2,…,VN}代表变量,节点间的有向边E代表了变量间的关联关系。节点变量可以是任何问题的抽象,如部件状态、观测值、人员操作等。对于有向边(Vi,Vj),Vi称为Vj的父节点,而Vj称为Vi的子节点;没有父节点的节点称为根节点,没有子节点的节点称为叶节点。Vi的父节点集合和非后代节点集合分别用pa(Vi)和A(Vi)来表示。有向图〈V,E〉蕴含了条件独立性假设,即在给定pa(Vi)下,Vi与A(Vi)条件独立:P(Vi|pa(Vi),A(Vi))=P(Vi|pa(Vi))。b.P表示一个与每个节点相关的条件概率分布(Conditional Probabilities Distribution,CPD)。由贝叶斯网络的条件独立性假设可知,条件概率分布可用P(Vi|pa(Vi))来描述,它表达了节点与其父节点的关联关系。如果给定根节点先验概率分布和非根节点条件概率分布,可以得到包含所有节点的联合概率分布。在图1中,包含全部节点的联合概率分布函数为[11]:
P(V1,V2,V3,V4,V5,V6)=P(V6|V5)P(V5|V3,V2)P(V4|V2,V1)P(V3|V1)P(V2|V1)P(V1)
因此,贝叶斯网络可看作是一个概率专家系统,其概率知识库由网络的拓扑结构和每个节点的条件概率组成。
1.2 Hugin Lite软件应用
Hugin Lite软件是一款由丹麦公司研发的,利用贝叶斯网络技术为决策者提供先进的解决方案的软件。该软件可以运用于许多领域,如使用决策分析、决策支持、预测、诊断、健康监测、故障诊断、风险管理和安全评估等方面。该软件的应用程序有着良好高效的推理机制,主要用来处理基于贝叶斯因果网络或者影响图的知识领域。通过对知识领域的因果关系概率描述,在应用程序中建立起该领域的贝叶斯因果网络或影响图[12],应用概率关联来描述领域事件的不确定性。所以,Hugin Lite软件的推理机制能够执行既快速又准确的因果推理。
以判断猪肉肉质品质为例,首先创建节点,在贝叶斯网络中是用“discrete chance tool”创建五个离散节点,分别是:沙门氏菌、金黄色葡萄球菌、单增李斯特菌、大肠菌群和肉。再以沙门氏菌,金黄色葡萄球菌,单增李斯特菌和大肠菌群作为父节点(根节点);将肉作为子节点,建立因果关系网如图2所示。同时使用“utility tool”,命名为腐败情况的功能节点表示肉的品质状况。在本案例中,腐败情况亦为叶节点。
1.3 贝叶斯网络的学习
进一步对贝叶斯网络进行学习我们可以发现,将先验概率与数据相结合,经过贝叶斯网络学习之后所得到的概率为后验概率。实际上,贝叶斯网络学习就是由先验概率通过求解后得到后验概率的过程。后验概率可借助贝叶斯公式来计算,其表达式为:
式中:A为猪肉检测呈阳性的现象;Fj为四种不同的优势腐败菌对其的影响;P(Fj)为先验概率,代表假设Fj的初始概率;P(A)为猪肉中发生不合格现象的先验概率;P(Fj|A)为猪肉呈阳性即不合格的情况下,各影响因素出现的概率;P(A|Fj)为猪肉在各因素单独影响下,发生不合格现象的概率;P(A|F)为猪肉在各因素综合影响下发生不合格现象的概率。
在贝叶斯网络中,通常要选择后验概率最大的结构,即:
后验概率的最大结构需要借助似然函数来求取。设X=(x1,x2,…,xn)为对应于各个节点的随机变量集,因为每个变量只有“1”或“0”2个状态,所以变量均为二元随机变量。定义似然函数为:
式中:为各节点条件概率分布的随机变量。
根据最大似然估计法,选择合适的参数,使得所定义的似然函数,Ln(θ)取得最大值。则θ*=arg θmax Ln(θ)即极大后验概率[11]。
这样,利用联合概率分布函数、贝叶斯公式和似然函数就可以计算出任意节点的后验概率。从而能得出各个菌种对猪肉合格率的影响,得出猪肉合格的概率。
表1 合格率的判定关系Table 1 Decision between qualifying criteria
2 应用实例与分析
确定了网络结构,随之应确定该网络节点的参数,先确定节点的值域,在此基础上解决节点的先验概率问题。本研究中可将节点参数状态设定为真/假(TRUE/FALSE)两个状态,例如表1中沙门氏菌{阳性,阴性};阳性=TRUE=1,阴性=FALSE=0;即为(1,0)。肉{合格,不合格};合格=TRUE=1,不合格=FALSE=0;即为(1,0)。
沙门氏菌、金黄色葡萄球菌、单增李斯特菌和大肠菌群是生猪肉中主要有害菌。基于2006~2008年上海市猪肉及其制品食源性致病菌监测结果[12],沙门氏菌检出率为3%,金黄色葡萄球菌为6.8%,单增李斯特菌为4.2%,大肠杆菌为0;且规定只有当沙门氏菌、金黄色葡萄球菌、单增李斯特菌及大肠菌群在检测过程中均为阴性时才能确定该肉质为合格。将上述数值作为贝叶斯模型的先验概率。
根据国家无公害食品标准[13]进行判定,菌落总数(≤106CFU/g)和大肠菌群(≤104MPN/100g),两项指标超出检测标准设定的限值即判为阳性;金黄色葡萄球菌、沙门氏菌和单增李斯特菌不得检出,若有检出即判为阳性。菌落总数小于等于106CFU/g时为阴性。
将已知数据输入Hugin Lite软件中运行后如图2所示,可知后验概率及猪肉的合格率为86.61%。假设抽取100份猪肉样本,则从“腐败情况”此栏中得出合格的理论样本数为86.61份。
图2 应用Hugin Lite软件构建猪肉合格率的贝叶斯模型Fig.2 Bayesian model of pork qualifying criteria built by Hugin-Lite
同时也可将已知的猪肉合格率看为先验概率,通过该贝叶斯网络模型可得出四种菌群的检出率即后验概率。如图3所示,若将该批猪肉的已知合格率(99.66%)输入贝叶斯网络模型中,则可以得到单增李斯特菌、大肠菌群、沙门氏菌和金黄色葡萄球菌的理论检出值,分别为0.24%、0、0.17%、0。同理,若将猪肉合格率改为100%,可求得四种菌的理论检出率都为0。
图3 由猪肉合格率的改变对微生物检出率的预测Fig.3 Prediction of microbial detection rates by the changable pork qualifying criteria
3 结论与讨论
贝叶斯模型在食品工业的品质控制方面获得了广泛应用,如陈华等[14]运用贝叶斯网络原理判别中国白酒香型的化学模式,邓淑芬等[15]建立了食品供应链的信号博弈模型,分析信号博弈的三种贝叶斯均衡及其条件,得出了信息不对称情况下安全食品生产商的损失函数。相比于上述模型,本文的系统可用于猪肉检测部门更快速,简便地对猪肉的合格率做出判断,从而控制食品的安全生产问题。
本研究构建的贝叶斯模型还缺少四种菌种的交互作用对猪肉合格率的影响,使得检测结果可能与实际情况有偏差。今后应该进一步研究贝叶斯网络中使得各个影响因素对结果的交互作用以及用相关度更大的公式或引入函数来建立贝叶斯网络模型,以便于更好的模拟出实际的猪肉合格率检测,用于检测猪肉以及其他食品的安全状况。
由于猪肉的变质及腐败所涉及的菌种种类繁多,本文根据文献中的数据,构建描述变量间不确定性关系的贝叶斯网络模型,可以通过四种菌群的变化得到肉质的腐败情况。亦可通过肉质状况的改变而对猪肉中菌群的状况进行反追踪,调查各菌种所占含量,得到货架期内猪肉的质量的变化,从而达到溯源的效果。
[1]周建新.植物源天然食品防腐剂的研究现状存在问题及前景[J].食品科学,2006,27(1):263-268.
[2]王戬,葛长荣.冷却肉保鲜方法及保鲜剂研究进展[J].食品科学,2011,25(5):54-57.
[3]王金美,石晶,李睿晓.肉与肉制品常见的安全卫生问题及对策[J].肉类研究,2009(1):33-35.
[4]熊立文,李江华,李丹.我国肉与肉制品法规体系和标准体系现状[J].肉类研究,2011,25(5):46-53.
[5]Smid J H,Verloo D,Barker G C,et al.Strengths and weaknesses of Monte Carlo simulation models and Bayesian belief[J].International Journal of Food Microbiology,2010,139(S1): 57-63.
[6]江静,侯永芳,刘秀娟,等.药品不良反应信号检测方法概述[J].中国药物警戒,2010,7(2):78-80.
[7]张汉江,葛伟娜,罗端红.质量贸易条件与农产食品贸易的质量风险控制[J].系统工程,2007,25(9):49-54.
[8]段鹏武.Bayes网络在数据挖掘中的应用研究[J].软件导刊,2007(1):12-13.
[9]周忠宝,董豆豆,周经伦.贝叶斯网络在可靠性分析中的应用[J].系统工程理论与实践,2006(6):95-100.
[10]杨建勇.现代港口发展的理论与实践研究[D].上海:上海海事大学,2005.
[11]魏爱国,王冉冉,李亚玲.基于贝叶斯网络的车辆交通事故预防研究[J].军事交通学院学报,2011,5(13):24-31.
[12]王颖,彭少杰,田明胜,等.2006~2008年上海市猪肉及其制品食源性致病菌监测结果分析[J].公共卫生与预防医学,2011,21(1):109-111.
[13]赵敏,李亚东.无公害食品行业标准-猪肉[J].Sichuan Animal Veterinary Sciences,2001,28(11):18.
[14]陈华,郁志勇,朱国斌.中国白酒香型的化学模式识别Ⅲ一一判别分析[J].食品科学,2000,21(9):40-41.
[15]邓淑芬,吴广谋,赵林度,等.食品供应链安全问题的信号博弈模型[J].物流技术,2005(10):135-137.
Modeling the qualifying criteria of pork based on Bayesian network
ZHANG Fang-yi,DONG Qing-li*,HUANG Song-lin,HUANG Xun-juan,WANG Wen-di
(School of Medical Instrument and Food Engineering,University of Shanghai for Science and Technology,Shanghai 200093,China)
A significant proportion of China’s meat consumption consists of pork.Therefore the issue of pork food safety is a matter of public concern.The establishment of an effective meat traceability system is necessary to monitor food safety.Using the Bayesian network theory to build the model by the Hugin Lite software system,we had identified the qualifying criteria in relate to four specific spoilage organisms(SSOs),including E.Coli,Listeria monocytogenes,Salmonella and Staphylococcus aurous.By using this model,the qualifying criteria could be examined efficiently even when inputting variable bacteria levels.
Bayesian network;pork;traceability model
TS251.1
A
1002-0306(2012)10-0052-04
2011-08-31 *通讯联系人
张方怡(1990-),女,大学本科,研究方向:食品质量安全快速检测。
国家自然科学基金(30800864);上海理工大学微创微创励志创新基金。