基于博弈论的食品安全监管分析

2013-03-31

合作经济与科技 2013年14期

（河北经贸大学河北·石家庄）

一、研究现状

近年来，我国食品安全事故频发，“苏丹红”、“假葡萄酒”、“三鹿奶粉”等事件令人触目惊心，许多人对我国的食品安全和卫生充满了不信任。据《求是》主办的《小康》杂志和清华大学媒介调查实验室发布《2010～2011 消费者食品安全信心报告》显示，近七成人对中国的食品安全状况感到“没有安全感”。食品安全是保护人类生命健康，提高人类生活质量的基础，是经济社会稳定发展的重要保障。食品业是当今中国经济中一个重要支柱产业、一个重要的就业领域。然而，2011年“瘦肉精”又将中国肉业第一大品牌“双汇”推上风口浪尖，接踵而来的是“染色馒头”、“回炉面包”、“牛肉膏”事件。“旧问题没有解决，新问题层出不穷”。食品安全已经成为公众心中异常沉重的话题。食品安全问题不仅严重影响公民的幸福感，影响我国食品行业的可持续发展，而且也严重影响着政府的形象和民族的尊严。如何提高食品安全已是非常迫切需要解决的问题。

二、食品市场各相关主体之间的博弈论分析

（一）食品供给者与消费者之间的博弈模型

1、没有政府、法律保障制度的监管与声誉效应的情形下食品供给者与消费者之间的博弈。假设在一个食品市场，只有一个食品供给者和一个消费者，而且他们都是理性的经纪人。食品供给者拥有食品安全质量的完全信息，而消费者不拥有食品质量的完全信息。食品供给者有供给安全与不安全食品两种策略选择，提供安全食品的成本为C1，供给不安全食品的成本为C2，一般有C1＞C2＞0。消费者有购买与不购买两种策略选择。食品的销售收益为R，消费者消费安全食品带来的净效用为V，消费者购买并消费不安全食品通常会造成净损失，记为-W。消费者不购买则自己的净收益为0，同时导致食品供给者的产品积压，此时食品供给者的损失分别记为-C1 和-C2。各种策略组合下的得益情况见得益矩阵表1。（表1）

表1 食品供给者与消费者之间的博弈

由于C1＞C2＞0，所以R-C2＞R-C1，且-C2＞-C1。因此，食品供给者的最优选择是提供不安全食品。此时，因-W＜0，所以消费者的理性选择是不购买，均衡是（不安全食品，不购买）。

然而，从参与者的行为看，由于博弈可以重复无数次，博弈双方为了共同利益有时间进行试探性的选择。在第一次的博弈中，食品供给者为了谋求更高的利益供给了不安全的食品，然而对消费者来说购买不安全的食品给自身带来了一定的损失-W，因此消费者采取了抵制行为，那就是不购买，使得食品供应者产生库存积压，经济利益受损-C2。然而，消费者并不具有生产能力，在只有一种食品的供给市场上，消费者只能选择不买。此种情况若考虑到所有的食品市场食品供给者提供不安全食品，食品供给者的这种策略被称为“以牙还牙”策略，这种策略如果供给者在初始选择提供安全食品，那么消费者购买，供给者也会一直供给安全食品；若利益驱使供给者提供不安全食品，那么消费者在以后博弈中都采取不合作策略。“以牙还牙”策略意味着任何一个参与人的一次性不合作将会引起永远的不合作。所有参与人为了长期利益，使得无限次重复的非合作博弈产生合作解，最终走向（供给安全食品，购买）。

2、有政府、法律保障制度的监管与声誉效应的情形下食品供给者与消费者之间的博弈。以上分析是基于食品市场上食品供给者和消费者之间在没有政府、法律保障制度的监管与声誉效应的情况下的博弈。然而，由于食品安全的外部性特征和食品本身的观察属性、经验属性和信任属性决定了声誉效应在食品市场上表现得尤其突出。而且声誉的毁损是以交易终止、丧失未来收益为代价的，声誉的价值等于丧失未来交易的损失减去背信合约所得到的短期收益。这种得不偿失的付出在食品市场上是不值得的，而且实际的市场中是有政府干预和一定法律保障的，下面我们分析在食品市场上有政府、法律保障制度的监管与声誉效应的前提下，食品供给者和消费者之间的博弈。

在以上其他参数如上述模型不变的情况下，我们另外引进了参数P（P＞0），它表示在食品市场上，有政府、法律保障制度监管和声誉效应的前提下，如果食品供给者提供不安全的食品，并且消费者购买了这些不安全的食品，法律将给予食品供给者P 的惩罚。各种策略组合下的得益情况见得益矩阵表2。（表2）

表2 食品供给者与消费者之间的博弈

由于C1＞C2＞0，且-C2＞-C1，当P＞C1-C2 时R-C1＞R-C2-P。因此，食品供给者的最优选择是提供安全食品，此时，V＞0，所以消费者的理性选择是买，均衡是（安全，购买）。根据此模型的分析可知，在食品市场政府应该通过各种手段提高食品供给者因供给不安全食品的惩罚，这种手段可以有效地控制不安全食品的出现。针对以上模型分析并结合我国的实际国情可知：不安全食品伪装成安全食品的成本C 很低，原因在于不安全食品主要流向了农村。像每块1 元的仿名牌的巧克力、胀袋漏水的果冻、霉变的辣条，这些国家禁止销售的假劣食品，虽已在城市早已难觅踪迹，却在农村沉渣泛起。在有政府、法律保障制度的监管和声誉效应的前提下，如果食品供给者提供不安全的食品，并且消费者购买了这些不安全的食品，法律将给予食品供给者P 的惩罚，P 的大小与食品供给者供给食品的概率成反比。我国在食品安全监管上存在着严重的惩罚机制的漏洞。

（二）食品供给者和食品安全监管人员的博弈分析

1、博弈模型的设定。现实中我国食品安全的监督部门众多，为便于分析，我们暂时将众多的监督部门抽象成一个博弈方，记为监管者。监管者有严格检查（简记为“检查”）与不严格检查（简记为“不检查”）两种策略；另一博弈方即食品生产者，有提供安全食品和不安全食品（简记为“安全”、“不安全”）两种策略。可以用表3 所示的得益矩阵表示。这里V 是食品生产者提供不安全食品成功时获得的额外收益。F 是食品生产者提供不安全食品被发现并且受到处罚而遭受的净损失；如果生产者提供安全食品，无论监管者是否严格检查，他的得益都为0。C 是监管者检查时付出的成本，如果监管者不检查而没有发生食品安全事件，则监管者不但不会发生检查成本，并且也不会受到有关部门的问责和惩罚，记其得益为0；若因监管者不严格检查导致出现食品安全事件，监管者就要受到问责和惩罚，记其负效用为-D，R≥0 是政府对监管者查处不安全食品的奖励。得益矩阵中各得益数组的第一个数字是食品供给者的得益，第二个数字是监管部门的得益。显然F、C、V 通常都是大于零的，D 大于或等于零。进一步假设博弈方都是完全理性的，每一个博弈方都具有完全信息。（表3）

表3 食品安全监管博弈1

2、模型的分析求解与讨论。如果D＞C-R＞0，显然该博弈没有纯策略纳什均衡。因为给定食品供给者提供不安全食品，监管者的最优策略是严格检查（RC＞-D）；给定监管者严格检查时，食品供给者的最优策略是提供安全食品（0＞-F）；给定食品供给者提供安全食品，监管者的最优策略是不检查（0＞-C）；给定监管者不检查，食品供给者的最优策略就是提供不安全食品；如此等等，没有一个纯策略组合构成纳什均衡。因此，我们转向求解混合策略纳什均衡。

我们设t 为食品供给者提供不安全食品的概率，m 为监管者实施严格检查概率。给定m，食品供给者选择“不安全”（t=1）和“安全”（t=0）的期望得益分别为：U1（1，m）=（-F）×m+V×（1-m）=-m（V+F）+V，U1（0，m）=0。解U1（1，m）=U1（0，m）。这样，解得m*=V/（V+F）。即如果监管者实行严格检查的概率大于V/（V+F）时，食品供给者的最优选择是“安全”；如果监管者实行严格检查的概率小于V/（V+F）时，食品供给者的最优选择是“不安全”；如果监管者实行严格检查的概率等于V/（V+F）时，食品供给者随机地选择“不安全”或“安全”。同理，给定t，监管者选择严格检查（m=1）的得益U2（t，1）=（R-C）×t＋（-C）×（1-t）=Rt－C；监管者选择不检查（m=0）的期望收益为：U2（t，0）=（-D）×t+0×（1-t）=-tD。解U2（t，1）=U2（t，0），得t*=C/（R＋D）。即如果食品供给者提供不安全食品的概率大于C/（R＋D）时，监管者的最优选择是检查；如果食品供给者提供不安全食品的概率小于C/（R＋D）时，监管者的最优选择是不检查；如果食品供给者提供不安全食品的概率等于C/（R＋D）时，监管者随机地选择检查或不检查。

因此，混合策略纳什均衡为：t*=C/（R＋D），m*=V/（V+F）。也就是说，食品供给者以C/（R＋D）的概率选择提供不安全食品，而监管者以V/（V+F）的概率选择严格检查。

以上的求解过程表明，该博弈模型的解存在两种情况：一是当C-R＞D＞0 时，该博弈有惟一的纯策略纳什均衡：（不安全，不检查）。这一均衡结果意味着有大量不安全食品的出现，而有关监管部门没有负起监管的职责。二是当D＞C-R＞0 时，该博弈没有纯策略纳什均衡。此时混合策略纳什均衡为：t*=C/（R＋D），m*=V/（V+F）。该均衡表明：在其他情况一定时，监管者严格检查的成本C 越高，食品供给者提供不安全食品的概率越大；监管者因玩忽职守（即不检查）导致食品安全事件发生而受到的惩D 越大，食品供给者提供不安全食品的概率越小，监管者发现并查处不安全食品受到的奖励R 越重，食品供给者提供不安全食品的概率也越小。在其他情况一定时，监管者检查的概率与食品供给者提供不安全食品成功获得的净利润V 成正比，而与食品供给者提供不安全食品被发现而遭受的损失F 成反比。进一步可以看出，只要检查的成本C 远大于零，食品供给者提供不安全食品成功的净利润V 远大于零，就无法完全避免不安全食品的出现。但是，政府可以通过加强对监管者的奖惩力度，或者通过某些措施或制度建设减少严格检查的成本来降低食品供给者提供不安全食品的概率。

3、模型解的进一步讨论。以上分析暗含一个假定，即只要监管者严格监管，不安全食品一定会被发现。这有可能不符合现实。实际情况通常是，即使监管者严格监管，不安全食品也只能以一定的概率P被发现。这意味着食品供给者提供不安全食品，监管者选择严格监管时，双方的期望得益分别为-PF＋（1-p）V 和PR-C。此时博弈的得益矩阵如表4。（表4）

表4 食品安全监管博弈2

为分析方便，进一步假定博弈双方是风险中性，对该博弈可以类似分析求解。该博弈均衡解有如下几种可能情况：（1）当-PF＋（1-P）V≥0，PR-C≥-D 时，食品供给者有占优策略即“不安全”，此时，监管者会选择严格检查。惟一的纯策略纳什均衡是（不安全、检查）；（2）当-PF＋（1-P）V≥0，PR-C＜-D 时，食品供给者有占优策略即“不安全”，监管者有占优策略即“不检查”，该博弈有占优策略均衡：（不安全，不检查）；（3）当-PF＋（1-P）V＜0，PR-C＜-D时，因为监管者有占优策略即“不检查”，食品供给者当然选择“不安全”，因为V＞0，从而该博弈有惟一的纯策略纳什均衡：（不安全，不检查）；（4）当-PF＋（1-P）V＜0，PR-C≥-D 时，此时该博弈没有纯策略纳什均衡。混合策略纳什均衡为，食品供给者以C/（PR＋D）的概率选择“不安全”，而监管者以V/［P（V+F）］的概率选择“检查”。

比较监管博弈1 和监管博弈2 的均衡解发现，监管博弈1 可以看作是监管博弈2 的特例（即P=1）。当监管者严格监管，不安全食品只能以一定的概率P（＜1）被发现时，博弈的均衡情况更加复杂，纯策略纳什均衡（不安全，不检查）或（不安全，检查）显然不是政府和消费者希望看到的结果。（不安全，不检查）结果的出现与PR-C＜-D 密切相关，通常意味着监管者严格检查的成本高于可能的奖励与因不检查受到的惩罚D 之和。在一定的社会条件下，严格检查的成本通常是一定的，（不安全，不检查）结果的出现一般都是由于对监管者的奖惩力度不足。因此，要避免该结果出现，政府应加大对监管者的奖惩力度。而（不安全，检查）结果的出现与-PF＋（1-P）V≥0 密切相关，该条件成立，通常是由于V 太大，F 太小造成的，或者仅仅是由于P 太小造成的。因此，要避免该结果出现，政府应设法减少V，增加对食品供给者供给不安全食品的惩罚力度F，以及提高监管者的监管能力即提高发现不安全食品的概率P。监管博弈2的混合策略纳什均衡同样表明，只要检查的成本C 远大于零，提供不安全食品成功的净利V 远大于零，就无法完全避免不安全食品的出现。最后，以上分析隐含假定众多的监督部门利益上是完全一致的，它们之间不存在沟通与协调的困难，这一假定不完全符合现实。

在以上分析中可以看到，食品监管的成本与监管效率成反比，对监管者的奖励与监管效率成反比，在食品监管中存在政府失灵。由于我国社会主义市场经济体制还不完善，政府在职能定位上存在偏差，对于市场不能有效调节的经济领域，本应通过政府规制来调节，但是政府在制度建设上没能及时跟进。另外，在监管部门的建设方面，并未引起国家的重视，很多监管部门出现检验设备落后，检验人员整体素质不高，检验人员只拿固定的工资没有任何的奖惩制度来激励监管者。最终导致一些食品供给者通过贿赂监管者的办法而蒙混过关，最终危害了消费者的利益。

［1］《2010～2011 消费者食品安全信心报告》发布［EB/OL］.中国工业信息网，http：//www.587766.com/news2/23053.html.

［2］周洁红，钱峰燕，马成武.食品安全管理问题研究与进展. 农业经济问题，2004.4.

［3］张维迎.博弈论与信息经济学［M］.上海三联书店，2004.3.

［4］谢敏，于永达.对中国食品安全问题的分析［J］.上海经济研究，2002.1.5

［5］谢识予.经济博弈论［M］.上海：复旦大学出版社，2007.4.

［6］薛庆根等.美国食品安全管理体系对我国的启示［J］.经济体制改革，2006.

［7］王浩.供应链结构特征、机制设计与产品质量激励［J］.中国工业经济，2010.8.

［8］肖志兴，胡艳芳.中国食品安全监管的激励机制［J］. 中南财经政法大学学报，2009.1.

［9］陶海飞.经济转型期中国食品药品安全的社会性管制研究［M］.北京：经济科学出版社，2010.

［10］岳中刚.基于零售商主导的纵向约束研究述评［J］.产业经济研究，2008.1.