监管失灵导致的共有信念扭曲：对食品安全问题频发的经济学分析

2010-11-02周彩霞

长春市委党校学报 2010年5期

关键词：监管者信念违法

周彩霞

（南京理工大学应用经济系，江苏南京 210014）

监管失灵导致的共有信念扭曲：对食品安全问题频发的经济学分析

周彩霞

（南京理工大学应用经济系，江苏南京 210014）

中国食品安全问题频发的根源在于监管失灵导致食品生产者对法规执行的共有信念的扭曲。由监管官员个体与被监管者的静态和动态博弈分析可见，经济个体的行为选择取决于其成本—收益分析。在对监管者的激励约束机制缺位，进而执法乏力的情况下，较多的食品生产者通过学习，形成了违法收益高于守法收益的稳定预期，必然会更倾向于选择违法。只有切实强化对监管者的监管，确保有法可依、执法必严，才能真正形成对原有扭曲信念的强有力冲击，重构生产者有法必依的共有信念，从源头上减少食品危机的发生。

食品安全；共有信念；成本—收益分析；监管失灵

一、问题的提出

俗话说“民以食为天”，但食品安全问题却困扰中国消费者及监管部门多年，始终难以得到有效解决，毒大米、毒多宝鱼、劣质奶粉、瘦肉精、“苏丹红”鸭蛋等食品危机层出不穷。2010年伊始，三聚氰胺问题乳制品重现市场及海南“毒”豇豆危机再一次震惊世人。

我们稍作回顾可发现，我国历次食品危机几乎沿袭了如下发展过程：媒体曝光——生产企业或有关部门极力掩饰事实真相——更严重的问题被进一步揭露——引起高层重视——有关部门对问题食品进行集中查处整治——监管放松——问题食品再次卷土重来。

我国与食品安全相关的政府部门包括工商行政管理部门、质量监督部门、卫生行政部门、农业及林业部门以及食品药品监督管理局等。法规方面，各类食品生产一般均有其行业标准或部门规章，2008年的奶业危机加速了食品安全立法进程，《食品安全法》于2009年初正式颁布实施。《食品安全法》进一步明确了各部门的职责，明确了生产经营者为食品安全第一责任人，还明确了民事赔偿责任优先的原则。为什么这么多的监管部门及规章制度都无法阻止食品安全问题频发？严峻的现实需要给出有说服力的理论解释。

此类问题一般被看作是社会或法律问题，很少从经济学的角度展开分析。本文将尝试以个体学习行为作为切入点，借鉴共有信念的分析框架，运用博弈分析法对我国食品安全问题频发的现象进行剖析，并以此作为寻求更有针对性的对策建议的依据。

二、个体学习、共有信念与制度：理论概述

哈耶克强调个体学习对分析社会秩序的重要性，认为群体秩序是由拥有不同相关知识的个体进行策略互动形成的均衡。[1]斯密德把有限理性的当事人在社会经济活动中所表现出的偏好看作是一个学习过程。基于有限理性的假定，当事人通过一种共识的形成来降低不确定性带来的成本。这种共识沉淀下来，就演变为制度。所谓制度的变迁，就是随偏好的学习过程所引致的共识的不断变化过程。[2](P298)随着进化博弈论、特别是近年来博弈学习理论的发展，个体认知和学习行为的重要性日益受到关注。博弈学习理论中的行为人是一种适应性理性。博弈方往往不能或不会采用完全理性条件下的最优策略，博弈方之间的策略均衡是学习调整的结果而非一次性选择的结果。[3](P2-4)

与诺斯、奥斯特罗姆、赫尔维茨等将制度视为博弈规则，倾向于规则是设计结果的观点不同，青木昌彦将制度定义为关于博弈重复进行的主要方式的共有信念的自我维系系统。制度实质是对博弈均衡的概要表征（信息浓缩），起着协调参与人信念的作用。

在青木昌彦的分析框架[4](P11-13)中，共有信念的形成与变化遵循如下路径：所有参与人在反复博弈中根据他们对别人行动规则的主观认知（信念）形成自己的行动准则，当这些认知稳定下来并不断再生时，参与人自己的行动规则才能趋于稳定，成为参与博弈的指南。当参与人的信念和行动规则一致时，达到纳什均衡状态。在均衡条件下，博弈将实际进行的方式的预期稳定下来，这种预期沉淀为共有信念，参与人相互之间通过共有信念进行持续博弈。制度在这种预期稳定和共有信念形成过程中产生，并作为均衡的概要表征协调着参与人的信念。参与人基于共有信念决定随后的策略选择，导致均衡的再生，均衡的再生反过来又强化了关于其概要表征。制度本身因此获得自我维持功能。如果外部条件发生改变，由主观博弈模型所导致的行动决策未能产生预期的结果，则认知危机会随之出现，并引发人们重新定位主观博弈模型，力图发现新的决策机会。如果新决策被证明是成功的，其他参与人就会去模仿，这实际上是参与人协同修正其信念的方式。

特别要强调的是，青木昌彦认为，一种具体的表现形式只有当参与人相信它时才能成为制度，成文法和政府规制如果没有人把它当回事就不构成制度。他举例说“政府根据某项法令禁止进口某些物品，但如果人们相信贿赂海关官员可以绕开此项法令，而且这是普遍现象，那么与其把这项法令视为制度，还不如把这种贿赂现象视为制度更为合适。”[4]（P14）制度必须是作为博弈的均衡结果来维持的，而“制定的”法律只规定了诱发均衡的博弈外在规则（后果函数）的一个参数。因此，仅仅撰写一部法律不足以实现一种理想的内在状态，执法者和其他参与人的策略决策是重要的。以上观点构成本文分析的理论基础。

三、食品业监管者与被监管者的博弈分析

基于中国食品业的实际状况，我们首先作如下假定：（1）在某一领域，有若干从事同类活动的食品生产者，他们具备学习能力，有限理性，在一定的约束条件下追求个体效用最大化或满意；（2）有相应法规来规定食品生产者可以做和不可以做什么；（3）有作为第三方的监管部门存在，且监管官员个体也是追求个人效用最大化或满意的有限理性的经济人；（4）在不考虑处罚后果的前提下，违法可以比守法获得更多的经济收益；（5）生产者守法与否，监管者称职与否完全取决于成本收益分析，不考虑道德因素的作用。这并不表明道德不重要，做出这一假设是为了简化分析的需要。

（一）食品生产者的成本—收益分析

对食品生产者而言，有两种行为选择：守法或违法。前者特指严格遵守国家有关法规及行业标准，生产符合质量要求的食品。

假设守法生产的预期净收益为R1，违法生产的预期净收益为：R2=R1+R*(W)－μC(W)(P/F，δ，t)。

其中，R*（W）表示因违法行为获得的额外收益。

为简化分析，我们不考虑其他可能影响违法收益水平的因素，仅考虑违法涉及的资金量W，有

C(W)表示依法被查处后当事人按规定要付出的成本，包括可直接用货币衡量的物质、金钱损失和不可直接用货币衡量的声誉、社会地位损失，甚至失去自由、生命等。对成本的衡量亦可借助效用评价大致折算为货币。W越大，一旦被查处面临的处罚也越严厉，从而导致成本越大，所以有

μ表示监管力度系数，本处用违法行为被查处的概率来替代。若μ=0，表示任何违法行为都不会被查处，若μ=1，表示所有违法行为都会被查处。这显然是两个极端，实际情况为0＜μ＜1。监管力度系数越大，因违法行为而需要付出的预期成本越大。

δ为折现率，表示个体的时间偏好。因为违法行为一般要过一段时间才能被发现，在折现率δ一定的前提下，显然越晚被发现，即t越大，成本的现值越小。

经济个体某一时刻对守法与否的选择，是在给定的知识结构和风险偏好基础上对各自成本收益进行分析的结果。由于无论违法与否都有收益R1，所以实际上只要考虑违法的额外期望收益和违法成本之间的关系即可。违法收益和违法成本的关系如图1所示。

图1 食品生产者最优W值的决定

R*（W）是向右上方倾斜的曲线，表示涉及金额越大，违法的额外收益越高。

违法成本曲线的位置有两种情况：

一是C*(W)(P/F，δ*，t*)线所示，由于违法被查处的成本非常高，其值始终大于R*（W），违法无利可图，经济主体会选择守法；二是C(W)(P/F，δ，t)线所示。在0W1区间，违法是有利可图的，且最大期望净收益为AB。考虑到执法力度系数μ后的成本曲线变为μC (W)(P/F，δ，t)线，与C(W)(P/F，δ，t)线相比，违法有利可图的区间扩大为0W2，违法的最大期望净收益也扩大为CD，生产者将更倾向于选择违法行为。

显然，μ越小，违法有利可图区间越大，违法的最大期望净收益也越大。即便是对C*(W)(P/F，δ*，t*)线，只要μ足够小，也会有较大的违法获利空间产生。这说明了一个简单的道理，即监管至关重要。在违法行为被查处的概率很低的情况下，法律规定的惩罚再严厉也无济于事，采用及时而准确的惩罚比采用制定很严而执行却很松的惩罚更为有效。

（二）监管官员个体的净收益分析

虽然加强监管、及时制止违法行为和惩罚有利于提高社会整体福利水平，但基于我国现状，可以近似认为，这与监管机构中监管官员个人的损益并无太大的直接关联。监管者极少会因为没对违法行为实施有效监管而受到足够力度的惩罚；此外，监管人在成功查处被监管对象的违法犯罪行为后所得到的奖励与其在监管过程中所付的努力也并不明显相关，反而可能因此付出额外代价，如因破坏“潜规则”得罪同行，或因打击违法行为影响地方财政收入而得罪地方政府等。

考虑以上因素后，监管者个体的行为选择可能是恪尽职守，也有可能是不作为；选择监管难度小、监管成本低的违法行为进行查处，即所谓的打“苍蝇”不打“老虎”；或是查处后信息不公开以避免影响扩大；甚至是收取贿赂被监管对象所收买。所以，分析监管者的行为选择也必须从监管官员个人的收益成本分析出发。我们可通过监管者与被监管者的一个简单静态博弈来展开分析，二者的支付矩阵如下：

表1 监管者与被监管者的静态博弈支付矩阵

其中R和Y分别表示被监管者与监管官员个人的净收益。在被监管者选择守法行为，且不考虑监管给个人带来的成本情况下，无论监管与否对双方而言收益都一样，被监管者收益R1，监管者收益Y1；若被监管者选择违法、监管者选择监管，则被监管者将为此付出代价，收益变为：R2=R1+R*（W）－C(W)(P/F，δ，t)。

监管者个人可能因为成功查处违法操作而受到奖励，但也可能因此得罪了被查处对象而收益受到一定损害，所以Y2的值有可能大于、等于或小于Y1；如果监管者选择不监管，被监管者会获得较大收益，有

若监管者个人不会因工作不力而受处罚，则Y3与Y1无异；倘若他因此还收受了被监管者的贿赂，且被发现的可能性很小，则Y3＞Y1。所以在被监管者选择了违法之后，监管者个人的行为选择取决于Y2与Y3的比较。由此可见，监管官员个人的最优行为选择取决于其自身的净收益权衡。只有当认真执法收益大于不作为或受贿的收益时，监管官员才会真正履行监管职能。要让监管者个人能很好地履行自己的职责，就需要对其施行有效的“激励—约束”机制，使Y2＞Y3。

（三）监管者与被监管者的动态博弈分析

在监管者与被监管者的支付矩阵中，R1和R2的大小关系可能有两种情况：（1）法规规定的惩罚措施足够严厉，使得违法行为被查处后的成本高于违法的额外收益，也就是说有R2＜R1。法规一旦得到切实的执行，对被监管者还是有威慑力的；（2）法规规定的惩罚措施十分轻微，违法行为被查处后的成本低于违法的额外收益，也就是说有R2＞R1。则被监管者不必担心法规存在对其行为选择的影响，会倾向于选择收益水平更高的违法行为。虽然违法成本低的不正常状况在中国食品业实际上长期存在，但为了便于下文分析，我们假定有R2＜R1。

绝对的严格监管和不监管均属极端情况。考虑到μ值的存在，以上博弈变为一个混合策略博弈，即监管的概率为μ，不监管的概率为（1－μ）。则经济个体选择违法的期望收益为：（1－μ）R3+μR2；选择守法的期望收益为R1。此时，食品生产者的行为选择取决于[(1－μ)R3+μR2]与R1的比较。显然，μ值越小，前者大于后者的可能性越大，他们越倾向于选择违法。这与前文分析得到的结论完全一致。

在一期博弈中，假定μ、t值由监管部门外生决定，控制人可根据监管机构过去对违法事件查处情况的观察或自己的切身体验即学习过程形成对μ和t值的预期。如果由于长期存在μ值较小而t值较大，则会使得违法的预期成本C(W)(P/F，δ，t)很低，净收益值较大，经济个体倾向于选择违法行为。与之同时，食品生产者还可以通过对监管者进行贿赂等手段来达到降低μ、延长t的目的。如果因此降低的成本大于贿赂支出，他们就会有动力去行贿。

图2 监管者与被监管者的动态博弈

我们在静态分析的基础上构建监管者与被监管者的动态博弈模型。如图2所示，被监管者有两种策略选择：守法或违法。监管者有三种策略选择：严格监管、不监管、威胁但不查处，分别用a、b、c表示。为便于分析，设动态博弈过程中，监管者的“严格监管”策略是违法必究。“不监管”是现在不管以后也不管；现实中存在的监管部门无关痛痒的“警告”、“谴责”，由于对当事人利益影响不大，也视同不监管。“威胁但不查处”则较为特殊，先警告，若还要违法则可能遵从类似“事不过三”的原则转用“严格监管”策略严厉查处，但也可能是继续警告却没有实质性行动。对监管者究竟会采用何种策略或者说采用各种策略的概率是多少，被监管者会根据过去的观察或自身的实际体验（学习）来做出预期，从而分析收益成本状况，做出相应选择。

据此可推出以下可能结果：（1）若监管者始终严管，则被监管者违法成本很高，守法是占优策略；（2）若监管者始终不监管，则被监管者违法是占优策略；（3）若监管者总是威胁却无实质性行动，其威胁将被视为“不可置信威胁”，结果与不监管一样，被监管者违法占优；同时使监管者的话语“不可信”，因此信誉受损；（4）若监管者没有一个稳定的策略选择原则，时严时松，或对某些对象严而对某些对象松，被监管者会根据前期经验来调整行为，如在运动式执法来之前守法，“风头”过去后再违法的“猫鼠游戏”，并极有可能通过贿赂谋求对自身放松监管，“俘获”监管者。这种情况下，监管者信誉同样会严重受损。

（四）案例分析：以三聚氰胺超标乳制品频现市场为例

基于以上分析框架，我们分析三聚氰胺超标乳制品频现市场的案例。乳制品行业包括养牛户、奶站、经营户、奶粉及含奶食品生产企业、市场销售多个环节，卫生行政、农业行政、质量监督、工商行政管理、食品药品监督管理等部门均负有相应的监管职责。从监管角度看，存在的问题非常明显。（1）近年来中国乳制品市场的激烈竞争加剧了奶源紧缺，进而导致产业链上的部分商户或企业铤而走险，对原奶进行掺杂使假或使用不合格原奶生产下游产品。向原奶添加三聚氰胺的行为早已存在，奶业生产企业和监管部门却长期视而不见，问题曝光后还试图掩盖真相。例如，上海熊猫早在2008年三鹿事件和2009年4月份的检测中就两次上过三聚氰胺的黑名单，但相关信息却迟迟没有公布。可见，对生产者而言，违法行为有利可图的区间较大。（2）2008年的奶业危机过后，除三鹿被宣告破产，其他同样存在问题的乳企巨头安然度过危机，行业格局没有根本性改变。所以，对被监管者而言，违法被查处的概率很低，被查处后要付出的代价也很低。而对监管者来说，受到处分的官员很快复出，失职的后果同样轻微。2010年初，在陕西一再出现问题奶粉后，副省长郑小明放狠话，如果再发生奶粉问题，将对主管区县长和责任局长先免职再处理。[5]显然，此类“狠话”表达的是“人治”而非“法治”，再加上有大量因失职被问责官员迅速复出的案例在先，领导“狠话”的威慑力也是非常有限的。由此，在监管者与被监管者的博弈中，得到这一最糟糕博弈均衡结果（违法，不监管）的可能性极大。（3）早在2007年发布的《国务院关于促进奶业持续健康发展的意见》中就提出，“建立原料奶质量第三方检测制度，逐步实现原料奶收购的优质优价。”2008年10月16日，国家工商行政管理总局等九局(部)下发《关于不合格奶制品退货退款和召回、销毁有关问题的紧急通知》，强调“及时召回和销毁不合格奶制品，确保不合格奶制品得到及时有效处理。”新颁布的《食品安全法》对食品召回制度也作了专门规定。但遗憾的是，这些法规既没有阻止三聚氰胺超标奶粉的上市，也没有阻止有关部门对问题奶粉“查而不处”，部分地方居然将未销毁问题奶粉的理由归于技术不成熟，导致它们改头换面再次流向市场。例如，陕西金桥乳粉事件中的涉案奶粉在2008年10月份就被查出三聚氰胺超标，但却未被要求销毁。之后，企业负责人居然设法使该批次奶粉复检合格，直到卖给外省一家企业后才被对方查出问题。而针对一批问题奶粉由宁夏流入广州从化某面包坊的事件，广州卫监所负责人则表示是卫生部通报才知情，同时由于面包坊不归他们管，所以具体应归谁查处他们也不清楚。[6]

由此可见，我国食品领域并非没有法规，但长期监管失灵导致执法不严、有法不依，食品生产者形成的共有信念不是法规必须得到或必然会得到严格执行，而是法规执行存在很大的变通空间，即便被查处损失也很轻微。共有信念扭曲的严重后果不言而喻——生产者为逐利而肆无忌惮地不择手段，制定再多的法规也不能发挥作用，反而会损害立法、执法部门的声誉。

四、解决食品安全问题的关键：强化对监管者的监督

综上所述，如果制定有严格的法规，且违法行为会得到及时且严厉的惩戒，则理性经济个体出于成本收益比较，不会选择违法。问题食品频现市场的表象下所隐藏的问题实质是执法不严使得法律法规因缺乏威慑力而形同虚设，违法可以给理性的经济个体带来比守法更高的收益，他们必然会更倾向于选择违法。显而易见，监管失灵是导致奶业乃至整个食品行业危机频发的重要因素，监管失灵的根本原因不是人力物力有限、技术手段滞后、检验经费不足、企业自律差、招商引资政策之类的客观因素，而是对同样作为经济人的监管官员个体缺乏有效的激励—约束机制。

因此，解决我国食品安全问题的当务之急并不在于对特定对象的查处，或是制定更多的法规、提升监测技术及设备水平，而是要建立过去一向缺乏的对监管者的考核监督机制，使得监管者个人恪尽职守的净收益要显著大于不履行职责的收益。只有当监管者的行为策略实现切实转变后，才能真正提升执法力度和对违法行为的惩罚力度，迫使被监管者调整原有博弈过程中的支付函数；因此才有可能通过持之以恒的严格执法来使得“违法行为得不偿失”的信念得到巩固，将扭曲的共有信念复位，真正形成“有法必依，执法必严”新共有信念，让老百姓能放心地吃上健康卫生的食品。虽然道理浅显，但由于强化对监管者的监管涉及政治体制的变革，真正实现尚需要社会各界付出艰苦努力。

[1]转引自：李玉连.个体学习、预期与制度演化[J].江汉论坛，2006，（1）.

[2]A.爱伦·斯密德.财产、权力和公共选择——对法和经济学的进一步思考[M].上海：上海三联书店，上海人民出版社，1999.

[3]朱·弗登伯格，戴维·K.莱文.博弈学习理论[M].北京：中国人民大学出版社，2004.

[4]青木昌彦.比较制度分析[M].上海：上海远东出版社，2001.

[5]左志英.陕西又一厂家现问题奶粉，或已流入广东[EB/OL].南方网，http://news.xinmin.cn/rollnews/2010/ 02/12/3644053.html，2010-02-12.

[6]陈辉.广州卫生局今早回应：问题奶粉销到从化是卫生部通报的[N].羊城晚报，2010-02-04，A3.

［责任编辑：王慧慧］

F224.32；F407.82

1008-8466（2010）05-0038-05

2010-06-26

周彩霞（1976—），女，湖南茶陵人，南京理工大学经济管理学院应用经济系副教授，经济学博士，主要从事产业经济学、个体行为与制度变迁方面的研究。