绩效博弈与官僚治理机制
2015-10-20李佳源
李佳源
政绩考核的内在悖论
毛泽东说,在路线确定之后,最重要的因素就是干部。这个判断强调国家治理的关键在于吏治。在诸多管理工具中,吏治的关键则在于形成一套有效的干部激励机制,以帮助公职人员成长为出类拔萃之辈的干部。在目前的制度安排下,这种激励更多表现在通过构建量化指标来对官员的工作业绩进行测量,并且将测量的结果和官员的选拔任用结合起来。借助量化指标可以对官员的业绩和能力进行精确的区分。尽管如此,这种制度设计也导致了一系列的问题,其中最为突出的问题就是绩效考核中存在集体数据作假等博弈行为:被考核者采取不正当甚至是违法的手段对数据进行调整,即出现社会学家所说的目标替代的问题。在这种情况下,绩效考核从一种手段被异化为目的本身。
近年来,公共部门中量化考核及其引发的负面效应已经成为公共管理和组织社会学研究的重要主题,这些研究使得我们得以窥见博弈这个近乎黑箱的组织现象。牛津大学万灵学院的胡德(Christopher Hood)教授的一系列研究都揭示了量化考核的悖论:当一项绩效考核对被考核者的奖惩过大的时候,那么它扭曲被考核者的激励结构和诱发博弈行为的可能性更大。在他与合作者贝文(Bevan and Hood, 2006)对英格兰公共卫生领域的量化指标的研究中,他们发现对医疗救护响应时间的硬性考核规定导致了医护人员对数据进行违规修正的行为。例如,为了达到不超过4个小时救助等候时间的目标,一些病人被要求在救护车中等待,直到医院确定他们能在规定时间内开展救助才允许这些病人进入医院。威斯康辛--麦迪逊大学的海因里奇通过实证研究发现,在就业培训中,根据参与人员完成训练后的就业状况来决定管理者的绩效工作的分配,确实诱发了项目管理者的策略性行为。例如,项目的管理方将一些就业前景不好的培训申请者(如低学历和少数族裔等)排除在项目外,以此来达到“提升”项目效果的目的。
基于中国情境的许多实证研究也证实了类似的悖论。香港城市大学的陈汉宣教授和高洁博士的一系列有关中国地方政府绩效评估的研究,都发现量化考核诱发了不同程度的数据造假行为(Chan and Gao, 2012)。斯坦福大学的周雪光老师及其合作者对中国官僚机构运作的近距离观察,也提供了与此相关的丰富证据(周雪光,2008)。高洁博士(Gao, 2015)在新近的一篇论文中,将中国地方政府的目标责任制中存在的博弈行为区分为良性博弈和恶性博弈,两者的区别在于,“博弈”是否导致了报告的绩效和真实绩效之间的差异。良性博弈主要包括棘轮效应和门槛效应,主要是指被考核者为了避免下一轮考核中更重的任务,将指标的完成水平限制在考核方确定的目标水平之下,或避免以较大幅度地超过上级确定的目标值。这类博弈行为以往并没有得到足够的关注,但近年来开始见诸文献。例如,一些研究人员发现,为了应对逐年上升的考核任务,基层派出所会把超额完成的犯罪打击任务,按照一定的比例“交易”给完成情况不理想的派出所,以此来达到一种“双赢”的局面:超额完成的派出所可以避免来年更重的考核压力,而未完成任务的单位则可以通过考核。这类博弈行为出现的直接诱因是目前绩效指标的制定方式:下一年考核目标值的确定,是基于该指标今年的完成情况来制定,因此被考核者为了减轻考核压力,他们会避免在考核指标上完成得太过理想。
相比较而言,恶性博弈指的是被考核方由于种种原因无法完成考核任务,而通过直接的数据造假来影响考核的结果。在一些情况下,恶性博弈会直接损害民众的利益。例如,一些地方为了完成节能减排的任务,对所在辖区的企业和居民进行拉闸限电,严重影响了企业生产和民众生活。再如,为了遏制耕地锐减的势头,各级政府已经建立了耕地保护目标责任制。为了平衡耕地保护和经济发展之间的矛盾,耕地保护的基本原则之一是耕地总量动态平衡,允许地方在占用耕地的同时补充数量和质量相当的耕地。但是一些调查发现,“占优补劣”的情况较为普遍:非农建设用地占用的大都是良田沃土,而补充的耕地主要是土壤肥力差、生产能力不足及灌溉条件较差的耕地。表面上看,耕地的绝对数量没有减少,但是耕地的综合生产能力被严重削弱。从长远来看,“占优补劣”的问题影响的是国家的粮食安全。这些例子都说明,恶性博弈行为在一定程度上是通过牺牲民众和社会的利益来完成考核任务的。
此外,这些行为的隐秘性和敏感性也使得我们无法准确估计各类博弈行为的普遍程度。但是从部分基层公职人员对考核数据真实性的质疑(Xiao and Womack, 2014),到大家经常听到的一些顺口溜,例如,“村骗乡,乡骗县,一直骗到国务院”,我们不难窥探数据“注水”的问题事实上十分严重。
博弈行为对官员选拔机制的扭曲
这些博弈行为的危害是多方面的。博弈行为首先对政府的科学决策构成威胁。大数据时代的公共管理愈加强调数据驱动。尽管政府决策的数据来源是多方面,但是自身的统计体系是其中重要的因素。因此,博弈行为的发生首先损害了数据的真实性和可靠性,“注水”的数据导致决策者对实际情况的误判。例如,近年来,一些地方政府片面追求经济数据的华丽,进而对数据进行人为的修正。如果这种行为具有普遍性,那么决策层可能会对宏观经济环境形成错误的认识。类似地,在犯罪打击领域,目前一种颇为流行的主张是,警力跟着警情走:警力资源的配置必须根据地方的治安状况来制定。如果基层派出所对反映他们绩效的治安绩效进行干扰或调整,那么数据结果将严重影响上级公安部门对治安形势的判断,进而误导警力资源的科学配置。
其次,博弈行为损害了政府组织内部的信任,增加了治理的成本和难度。政府绩效评估从本质上说是一种激励工具,但是由于博弈行为的发生,上级在考核的时候不得不加大了许多资金和技术投入用于减少博弈的空间。例如,在环保领域,环保部借助了污水排放在线监控来避免基层数据作假。尽管这些投入的效果如何有待评估,但是从这些例子不难看出,博弈风险明显提高了上级政府的治理成本和难度。
此外,博弈行为的发生扭曲了官员选拔机制。从理想的层面理解,官员的选拔和任用无非是让“能者上,平者让,庸者下”。如果数据造假非常普遍,甚至存在社会学家所说的“上下级共谋”对绩效结果进行非法干扰,那么绩效评估作为一把选贤任能的尺子将会失灵,在考核的“锦标赛”中胜出的将是那些善于对数据进行调整的官员,而那些实事求是的官员将受到淘汰。显然,放任这个问题存在,将严重污染中国官场的政治生态。
但是,一个更进一步的问题是,为什么会出现考核作假?特别是考核技术日益改进的背景下,为什么博弈行为仍然普遍存在?对官员在考核中的作假行为,目前的解释,仍然局限于委托--代理理论。这个框架的基本出发点,是将政府组织间的上下级关系视为委托者和代理者的关系,委托人和代理人之间的目标不一致,以及双方的信息不对称导致了博弈行为的出现。许多研究都是从这个视角来分析这个问题的。
但笔者认为,尽管委托--代理视角具有一定的解释力,但是要理解这些行为的发生,就必须关注诱发博弈动机和行为的制度逻辑。制度逻辑视角可以为博弈行为的发生以及这些不正当行为的顽固性提供一种新的解释。这个理论流派的主要观点是,社会是由不同的制度逻辑构成的,这些制度逻辑为个体的行为提出了相互矛盾的要求。尽管制度逻辑是在社会的宏观层面运作的,它们塑造了行动者的认同(“我是谁”)、目标(“我追求什么”)和手段(“我要如何实现目标”)。另一方面,制度逻辑视角也认为,个体依据制度逻辑行动会强化制度逻辑本身,这也是为什么制度化的行为一旦形成就会表现出很强的稳定性。总之,这个理论流派强调制度逻辑和行为之间存在的相互影响的关系:即制度逻辑塑造了个体的行为,而个体的行为反过来会强化制度逻辑。
新官僚精英机制的出路
在当前的制度安排下,量化考核更容易诱发国家科层(state-bureaucratic)的官僚化逻辑。在这个逻辑占主导的制度体系下,官员的合法性取决于他们对上级制定的各种指令的回应和执行,因此他们必须将注意力聚焦于上级下达的指令。近年来,横向排名机制、末位淘汰和一票否决等考核技术的应用,使得被考核者对上级制定的各种指标更加敏感,前者的注意力被锁定在了自上而下分配的量化指标上。在一些极端的情形下,被考核者不得不采用博弈行为来确保自己在考核中的优势。博弈行为的发生,事实上就是国家科层逻辑影响官员动机和行为的体现,而遵循国家科层逻辑的行动策略,反过来又固化了这一官僚化逻辑在制度环境中的主导地位。
从制度逻辑的角度出发,减少博弈行为的关键,在于如何从技术上和制度上缓解国家科层逻辑对官员行为的控制。笔者认为可以从以下几个方面入手:首先,必须完善测量体系的设计,尤其是确定绩效目标的合理性。目前指标任务的制定存在“只升不降”的趋势,而且为了所谓的“打出多余量”,一些考核者惯用横向排名机制,这便意味着单纯完成上级下达的任务是远远不够的,被考核者必须获得“相对绩效”的优势。在考核的高压下,自上而下的层层加码和自下而上的层层注水成为常态。事实上,不少经验研究已表明,目标任务的难度和博弈的发生之间存在一定的关联性(Bohte and Meier, 2000)。因此,如何提升目标和指标制定的合理性,是降低博弈风险的当务之急。
环保指标考核即是地方官员治理中经常诱发博弈行为的一项
目标的合理性,还意味着在制定考核指标和目标的过程中必须兼顾地方发展程度和发展定位的差异,避免搞“一刀切”。广东省贯彻和落实科学发展观考核体系的设计就是一个很好的例子。自2008年以来,该考核体系将全省分为四类地区,分别是都市发展区(广州、深圳)、重点发展区(粤西、粤北、粤东)、优先发展区(广、深以外的珠三角城市)和生态发展区(河源、梅州等)。四类地区的指标和权重设计,都是根据地区的发展战略来确定。通过差异化和个性化考核可以顾及地方发展的特色,实现绩效考核的公平性和结果的可比性。相反的,目标设定上的“一刀切”非常容易诱发博弈行为。高洁博士 (Gao, 2015)在其论文中就讲述了这样一个例子。在陕西省某县,按照绩效考核的要求,每个地方必须完成一定数量的农村富余劳动力转移,但是对于一些乡镇,由于当地有着较为发达的果树种植产业,农民通过种植业就可以获得高于外务工的收入,因此下达富余劳动力转移的硬指标是不合理的。为了应对这些指标,乡镇政府不得不捏造数据。从这些例子可以看出,绩效目标不合理是诱发绩效考核博弈的主要原因之一。
其次,要改善绩效数据的采集手段。博弈行为在很大程度上是被考核方对自由裁量权的滥用,破解这个问题的相应办法,就是提高绩效数据采集的独立性。例如,在耕地保护领域,卫星航拍技术的运用对地方政府的耕地保护形成了很大的压力。在卫星遥感技术的协助下,国土部门将一个地区同一地域的两个不同时间点的卫片进行对比,就可以直观地判断所拍摄地域土地利用的变更情况。这项技术的应用,明显减少了考核的主观性和被考核方博弈的空间。应该强调的是,这些手段和技术的应用虽然不可能完全杜绝博弈行为,但可以减少绩效数据采集过程中对被考核方的依赖。当然,绩效考核的设计也需要考虑到成本的问题,在经济条件允许的情况下,可以尝试应用技术化的手段提升绩效数据采集的独立性。
另外一个相应的方法是借助其他数据对绩效数据的真实性进行校验。 Rawski (2001)的研究,就是通过比较GDP的增长和能源消耗之间的反差来对中国GDP数据的真实性提出质疑。作者的逻辑是,GDP的增长必须建立在能源消耗的基础上,能耗下降但GDP仍然快速增长只有两种解释,一种是单位GDP能耗剧烈下降,但是这显然不符合中国的实际。另外一种可能的解释就是数据作假。事实上,考核的竞争压力下如何挤出绩效数据的水分,也是决策层的重要关切。例如,李克强总理在担任辽宁省委书记的时候告诉来访的美国驻华大使,他更喜欢通过耗电量、铁路货运量和贷款发放量来评估当时辽宁省的经济状况。英国著名的政经杂志《经济学人》受到这个方法启发将这三项经济指标进行综合,设计出了“克强”指数。这些例子说明,如果一个关键业绩指标非常容易受到操纵,一个相应的方法就是采用多个相关指标进行共同的测量和校验。
指标考核的设置应因地制宜,切忌“一刀切”
第三,要尽可能扩大绩效评估指标体系的涵盖面。绩效评估研究的一个比较一致的观点是,对于被考核者而言,理性的策略就是测量什么就重视什么。因此,在指标设计上要避免过于简单化。组织的注意力是一种稀缺的资源,为了避免出现选择性关注,政府绩效指标的设计必须包括关键业绩指标(Key Performance Indicators)。此外,指标之间必须具有一定的逻辑关系,即涵盖投入、产出、过程和结果。和西方公共管理改革的趋势一样,许多地方政府在实施绩效评估过程中都存在一种结果至上的倾向,对完成绩效目标的投入和过程重视不够。事实上,在评价官员的实绩中,考核的设计者不仅仅要重视结果,还要考虑过程,即完成目标的手段的合理性和正当性(王汉生、王一鸽 ,2009)。
在指标的筛选过程中还需要注意一个问题,就是考核指标是否适合用于评价政府部门的业绩。如果考核的内容受到被考核者努力以外的因素影响,那么这些指标不宜作为有效的信号来评价官员的业绩。例如,目前许多地方政府开始使用公众主观感知指标(例如满意度和幸福感等)对政府机构的业绩进行测量,但是影响这些主观感知的因素除了公共服务的质量外,还包括了许多被考核者无法直接影响的因素。例如,幸福感的许多研究表明,人格甚至是受访者填答问卷时候的心情,都可能会影响他们报告的幸福感的高低 (Schwarz and Strack 1999)。如果考核的设计者过于强调这些“民意指标”,那么可能诱发被考核者的抵触甚至是博弈行为。总之,在指标体系的设计上必须考虑权责一致。
最后,除了在技术上和方法上对考核进行改良外,笔者认为,政府绩效考核应该在政治问责和组织学习中寻求平衡点。哈佛大学肯尼迪政府学院的罗伯特·贝恩教授认为,公共部门的绩效考核应该包括评价、控制、预算、激励、学习和提升等功能(Behn, 2003)。但在实践中,我们观察到,目前对政绩考核的应用,过于强调绩效评估的控制和问责功能,而忽视了这项工具的其他作用。笔者认为,改进政府绩效考核的方向是,弱化绩效评估的问责取向,减少被考核者对考核的抵触,并且强化绩效评估在推动组织学习和创新中的作用。实现绩效考核的功能转变,可以促使对这项工具的应用回归理性。
总之,不同于目前主流媒体将考核博弈行为的发生归结于涉事官员的自利动机和道德缺陷,笔者的主要观点是,必须重视诱发博弈行为的制度性根源。绩效考核的制度设计非常容易诱发国家科层官僚化的制度逻辑,这个逻辑将被考核者的注意力局限在各种自上而下制定的量化指标上。而在国家科层逻辑占主导性的制度环境中,包括数据造假在内的各种博弈行为,对于被考核者来说就是一种“理性”的行为。对于博弈行为的出现,我们必须从制度上寻找原因和对策。没有这一点,如何寻找新官僚精英将成为无本之木。
受到中国几千年来“学而优则仕”的观念影响,公务员至今仍然是一个非常具有吸引力的职业选择。竞争激烈的公务员考试选拔,无疑能够确保进入这个队伍的大部分人都是有潜力成为独当一面的政务精英。公共部门这个“雇主”需要帮助这些年轻的公务员更快更好地成长,让公共管理成为他们施展抱负的地方,将他们的个人成长和组织发展统一起来。但是,目前的量化考核在这一点上起到了反作用,不合理的绩效考核机制迫使不少公职人员疲于应对各种自上而下的考核指标,甚至导致他们对自己工作的意义和价值产生了怀疑。从这个意义上说,寻找新的官僚精英,关键在于如何通过完善绩效管理等激励机制最大限度释放公职人员的潜能和公共服务动机。这或许可以为郑永年先生提出的“出类拔萃之辈去了哪里”一问提供一些初步的回答。