APP下载

从循证决策到循证治理:理论框架与方法论分析

2018-12-04王学军王子琦

图书与情报 2018年3期
关键词:循证医学系统评价

王学军 王子琦

摘 要:近年来,循证决策在全球范围内掀起了一场政策“有效性”变革的浪潮,但也受到越来越多理论和实践的挑战。基于治理理论和善治理论的观点,许多学者探讨了“循证治理”相关的概念,以弥合“循证”思潮与主流公共管理理论的断桥。文章从证据生产、评价、使用和价值取向四个方面阐释了从循证决策到循证治理的转变逻辑,类比循证医学三要素提出了循证治理的三要素:证据、领导力和公共价值。文章以循证领域的主要研究方法——系统评价为分析对象,考察了循证医学和公共管理领域系统评价研究的方法论异同,呈现了Campbell数据库中一项公共管理领域系统评价研究,并讨论了其方法论启示。循证治理的未来研究问题包括中层理论构建、知识转化、方法论研究、本土化研究以及大数据与计算社会科学背景下的循证治理等。

关键词:循证医学;循证决策;循证治理;系统评价;公共价值

中图分类号:C3;R-3 文献标识码:A DOI:10.11968/tsyqb.1003-6938.2018040

From Evidence-based Policy-making to Evidence-based Governance:Theoretical Framework and Methodological Analysis

Abstract In recent years, evidence-based policy-making has raised a wave of changes on policy "effectiveness" globally. At the same time, the concepts and frameworks of evidence-based policy-making are being challenged more and more both in theory and practice. Based on the theory of governance and good governance, many scholars have explored the concepts related to "evidence-based governance" to fill the gap between the trend of "evidence-based" thought and the mainstream public management theory. This article illustrates the logic of change from evidence-based policy-making to evidence-based governance from the perspectives of production, evaluation, utilization and the value propositions of evidence, and puts forward three elements of evidence-based management, including evidence, leadership, and public value comparing with the three elements of evidence-based medicine. The article examines the methodological similarities and differences between systematic review research,the main research method in the evidence-based field, in evidence-based medicine and in the field of public management and presents a systematic review case in public management field in Campbell database, and discusses its methodological implications. The future research questions of evidence-based governance include the construction of middle-level theory, knowledge transformation, methodology, indigenous research and the evidence-based governance under the background of big data and social computing.

Key words evidence-based medicine;evidence-based policy making;evidence-based governance;systematic review;public value

1 引言

循證决策(Evidence-based Policy Making)和新韦伯主义、公民参与、公共价值管理等一同被视为后新公共管理时期的重要理论思潮,近年来受到学界的广泛关注[1]。从本质而言,循证决策回应了公共政策领域的一个根本问题:公共政策学者对政策的研究成果如何转化为有效的决策?这一问题是实践者追寻理性决策的必然考量,也构成了公共政策研究的根本合法性基础。从20世纪后期开始,循证决策的思想先后在英国、美国、澳大利亚、日本、加拿大等国扩散,我国的卫生政策、科技政策等领域也能窥见循证决策的端倪,各国政府在政策文本中不断强调使用最佳证据做出有效决策,学者也积极探索政策研究以及知识转化的种种议题[2-7]。循证决策正在全球范围内掀起一场政策“有效性”(What Works)变革的浪潮。

随着理论研究和政策实践的深入推进,循证决策面临的挑战也逐渐显现:一是,循证决策延续了新公共管理理论以效率、效益和结果为中心的价值取向,不可避免地再次陷入了管理主义和工具理性取向的狭隘性。公共决策从来不是一个价值中立的技术议题,仅仅关注干预有效性的循证决策无法平衡多元的、甚至冲突的价值诉求[8]。从这个意义上讲,循证决策无法应对当前全球公共行政实践中普遍存在的具有高度复杂性和高度价值冲突双重属性的棘手问题[9];二是,在对布莱尔政府的循证决策实践批判反思过程中,学者们质疑循证决策事实上仍是政府选择性的使用证据支持其政策取向的线性过程,即“基于政策的证据”而非“基于证据的政策”[4]。由于政策科学研究可能提供丰富的、甚至有时是相互矛盾的证据,公共决策者在选择证据时往往会根据自身决策意图选择性的筛选、解释、使用证据,循证决策追寻的客观真实性因此不可避免地受到政治主观性的影响和控制[10-11];三是,政治体制、价值观、文化等要素都会显著干扰证据的适用性,对证据的使用也存在种种可知的或不可知的偏误,如未遵循“最佳”决策证据导致的“技术偏误”和未遵循透明的决策程序并曲解社会价值的“议题偏误”[12-14]等。

循证决策面临的理论和实践挑战促使学界反思“循证”思潮在公共管理领域将何去何从。特别是循证决策因循的理论前提和方法论很大程度上仍是循证医学的简单移植嫁接。如何结合国家治国理政实践,融入前沿公共行政理论,深度整合“循证”思潮和“治理”思潮,克服工具理性弊病,并最终改良理论分析框架和方法论将是“循证”思想贡献于公共治理研究和实践的必经路径。为此,本文梳理了从循证决策到循证治理的转变逻辑,类比循证医学三要素提出了循证治理的三要素——证据、领导力、公共价值,比较分析了系统评价方法在医学和公共管理学应用的方法论异同,并展示了Campbell数据库中的一项公共管理领域系统评价研究,最后提出了循证治理的未来研究问题。

2 循证治理的转变逻辑和分析框架

2.1 从循证决策到循证治理的转变逻辑

许多学者曾质疑“循证”的模式是一个线性的证据生产、使用过程[15-17]。因为在此模式下,遵循证据的决策变成了嵌套在层级官僚制中的单一主体活动,证据使用究竟是否改善了决策质量?遵循证据决策的回应性如何?当证据无法满足决策需要时政府如何行动?这些问题都在质问:停留在管理主义和价值无涉追求的“循证决策”是否是“循证”思潮在公共部门的最佳实践形式?随着治理理论的兴起,许多学者开始思考“循证+治理”的模式是否能推动循证思潮在公共部门中应对挑战,焕发新的思想活力和实践启迪。如Parkhurst提出了“证据的善治”(Good Governance of Evidence)概念,从“善的证据”和“善的证据使用”两方面提出了证据适当性、证据质量、系统和严密的证据、证据的可消化性、知证过程的公民协商、证据使用的透明性、决策权威的公民代表性、顾问系统设计的公共授权等8个要素[14];Mele等人[18]也提出了“经由证据的治理”(Governing through Evidence),认为经由证据的治理应该涵盖三个步骤:选择或结合一系列证据基础、构建多元主体间新的关系安排、将决策标准或流程规范化。在新公共治理范式下,循證决策向循证治理的转变契合了网络构建与维护、价值多元主义等一系列治理理论的观点。从循证决策到循证治理的转变存在于证据生产、评价、使用、价值取向的各个环节,其逻辑包括:

(1)从证据的线性生产到合作生产。证据的生产并非价值无涉的,在循证决策模式中,证据生产是一个政府和相关机构间的“委托-代理”关系,相关机构生产的证据不可避免地会受政府价值取向的影响。循证治理背景下的证据处于多元主体的“合作生产”模式之下,政府、公民、企业、研究机构等多元利益相关者通过治理网络完成证据生产,实现价值的“合作创造”[19-20]。

(2)从证据评价到证据综合治理。循证决策对证据的评价沿用了循证医学中的“证据链”、质量评价量表等工具,是讲究管理主义和实用主义的方法体系。循证治理模式下的证据评价强调,证据的评价标准除了客观质量和科学性,还应该包括实践中的适当性和可用性,即考虑到证据使用的本土化情境和实践者的知识背景。

(3)从证据的偶然使用到系统议程设置。循证决策中的证据使用具有偶然性:一方面,并非所有推行循证决策的组织都设置了筛选、研究证据的公共机构,未经过研究的证据无法被决策部门充分理解(甚至无法被发现)[21];另一方面,实践部门的问题和热点研究主题不一定一一对应,各类关系和社会网络也会影响证据的使用[22]。循证治理中的证据使用是基于系统的议程设置的,实践部门通过构建议程与公民需求、研究专家进行充分对话,进而构建证据使用的制度化议程系统。

(4)从有效性到有价值。循证决策的价值取向是有效性(What Works),是公共政策的工具主义取向。循证治理则更偏向有价值(What values)的取向,强调证据生产、评价、使用全过程中的公民授权、价值协调和社会层面的公共价值创造。

2.2 循证治理的一个理论分析框架:动态三角模型

循证医学包含三个基本要素:即医学研究获得的不同层级的证据、临床医生自身具备的临床经验、患者的价值观及意愿,只有将三者充分平衡和结合在一起,才能形成最佳的治疗决策[23]。本文认为,循证治理的基本要素及要素间关系与循证医学具有类似的逻辑:循证治理的核心仍然是“证据”,包括但不限于公共政策研究提供的科学治理依据;临床医生自身具备的临床经验则对应公共管理者运用证据、应对情景变化的能力,即领导力;患者的价值观和意愿则对应公共服务的直接利益相关对象,即公民的价值观和意愿,反映大部分公民达成的价值共识——也即公共价值。循证治理的要素至少包括:政策研究及其他与议题相关研究形成的证据、公共部门的领导力、在社会公共领域中协调表达的公共价值(见图1)。

在循证治理的动态三角模型中,证据要素指政策效应研究、行为研究、成本收益分析等与公共部门决策相关的研究成果,根据证据可靠性高低可以将不同证据排列为“证据链”,证据链顶端为规范使用系统评价(Systematic Review或Systematic Literature Review)方法获取的现存研究最佳证据,包括定量研究形成的合并效应值或定性系统评价研究形成的统合理论;次一级证据为严密随机干预实验证实的效应值;再次一级证据为准实验、自然实验等因果推断研究推定的效应值;再次一级证据为小样本调查的相关性数据及专家的经验性判斷和观点等[24-25]。领导力要素在公共部门中对公共权力和公共资源进行统筹和协调,以提供高质量的公共产品和服务。在公共决策中,领导力是识别情境变化、积极推动决策形成和实施的要素,主要作用是应对变化并协同冲突。作为公民集体偏好的政治协调表达,公共价值要素是决策相关议题激发下,多元利益相关者表达自身利益诉求和价值偏好,在公共领域中充分讨论、沟通和整合,与政府建构价值双向互动后形成的重叠共识,反映作为整体的公民对公共决策的意愿期望和价值偏好[26]。

本文认为,循证治理的最终目的是使证据、领导力、公共价值三要素达成动态平衡,治理嵌套于这组动态关系之中,是动态平衡实现的结果,“善治”是循证治理的最终目的。领导力、证据和公共价值的动态平衡不仅反映了循证治理的有效性(What Works)向度,回应了“什么是有效的”这一问题,还反映了循证治理的价值向度(What Values),回应了“什么是有价值的”这一问题。对两两要素间双向关系的理解和治理构成了循证治理的基础。

(1)领导力和证据之间存在双向动态关系,即基于证据的领导力和对证据的领导。一方面,政策研究生产的证据可以为公共部门领导力提供策略依据和决策支撑,帮助公共管理者评估决策、管理风险并降低不确定性。证据使公共部门领导者更好、更有效地实现公共部门战略目标的逻辑不言而喻[27-28];另一方面,公共部门领导可以实现证据的“落地”。学者研究的问题出发点并不一定总是和实践需求一致,学界生产的证据并不总能够用于决策治理实践之中,即使存在充分的研究,科学研究的结果也不一定总能够达成共识。因此,有时政府也会根据实践需要使用自行研究或者资助研究项目等方式引导证据的生产。如2009年美国大选之后,奥巴马政府在全国大范围推行循证决策,促使国会通过了一系列新的社会服务项目,其中有六个大项目结合了循证评估的方法,包含近一千个子项目,共计花费近五十五亿美元;成立了“循证决策评议会”并积极推动检验政策效应因果关系的数据分析研究;英国则在政府内部设置了9个“有效性”(What Works)中心,推进在诸如保健、教育、老龄化、地方经济增长、早期干预和犯罪减少等领域内的干预措施的有效性证据和成本效益的系统评价的产生和传播[6,29]。

(2)公共价值和领导力之间同样构成双向动态关系,即基于公共价值的领导力和公共价值领导。一方面,将公共价值加诸领导力中,强调公共部门领导活动对“公共性”的价值回归,将公共价值创造而非管理效率作为公共领导的终极使命,可以提升公共领导应对全球公共行政实践中频发的棘手问题的能力;另一方面,领导力同样是公共价值实现的载体,作为社会建构的公共部门领导力在公共价值建构中发挥着不可替代的作用,在公共部门战略中充分动员公共资源和权力,降低价值冲突,预防公共价值失败,并促进公共价值共识形成[30]。

(3)对公共价值和证据的平衡也是循证治理中十分重要的一环。许多学者都曾经论证过,制度背景、文化、价值观等要素都会影响证据的产生过程,证据因此不可能是价值中立的,脱离价值探讨“有效性”(What Works)没有意义[12-13]。公共价值则可以弥补证据“价值中立”的失败尝试,在公共价值的促动下,证据的议题设置、生产、评估和使用都需要回应“价值”(What Values)的问题。特别是,公共价值的两个核心内涵包含“什么是公民认为有价值的”(What values to public)和“什么为公共领域增加了价值”(What add value to public sphere)[31]。从公共价值的视角反思证据的生产和使用,公共服务的相关证据并非仅仅是狭隘的“顾客”的价值偏好,这已经在后新公共管理时期受到了广泛的诟病,而是作为整体的公民在公共领域中充分讨论形成的集体偏好[32]。同时,证据也会促进公共价值的建构和重构。一方面,研究证据会通过各类科普活动和新闻报道渗透到更广义的社会公共领域之中,影响公民对某一问题的认知、偏好和投入注意力,进而推动公共价值的渐进或非渐进演化;另一方面,对价值观、政治情境、文化等议题的研究也构成了循证治理因循的“证据”。证据并非仅仅局限在可显示行为层面,更深层的价值偏好等问题的研究也同样为公共管理者提供管理启示。本质上,证据是“科学的共识”,公共价值是“权利、义务和规范的共识”,对证据和公共价值的平衡旨在寻求两个公共领域融合以实现更高层次的共识[33]。

3 循证治理的方法论

循证治理所因循的“证据”不同于数据或者信息,强调通过科学研究获取决策依据[34]。循证决策中开展科学研究的方法路径主要包括系统评价(Systematic Review)和随机对照试验(Randomised Controlled Trials,RCT)。这两种方法都来源于循证医学,其中随机对照试验尤其适用于某领域的全新决策问题,此时由于缺乏相关证据经验,决策者可能倾向资助研究者就某一问题展开试验研究,以控制政策的不确定性,但研究周期和成本的限制也使具有很强实用目的性的随机对照试验无法广泛推行[35]。同时,受研究伦理和政治规范的影响,对某些问题也无法开展随机对照试验,事实上目前只有少数社会政策研究领域会使用随机对照试验开展研究。系统评价方法则沿用了临床医学的一个基本假设:即现有研究中含有大量有价值、可转化的经验。系统评价方法就是如何在现有研究中挖掘有效的决策证据并进行准确全面的总结[36]。

从方法论而言,循证医学的研究路径和当前公共管理学沿用的管理统计学和计量经济学路径都有许多共通之处,但研究的术语规范和操作规范又相去甚远。如元分析或者荟萃分析(Meta-analysis,在循证医学的一些术语规范中常被直接称为“Meta分析”)本质上是统计学中一种效应值合并的方法,循证医学将Meta分析作为定量系统评价的主要数据分析方法,管理学中也常常使用元分析的方法评估多项研究中自变量和因变量的合并效应值,但是两者的文献纳入标准、编码流程、偏倚分析和结果的呈现形式都不尽相同。事实上,近年来公共管理主流期刊中都有“系统文献综述”(Systematic Literature Review)的提法,与循证医学中的“系统评价”也是类似的概念[21,37]。因此,循证治理的研究绝非“循证医学的方法”加“公共治理的问题”,循证治理的研究亟待从方法论上正本清源,探究循证医学和公共治理方法论深度整合的可能。本文通过呈现循证医学方法论的基本逻辑,探讨公共管理研究和循证医学方法论间的“断桥”,并浅析可能的整合方向。

循证医学的核心方法——系统评价是按照一定的纳入标准,广泛收集关于某一方面问题的所有相关研究,对纳入研究进行严格地偏倚分析和证据质量评估,将各研究结果进行定量合并分析或定性客观评价,以对该问题进行系统总结的一种证据综合研究法[38]。无论是定量系统评价还是定性系统评价,都包含9个步骤:选题、文献检索、文献筛选、纳入研究偏倚风险评价、信息提取、数据分析、异质性分析、发表偏倚①、研究报告。

从选题而言,循证医学的选题强调研究“干预有效性”的证据,由于在医学领域的循证研究常指向药物、措施等的有效性,选题一般概念化程度较低,偏向于实践者可以直接理解的问题,同时强调选题的重要性、科学性、创新性和可行性。然而,公共管理领域的许多主流研究选题都是概念化程度较高的术语或者高维概念,这些选题可能无法为决策实践部门直接理解。从文献检索而言,循证医学的系统评价要求无论学科、无论来源地获取当前所能获得的所有相关信息,一项严格的循证医学系统评价包括几十个综合数据库、专题数据库、国家或地区数据库,也包括会议论文、学位论文等灰色文献和纸质文献、在研研究等。而公共管理学科的二次文献研究则常常“带着公共行政的眼罩”,注重文献检索的准确性而非敏感性[39]。从文献筛选而言,循证医学的研究遵循严格的纳入排除标准筛选文献,包括定量的PICOS标准和定性的SPIDER标准。以定量系统评价的PICOS标准为例,该标准包括研究对象或问题(Population/Problem,P)、干预措施(Intervention,I)、对照措施(Comparison,C)、结局指标(Outcome,O)、研究类型(Study Design,S),这些术语大多来自医学的随机干预实验,并不常被公共管理研究使用,但在以调查研究和二手数据研究为主流的公共管理定量實证研究中也存在相似的概念——被试、自变量、控制变量、因变量等,相应的如何制定适用于循证治理研究文献筛选的纳入排除标准也无法简单类比。从纳入研究偏倚风险评价而言,循证医学的研究偏倚风险评价主要包括方法学偏倚和报告偏倚,管理学元分析的研究偏倚风险评价则常常只报告可能引起选择性偏误的发表偏倚,两者的偏倚来源逻辑相当不同:前者认为具体研究采用的方法与理想状态下最佳方法之间存在差距,研究者在进行报告时也会存在模糊或隐瞒;后者则将元分析当作一种样本合并的方法,倾向于评价样本的选择性偏误和由此引起的内生性问题。此外,循证医学评估偏倚时强调使用科学工具——测量量表以降低评价主观性,如针对随机对照试验的Cochrane ROB量表、针对非随机试验的ROBINS-Ⅰ量表以及针对质性研究的CASP清单等[40]。从信息提取而言,循证医学使用的信息提取方法类似于公共管理研究中的“结构化编码”,多采用两个研究者双盲编码的方法保证研究信度,公共管理学的研究则较少报告该步骤。从数据分析而言,循证医学中定量分析的Meta分析的数据处理原理和方法与管理学基本一致,但报告习惯不同;质性分析使用的主题综合法、Meta-民族志、批判解释综合(Critical Interpretive Synthesis,CIS)等方法较少出现在管理学研究中,公共管理学的质性综述获取统和理论大多是基于思辨的、建构主义或者解释主义的方法论开展的。从异质性分析而言,循证医学和公共管理学的异质性分析思路基本相同,都是基于“所有样本都来自于同一个总体”的假设,使用随机效应模型或固定效应模型做卡方检验,判断不同研究间的异质性是否可以接受。从研究报告而言,循证医学研究通常会在选题完成后在一些循证医学协会上注册并提交题目注册表和研究方案,防止重复研究和减少偏倚;完成研究后进行报告时倾向于遵循发表平台的特殊规范和纲要(如符合Cochrane协作网规范的系统研究被称为“Cochrane系统评价”)。公共管理学的系统文献综述则随意性更强,元分析的研究还常常需要从现存理论出发提出研究假设并对结果进行假设检验。报告规范的区别一定程度上映射了实证主义和后实证主义的方法论差异。

在循证治理的新理论模式下,方法论的发展是开展循证研究的主要制约因素。综上可知,循证治理的方法论不是全盘照搬循证医学的方法论,更不是维持公共管理学现行的文献研究方法论并冠以“循证”之名,而是从两种方法论的哲学基础和统计学基础出发,在循证治理理论下弥合术语和规范差异,需要大量系统评价研究和方法论研究推动的演化融合过程。

4 公共管理领域系统评价研究实例

2000年2月在宾夕法尼亚大学成立的Campbell协作网是将循证医学方法论向社会治理和公共政策领域扩散整合的有益尝试。Campbell 协作网是一个针对社会项目、社会政策和社会实践有效性的研究证据,旨在编制和传播高质量系统评价的国际支持网络[41]。Campbell协作网数据库中发表的系统评价研究涵盖司法犯罪、残疾、教育、国际发展、知识转化和实施、营养、方法和社会福利等8个与公共政策和公共治理相关的领域,为循证治理方法论的发展奠定了基础。本文将展示Campbell数据库中发表的一项针对公共管理领域研究问题的系统评价,为研究者和实践者提供系统评价研究方法论借鉴的同时,启发更多对方法论异同的反思。

该实例是Kluve等人2017年发表于Campbell数据库的一项对青年劳动力市场干预政策的系统评价研究[42]。该研究一定程度将规范的、标准化的系统评价流程和公共管理研究实际进行了有机融合,也映射了循证治理方法论有待改进的方面。

4.1 研究背景

青年代表着包容性增长和发展的巨大潜力。青年如果有机会进行适当的技能培养并获得就业,一方面可以帮助各国加快“2030年可持续发展议程”的进展,另一方面也有利于他们自身从事对自己、家庭和整个社会有意义的工作。不幸的是,并不是所有的青年男女都能拥有体面的工作。今天的劳动力市场对年轻人来说是一个充满挑战的舞台,全世界有超过七千三百万的年轻人失业,青年失业率远高于成年人的平均失业率,有些甚至超过三倍,越来越多的青年正面临着就业困难的形势。青年在劳动力市场上的悲观现状意味着青年潜力的大量浪费,同时也是对社会凝聚力的巨大威胁。故而,探究什么措施可以帮助青年就业并且有助于改善青年劳动力市场结果,这对所有国家和地区来说都至关重要,同时也是当前政策制定者提出的最常见和最迫切的问题之一。

各国政策决策者正在寻求应对青年就业挑战的路径,力求找到最有效的方法和实践指南,以改善青年人的劳动力市场状况。如创业促进、技能培训、就业服务、补贴就业等被认为是改善青年劳动力市场结果的共同措施,这些措施属于“积极的劳动力市场计划”(Active labor Market Programs),旨在增加青年寻找有收益的就业机会或提高其收入能力。2012年,在国际劳工大会期间,各国政府和社会组织认识到需要对“积极的劳动力市场计划”的有效性进行更严格的评估,要求国际劳工组织加强有关“积极的劳动力市场计划”的证据基础。为了促进支持青年就业更多、更好的方案和政策证据的产生,该系统评价调查了“积极的劳动力市场计划”对青年劳动力市场结果的影响。

4.2 研究目的

探讨“积极的劳动力市场计划”对青年劳动力市场结果的影响。着重调查创业促进、技能培训、就业服务和补贴就业四项措施对青年就业、青年收入、企业绩效的影响。通过研究分析,该系统评价主要回答了以下两个问题:

(1)“积极的劳动力市场计划”对青年劳动力市场结果的影响是什么?创业促进、技能培训、就业服务和补贴就业等干预措施的影响结果如何?

(2)这些干预措施中哪一项最为有效?

4.3 检索方法

干预措施以“retraining/training/skill/skills/entre-

preneur*/program*/intervention/measur*/scheme/project/

activation/subsidy/subsidies/subsidized/subsidized/upgr-

ade/assistance/internship/intern/interns/business/couns-

eling/counselling/mentor*/advisory/coaching/placement/insertion”為检索词,结果指标以“Unemployment/unemployed/employed/employment/participation/labor/labour/earning*/job*/wage*/income*/salar*/profit/reven-

ue/work”为检索词,研究对象以“youth*/young/adolesc-

ent*/schoolleaver*/school leaver*/high school gradua-

te*”为检索词,影响指标以“evaluación/évaluation/evaluat*/assess*/analy*/estimat*Impact/effect/evaluat-

ion/random”为检索词,系统检索了包括ASSIA、RePEc、SSRN、SSCI、AHCI、RIDIE、RIEPS、J-PAL、ELDIS等70多个数据库和网站在内的所有相关文献,检索过程于2015年1月完成。

4.4 纳入标准

此处采用“PICOS”原则建立纳入排除标准。P(Population/Problem):研究对象为“积极的劳动力市场计划”对象:15-35岁年轻男女;I(Intervention/Exposure):干预措施包括下列“积极的劳动力市场计划”:创业促进、技能培训、就业服务和补贴就业;C(Comparison/Control):对照措施为没有受到任何干预措施影响的空白组;O(Outcome):符合条件的研究至少测量了下列主要结局指标的其中一个——青年就业、青年收入和企业绩效;S(study design):研究类型主要为实验研究和准实验研究,也包括随机对照实验(RCT)。

4.5 纳入文献质量评价

该系统评价采用Duvendack等人所设计的评估框架,对纳入文献进行质量评价[43]。纳入的113篇文献覆盖了31个国家的107项干预措施,其中包括15项创业促进措施、55项技能培训措施、10项就业服务措施和21项补贴性就业措施,还有6项措施干预类别不明确。分析表明,纳入的文献大多采用科学的研究设计,其中,有48%的文献提供了高质量的证据,42%的文献提供了中高等质量证据,只有10%的文献所提供的证据质量不高。

4.6 数据收集与分析

评价小组使用编码手册和编码工具提取纳入文献的相关信息,当第一个评价员将满足标准的文献纳入后,他们的选择将由第二位评价员进行验证。如果依旧存在争议,两位评价员将与第三者进一步讨论论证,最终决定文献是否纳入。该系统评价运用Stata统计软件对数据进行分析,包括描述性统计分析、单变量随机效应荟萃分析、调节分析、敏感性分析和发表偏倚分析等。

4.7 Meta分析结果

(1)总的来讲,青年就业干预措施对青年就业有正向影响且具有统计学意义,在105项干预措施中总效应值为0.04SMD(95%CI= 0.03,0.06),表明受干预措施影响的青年就业效果比未受到影响的控制组更好。进一步的干预类别的亚组分析表明,创业促进、技能培训改善了就业结果,而就业服务和补贴就业对青年就业的影响很小且无统计学意义。

(2)总的来讲,青年就业干预措施对青年收入有正向影响且具有统计学意义,在92项干预措施中总效应值为0.05 SMD(95%CI=0.03,0.06)。进一步的干预类别的亚组分析表明,创业促进和技能培训有利于提高青年的收入,而就业服务和补贴就业对青年收入的影响极小且无统计学意义。

(3)青年就业干预措施对企业绩效影响的证据有限,在14项干预措施中总效应值无统计学意(SMD=0.03;95%CI=-0.05,0.12;I2= 49%)①。当单独考虑创业促进干预措施时,其对企业绩效的影响更大且显著。

(4)结果表明,青年就业干预措施对中低收入国家的影响程度大于高收入国家。在中低收入国家,创业促进、技能培训和补贴就业有效地增加了青年就业就会,创业促进和技能培训对青年的收入增长也发挥了正向作用。在高收入国家,青年就业干预措施对青年就业和收入的影响很小,在干预类型的亚组分析中,结果表明只有技能培训对青年就业产生了很小的影响。

(5)在性别差异上,研究结果表明受干预措施影响的女性就业和收入情况略优于男性。

4.8 研究结论

该系统评价确认了“积极的劳动力市场计划”能够改善参与青年的就业和收入状况,但效果较小。其中,创业促进和技能培训对青年就业和收入有显著影响,就业服务和补贴就业并没有显著影响。从而为各国政策决策者改善青年劳动力市场结果提供了有效的、科学的、系统的、高质量的证据,进一步确定了各组织支持青年在劳动力市场上取得成功的关键因素。同时,强调了未来的研究有必要对相关措施进行更详细、更全面、更规范的分析。

4.9 方法论启示

该实例研究了劳动政策领域的重要问题——如何有效促进青年就业。作者遵循严格的系统评价步骤开展研究,同时一定程度上也兼顾了公共管理问题的特殊性:如在制定纳入排除标准时,将青年就业、青年收入、企业绩效等兼顾个体效应和组织效应的指標设置为结果指标,将非随机实验和准实验研究作为主要纳入研究类型,而非循证医学研究常常选择的随机干预试验。同时,这项研究也是在假定就业干预措施与就业、收入、企业绩效存在关联的基础上开展的,将理论和系统评价进行了有效整合。但该实例并未讨论系统评价价值取向的问题,此外,由于公共管理研究中实验研究比例较低,一些设置(如PICOS标准中的控制要素)也并不利于系统评价研究的操作。

5 循证治理的未来研究问题

循证治理框架提供了一种平衡研究证据、实践者领导力和公共价值的治理框架,突破了循证决策的工具理性局限,重新诠释了证据在公共行政理论和实践中的意义与价值。本文也阐释了为何循证治理研究无法照搬循证医学的方法论,并通过研究实例展示了公共管理领域循证研究的流程规范,以期启发更多更深入的方法论反思。作为一项探索性研究,本文不可避免地具有一定局限性,循证治理的理论框架和方法发展需要大量的未来研究建构完善。本文尝试提出一些未来可能的研究问题,以抛砖引玉:

(1)循证治理的中层理论构建问题。作为一个宏观理论,循证治理的落地需要一系列中层理论以剖析更深层的机理,如循证治理中的价值冲突、社会网络与循证治理的关系、证据使用和领导力类型的匹配等问题。

(2)循证治理研究的知识转化问题。“循证”思潮对公共治理最大的启示是弥合实践和研究的断桥,如何将循证治理研究成果转化为可以被实践部门理解的知识是这一背景下的核心问题。为此,需要系统研究知识转化中的制度设计、动力机制、研究机构和实践部门关系等问题。

(3)循证治理研究的方法论问题。如前文所述,循证治理的方法论尚需大量研究完善,尤其是在系统评价研究中,如何将价值取向嵌入评价过程之中,如何构建基于公共管理研究实践的纳入排除标准、质量评价量表,更复杂的前沿数据合并方法如网状Meta分析、系统评价再评价等如何迁移使用,都有待进一步研究。

(4)本土情境下的循证治理研究问题。我国政府文件中虽然很少有“证据”或者“循证”的提法,但智库建设和决策科学性也是当前我国行政实践中的重要问题。在我国本土化情境下,可以通过案例研究、政策文本分析研究循证治理的思想发展,或是通过规范研究建构具有本土解释力的应然理论。

(5)大数据与计算社会科学背景下的循证治理。随着大数据和计算社会科学的兴起,循证治理的研究实践也面临新的机遇,未来研究中可以探索运用机器学习模型探索系统评价的简化步骤和自动化编码,也可以探索循证治理实践与智慧政府建设的有机结合。

参考文献:

[1] Overeem P,Twholen B. After Managerialism:Macintyres Lessons for the Study of Public Administration[J].Administration & Society,2011,43(7):722-748.

[2] Weiss C,Petrosino M,Gandhi A.The Fairy Godmother—and Her Warts Making the Dream of Evidence-Based Policy Come True[J].American Journal of Evaluation,2008,29(1):29-47.

[3] 马小亮,樊春良.基于证据的政策:思想起源、发展和启示[J].科学学研究,2015,33(3):353-362.

[4] 周志忍,李乐.循证决策:国际实践、理论渊源与学术定位[J].中国行政管理,2013(12):23-27,43.

[5] Rudd K.Address to Heads of Agencies and Members of the Senior Executive Service[N].Great Hall,Parliament House,Canberra,2008-04-30.

[6] Ron H,Margolis G.Show Me the Evidence:Obama's Fight for Rigor and Results in Social Policy[M].Brookings Institution Press,2014.

[7] Tian Z,Shi J,Hafsi T,et al.How to Get Evidence?The Role of Government business Interaction in Evidence-based Policy-making for the Development of Internet of Things Industry in China[J].Policy Studies,2017,38(1):1-20.

[8] 道格拉斯·摩根.衡量政府绩效的信任范式和效率范式——对地方政府领导和决策的启示[J].公共管理学报,2013(2):117-125,143.

[9] Bao G,Wang X,Larsen G,et al.Beyond New Public Governance:A Value-Based Global Framework for Performance Management,Governance and Leadership[J].Administration and Society,2013,45(4):443-467.

[10] Sarewitz D.Frontiers of illusion:Science,Technology and the Politics of Progress[M].Philadelphia,PA:Temple Univ Press,1996.

[11] Head B W.Three Lenses of Evidence-based Policy[J].The Australian Journal of Public Administration,2008,67(1):1-11.

[12] Dobrow Mark J,Vivek Goel,Ross E.Evidence-based Health Policy:Context and Utilization[J].Social Science & Medicine,2004,58(1):207-217.

[13] Goldenberg Maya J.On Evidence and Evidence-based Medicine:Lessons from the Philosophy of Science[J].Social Science & Medicine,2011,65(12):2621-2632.

[14] Parkhurst J.The Politics of Evidence:From Evidence-Based Policy to the Good Governance of Evidence[M].New York:Routledge press,2016.

[15] Guston David.Principal-agent Theory and the Structure of Science Policy,Revisited:‘Science in Policy and the US Report on Carcinogens[J].Science & Public Policy,1996,30(5):347-357.

[16] Vifell ?魡sa C,Ebba Sj?觟gren.More Knowledge,Better Government?Consequences of knowledge-based Decision Making in Swedish Pharmaceutical Benefits[J].Governance,2011,24(1):85-110.

[17] Jasanoff Sheila.The fifth branch:Science Advisers and Policymakers[M].Cambridge,MA:Harvard Univ.Press,1990.

[18] Mele V,Compagni A,Cavazza M.Governing through Evidence:A Study of Technological Innovation in Health Care[J].Journal of Public Administration Research & Theory,2014,24(4):843-877.

[19] Osborne S P.From Public Service-dominant Logic to Public Service Logic:Are Public Service Organizations Capable of Co-production and Value Co-creation?[J].Public Management Review,2018,20(3):1-7.

[20] 包國宪,王学军.以公共价值为基础的政府绩效治理——源起、架构与研究问题[J].公共管理学报,2012,9(2):89-97.

猜你喜欢

循证医学系统评价
中药注射剂治疗冠心病的系统评价再评价
医学院校开展药理学循证医学
高压氧治疗血管性痴呆随机对照试验的Meta分析
细辛脑注射液治疗慢性阻塞性肺疾病急性加重期疗效的Meta分析
丹红注射液治疗特发性肺纤维化临床疗效及安全性的Meta分析
循证医学在医学教育中的实践
大疱性类天疱疮合并脑血管病的循证护理体会
银杏叶注射液治疗急性脑梗死随机对照试验的系统评价