社会政策评估的哲学基础、实践形式与交互影响因素

2020-10-23李海荣王琳

重庆社会科学 2020年6期

李海荣王琳

摘要：随着社会政策学科的蓬勃发展，作为衡量社会政策实践效果的政策评估愈益受到重视，并成为政策科学的主要研究议题之一。而这之中，不同的哲学取向是社会政策产生多种评估形式的基本原因。日渐多元的评估实践不仅丰富了社会政策的评估类型，而且以“倒逼”方式提升了政策的执行效力。复杂的政策环境、宏观政治结构等因素会影响社会政策的评估结果，但这一交互融合过程也会促使政策参与者开展政策学习与政策合作，最终推动政策的落实和政策科学的发展。

关键词：哲学基础;实践形式;政策科学

基金项目：国家社会科学基金项目“我国老年人非正式长期照护多主体合作发展路径研究”（18BSH170）;青岛市社会科学规划研究项目“公共权力的失范风险与治理路径研究”（QDSKL1901305）。

[中图分类号] C934 [文章编号] 1673-0186（2020）006-0110-013

[文献标识码] A [DOI编码] 10.19631/j.cnki.css.2020.006.009

在各类风险不断凸显的当代社会，世界各国相继把社会建设作为现代化的一个基本内容予以推进执行，与之紧密相连的社会政策亦随之增多，可以说“政策型治理”已经成为提升国家治理能力的一个重要方式。但就政策实践而言，其也存在一定问题，各国的政策实践多偏重于政策制定而轻视政策评估，进而导致政策的执行效力难以达到预期。伴随新公共管理理念的兴起，如何以更有效的方式对社会政策开展评估，成为今后社会政策整体实施过程的一个关键环节。

与西方国家相比，中国现今的社会政策实践模式也有较大程度进步，主要表现有：一是从之前的应急性政策向常态化政策转变，这使得政策覆盖的目标对象得以扩展;二是从之前的单一性政策向综合性政策转变，这使得社会政策的受益范畴得以拓宽;三是从之前的整体性政策向专业化政策转变，这使得社会政策的受益群体得以精准对接。就总体而论，当代中国已经建立起了一个初具规模的社会政策体系。但也面临一个重要挑战，就是以何种方式实现对政策的有效评估。

一、社会政策评估的哲学基础

社會政策作为一种人为的社会干预“实验”，其介入都是基于一定的理论假设，即政策可以产生何种效果以及哪种因果机制可以“制造”预期的社会变革[1]。因此，建立稳固的因果关系成为社会政策评估中的一个难点[2]，分析政策理论在多大程度上得到科学证据的支持便成为社会政策评估的基本内容，考察政策评估背后的哲学基础也就成为综合衡量社会政策成效的关键步骤。

历史地看，社会政策评估的哲学基础经历了一个转变过程，表现为评估主体由一元向多元转变、评估方法由实证量化向混合评估转变。而影响社会政策评估范式转换的主要原因在于制定、实施和评价政策所依据的哲学基础发生了改变。其间争论的核心问题基本是围绕社会政策评估的哲学基础展开，具体争论的焦点可以归结为几组概念。

（一）社会政策评估的概念之争

1.经济效益与社会效益

作为衡量社会政策在多大程度上实现了既定目标，效益一直是社会政策评估的基础概念，但使用经济效益还是社会效益则是政策评估哲学中一个平衡的难点。

西方国家广泛制定社会政策，与第二次世界大战后各国推行积极福利计划紧密相关;但其最初目的仍是将社会政策作为经济政策的补充，可以说此阶段的社会政策是一种带有很大应急色彩的“反应性福利计划”，对社会政策的评估主要取决于资金来源及其所依赖的政治经济结构。在这种政策条件下，社会政策评估的首要目标是衡量政策所产生的短期经济效益，其长期效益及其所衍生的社会效益往往不受重视。在经济效益评价框架下，社会政策评估基本可以被抽象为一种“成本—收益”分析，政策执行成本、资源使用效率、经济指标达成等成为政策评估的主要维度。

与之形成鲜明对比的事实是，秉持用“社会效益”对政策进行评估的理念在20世纪70年代出现。它兴起的原因可以概括为三个：其一，对社会政策的投入尽管在一定程度上缓和了“劳资矛盾”，为西方各国经济的持续发展提供了保护，但却没有在实质上降低经济的不平等程度;西方国家通过福利购买所获得的合法性与资本主义再生产之间的矛盾日趋激烈，这迫使各界重新反思经济增长的价值与局限，也倒逼了社会政策评估哲学的转向。其二，之前注重经济效益的社会政策评估范式，往往以短期的经济绩效来衡量社会政策的成效，长期效益由于不好测量等原因被忽视，导致社会政策的资金投入不足、连续性较差，政策的整体效益不显著。其三，伴随现代化进程的深入，民众的权利意识逐渐觉醒，一定程度上改变了社会政策的目标取向，使政策的各方认识到，“不应只视社会政策是为特殊人群而定，而应将社会政策视为是一个维护个人权利的政策谱系”[3]，社会效益逐渐代替经济效益并成为社会政策评估的基本目标。

2.事实判断与价值判断

社会政策评估的哲学取向还受到事实判断与价值判断的双重约束。政治哲学、现象学和行为主义等众多学术流派，在整个20世纪围绕事实和价值之间的关系进行了激烈辩论。作为社会科学发展历程中长期存在的一个焦点议题，事实和价值这一对共生性学术词汇，催生出了不同的政策评估范式。

一般而言，理性主义者主张严格的事实与价值分离，并致力于生产非政治性的知识[4]。在这一理念下，政策评估植根于实证主义，借用自然科学等学科中的概念和方法，提供关于社会结构和社会发展的事实数据。这种政策分析要求对程序或项目的公正性判断必须以可靠的经验数据为基础，政策分析人员的任务是产出不受心理、文化和语言环境影响的信息。由于这类信息超越了历史和文化经验，因此在政治和道德层面具有一定的中立性。按照这种评估逻辑，合理的方法可以产生有关预期和实施政策绩效之间差异的相关信息，因此可以用来优化政策。这种以不偏不倚的方式提供有关政策的最准确的信息，要求政策评估方能根据有效、可靠的经验信息，对政策方案的改进进行持续评估[5]，有助于在政策过程中实现理性决策。

但事实证明，在现实世界中遵循实证社会科学研究方法的要求比预期要困难得多。结果往往难以量化政策目标，尤其是在这些目标没有明确规定的情况下。理性主义方法的批评者认为关于社会和政治现象的政策干预是一项具有特定价值和规范的活动，而实证主义世界观及其方法则从根本上扭曲了事实与价值的分离。后实证主义者以及社会建构主义者将社会理解为一个有组织的意义世界，而不仅仅是一组要测量的物理实体。从这个逻辑出发，“事实”取决于一系列基本假设，这些假设赋予了生活世界以意义。但这些假设同时受到政治和权力的影响，基于这些假定的经验假设“倾向于具体化一个特定的现实”[6]。

3.定量方法与定性方法

社会政策评估在技术方法层面也出现了分化，定量和定性方法的差异性使用就是一个主要表征。定量方法一般被称为“实证的、假设的、演绎的、特殊的、客观的、面向结果的和自然科学的世界观”，而定性的方法则被称为“现象学、归纳、整体、主观、过程导向和社会人类学的世界观”。

20世纪50、60年代的社会政策评估，认为能够提供最佳决策的政策成果要采取非政治性、定量的评估，定量方法能够为政策实践提供坚实的、基础性的理想知识。这种技术方法否认了政策实践是“一种价值、信仰、政党执政和意识形态的活动”[7]，定量研究成为政策评估的主导技术方法。依靠定量研究，可以建立起科学研究和政策实践之间的因果联系，进而使“政策制定者寻求以一种非政治化、科学化的方式‘理性地管理经济和社会事务，从而使社会政策或多或少成为了社会技术学的一种实践”[8]。

继定量方法之后，定性方法在20世纪70年代开始迅速发展。与定量方法的理论假设不同，定性方法直接处理的是价值问题。正如一些理性主义的评价者所言，政策评估本质上是对一项政策或方案的价值的判断，因此政策评估有可能会超越经验科学的范畴;或者说，政策评估是在涉及多个行为者偏好的背景下进行的，而现有的基于定量方法所建构的因果模型没有能力处理这些问题。在定量方法不断受到批评后，定性方法愈益受到政策评估者的重视。与定量方法侧重政策结果的测量不同，定性方法能够描述和分析政策过程。因此评估研究人员认为，单靠定量方法是不够的，新的、混合的研究方法可以而且应该被广泛应用到社会政策评估之中。这改变了定量方法主导评估研究的局面，其他各种方法逐渐成为定量方法合理的替代品和补充，进而使评估研究从方法论的极权主义走向了多元化。

4.过程主义与结果主义

影响社会政策评估的第四对概念，主要涉及评估的内容层面，可以简单地概括为过程主义和结果主义。过程主义侧重政策过程评估，又被称之为形成性评估，以确定政策执行部门是否遵守了准则、政策执行是否得到适当管理或合同条款是否得到遵守，当然执行本身也是重要的结果。形成性评估发生在一个政策或项目刚开始之时，需要对政策过程是否有效做初步判断。可以说形成性评估不是处理“问题”，它不侧重于政策结果，而是判断政策过程是否有效。而结果主义侧重政策结果评估，也被称之为总结性评估。这种评估是对整个政策或政策执行结果的评价，政策的影响是评估的重点。大多数的政策都可以按一系列的類别，如目标、方法、实施和结果来处理。总结性评估可以对这些类别中的每一个进行审查，以查看政策的操作是否与政策目标一致。政策的影响通常是通过询问政策是否已经完成它所规定的目标来确定。但总结性评估也可能会考虑意想不到的政策结果。

形成性评估与总结性评估的区别是技术性的，涉及到评估的不同阶段。总结性评估侧重于政策结果，而形成性评估更倾向于将政策视为一项渐进的互动工作的一部分。而今的理性决策模式，评估回到了政策的形成和发展，所以从这个意义上说，几乎所有的评估都是形成性的[9]。

（二）社会政策评估的哲学范式

分析影响社会政策评估的概念可以发现，社会福利和社会政策中常见的、专业的概念与传统目标正在被解构，这对政策的执行和评估都带来了新的挑战。如果不仔细审查不同社会成员对日常概念的意义理解，必定会造成政策实践和政策评估之间的差距[10]。具体到科学研究和评估研究来看，评估研究和社会科学研究更多地是以概念性而非工具性的方式进行，以非系统和分散的形式接触决策者，进而“渗透”到政策领域，影响政策思考并为决策者提供服务[11]。基于对上述几组概念框架的分析，社会政策评估大致可以归纳为以下几种范式。

1.实证主义哲学范式

就社会政策评估的历史演进来看，实证主义评估范式尽管受到了批判，但仍然是政策评估的基本方式。实证主义哲学范式包含的理论要素主要有：其一，基于事实判断的因果假定。实证主义哲学范式的基本逻辑，主要是构建政策实践和政策结果之间的线性因果关系。在社会政策应对复杂经济和社会问题的背景下，要实现精确的和明确的因果归因几乎是不可能的，因此实证主义评估方法不得不接受因果推断的适度标准，以保持知识的“稳健性”来抵消因果推论的不确定性。其二，基于实验逻辑的假设检验。实证主义评估哲学的一个基本立足点，是认为社会政策本质上是一种人为的干预实验，它假设政策干预能够按照预期的最有效假定达到既定的政策效果。在这个实验框架下，“政策被视为是一种假设，是关于手段如何导致预期目标的假设”[12]，而假设的结果可以通过实施该程序来进行实证检验，这个过程类似于经典的科学实验的“假设—干预—效果”逻辑[13]。其三，基于计算科学的技术支撑。社会政策和政策评估间的关系是复杂的，二者容易产生一定的紧张关系。这在很大程度上是由于社会政策的价值负载和研究的客观性之间的张力导致的。为了分析政策目的，政策工作者倾向于分析政策产品、过程和绩效。这种以经验为导向的技术手段，旨在实现预先设定的目标;而政策科学家作为社会工程师，其主要工作是计算实现政治机构确定的目标手段的成本和收益。因此，实证主义评估哲学的一个技术支撑便是计算科学的发展。

2.社会建构主义哲学范式

与实证主义哲学范式立足于事实判断的分析不同，社会建构主义哲学范式侧重价值判断，它对政策结果的测量持一种相对主义的观点，认为“社会现象的知识来自于相互竞争的框架之间的讨论”[14]，因此建构主义哲学在认识论中制造了一种强烈的不确定性以及思维和意义的偶然性，这与传统的基于事实的决策观念有很大不同。

此外，与实证主义哲学假定研究者是理性人、持中立态度不同，社会建构主义哲学更强调人的主观性以及环境的影响，认为“我们对世界的理解是通过特定的思想和语言在特定的社会和政治环境中解释的。我们发现自己身处一个社会理论和分析不再能够以任何可信度为政治实践和道德决策提供保证的世界”[15]。换言之，在社会建构主义哲学看来，“社会世界的知识是建构的、文化的和历史的”[16]。从这一点出发，社会建构主义认为科学知识并不具有独立的客观性，这就使得知识的概念及其在政策制定中的作用变得更加复杂。就建构主义角度而言，政策发展是一种在解释和评估世界的多种框架条件下权衡信念、原则和行动的审议过程。政策学习涉及到对政策目标和假设提出质疑的认知模式或框架的社会条件、讨论和辩论过程。而以事实为基础的政策制定方式则是一个可以考虑的备选方案。

3.批判主义哲学范式

批判主义哲学范式主要受马克思主义及法兰克福学派的影响。经典马克思主义者对资本主义国家的福利建设及其相应的社会政策实践，起到了一个“倒逼”作用。以马克思主义观点来看，西方资本主义国家所施行的社会福利政策，其实是以一种福利购买方式降低无产阶级反抗的权宜之计，尽管能在一定程度上缓解资产阶级和无产阶级的冲突，但无法从根本上解决资本主义生产所固有的内在矛盾。继之而起的新马克思主义者，在继承传统马克思主义理论下，则倾向于分析现代资本主义国家的分配、压制或意识形态结构中进行的基本的统治结构的改变;而在具体规定上，新马克思主义者强调工业的民族化或资本的集体控制。他们认为扩大与改革社会政策是无关紧要的，因为这只不过是“资本主义霸权”的另类手段;为了解决矛盾，新马克思主义者所提供的策略是权力的下放及工人的参与[17]。

总体来看，批判主义哲学范式有几个特征：一是重视主客体的双向分析，这有别于以往其他范式的单一化分析取向，有助于从政策实施主体和客体的双重角度来评估政策的最终效果。二是重视结构性和历史性分析，有助于从宏观角度来开展政策研究，将政策实施的长期效应纳入了评估范畴。三是重视社会弱势群体利益，多以社会弱势群体的利益受损为出发点展开批判，重视工人、贫困等人群的利益及社会参与，这为此后混合评估、多元评估及政策的社会公正分析做了铺垫和开拓工作。

二、社会政策评估的基本类型

由于对社会政策评估基本概念的理解不同，进而形成了不同的社会政策评估哲学范式。而在不同的哲学框架下，社会政策评估又发展出不同的实践类型。

（一）政策成效评估

政策评估的核心问题是政策能否提供它应该交付的内容。最简单的有效性测量是通过考虑政策行动所做的工作指标，并将这些指标与目标指标进行比较。现有数据通常按投入、产出和结果分类，而决定一项政策是否有效，理论上应主要以成果而不是投入或產出为基础。但在实践中很难明确区分投入、产出和结果，因此评估方式在不同测量指标之间来回变动是相当常见的。

（二）业绩绩效评估

业绩计量是评估的一项例行活动，它使用成本较低且容易操作的措施来监测一个政策是否交付完成。绩效指标用于衡量政策或项目的进展情况。基准是一种标准，用于对照理想标准检查机构的业绩。这些主题相互重叠，因为采用业绩指标时通常考虑到某种标准，而且基准通常以业绩指标、实现目标的方式表示。

虽然基准可能与政策进程的任一部分，如投入、过程、产出或结果有关，但它们更多地被用来测量过程和产出，而不是结果。使用它们来获得结果的问题是，结果可能取决于一系列外部因素;当问题在基准机构控制范围内时，它们可以在影响方面有更多的表现。然而，使用基于结果的措施，试图通过判定结果来向评估机构进行支付的问题是，这为评估系统创造了奖励规则，进而可以操纵评估活动来满足指标的要求，因此也不是最佳做法。

（三）证据为本的评估

证据为本的政策评估在过去的二三十年间呈快速发展态势。尽管基于证据政策制定的背后理性主义假设，受到了社会建构主义和后现代主义的严峻挑战，但对政策评估者而言，在判定“什么有效”的知识基础上制定政策仍然具有现实意义[16]。其原因一方面与“福利国家”的福利支出过大有关，这迫使具有高福利体制的西方国家纷纷消减开支，企图以最小的福利投入获取最大的福利产出，而以证据为本的评估方式能够更为快速、更加直接地测量福利的投入和产出情况;另一方面，这种评估方式也与近年来西方盛行的新自由主义理念密切相关，使得众多西方国家在坚持维护个人基本权利的基础上，最大限度地减少政府干预，进而导致福利国家在福利领域的“退却”，也使得以证据为基础的政策制定重新抬头，同时表明通过运用理性知识实现社会进步的空间依然很大。

21世纪政策转型的一个重要表现，是从基于意见的决策转向以证据为基础并受到严格评估的决策。证据基础能够为政策决策过程的透明度和问责制提供支持[18]，从设计新政策到对现行政策的评价和审查，都可以广泛地在政策制定的各个阶段使用证据。可以说，以证据为本的评估方式通常被认为是“科学”的。但也要看到问题的另一个层面，那就是以证据为本的政策制定，也会受到意识形态、政治目标及财政状况的限制。换言之，社会政策的目标常常受制于一定的社会情境，因而很难进行普遍化甚至是量化。这就造成有效的政策制定与执行的政策之间存在一定差距。加之证据往往是复杂多样的，评估所使用的“证据”经常被“简化”。因此很多学者认为，由于证据常常受到质疑，有时是模棱两可的，因此必须对证据的复杂性和模糊性进行考量[19]。此外，证据为本的政策评估方式还可能导致评估本质的偏离，使其注重目标的管理而不是高质量的评估和计划[20]。

（四）社会影响力评估

社会影响力评估是继众多评估方式后又一个具有转折意义的政策评估类型。社会影响力评估，其基本理念就是使政策制定者要考虑政策的“社会影响”。社会影响主要包括了个体、团体和社区在改变居民生活、工作、人际关系、组织方式的项目和活动中所产生的身体和情感体验。就其起源而言，社会影响力评估最初是作为环境影响评估的一部分来构思的，主要用于衡量国家规划和决策对环境和社区的影响。伴随各国对生态问题和社会问题的日益重视，加之受可持续发展理念的影响，社会影响力评估的应用范围得以拓展，方便政策制定者用来评估政策潜在的负面影响并提出缓解措施。

总体来看，社会影响力评估具有独特的评估优势：其一，社会影响力评估的针对性比较强，这主要源于社会影响力评估可以将“项目”或“政策”置于具体情境中来考察，因此这种评估方式能够适应不断变化的社会情境。其二，社会影响力评估采取整合的取向，可以识别各种相互关系，进而可以评估各类潜在的正面和负面效应，确保可以对政策执行风险进行管控。其三，社會影响力评估可以广泛使用各种数据，以求最大限度地挖掘数据的价值，全面呈现社会政策的实践效果[21]。其四，社会影响力评估还可用于前瞻性的政策和项目研究，以确保更好的决策和可持续发展。它的视野超越了物理环境，使人们看到了计划的变化对人们的生活、生计和景观意味着什么。因此，它修正了经常采用的技术官僚的环境影响评估方法。它不仅着眼于负面影响和预测风险，还包括提供增进人民福祉的备选方案。它采用参与性进程办法，为所有利益攸关方包括受影响社区的需要和关切提供政策参与空间[22]。

社会影响力评估努力评估任何项目或活动可能对社会产生的影响。从某种意义上说，它超越了单纯的产出评价，并评估了可能的社会结果。这尤其重要，因为大多数项目和活动都有成本、优势和非预期的副作用。相应地，它们对人群有不同的影响;有些人直接承担了费用，有些人直接受益于项目，还有一些人最终成为意外的利益受损者。因此，社会影响力评估旨在确定成本和效益是什么、可能的非预期效果是什么，谁会受益、谁将会损失。从这一角度来看，社会影响力评估包括许多其他评估，特别是经济影响评估、环境影响评估、健康影响评估以及对其他此类影响的评估。

（五）用户视角的评估

一般而言，社会政策评估的主要参与者是政策制定部门、专家学者等群体，社会政策的受众群体往往不被纳入进来。但随着近些年社会政策理念的变革，服务使用者也开始被吸纳进政策评估或项目评估的过程之中。这种评估方式改变了以往政治精英或知识精英占主导的评估模式，在一定程度上补充完善了社会政策评估维度。

用户视角的社会政策评估，涉及的评估层面比较多，其中有三个突出特征：一是服务用户是关键的涉众，他们对所遵循的策略、提供服务的条件以及服务的执行方式最为关注。这与以前对用户参与的考虑重叠，也使人们认识到评估可以作为赋予用户权力的一种手段。二是用户对提供服务比较关注，并对该过程有不同看法。而关注政策所述目标可以隐式地覆盖用户的关注点。这里存在潜在的危险，但不一定是真实的;用户希望服务工作，并且他们的关注点通常可以用服务的目标来表达。用户对服务的满意度、对质量和性能的看法以及交付体验是结果评估的一部分。许多公共服务部门将用户满意度的定量调查作为业绩的基本指标。这些调查在研究方面存在潜在问题。被某一机构征求意见的人不会做出中立的反应，而是有一种暗含的偏向于该机构提出这个问题。从数量上说，反馈问卷主要用于编制一系列指标，因此，各机构知道，随着时间的推移，它们是做得更好还是更糟。从质量上讲，它们更有价值;它们给出了另一种见解，并提供了关于所做的事情和其他方面的各种观点。三是服务操作的方式能够体现用户的特定洞察力。来自用户的投诉是重要的信息来源，对关键事件的密切检查使其能够识别出问题以及如何将其设置为正确。评论、投诉和问题可以用来汇总指标，但更有价值的是进行详细、密集、定性的审查，这有助于指出服务提供的问题。

三、社会政策评估的交互影响因素

社会政策评估所处的政治、经济和社会情境，不仅会在一定程度上左右社会政策评估的结果，还会对社会政策的治理成效以及社会政策科学的发展带来重大影响。

（一）宏观政治结构

社会政策评估作为多方社会力量共同参与的一个“集体事件”，结果如何受多种因素制约。总体来看，以往评估的注意力过于狭窄，政策评估的重点集中于评估的过程，涉及政策的设计、实施过程和评估报告。但想要提高评估的成效，还要考虑评估的政治环境。来自政治结构的压力能够影响评估单位和评估人员的独立性、可信度与职业道德。缺乏对政治关系的认识可能导致评估的失败，不能想当然地认为可以很容易地将评估纳入现有的政治机制之中，现有政策评估失败的很大一个原因，可以归结为评估专家和政治环境之间的配合问题上[23]。

政策评估受到的政治压力主要有三类：一是政府的总体制衡架构，即所谓跨部门政治的影响。因部门利益导致的分割运行和政策碎片化，可能导致评估的片面性和分散化。行政评估人员可能受到来自行政和机构政治的压力;如果他们提供了有关机构项目的有利证据，可能会遇到新的政治问题。更重要的是，跨部门政治推动了政府的政策发展，主导了评估议程，致使评估人员在必须报告政策“错误”时面临巨大压力。二是评估单位的官僚环境。这可能导致评估人员面临压力，从而被迫接受官僚机构规定的价值观，进而改变评估的客观结果。在官僚一级，对评估的影响主要涉及生产力和士气，但如果机构对评价结果不满意，就会影响到独立性。由于官僚环境优化了机构防御，因此助长了自我保护和秘密行为。官僚部门特别讨厌告密者，但他们也不赞成任何内部异议，尤其是无视机构传统或与过去的声明相矛盾的评价性结论。三是职业文化。这是因为职业文化有可能与评估文化发生冲突。在占主导地位的专业一级，评估方面的政治压力往往来自于竞争在机构内的地位，但它们通常表面上侧重于一种职业的方法、标准和价值观与另一种职业的方法、标准和价值观之间的差异。然而，由于主导的专业文化一般与官僚主义存在着亲密关系与合作，这意味着外部人员评估单位必须同时做出两方面的整合努力：适应官僚生活的束缚，同时在职业文化视野中面对评估的合法性问题。

关于评估的政治环境还应关注另外两点。第一，三个层次可以同时施加压力，尽管不一定有相同的结果，因此评估单位可能同时遭受多个方向的压力。第二，政治环境始终处于变动之中，思想、政策和政治联盟不断变化，评估人员在研究结束时很难找到与开始时存在的相同的政治环境，这种动态对评估过程和调查结果都有影响。

总之，评估单位周围的政治环境包含三个不同的来源或政治压力;这种环境在所有复杂的情况下，特别是在跨部门一级也是高度流动的;这种复杂性和活力的结合可能对一个新的评估单位带来严重挑战。因此，协调评估单位必须面对复杂的政治环境是政策评估的一个基本目标。迄今为止，大多数政策评估主要涉及的是评价过程而不是背景。但如果我们接受这种逻辑，下一个问题是在如此复杂的环境中如何选择有效的切入点。

政策评估是一种固有的规范性行为，是一种政治判断模式，它永远不会完全被学术的教条所支配，从而将理性、算计和真理逻辑带到决策世界。政策分析“对权力说真话”[24]的趋势会继续下去，學者们不应天真地看待他们参与的评估的性质。理想化的政策评估，是将政策评估作为反馈、学习和改进政策不可或缺的工具。在现实政治世界，它总是有可能被降级为一个空洞的仪式或指责游戏，而不是增强寻找更好的治理的契机。

评估的主体是政治创造，但研究证据必须在隐含的政治过程和语境中与其他因素竞争[25]。学者有义务平衡其间的角色，以使他们以解决问题的方式来确定问题，而不让自己成为政治行为者。我们强调政策研究的知识方面，强调在辩证法和经验主义的基础上区分选择的能力。传统上，它们的作用是重新定义问题，而不是解决问题;在政策过程中，它们的角色是连贯一致的，并为决策者发挥启示作用[26]。

（二）评估能力与社会学习能力建设

为了使社会政策评估获得更好的效果，需要社会政策评估各方的通力配合。这之中，作为社会政策评估主要参与者的社会科学家，其最佳策略是稳定地关注评估的基本问题，避免夸大其工作的直接政策相关性，防止在政策评估过程中受到更多政治情绪的影响[27]。而其他各方也应共同努力，在相互妥协基础上实现评估的最优状态[28]。作为一种政策视角，社会科学分析在政策发展中可以起到教育作用;如果是在具体问题的背景下制定的，可以为决策者提供对其政策困境的有益理解。这种工作不一定改变政策，但它确实影响政策。在一个致力于民主理想的多元社会中，这是人们所期望的[29]。

政策制定和评估不单纯是一种技术实践，而是需要以实际理性为依据。伴随社会各方对政策评估的日益重视，在整个社会政策部门建立并嵌入一种复杂的政策评估能力，在各级进行适当的评估培训并提高认识，建立部门评估文化，努力促进在全部门范围内确定评估问题的战略优先次序，对政策评估和实践效果能够起到积极推动作用。据此，需要在三个方面做出努力[30]：第一，要使用适当的评估模型。努力使评估不那么神秘莫测，以便能够使社会政策部门的所有层级能够理解和实施;使用一套评估术语，强调评估可以在方案的整个生命周期内进行，而不限于结果评估;允许内部和外部评估者均可发挥作用;有评估现实世界的方案，而不仅仅是理想的类型、昂贵的外部评估设计。根据社会政策的证据基础，深入了解评估能提供什么;考虑到有必要采用与主流评估方法不同的方式来评价项目。第二，在整个社会政策部门培养评估文化，讲授适合该部门每一级的评估技能。这将需要一种与仅对社会政策干预进行大规模、技术复杂的评估截然不同的方法。如果这些评价的目标是回答该部门的战略评价问题，有足够的资源，而且在所评价的方案或政策方面是可行的，则这类评价是有一席之地的。然而，这些类型的评价需要嵌入社会政策部门，使部门中每个人都意识到评估是其职责的一部分。部门内的每个人都需要具备技能，以便在日常工作中可以进行适当类型的评估。现在需要的是培训和提高对适当评价模式和方法的认识，以及如何促进更丰富和更全面的讨论以确定整个社会政策部门的优先评价问题这一艰巨任务。第三，制定部门一级的战略，以确定优先评估问题，而不仅仅是依靠个别方案层次的评估规划。在考虑战略讨论时，必须将关于评估的讨论与关于业绩衡量的讨论区分开来。业绩计量是一项例行活动，它使用相对便宜和容易收集的措施来监测一个方案是否交付。但评估通常是一种更具战略性、更昂贵、更详细的一次性活动。这可能包括一个更为困难的问题，即该方案是否正在实现其目标。业绩衡量和评价都是必不可少的。然而，当目的变得不清晰时则会引起重大问题。这种做法的结果应是不再把评估视为一项“技术方案”，而应将其视为对正在进行的战略性社会政策辩论的贡献。一项技术不那么复杂的评估，能够为战略对话增加更多的价值，比技术复杂的评估更有价值，因为评估的结果可能分散了对稀缺公共部门资源的战略性使用的注意力。

（三）社会政策评估与社会政策科学的关系问题

政策评估作为社会政策科学的一个重要组成部分，其整体的评估逻辑都是基于一定的科学逻辑渐次展开的，但评估实践却受到各种政治、经济和社会等现实性因素的影响。因此，如何平衡政策评估科学和政策评估实践的关系，是今后社会政策评估必须面对的一个重要议题。

在对政策科学进行重新定位的背景下，一方面要重新考虑评估方法背后的理论假设，毕竟所有关于社会可用性的知识包括社会政策的制定，都是基于有限的信息获取和社会结构的静态描述。评估作为政策不可分割的一部分，不应当采取“以科学换政策”的简单线性思维方式，而应多关注政策评估的反作用，通过反思评估标准来促进社会学习，并鼓励对社会政策进行更复杂的理解;通过补充和比较政策评估的其他逻辑，可以采用不同的评估路径从而削减评估的负面效应。正如Majone所说，“今天，我们不需要制定‘客观的结果衡量标准——这是评估研究的传统目标——而是促进不同标准倡导者之间的广泛对话”[31]。知识的生产可以也不应该是一维的，更多的研究往往意味着社会科学家之间对某一特定社会科学问题的性质及其可能的解决办法有更大的分歧。找到创造性地处理学术超脱和政治现实主义双重要求的方法，可以说是政策评估艺术的全部内容。

應用研究学者常常把科学的政策建议理解为提供客观和一致的信息来支持政治决策，但其研究结果对政治决策或政策制定产生的影响往往未如预期。在复杂的政治、经济和社会环境中，科学并不是对治理的独立投入，而是治理不可分割的一部分[32]。从这个角度来看，广泛使用的“科学—政策”接口中的“差距应该被弥合”的比喻可能会产生误导。这些隐喻表明了对非常复杂和异质性的科学—政策关系的简化和技术性理解。为了提高对复杂关系的理解，科学—政策互动不应被概念化为两个相互独立的系统。相反，应将科学家和政治家之间的互动看作一个复杂的社会制度，双方的关系可以通过社会学习过程进行优化。这种科学政策系统可以被看作是一个交往平台，参与者可以交换信息、知识和观点，也可以被看作是参与者互动以追求他们的利益和行使权力的领域。两种交互模式都可以被认为是促进了学习过程。

参考文献

[1] Lub V. Polarisation， Radicalisation and Social Policy： Evaluating the Theories of Change[J]. Evidence & Policy， 2013（2）：165-183.

[2] Espen Bratberg， Astrid Grasdal， Alf Erling Risa. Evaluating Social Policy by Experimental and Nonexperimental Methods[J]. The Scandinavian Journal of Economics， 2002（1）： 147-171.

[3] Symeonidou， Simoni. New Policies， Old ideas： the Question of Disability Assessment Systems and Social Policy [J]. Disability & Society， 2014（8）： 1260-1274.

[4] Lynn Laurence E. A Place at the Table： Policy Analysis， Its Postpositive Critics， and the Future of Practice[J]. Journal of Policy Analysis & Management， 1999（3）： 411-425.

[5] Rossi P.， Freeman H.， Lipsey M. Evaluation： A Systemic Approach （6th Ed.）[M]. Thousand Oaks， CA： Sage Publications， 1999：6.

[6] Fischer， F. Beyond Empiricism： Policy Inquiry in Postpositivist Perspective[J]. Policy Studies Journal， 1998（1）： 129.

[7] Parsons， D. W. Public Policy： An Introduction to the Theory and Practice of Policy Analysis[M]. Edward Elgar， 1995：550.

[8] Thomas， A ，Schwandt.Evaluation as Practical Hermeneutics[J] .Evaluation， 1997（1）： 69-83.

[9] Paul Spicker. Social Policy： Theory and Practice （Third Edition） [M]. Policy Press， 2014：412.

[10] Katarina Andersson， Hildur Kalman. Methodological Challenges in the Implementation and Evaluation of Social Welfare Policies[J]. International Journal of Social Research Methodology， 2012（1）：69-80.

[11] Sanderson I. Evaluation， Policy Learning and Evidence-Based Policy Making[J]. Public Administration， 2002（1）： 1-22.

[12] Martin Landau. The Proper Domain of Policy Analysis[J]. American Journal of Political Science， 1977（4）： 423-427.

[13] Albaek E. Policy Evaluation： Design and Utilization [J]. Knowledge in Society， 1989（4）： 6-19.

[14] Michael Moran， Martin Rein and Roberte Goodin. The Oxford Handbook of Public Policy[M]. Oxford University Press， 2006： 327.

[15] Barry Smart. Facing Modernity： Ambivalence， Reflexivity and Morality[M]. London： Sage Publications， 1999： 63.

[16] Sanderson I. Evaluation， Policy Learning and Evidence-Based Policy Making[J]. Public Administration， 2002（1）：1-22.

[17] Wilensky， H L. Political Legitimacy and Consensus： Missing Variables in the Assessment of Social Policy[J].Evaluating the Welfare State， 1983： 51-74.

[18] Edwards P.E-Social Science and Evidence-Based Policy Assessment： Challenges and Solutions[J]. Social Science Computer Review， 2009（4）：553-568.

[19] Boaz A.& Pawson R. The Arduous Road from Evidence to Policy： Five Journeys Compared[J]. Journal of Social Policy， 2005（2）：173-194.

[20] Diaz C， Drewery S. A Critical Assessment of Evidence-Based Policy and Practice in Social Work [J]. Journal of Evidence-Informed Social Work， 2016， 13（4）：425-431.

[21] Parsons R， Everingham J A， Kemp D. Developing Social Impact Assessment Guidelines in a Pre-existing Policy Context [J]. Project Appraisal， 2019（2）：114-123.

[22] Broeder L D， Vanclay F. Social Impact Assessment： An Opportunity for Health Issues in Public Policies and Private Investments[J]. European Journal of Public Health， 2012（1）： 47.

[23] Chelimsky E. Integrating Evaluation Units into the Political Environment of Government： The Role of Evaluation Policy[J]. New Directions for Evaluation， 2009（123）：51-66.

[24] Wildavsky A. Speaking the Truth to Power [M]. Boston： Little Brown and Co， 1979：6.

[25] Johansen E. Evaluation as Social Policy[J]. Review of Policy Research， 1986（1）： 26-35.

[26] Meehan， E. J. Science， Values， and Policies. American？ [J]. Behavioral Scientist， 1973（1）： 53-100.

[27] Harold L. Wilensky. Political Legitimacy and Consensus： Missing Variables in the Assessment of Social Policy， In Evaluating the Welfare State， Shimon E.Spiro，Ephraim Yuchtman-Yaar[M]. Academic Press， 1983： 51-74.

[28] Greener I ， Greve B . Introduction： Evidence and Evaluation in Social Policy [J]. Social Policy & Administration， 2013（4）： 355-358.

[29] Saxe L. Policymakers. Use of Social Science Research： Technology Assessment in the U.S. Congress[J]. Science Communication， 1986（1）： 59-78.

[30] Duignan P. Building Social Policy Evaluation Capacity[J]. Social Policy Journal of New Zealand， 2002， 19： 179-194.

[31] Majone G. Evidence， Argument and Persuasion in the Policy Process[M]. New Haven， Conn： Yale University Press， 1989：183.

重庆社会科学

2020年6期

社会政策评估的哲学基础、实践形式与交互影响因素

杂志排行

重庆社会科学的其它文章