时代模式下政策评估方法的演变
2017-06-08张璞玉
张璞玉
(上海杉达学院,上海 201209)
[摘 要]评估方法是政策评估活动中的重要工具。Guba,E. G和Lincoln,Y. S.基于评估研究的发展历程,提出了时代模式,展示了政策评估发展的特点。本文基于时代模式下每一阶段评估的特点,发现政策评估方法出现了从实证主义向诠释主义转变的趋势。然而,这一模式下评估的发展是非线性的,政策评估方法在演变的过程中也并不是替代与被替代的关系,而是在时代模式下的融合。
[关键词]政策评估;时代模式;评估方法
doi:10.3969/j.issn.1673 - 0194.2017.10.125
[中图分类号]D630 [文献标识码]A [文章编号]1673-0194(2017)10-0-02
政策评估是政策过程中的重要环节,通过政策评估可以判断政策本身的质量和价值,从而进一步决定政策是延续、革新或是终结。政策评估功能的发挥主要取决于是否能够选取合适的政策评估方法并有效运用。现阶段,国内关于政策评估方法的研究甚少,且主要集中于对国外政策评估模式等理论的介绍。总的来看,我国的政策评估还未形成一套成熟、完善的方法体系。探究政策评估的兴起背景以及评估研究的发展历程可知,政策评估是评估研究在其发展过程中,由接受了该学科训练的人将评估研究方法运用到机构政治决策中而形成的,是众多评估活动中的一类。评估模式是评估要素、评估过程以及评估方法等因素形成的相对稳固的逻辑关系。评估模式能表现出评估者对评估工作的主要概念、结构的看法。在评估研究的發展过程中,已形成了不同的模式及发展方向。“时代模式”是Guba,E. G和Lincoln,Y. S.基于评估研究的发展,提出的评估分类体系,是最早对评估进行系统分类的模式。该评估模式已在政策评估的研究中被广为接受,并且可以将该模式看作是政策评估的演进历程。相较于Alkin,M.C.的树状模式和Fitzpatrick,J.L.,Sander,J.R.和Worthen,C.P.的运用模式,“时代模式”将复杂的评估活动简单清晰地呈现出来,并体现了每一阶段评估的鲜明特点,有利于探究政策评估方法的变化。
1 “时代模式”概述
Guba,E. G和Lincoln,Y. S.将评估的发展按时代进行划分,并在此基础之上提出了第四代评估理论。第一代评估起源于教育领域,是对学生特征的测量。这一时代的评估等同于测量,以获得测量数据为中心,评估者利用其可以掌握的工具,对评估对象进行测量。第二代评估被称作描述,准确的说,这一评估时代应是以目标为导向的评估,描述是其重要特征,即“目标导向的描述途径”。在政策评估中,首先要对目标进行描述分析,并将政策实施结果加以精确测量,在此基础上将结果与目标进行比较。这种将目标与结果进行比较的第二代评估,对当今的评估活动产生了深远的影响。以判断作为特征的评估被划分为第三代评估。“判断”是评估活动中重要的因素,并贯穿于评估活动。与第三代评估相比,第二代评估中的判断是将目标与结果进行对比,对比则意味着判断的存在。而该时代的评估,则以独立于评估活动的外部标准作为判断的依据。因项目目标本身也被看成是有问题的,因此,不能将其作为判断的标准。对判断定义的不同理解,其体现了评估活动的发展从以科学为基础的研究,向“自然主义评估”过渡。Guba,E. G和Lincoln,Y. S.基于前三代评估发展提出了第四代评估——协商。他们认为在评估活动中要考虑评估者与政策相关者间的关系,如政策评估项目委托方、评估活动开展的资金提供者、评估报告使用的领导者等。他们认为评估要深入到评估对象中,探清其需求,在不断协商中进行。如文中所述,判断伴随着评估活动而存在,判断的标准也体现了评估者的价值取向,这一时代的评估则强调评估者在与政策相关方协商的过程中共同构建评估的目标价值。
2 政策评估方法演变——社会实验与质性研究方法
基于Guba,E. G和Lincoln,Y. S.提出的时代模式,第一代评估到第四代评估,体现了评估范式从实证主义到诠释主义的转变。实证主义评估范式的核心在于使用科学的技术方法对评估对象进行精确的测量,主要使用的是实验方法。诠释主义评估范式的核心是评估者深度参与政策的制定、执行等全过程,建构政策的目标价值,主要使用质性的研究方法,通过实地参与式观察、深度访谈等方法对政策进行全面理解。
前三代的评估都具备一个共同的特性——强调评估的科学范式,在评估方法上重视使用定量的测量工具以及实验方法。第一代评估采用实验室实验,运用技术性的测量方法,如心理学的测量方法,目的是确保测量结果客观、准确;第二代则采用实地实验,保留了上一阶段测量这一技术手段,提出对评估对象进行客观描述,在客观描述的基础上,强调对政策目标与政策干预结果的测量;第三代评估中使用的是社会实验方法,在前两代评估方法继续沿用的基础上,强调了评估者要以外部标准进行价值判断。尽管在评估工具的使用和侧重上略有不同,但前三代都采用了对评估对象有控制性的实验方式,看重获取关于评估对象客观、真实的数据。第四代评估强调构建、协商,基于诠释主义方法论,运用质性的评估方法。诠释主义的评估范式强调评估者参与到评估对象的活动中,通过获取质性的数据资料,进而进行判断评价。
2.1 社会实验法
实证主义范式下的政策评估方法有很多种,就其本质来看,政策评估是检视政策实施后,对其实施对象是否带来了预期及预期外的影响,那么评估者就需要对政策的实施进行判断。目前,比较流行且广泛使用的实证主义的政策评估方法是社会实验。美国从20世纪60年代至20世纪90年代,各级政府采用社会实验对医疗、教育、住房等领域实施的政策,进行了90多次的评估,耗资超过10亿美元。
社会实验的基本思想是把评估对象随机分配到实验组和控制组,对实验组实施政策,经政策干预后,通过对比两组的变化情况,判断政策干预效果。若仅有实验组发生变化,那么两组之间的差异为政策干预所致。这是社会实验最基本的思路,被视为最有效的社会实验方法——随机实验。在实际操作中因受现实情况的限制,无法随机分配控制组或无法选取控制组时,会采用准实验方法。准实验的思路同随机实验,但二者的区别在于对实验组与控制组的选取并不是随机分配的,是通过相似性进行选择。此外,覆盖面较为全面的政策,如全国性或某一地方政府的政策,随机建立实验组和控制组不太可行,这时就可以使用反身设计。这一实验设计的假设是若没有政策的干预,那么评估对象的前后测数据是一致的。但这种方法的缺点较为明显,如果后测出的数据较前测出的数据产生了变化,该变化是否为政策干预所致?因而,该实验设计在政策干预与测量的对象上存在非常密切的关系,且评估对象所处的外界环境较为稳定时才会使用。
2.2 质性研究方法
Guba,E. G和Lincoln,Y. S.提出的超越了纯粹科学范畴的第四代评估——以协调和谈判为核心的评估,需要评估者与政策相关方充分互动,完全参与政策评估项目。质性研究方法在此发挥了重要的作用。质性研究方法在政策评估使用过程中、在资料收集方面,不是通过测量而获得数据,而是在自然情境下与政策评估对象进行互动。不同于实验法的是,质性研究方法强调在“自然状态”下进行,而不是实验设计中强调的对实验环境的控制。在质性研究中最有代表性的是实地法。实地法的使用需要评估者深入评估对象的背景中,通过参与观察和无结构访谈来收集项目资料,并通过对项目资料进行定性的分析,从而与评估对象进行沟通协商。实地研究具有很强的弹性,不像实验法那样具有严格和固定的程序。
3 结 论
时代模式视角下政策评估的发展历程,展现了政策评估方法从实证主义评估范式向诠释主义评估范式演变的趋势。但这并不意味着质性研究方法在政策评估活动中完全替代了实证主义的评估方法。时代模式揭示了政策评估的发展与进步,这种发展与进步并不是简单的线性发展轨迹,新一代政策评估弥补了上一代政策评估活动中的不足,上一代政策评估中的特点则作为已有的评估要素蕴含在新一代政策评估中,作为评估时代要素之一的评估方法,也伴随着政策评估的发展而发展。第一代评估突出了评估的工具属性以及评估者评估技术的熟练性、准确性,其目的是要得到客观准确的测量结果,以保证政策评估结果的准确。在之后的评估研究中,认为其测量过分强调了评估的技术性,忽略了对评估对象的了解、描述,不应将测量等同于评估。第二代评估强调了对项目结果的描述,但仍保留了测量这一技术方法,并将其作为对目标描述的工具。尤其是在社会实验中,在测量实验对象受政策干预时,测量的技术性与重要性不可忽视。第四代评估突出协商和政策评估价值的建构,虽然其以质性研究方法为主,但并不意味着这种方法的使用就完全脱离了技术指导。前三代政策评估中,实证主义评估方法强调的客观、准确的科学精神依然适用于质性的评估方法。质性的评估方法依赖于对获得信息的意义解释,对数据内容的解释也有与其相适应的技术,诸如分类学的解释、语言学的解释和注释学的解释,必要的话,还需将信息转化为可以处理的数字或文本。当然,没有哪一种评估方法可以适用于所有的政策评估活动,但通过评估模式建立了政策评估活动中各要素间的稳定关系,可以体现出政策评估的特点,从而采取更适用的政策评估方法。
主要参考文献
[1]和经纬.中国公共政策评估研究的方法论取向:走向实证主义[J].中国行政管理,2008(9).
[2][美]彼得·罗西,马克·李普希,霍华德·弗里德曼.评估:方法与技术[M].第7版.邱泽奇,王旭辉,刘月,译.重庆:重庆大学出版社,2007.
[3]曹哲堂.公共管理评估研究[M].北京:北京大学出版社,2014.
[4]李志軍.重大公共政策评估理论、方法与实践[M].北京:中国发展出版社,2013.
[5][德]赖因哈德·施托克曼,沃尔夫冈·梅耶.评估学[M].唐以志,译.北京:人民出版社,2012.
[6][美]埃贡·G·古贝,伊冯娜·S·林肯.第四代评估[M].秦霖,蒋燕玲,译.北京:中国人民大学出版社,2008.
[7]G Burtless. The Case for Randomized Field Trialsin Economic and Policy Research[J].Journal of Economic Perspectives,1995(2).
[8]陈向明.质的研究方法与社会科学研究[M].北京:教育科学出版社,2000.
[9][美]劳伦斯·纽曼.社会研究方法——定性和定量的取向[M].郝大海,译.北京:中国人民大学出版社,2007.
[10]李伟.公共政策评估:发达国家“抓落实”的一把“利剑”[J].秘书工作,2016(1).
[11]孙达.对我国当前公共政策评估现状分析及完善途径的几点思考[J].人力资源管理,2016(5).
[12]刘星.我国公共政策评估发展面临的困境及对策研究[J].商,2016(16).
[13]王海波.公共政策评估基本问题研究综述[J].齐齐哈尔工程学院学报,2016(3).
[14]覃耀坚.我国公共政策评估存在的问题及其对策研究[J].大众科技,2015(1).
[15]廉尔力.公共政策评估内涵新探[J].中共山西省直机关党校学报,2015(2).
[16]陈何南.公共政策评估标准的应用路径分析[J].商业时代,2014(6).
[17]高小泉.我国公共政策评估存在的问题及其完善措施[J].人才资源开发,2014(14).