可行性及其路径:刍议大数据方法在公共政策评估中的运用
2017-09-22谢明刘爱民
谢明+++刘爱民
摘要:尽管大数据的理论和应用已有着相关学科的各类研究,但既有的研究缺乏对不同政策适用大数据方法进行评估的考察。文章的目的就是检视不同政策适用大数据方法进行评估的情况。文章基于对大数据相关文献的介绍和梳理,分别从理论逻辑、现实应用、实证经验三个维度对使用大数据方法进行政策评估的可行性进行分析,最后构建“数据收集—数据分析”矩阵来描述何种政策可使用大数据方法进行评估。
关键词:大数据方法;政策评估;收集数据;分析数据
政策评估在我国发展至今,其重要性已经得到一定的认可,但无论是作为政策理论研究的重要内容,还是作为政策实践的关键环节,政策评估的地位及其在政策活动中应发挥的作用都有待进一步发掘。问题的成因之一可能在于国内学界目前缺乏对政策评估方法的研究,导致政策评估难为“无米之炊”。
党的十八届三中全会提出治理能力现代化的目标,并强调加强顶层设计。这对公共政策领域也提出了全新的要求,引入更加科学、规范、有效的评估方法是新时期政策评估发展的题中之义。传统的政策评估方法主要包括规范研究方法和实证研究方法,两者各有所长,又都有局限。面对日益多元而复杂的政策环境,运用单一的研究方法进行评估已经难以满足现时政策发展的需求。运用大数据方法进行政策评估正是在此背景下应运而生。
一、 基于大数据进行政策评估的逻辑
一般认为,规范研究和实证研究是政策评估中彼此分立的两种评估思路。目前国际上主流的政策研究人员也据此形成两个旗帜鲜明的阵营:主张政策评估应以价值判断为主从事规范研究的传统政治学家,以及具备定量分析背景并强调量化指标进行实证评估的经济学家。虽然两种方法论的支持者观点不同,但是不同方法论本身的关系并非完全对立,而是相辅相成,互为补充,更有学者倡导二者的混合与共融。事实上,无论采用何种方法进行评估,都必须基于数据(包括简单的计数数据和高度复杂的数据信息)的获取。缺乏数据的评估方法不能成其为科学严谨的评估方法。政策评估的严肃性要求评估方法必须用事实说话,凭数据定论。可见,政策评估本质上应该是一种“循数评估”——通过分析数据来研判具体采取何种评估方法的“数据驱动”型评估模式。
严格来说,循数评估的有效实施必须基于一个运行着大量数据的环境,数据无处不在,随时可用,这显然是传统的社会和科技条件所不支持的。大数据时代的到来为循数评估创造了条件,海量数据、强调相关性分析、实时、动态等方面与循数评估的要求不谋而合。我们知道,政策评估的内核是分析因果关系,必须指出,“因果关系不过是相关关系中的一部分,分析相关关系也正是为了间接得出对因果关系的认识”。这就是大数据与政策评估相契合的逻辑。
二、 大数据方法在我国的现实应用
1. 既有对大数据的认知。大数据的概念在不同的研究中表述不一,关于其界定尚未形成共识。大数据通常被视为有价值的产业信息,是一系列体量巨大,尚不能运用现有管理和分析手段对之进行有效处理的数据集。大数据的开发利用对国家治理具有重要意义——大数据既是国家治理的环境和工具,又是国家治理的对象和结果。作为国家治理的重要内容,政策评估也将受益于大数据的发展。
随着大数据时代的到来,数据成为一种新的自然资源,作为重要生产要素的大数据已经渗透到各行各业。大数据的分析方法随之应运而生,如可视分析技术、人机交互、任务建模理论等方法技术的应用将带来新的变革契机,人类社会进入科学发现的“第四范式”。
2. 大数据在我国的现实应用。目前,大数据的分析方法已广泛运用于智能交通、环境监控和灾难预警等方面。国家治理层面,利用大数据的方法能提升国家的智慧决策水平、公共服务能力、防治腐败能力和风险治理能力。借助大数据的分析方法,可以提高公共管理的透明度、发现公众需求、提高政策的针对性、进行辅助决策、引导管理部门实现内外创新。大数据方法通过数据多维采集,提供即时线索,提高相关动态数据的采集精度,从而无限逼近社会真实状态。在此背景下,运用大数据方法可实现评估数据多维采集、评估数据集成挖掘和评估可视化解析,无疑是政策评估的全新范式。
3. 运用大数据方法的其他路径。总体看来,现有的大部分文献对大数据方法做了可观的技术性探讨,且以介绍性的描述居多,而研究内容上则主要围绕大数据的概念、方法、意义展开,侧重宏观分析。相比之下,针对社会科学实务层面的应用研究较少,尤其是将大数据方法与政策评估结合起来展开研究尚处于起步阶段。本文试图厘清大数据方法与政策评估方法论之间的关系,在借鉴国外运用大数据方法开展政策评估经验的基础上,尝试对可能存在的大数据方法适用于政策评估的规律做出总结。
三、 来自国外的经验
国外对利用大数据方法推进政策评估已有一定研究。宏观来看,许多发达国家确立了本国的大数据战略,竞相增加该领域的研究投入,试图从中找到新的国家治理思路。具体而言,不少学者在SSCI的国际主流期刊上相继发文,论述自己的研究发现。以下,我们列举两例:
1. 利用搜索查询的大数据来评估环保态度的研究。Donghyun Lee等在“Energy Policy”上发表的文章介绍了基于大数据的思路利用搜索查询的大数据对环保态度加以评估的研究。文章围绕在政府能源政策制定和执行过程中发挥越来越大作用的公众意见进行实证检验。为了对当地民众随着时间而不断变化的环保态度进行量化,作者采用互联网大数据的方法,对特定地域民众的谷歌搜索查询的数据做了采集,并通过普通最小二乘法的结果对民众的环保行为进行验证。为了检验这种方法的政策评估适用性,该研究再次考察了美国州政府制定的三项广为人知的绿色电力政策--可再生能源份额政策、净计量规则政策和公益基金政策。由于各州实行这三项政策的情况不一,作者选取的是右偏数据,运用累进失败时间序列模型的方法进行双重计量。研究发现控制其他傳统时变政策选取的因素后,州域内民众的态度对政策的影响具备统计学意义上的显著性。尤其是绿色能源政策中的反环保意见对政策的影响程度更高。据此,作者认为地方政府可以制定出更有针对性的环境政策。文章最后特别指出,能源政策领域内与民意相关的问题都可以借鉴这种方法进行讨论。endprint
2. 利用谷歌趋势及推特大数据来评估空间政策民意的研究。Wendy N. Whitman Cobb在“Space Policy”发表的题为“Trending now: Using big data to examine public opinion of space policy”的文章介绍的是关于利用谷歌趋势和推特网的大数据评估空间政策民意的研究。文章首先对传统测量民意的方法做了介绍,然后提出全新的民意测量工具,进而通过新旧测量方法的对比得出结论。作者认为,民意在美国空间政策中扮演着至关重要的角色,而谷歌趋势和推特网的大数据分别为之提供了新的宏观和微观的视角。对比盖勒普等民调组织的调研统计,大数据的方法能更加灵活地获取反映民意的即时有用数据,相关机构皆可从中受益:就空间政策而言,空间领域和政治领域的政策企业家都可以利用通过大数据方法获取的数据来游说国会和行政部门,以争取他们更多支持和资金投入以帮助NASA进一步开展活动;科学界可借助大数据方法将他们的研究与大众的兴趣结合起来,以增进外界对其工作的了解和支持;而华盛顿的官员则可以在不具备相关专业背景的情况下,通过大数据方法读懂高度专业化的数据信息。
3. 小结。民意,或谓之公众态度,在政策的制定和执行过程中发挥着关键作用,获取即时有用的民意数据并及时评估,可以有效推动政府制定出更加符合民众预期的政策,同时还能降低政策演变的成本。国外的经验表明,大数据方法已经为政策评估的这一需求提供了解决思路。不可否认,大数据方法仍存在一定局限,比如大数据的产生和发展较晚,缺乏长期数据;处理大数据的难度较大;收集的大数据仅来源于可接触互联网的人群等。但这些局限都不足以影响将大数据方法作为一种可行的政策评估思路。
四、 基于大数据方法的政策评估分析矩阵
以上我們探讨了将大数据方法运用于政策评估的理论逻辑、现实依据及国外经验,由此明确大数据方法可用于政策评估的结论。那么,何种类型的政策才能适用这一方法?为回答这一问题,基于Forte和Ward等学者在信息和数据方面的已有贡献、Economist Intelligence Unit (EIU)的“发展阶段”概念,以及Joseph Amankwah-Amoah对不同国家开发大数据的国家能力所做的分析,我们开发出用以检视一项政策是否可通过大数据方法进行评估的“数据收集-数据分析”矩阵。首先,我们设定数据收集和数据分析是一项政策可采用大数据方法进行评估的两项重要指标。同时,我们认为不同政策通常在这两个维度的具体分布不同。一些些政策可在互联网等媒介搜索与之相关的大量信息,从而为大数据的收集创造条件,另一些则不然。因此,不同政策用做评估的大数据“基础”分别处于“数据贫乏”到“数据丰富”区间的不同层次(见图1)。
数据丰富,是指与政策相关的数据可通过互联网或其他方式大量获取。互联?和社交媒体的出现意味着大数据的现实可用。信息丰富,指的是对数据进行分析,将其转化为知识并加以理解,以作为公共政策评估的基础和行动依据。为使分析矩阵的建立具备更为坚实有力的理论基础,我们选定数据收集和数据分析这两个关键指标,利用“2×2”矩阵对不同政策在这两个维度上分布的情况进行分类,如图1所示。这些模式强调影响不同政策可利用大数据方法进行评估的程度差异,各政策可在不同模式中进行转换。鉴于仅掌握大数据并不能开展政策评估,因而用作政策评估的大数据必须同时满足“可识别”和“能解析”的要求。接下来的部分将对“数据搜集—数据分析”矩阵进行重点介绍,从而揭示如何利用大数据作为政策评估的依据。
1. 模式一:数据现金型(数据丰富,信息丰富)。该模式具备将大数据运用于公共政策评估的清晰路径。“数据现金型”政策通常是全国性的政策,其特点是:公众在互联网平台可搜索与之相关的大量信息,最有可能从中获取政策评估所需的大数据。这源于技术的进步使得对网络、手机和社交媒体的大型数据进行收集和分析成为可能,进而为政策评估提供依据。该模式的另一特点是数据可在政府部门及其分支机构、服务提供商和政策评估方之间互通共享。大数据为弥补知识差距创造了机会,借助大数据中提取的有价值信息,可以帮助破解政策评估中信息不对称的难题。
2. 模式二:数据期货型(数据贫乏,信息丰富)。模式二中,政策的相关信息通常较少见诸于网联网平台,民众搜索频率不高,但偶尔可能出现的政策热点会产生包含大量有用信息的大数据。这类政策已经具备较为成熟的使用大数据方法进行评估的条件,充分利用出现的时机对收集到的数据做出分析,就能对该政策做出有效的评估。一种可能的解释是,一项政策在大部分时间运行平稳,当其做出调整,引发民众大量关注,并在较短时间内在互联网等媒介产生大量搜索。当然,也可能归因于与该政策相关的大规模数据收集不被允许,从而转向收集有限数据并作出高质量的分析。可见,掌握并运用大数据方法可以提高决策质量,改变政策评估的未来。
3. 模式三:数据原料型(数据丰富,信息贫乏)。该模式中政策的特点是:在互联网或社交媒体上拥有与该政策有关的大量信息检索,可收集的数据体量可观,但这些数据与政策本身无关,可用性不高,或现有技术水平尚不能对之进行有效分析,只能弃之不用。此外,政府或其他机构的数据共享机制缺失也是可能的原因。进入21世纪,成箱的观察笔记、软盘,满橱柜的数据表以及各地详实的数据表要么未经处理,要么没有连接到中央数据库的现象并不罕见,进而导致典型的“数据丰富—信息贫乏”综合征。一些机构可能收集和存储了大量与此政策相关的数据,却由于未经有效加工而无法关联,而从当地机构获取数据来分析则费时且昂贵。久而久之,丰富的数据由于缺乏整合导致可从数据中提取有用信息的能力非常有限。另外一些政策相关的大数据收集可能涉及道德伦理问题,必须对二者做出平衡。相当数量的数据可能因此不被用于政策评估。最后,收集的数据“通常不是直接可用,或不可直接用做临床和管理的支持信息”,此外,如果现有技术水平还不能对某些数据进行处理和分析,它们也同样不能辅助政策评估。endprint
4. 模式四:数据稀缺型(数据贫乏,信息贫乏)。模式四为数据稀缺型,该类政策规范的内容与民众缺乏关联度,民众对其关注度不高;或者政策相关信息很少公开,更是鲜见于互联网;现有技术水平的局限尚不能对相关数据进行有效的收集和分析也是一种可能的原因。对于后者,技术的不断进步会让问题迎刃而解。数据稀缺性政策的评估缺乏大数据的基础,因而大数据方法不可用于该类政策的评估。
5. 小结。基于对矩阵的上述讨论,我们提出以下假设:
假设性命题1: 如果政策相关信息的公开程度越低,那么使用大数据方法对之进行评估的可能性越低;
假设性命题2: 如果在全国范围内收集和分析数据的能力越弱,那么运用大数据方法进行政策评估的可能性越低;
假设性命题3:如果政策运行越平稳,民众的关注度越低,那么运用大数据方法进行政策评估的可能性越低;
假设性命题4:如果收集的数据不能形成全国性的数据网络,共享程度越低,那么运用大数据方法进行政策评估的可能性越低。
五、 结论与讨论
本文通过检视不同政策适用大数据方法進行评估的情况对大数据的运用做了扩展研究。研究揭示了数据与信息之间的关系。借助概念化构建了一个“2×2”的分析框架,用以呈现不同政策分别适用大数据方法进行评估的情况及其所属模式。几种模式分别是“数据现金型”“数据期货型”“数据原料型”,以及“数据稀缺型”。
本研究的构想还有助于厘清大数据并不必然转化为大知识、大认知的线索。运用大数据方法进行政策评估不仅是一种全新的评估范式,同时也有助于改善政策评估的质量。尽管已有学者对大数据信息系统做了探讨,却对大数据如何被用来帮助政策评估缺乏系统性检视。需要指出,由于大数据方法本身不是尽善尽美,我们的“2×2”分析框架也存在一些固有局限。比如数据有时具有欺骗性,某些数据并不必然具备政策意涵等。
虽然本研究还存在一些不足,却对这一方向的探索起到抛砖引玉的作用,这至少表现在两个方面:“2×2”分析框架显然不能囊括所有政策,开发一个更为全面的扩展框架势在必行,本研究为这种探索奠定了一定基础。此外,本文很大程度上忽视了包括道德问题在内的运用大数据方法产生的内生性问题。必须强调,能够运用大数据方法进行政策评估也就意味着相关主体具备大数据收集和分析能力,这必然给公民的活动带来巨大影响。相关问题的研究还有待于将来做进一步探索。
参考文献:
[1] 和经纬.中国公共政策评估研究的方法论取向,走向实证主义 [J].中国行政管理,2008,(9).
[2] 邱东.大数据时代对统计学的挑战[J].统计研究,2014,(1).
[3] Cobb W N W. Trending now: Using big data to examine public opinion of space policy[J]. Space Policy,2015,(32):11-16.
[4] Amankwahamoah J.Safety or no safety in numbers? Governments, big data and public policy formulation[J].Industrial Management & Data Systems,2015,(9).
作者简介:谢明(1958-),男,汉族,北京市人,中国人民大学公共管理学院教授、博士生导师,研究方向为公共政策基础理论、公共政策分析、中国公共政策研究;刘爱民(1987-),男,汉族,广西壮族自治区资源县人,中国人民大学公共管理学院博士生,研究方向为公共政策。
收稿日期:2017-09-11。endprint