以大数据俘获理性:“数据—知识—决策”框架下的公共决策理性增长逻辑
2022-08-19张红春
张红春 杨 涛
(贵州大学 公共管理学院,贵阳 550025)
一、问题提出
公共决策是促进和匡正国家治理的关键变量,理性则是科学决策的核心要义与评判标准。公共决策不仅是社会资源权威性分配的原则和秩序,更是多元政治主体和利益群体意志表达与利益平衡的机制,在某种意义上,公共决策是一国政治体制的中枢系统[1]。由此,公共决策理性与否不仅反映了国家与政府的治理体系与治理能力水平,更是国家兴衰盛败的关键和人民福祉所系。所谓理性,作为评价决策科学性的价值体系,表现为经过检验的、科学的知识集合,能够反映事物本质规律,并指引人们做出最优选择[2]。本质上,理性是对科学知识的掌握和应用。如何努力回应决策理性化的内在诉求向来是无数决策研究者不懈追求的目标。自亚当·斯密以降现代经济学提出的理性人假设开始,后来的新制度经济学、管理科学、组织决策学、政策科学等学科领域的诸多经济管理与决策科学理论实质上均以理性原则为基石进行建构。决策者的行为、选择都要以合乎理性原则为暗含前提,以科学的理论指导、先进的技术手段、规范的决策程序、科学的决策评估确保决策理性。从这个意义上来讲,现代公共决策所追求的目标取向之一的决策科学化,也就是要驱动决策理性化,理性原则由此构成公共决策科学的一种价值理念和基本取向。
决策科学正是围绕着理性内核,在理性和有限理性的争鸣中逐渐明朗和发展起来的,并最终将理性视作决策科学与否的判断标准。20世纪50年代,决策理性模式经历了一次完全理性与有限理性之间的分野。在此之前,建立在“经济人”假设基础上的古典决策模式与新古典经济学派的理性决策思想一脉相承。其认为决策者能够充分考虑所有目标,可获得完备的信息、知识等资源进行方案设计,并从中做出实现价值最大化的选择。但实际上,这种完全理性所声称的社会价值目标一致和人的认知能力无限等假设前提过于完美,忽略了决策本身的复杂性特质,更何况还要受到决策者主观偏好、知识的深度、信息资料的完备程度等主客观因素限制。故而后,西蒙和林德布洛姆等则构建了以有限理性原理为准则的决策模式,他们对“完全”“最优”等一些浮于理想的标准做出了全面反驳,认为受限于数据的完整性、信息的有限性、知识的广博性、动机的纯正性等因素,完全理性是不切实际的。如西蒙所描述,“管理者”力争理性却被束缚在有限的知识限度里,在有限的变量和有限后果封闭形成的独立系统中,不可能完备决策所需的知识、技能、价值、困难预见等方方面面条件[2]。他将完全理性批驳得体无完肤,以“有限理性”和“满意度原则”将推崇完全理性的古典决策模式拉回现实,也奠定了有限理性的理论基石。此后,政策科学、经济学、政治学等学科领域理性假设也随之发生转向,有限理性原则日渐成为决策的主流范式。必须说明的是,这并不代表持有限理性假定的决策学者只是被动接受理性的限制,他们实则从未停止尝试打破、增加决策理性限度的努力,试图不断优化决策理论、技术手段与过程,尽可能取得更好的决策方案和结果。譬如在计算机技术尚处于萌芽之际,西蒙便敏锐地洞悉了可利用计算机提升决策者信息储存、处理能力和系统分析能力的构想。林德布洛姆、马奇和奥尔森等相继提出了在不完美环境下尽可能提升理性程度的渐进决策模式、“垃圾桶模型”决策模型,其实质都是在有限理性的约束下改善和拓展决策者的理性境况。由此,无论是完全理性还是有限理性,无疑都是将“理性”作为衡量决策科学性的根本标志,从此意义上来讲,有限理性也是对完全理性的逼近,其以完全理性为终极目的[3]。总的来说,增加决策者的理性构成决策科学的根本使命。
同样,公共事务领域的公共决策也追求理性,但其达到理性标准更为困难,公共决策对理性的追求面临内生性障碍。相较于私人领域的决策,公共领域的决策要面对诸如公共事务治理的高度复杂性、不确定性,以及政治制度、技术革命、社会变迁等多重因素交织,更难以实现完全的决策理性。公共决策面临的理性约束有三个方面:第一,决策事实感知难以全面,理性的公共决策需要充分掌握关于决策环境、问题、对象等多方面的事实。但是,公共领域的事实范围大、变化快使得决策者对事实的感知有着天然的缺陷。第二,决策价值主张难协调,公共决策自身是一个多元利益交涉、价值偏好宽泛的复杂体系,由于价值信息交流机制的不畅、价值问题的复杂多变性等因素影响,决策中很难有效识别并兼顾多方价值偏好。第三,决策规律认知不科学,公共决策者天然地面临知识和精力等的理性约束很难及时地透过现象看到本质规律,决策制定和执行不知其所然,致使决策有失公允性和科学性。当公共决策者很难超越上述公共决策理性制约时,决策失灵和失误就会成为经常出现的陷阱,一旦落入这个陷阱,会造成重大经济损失和资源浪费,降低政府公信力,损害公共利益,最终阻碍社会经济发展。现实中,因公共决策理性受限而决策失败失灵的案例并不少见。中华人民共和国成立后的前50年共计两万多亿元的总投资额中,竟有超过一半以上的投资为决策失误买了单[4]。可见,公共决策失灵造成的巨大代价实属触目惊心,亟待找到扩展公共决策理性的方法路径,降低因欠缺理性造成的决策失灵和失误。
自20世纪50年代以来,各类新技术层出不穷,“技治主义”的声望日益升高,使得从科学技术中汲取力量以突破决策理性约束成为决策研究者拓展理性的新视角,并且利用决策方法和技术的改进来化解决策面临的理性限制至今仍然是决策科学的前沿。如西蒙在系统理论基础上,吸收了行为科学、运筹学和计算机科学等领域的理论与方法,形成了重视定量方法、计算技术的决策理论,这对提高决策的科学化与合理化水平贡献颇多。从历史的长期发展趋势看,技术的水平决定国家治理格局的整体水平[5]。而面向数据密集的大数据时代,大数据资源以及因其发生变革的人的世界观、知识观和方法论有望再次对传统公共决策模式中的有限理性颠扑不破的地位发起挑战。已有研究指出,大数据技术革命可以提升人们认识复杂环境、收集信息、积累知识和计算处理等方面的能力,助力公共决策突破有限理性束缚,提升科学性和精细化、智慧化水平,降低决策失灵风险[6-7]。一些学者指出大数据可以驱动公共决策模式变革[8],变革决策过程及其决策预测机制,并转向智慧公共决策[9-11]。不可否认,这些研究进展对于理解大数据时代公共决策的挑战、机遇和进路大有裨益,但遗憾的是,已有研究要么是对大数据于某一个决策环节变革的局部剖析而缺乏整体机理探究,要么没有从深层次的理性变量入手揭示大数据是如何通过影响决策理性进而影响决策的科学化和智慧化水平。鉴于此,本文以决策理性为分析视角,探究大数据何以赋能公共决策对理性的追求,进而展现大数据驱动公共决策科学化、智慧化的理性增长机制。
二、“数据—知识—决策”:公共决策理性生成的分析框架
既然知识是决策理性的内核,那么决策知识从何而来,决策知识又是如何嵌入决策中并制约决策理性水平,这是探究决策理性证成的关键理论命题。本部分从两个维度探讨了决策理性的制约因素:首先,通过对认知金字塔模型的观察和迁移,厘清决策理性的生成因素;随后,从决策过程理论出发,剖析了理性公共决策的流程溯源,从而建构了一个整体性的公共决策理性分析框架。
(一)“数据—知识”:基于认知金字塔的理性因素探源
自现代决策科学产生以来,决策依据更强调转向科学知识而非主观的经验和臆断,知识成为约束和表征决策理性的关键因子。西蒙认为,要想完全理智地做出决策,必须具备所选策略导致后果的完备知识,知识是影响理性限度的关键因素[2];林德布洛姆的渐进决策科学也持这样的观点:大多数人的决策行为囿于一个对过去一连串政策经验的框架,即受到渐进的经验、过去构建的知识影响[12]。国内学者王锡锌等也认为由于社会现实的复杂性以及资源的有限性,仅凭借个人经验很难一直做出正确的决策,不同的知识及其利用方式会影响行政过程的理性和正当性,越是复杂的决策,越需要完备的信息来源、深厚的知识储备和科学的决策方法[13]。可见,学界都持有一种共识性观点:决策理性源自知识。然而,何为决策知识?决策知识从何而来?决策信息、决策数据与决策知识之间又是何关系?这些都是困惑决策研究者与实践者的疑云所在。
将视域转向专门研究知识生产和利用的知识管理(Knowledge Management)领域,其对知识生成的影响因素不乏讨论,而其中最为经典的还是认知金字塔模型。认知金字塔模型最早由Ackoff于1989年提出,后又经诸多后续研究完善,逐渐成为揭示知识机制的经典框架。认知金字塔模型的核心构成要素从下至上依次是数据(Data)-信息(Information)-知识(Knowledge)-智慧(Wisdom),也常被称作DIKW模型、知识层次模型、认知金字塔模型[14-15]。在认知金字塔模型中,数据处于认知的基础层次,它是将客观事物抽象为可鉴别的数字、字母或者其他符号,或用图形、图片、音频或视频记录事实;信息则是在数据基础上整理和分析的产物,是对数据进行价值化、系统化分析得到的信号;知识则是对信息结构化后形成的产物,它是经过实践检验的因果规律;智慧是依据相关知识进行决策或准确评估采取最佳行动的能力和前瞻性看法,其本质也是一种知识[16-17]。由此,知识的形成机制是自数据采集伊始,而后借助信息挖掘和处理技术来分析数据获得信息,使数据从无序到有序、价值从无到有,信息结合经验与行动生成知识,当这些知识体系科学地对人类行为予以指导就是理性表达和应用。
将一般性的知识生成机制迁移至公共决策领域,可以解构决策知识生成的因果链条。在公共决策中,也涉及决策数据、信息、知识乃至智慧的不同形态的理性要素和层次。其中,决策数据是反映决策有关事实的记录,它是构成决策知识的本源与基石,决定了任何知识形态应是事实导向的、可被实践验证的。政府部门履行职责过程中会生成、采集和保存大量行政记录数据、商业领域交易记录数据、社交网络媒介用户行为数据[18]。而采集这些客观原始数据的本质目的在于掌握政府内外部相关利益主体行为及环境事实,为发现公共问题和制定对策方案提供事实依据。而决策信息是基于决策数据的价值判断,是进行决策与行动的信号。数据不会自动生成信息,需要进行数据有序化、结构化和价值化的转化过程。决策信息建构就是赋予事实相应的现实意义过程,这种“意义”指向决策主体的偏好、目的和价值取向,这体现公共决策从零散事实走向有序价值、从价值无涉到价值关联的内在逻辑[19-20]。因而,决策信息是支撑决策的直接依据,它能给予决策者行动方向、行动意义两方面的指导。而决策知识是高度体系化的因果规律,它是经过实践检验且行之有效的决策方案与政策效果之间规律联系的总结,知识生产的过程既是决策实施和检验的过程,也是数据和信息经结构化、形式化的推导演绎和认知者内在化产生过程,借助解释、集成、交互等一系列理解操作活动,将有关联的信息和隐含在其头脑中的认知共同作用形成[21]。由于公共决策是一项主观见之于客观的活动,决策者掌握的知识的广度、深度和质量决定了公共决策的质量,尤其是在方案规划与决策评估这样需要复杂知识的环节。因此,公共决策一向追求富有学识的谋士、不同知识背景的庞大智囊团和前沿的知识技术工具,以提高获取、组织、习得决策专业知识的能力。而公共决策中追求的智慧并非超脱现实的哲学思辨,而是经过实践检验后诸多决策知识中最佳、最有效的知识,是关于达成政策目标与效果的最佳决策选择。
综上,基于认知金字塔所展现的从决策数据、决策信息、决策知识、决策智慧逐渐演进的关系表明:公共决策中的知识是一个操纵数据获取决策信息,由决策信息取得相关知识,最终抵达深层智慧的过程。而理性决策既需要组织化、体系化的数据,还需要决策主体获取完备信息,归纳和发现决策规律和因果本质,以最终摆脱有限理性枷锁实现理性决策。认知金字塔不仅解释了决策知识和知识的源泉,也告知了决策理性增长的切入点,那就是首先要改变决策数据层的事实质量。
(二)“知识—决策”:基于决策流程的理性过程溯源
从认知金字塔模型可知,理性决策所仰仗的知识要素并不唾手可得,知识的获取本质上来源于决策所面向的实践并须接受实践的因果检验。因此,为了拥有理性决策知识因素,决策者必然需要付出相应决策行动,从既有、当下和未来的决策实践中实现决策数据、信息、知识和智慧的获取、检验和迭代。由此来看,理性决策的达成又必然表现为一个前后相继的决策过程,而这一理性展现过程可用决策流程加以解析其前因后果机制。
主流的公共决策理论都将决策活动看作从发现问题到方案选择的一系列程序的集合。如西蒙的决策模型就包括情报活动、设计活动、选择活动的过程[2]。再如国内公共政策学者陈振明从阶段论视角出发,将政策制定视作问题发现到政策方案出台的一系列过程[22]。归纳既有研究对决策流程的解析,公共决策可以视为问题界定、决策规划、决策优化三个宏观阶段构成的动态过程,而知识等理性因素影响每个决策阶段的理性程度。
在问题界定阶段,决策数据、信息、知识的掌握会制约问题发现、识别与判断的精准性和及时性。问题导向是公共决策的目的所在,科学决策首先要寻找能触发政策议程的真问题,即问题界定构成了公共决策的逻辑起点。但决策问题并非都是具体的、显性的,抽象的、结构不良或难以构造的公共问题更是常态。因此,必须对这样的问题加以具体化,从错综复杂的问题网络中层层剥离元问题以框定出最有价值的、能加以解决的实质问题[23]。决策者必须通过问题事实的探索、价值的辨析、知识的应用来探索、发现和框定问题。在这个圈定决策可行问题空间的过程中,由于决策者的偏好、期望、知识、态度等有限理性的因素限制,存在决策问题锚定偏差的潜在可能,这使得理性的问题界定对数据、信息和知识的依赖就更加明显。对此,韦默和维宁认为决策者有必要考虑对问题加以模拟,以提高鉴别与研判能力,检验这些价值不明的问题是否科学合理[23]。
在决策规划阶段,决策数据、信息和知识的掌握会制约决策规划设计的科学性与可行性。决策规划是公共决策的核心环节,旨在为拟解决问题打造可行解决方案。决策规划为决策问题相关利益主体提供了价值辩论的空间和应用知识与智慧的舞台,更是行动者达成共识、缔造规范性与合法性的重要场合。在政策问题上升为政策议程后,就要投入大量智力要素,运用各类技术工具全面、及时地收集情报,解读和把握蕴含多元价值偏好的决策信息,尽可能全面地设计备选方案。同时按照科学性、可行性等质量要求对决策方案本身质量和未来发展态势进行评估预测,从而规范、科学地从中做出符合理性预期的择优选择。
在决策优化阶段,决策数据、信息和知识的掌握会影响决策调试的科学性与可行性。持续优化是决策永葆活力与生机的活泉,这是因为决策环境与对象的动态变化决定了决策也应持续调整和优化,以增强决策的适应性和可持续性。公共决策涉面广阔、利益结构复杂,合理可靠的决策不可能一蹴而就,需要在一个渐进的调适过程中实现最佳状态,所以“摸着石头过河”的渐进式优化向来是公共组织决策的主要模式。决策优化不是纸上谈兵的理想设计,而应当基于决策方案应用于实践后的经验验证和反馈调试。因而决策执行应是公共决策优化的题中之义,包括一些实验性的、探索性的和正式性的决策执行都是决策优化的必然任务。在不断地执行与调适中及时采集决策执行效果的数据和信息,以进行形成性的和总结性的决策效果评估,挖掘决策与效果之间的因果规律,生成并迭代已有的决策知识和智慧。
通过以上分析表明,知识的获取、应用、检验和迭代是决定公共决策理性的根本性因素。而作为生成决策知识的基础性原材料,数据对于现代公共决策的重要性无异于巧妇之于米、鱼之于水。但数据并非唾手可得之物,数据也并非自动就能转为对决策有用的信息和知识。即便在决策科学与实践高度发达的今天,决策者仍然面临如何充分获得有效的数据、信息与知识的难题。回顾人类的数据信息历史,随着信息技术的变革,人类社会经历了数据从无到有、从小到大的历程,眼下正在经历着又一次从小数据到大数据的历史性巨变,这其中也蕴含了从决策数据到信息、知识、智慧变革以及整体性的决策理性增长机遇。
三、“小数据—小知识”:数据稀缺条件下的公共决策理性约束
在人类漫长的公共决策实践史当中,公共决策者始终面临充分掌握决策事实和数据的难题,这在小数据时代表现得尤胜。古往今来,无论中外,国家都会建立不同形式的统计调查机构和制度,其核心是负责决策数据收集,例如人口普查、土地调查、财产统计等国家数据活动都在试图使社会图景更加清晰可见[24]。显而易见,年代越久远,国家治理者面临的数据不足问题越严重,即便那时有“城邦政情”“政治算术”的数据统计制度,但这相对于国家治理的多样性、复杂性和动态性事实而言,决策者收集的数据信息与复杂决策对象和问题而言无异于杯水车薪,数据基础的稀缺也经常置公共决策于决策失灵、失败的窘境。随着现代统计调查与分析制度的建立,虽然公共决策者的数据供给困境有所缓解,但是因决策数据可获得性及其时间、成本和人的认知能力等因素,决策者所拥有的或者能够直接处理的数据往往是有限的,其决策数据的形态主要是基于小数据的。
一般意义上,小数据是指与大数据相对应的数据形态,指结构化数据集[19]。而所谓的结构化即数据具有二维行列结构逻辑,根据固定格式与长度规范进行标准化的数据获取、存储和管理。可以说,基于抽样调查的结构化小数据来推断总体、检验因果机制是现代统计科学的核心逻辑,并且已演化出一套完备的知识论、方法论以及工具体系,成为经济管理中的核心数据范式。尽管小数据具备采集方便、程序方法明确、知识获取简单等诸多优点,但是这并不能掩盖小数据事实记录与获取的缺损与稀缺条件,以及由此引致的信息偏差、知识不准、智慧不彰的理性风险,这在公共决策中体现尤为明显。第二次世界大战以后,为有效应对社会问题和治理挑战,政策科学在不断吸纳管理科学、经济学和计算机科学等学科理论方法的基础上逐渐壮大,形成了定量与质性方法结合的决策数据收集传统。问卷调查、专家咨询、德尔菲法、层次分析方法等决策数据采集和分析方法得到广泛应用并沿用至今。不可否认这些数据方法技术的有机嵌入使得决策系统具有更高的数据可获得性,并且依旧具有广阔发展前景,但其在事实感知、价值整合和因果推断等方面的能力欠缺也同样不可忽视。从本质上来说,这些决策数据采集和分析方法依旧属于小数据范式,小数据资源难以胜任公共决策对于理性的诉求,并不可避免地会使公共决策身陷非理性的泥潭。
(一)小数据决策中的数据采集风险:事实不全
从数据特性来看,小数据的自身特质使其在感知和记录事实的效能上存在先天劣势。与大数据相比,小数据在采集、处理过程中呈现低体量(Low Volume)、低速度性(Low Velocity)、低多样性(Low Variety)和低复杂性(Low Complexity)的“4L”特征[25]。在数据来源上,结构化数据以小样本、有限变量抽样调查方式获取,数据体量本就有限,加上抽样技术与生俱来的信度和效度内在缺陷,小数据所呈现的事实广泛性和代表性很难达到要求,可能存在相当大的缺失比例。而任何关键领域的数据缺省,都可能引发对事实的解读出现完全颠覆性错误,偏离理性化要求。从数据形式看,小数据是结构化、简单化的数值数据,只适用于那些易于观察、量化和赋值事物的测量和记录的事务,而必然损失决策事实中不易观察和量化的部分。从处理和分析方法看,围绕小数据建立起的描述性统计和推断性统计对复杂世界的感知颗粒较粗糙,难以测量和探究复杂多变的社会问题,缺乏深层次的记录、认识手段和能力。除此之外,小数据的生成与利用具有迟滞性。小数据价值变现采取的是发现因果关系、建立假设命题、构建理论模型、收集与分析等一系列复杂程序,从数据采集到知识生成利用的周期漫长且低效。受限于数据采集、传输、分析技术的迟滞性,决策者无法据此进行动态的、即时的决策监测、反馈和处理。
当决策者以结构化的小数据为决策知识的建构基石时,其面临的首要损失就是数据接收者依据小数据难以全面还原与重构决策事实。因为小数据资源是结构化的、高度抽象化和概括化的数值,难以像图片、视频、音频等形式的数据一样生动复刻决策问题事实。更何况,小数据采集采取的是静态假设,往往试图以阶段性的截面数据刻画动态演进的决策环境与行为。由于其数据持续性不足,自然就难以系统回溯和反映决策环境、问题、行为的动态演化轨迹。这就导致决策者可用的数据、可参考的事实是片段的、不连贯的甚至模糊的,容易忽略事实中的一些重要环节和关键决策数据,制约对公共问题机理的深层次分析和对决策效果的感知,容易存在决策事实认知偏差。由此,基于小样本的简单数据集无法依据数据分析得出科学结论,无法以数据的可靠性来保证决策问题识别、方案规划、效果评估的客观性和清晰度。
当决策者依据的事实和数据基础薄弱时,决策者的个人主观经验、感知就容易影响和取代公共决策理性。在数据缺乏的情况下,决策者容易先验地形成某个决策立场,然后再收集能够支撑该立场的有利数据,并过滤掉众多不利决策的信息,这个过程容易存在决策者主观偏好导致的误判[26]。尤其是在公共决策的源头阶段,由于理性判断生成的基础决策数据的限制,公共决策者很难做到“通盘考虑”和将有限资源精准投入最紧迫的公共问题,这也就直接造成理性在决策问题源头上的流失。数据与知识的缺乏也促使决策者求助于专家,但是小数据背景下的专家也面临数据与事实不全的难题。小数据时代,公共决策系统并没有树立起“数据说话”决策理念,框定问题这样的环节被经验论与精英统治,长期以来依赖官僚、智库和专家的经验、知识技能与主观判断,这其中所蕴含的事实风险必然进一步损失决策信息和知识等理性流失。
(二)小数据决策中的信息生成风险:价值偏差
决策信息是经由决策主体对决策数据处理、分析后的价值判断,它是驱动决策做出选择的行动方向与信号提示。然而限于事实掌握的偏颇以及决策的环境、主体、体制与技术等多方面的限制,导致小数据时代的决策信息在时空分布上呈现明显的信息不对称、信息不完美的偏差特征,进而给公共决策输入了错误的价值信号。
小数据难以有效反映和整合公共决策中复杂价值体系的偏差机理可以从三个方面加以解释:首先从环境因素来看,小数据难以承载公共决策价值的复杂性。尽管公共决策以客观科学为标榜,但它自身很难做到价值中立,更何况公共决策的本质是社会大众多元、复杂利益的平衡、协调与整合。在复杂性公共治理情境下,各类组织和个体之间对有关价值信息的掌握是有差异的,呈现不对称、不均匀分布状态,政府横纵之间、政府与社会之间、政府与公民之间都存在严重的价值信息的不对称。而公共决策进行价值平衡与协调的前提是要尽可能识别公众的需求与偏好,但是小数据的数据特质决定了它在反映决策对象、问题的偏好与需求事实的全面性方面是不足的。决策者缺乏对需求与偏好的全面掌握,其对决策信息的加工和应用也必然是价值偏颇的。其次从决策主体来看,决策者自身非理性因素容易替代公共偏好。在事实缺损和价值反应不全的条件下,决策主体容易将自身内在价值偏好运用于决策事实与客体,对事实和价值的有选择性认知和分析,以经验、显性程度、紧要性和新近发生等作为注意力和决策价值分配的原则。最后从信息体制角度来看,现有条块分割的、规模庞大的信息科层体系和漫长行政链条加剧了决策者的信息不对称和信息传递失真。官僚制的决策信息逻辑以自上而下为主、自下而上为辅,缺少内外与横向的沟通与协作,信息孤岛、信息壁垒现象普遍[27],单向度信息流动模式使得决策信息在复杂的科层组织中经常遭遇政府官员的筛选、节流和阻滞。其带来的结果就是:决策者所接收的由代理人供给的信息往往是偏差的。这些信息“代理人”左右了决策信息的价值偏好,加剧了决策数据信息与价值之间不对称分布。
在具体的决策流程中,决策者对决策价值的感知、协调与整合偏差对决策理性的制约是显而易见的。在问题界定阶段,小体量、小样本数据导致问题识别过程具有不可逾越的样本选择性偏差和模糊性,难以及时准确地呈现公共问题的真实全图景,问题的分布、严重性、利益相关者得不到如实反映。欠缺数据支撑的诸多潜在、微观问题事实、弱势利益相关者的价值难以输入给决策者,哪些问题进入政策议程取决于决策精英与代理人的价值偏好,决策者对问题的界定就必然会存在偏差。决策规划阶段,信息不对称、不完美情境下的决策规划难以遵循信息原则,难以定量定性方式结合导入决策信息中蕴含的多元决策价值,进而立足客观规律进行方案设计、评估预测和选择。相反,面对多元的社会利益诉求,决策者在信息不足条件下更多利用原则性的表述、笼统性的要求和模糊化的标准等来提供模糊的政策产品,以所谓的“最大公约数”消除价值分歧[28]。由于不能满足建立预测模型等要求全面收集预测对象和环境信息的要求,使得决策预测评估往往是重论证、轻预测的和重形式、轻效果的。在决策优化阶段,基于小数据的决策信息生产会掩盖真实的决策效果,有偏差的数据使得决策者或者放大了部分决策目标和效果的实现程度,或者缩小甚至忽略了其他价值追求,基于片面的、滞后的信息则使得决策反馈优化处于一种低效的、难以切中理性的循环之中。
总的来讲,决策者基于事实不全的小数据所产生的决策信息经过层层筛选后很难准确反映决策环境、问题的应有特征,决策者的偏好与价值选择难以和公共问题本来的事实和价值结构对应,偏差性的决策信息反而成为决策制定、决策执行以及决策知识形成与利用的梗阻,影响公共决策的理性化发展。
(三)小数据决策中的知识创造风险:因果失真
何种决策方案能导致最佳的决策效果,这是萦绕决策科学领域中永恒的知识命题。因而,无论是决策研究者还是实践者,都以发现公共决策中稳定决策因果关系为终极目的。前因后果是对决策知识和智慧的终极追问,它不满足表象转而思考“为何”,是基于实践和经验的因果逻辑的证实或证伪。不断地提炼与检验决策中因果关系,人类才得以构建宏伟决策科学知识殿堂。朱迪亚·珀尔曾提出关联、干预和反事实构成“因果关系之梯”,人类要建构和革新世界就要迈上因果之梯的更高层级,呈现主动行动和对虚拟创构物的想象[29]。同样,决策因果知识的发现既根源于决策实践,也源于对决策经验的科学认知与分析。因而,决策因果关系检验离不开经验数据的验证。但是在小数据范式下,决策因果关系的提炼受到了诸如数据质量、因果推断技术以及研究者的归纳能力的多重制约。
从决策知识发现所需数据来看,基于小数据的决策因果推断存在以偏概全的知识风险。用小数据来描述决策结果事实和原因事实存在的共性缺陷就是,它对原因和结果的感知和记录是不完整的。当用片面的决策结果事实和决策原因事实进行因果推断,其必然结果就是基于小数据所发现的决策因果知识可靠性不足,难以反映从问题界定、决策规划、决策执行到决策效果的本真因果链条。
从决策知识发现所用方法来看,在小数据基础上决策因果推断方法始终难以摆脱现代统计学随机抽样、有限变量推断因果的局限性。结构化样本数据发现因果规律的方法主要包括多元回归、倾向值匹配、工具变量法、双重差分、断点回归及结构方程模型等。受数据残缺和分析深度等限制,这些因果识别方法都不同程度存在固有缺陷,表现在:(1)先验判断的失误风险。小数据因果推断多以预先的假设或潜在的因果机制规定后续方向,并以定性的经验判断做出迎合假设的结果推断,其中数据规模、假设的质量、指标的代表性和广泛性等都会影响最后推断出的因果规律的真实性[30]。(2)以分布概率和样本特征推断总体的因果推断机制自身存在效度问题和简单化陷阱。小数据仅仅能测量和识别有限的结果变量和原因变量,小数据的统计分析模型或解释框架在宏大复杂的政策系统面前是微不足道的。过于简化的因果推断不能很好地从复杂因果网络中发现更多因果关系,也不能全面识别和展现影响决策实践成败的前因后果的复杂机制。(3)静态的、单向度的因果发现机制难以适应公共决策的动态性和突变性要求。公共决策的全要素和全流程都处于动态变化之中,遍布非线性、异质性和不确定性特征。小数据基于截面数据的因果建模难以抓住决策变量间的复杂非线性关系,更难根据决策变化及时调试因果机制。
从决策知识的供给来看,建于小数据基础上的决策知识支持系统并不可靠。有学者提出,公共政策就是决策系统学习并采纳新的政策知识的结果,提升决策的可操作性和正当性需要决策者知识、执行者知识、专家知识、大众知识等四种类型的知识[31]。由于政府部门缺乏高质量的数据、信息与知识共享协同机制,政府决策与执行脱节、部门条块分割的问题存在,不能有效支撑精准识别和归纳经事实印证过的决策因果规律,决策者和执行者面临相互的知识掣肘,难以构建协同的决策知识生产机制。在小数据时代,决策者也常常求助外部力量增长知识。虽然专家、社会大众可以帮助拓展决策知识来源,但也不可避免地面临可靠性不足的风险。专家的专业性决定了其面对复杂综合的公共决策问题时必然是理性不完整的,更何况还缺乏对决策直接经验的积累和掌握,专家知识供给也存在失灵风险。实际上现代国家治理不仅依赖于制度化的官僚知识,还需要充分集中和利用分散的个人知识[32]。此外,还需融合政治、管理、经济、法律、计算机等组织内外部多方面、多层次的知识,以丰富的知识储备为底蕴,才能发现决策真理。但在“小数据—小知识”阶段,公共决策领域知识融合程度不高,依赖于专家构建的知识库缺少知识关联,知识库的多样性和全面性都略显单薄。除此之外,社会大众中可利用的知识是有限的,且未经过有效的知识整合,因此对决策者意义不大。
总的来讲,基于小数据所发现的因果关系是存在偏差、存在缺失的小知识,难以有效支撑决策过程的理性化。基于小数据的决策信息获取的有限知识和有偏差的因果规律,难以全面、精准识别决策成功因素与决策失败的痛点[33]。简单因果推理难以深入发掘决策数据和信息中的隐性知识,更难跨越从显性知识到隐性知识、从表象性知识到背景性知识转化这一因果规律内化过程[34-35]。这种因果偏差对公共决策的制定实施全流程都会产生不利影响。在知识受限的条件之下,决策者往往根据简单性、机械论的因果观,以有限信息和知识机械、封闭地制定和实施决策;决策效果评估也趋于简单化和静态化,决策反馈与优化更表现出滞后性、低效性特点,无法及时根据决策知识反馈来优化决策理性。
通过前面的分析,小数据嵌入公共决策的理性窘境展露无遗。小数据难以在基础层面获取全面的事实,也就继发地损失了信息、知识的正确性与科学性。小数据驱动的公共决策往往不够智慧与理性,后果不仅是行政低效、资源浪费和政府合法性受到质疑,更会造成决策失灵,危害公共利益。因此,破解小数据时代公共决策惯性,寻找公共决策新资源是决策现代化变革的必由之路。
四、“大数据—大知识”:数据密集条件下的公共决策理性证成
自互联网等革命性信息技术诞生以来,人类在信息化之路上越行越远并已然迈入信息化高级阶段。与之相伴的是,层出不穷的信息技术所感知、记录、存储的数据资源以前所未有的速度与规模爆发式增长,数据密集的大数据时代已然来临。大数据是一种迥异于小数据的数据新范式,其核心特征是具有显著的“4V”特征:(1)更大的数据体量(Volume)。大数据的爆炸性增长速率已远超“摩尔定律”[36],无法再以传统的GB、TB等单位进行计量,而是向着PB、EB、ZB、YB甚至更大计量单位攀升。得益于互联网、物联网等IT技术的蓬勃兴起和应用,对数据进行感知、处理得到的数据集规模是小数据望尘莫及的。(2)更复杂多样的数据结构(Variety)。多样性的数据采集设备和技术让数据“活了起来”,除了以结构化的数值数据记录事实,大数据以文本、音频、图像、视频、脚本、算法等更加生动的非结构化样态承载事实信息,并且数据之间的复杂拓扑结构关联赋予了大数据无限的事实回溯可能。(3)更快的生成速率(Velocity)。借助宽带泛在和云计算等技术,大数据突破了从数据采集到传输,再到存储运算的生成周期中各项制约瓶颈,形成了灵敏的数据采集能力和高度网络化的传输通路,显著提升了人们认知事实、获取信息的效率。(4)更高的价值储量(Value)。大数据自身蕴含巨大价值,这种价值来自数据的复杂性对人类世界复杂性的精准刻画,即多元、异构、高频、关联、海量的密集数据可以映射复杂的现实世界。而通过实现大数据的记录和处理,可以获取高价值信息,揭示事物的特征及其内在的各种耦合关系,展示问题或事物的全貌,有效地降低决策问题的复杂性和研究的不确定性[37]。
在大数据情境下,数据密集正在构成公共决策者面临的全新条件。随着互联网、物联网、移动互联网、云计算、人工智能等信息技术在政府治理内部场域与外部事务的广泛应用,公共决策者已然身处各种业务系统、数据中心、数据库、数据平台等密集数据海洋之中[38]。海量决策数据的生产改变了决策的数据与事实基础,将显著提升公共决策事实洞察的效能,纠正公共决策的价值信号偏差,提高决策规律探索的正确性,继而将对决策者的理性增长提供新机遇。
(一)大数据支撑公共问题精准界定
大数据嵌入决策流程,首先可以重塑小数据时代的公共决策问题发现模式。大数据的多元联合感知技术使得对人、事、物的记录空前加强,理论上可以将社会全体样本和对象持续纳入观察范围。近乎全样本的事实感知使得决策数据的全面性、广泛性、可获得性得到根本改善,海量、高频、多元、异构复杂数据的生成、传输与汇集可以为决策者还原决策所需的任何场景事实。大数据的数据特征与公共治理复杂系统更为匹配,大数据能记录和描述更全面、更多样、更实时、更可见的复杂世界[39]。而对于决策者来说,大数据帮助决策者更生动地刻画多维度、多层次的复杂公共问题形态,改善决策者的问题感知、界定与解决思路。
一是大数据驱动公共问题探索转向全面感知、精准锚定。借助各类传感、记录设备和数据挖掘技术、并行化技术以及关联性分析等技术,决策系统对事实感知、汇总、分析的能力和速度都得到空前加强,决策者可以精准、高效地捕获“全样本、全事实”决策数据。通过人工智能、云计算的数据挖掘方法对多元、多样、复杂的非结构化数据进行数据归约与变量降维,将晦涩的原始数据转化为容易解读的问题信息。此外,大数据对相关性关注显著上升,庞大的关联感知网络能够完整地刻画社会问题的整体事实,实现从局部反映到全景呈现转变,决策者对决策对象与问题一目了然。由此,大规模的多源异构数据结合相关数据挖掘技术能最大程度还原、反映问题真实图景,避免决策者的主观感知偏误或裁剪,增强对公共问题的理性认知。
二是大数据驱动问题框定由主观主导转变为客观主导。大数据范式下,以数据驱动、事实驱动的自下而上的问题构建逻辑迥异于小数据范式自上而下的问题建构逻辑。即大数据是遵循数据说话、通过海量数据和完全事实归纳实质问题的发现逻辑,而小数据则是带着问题假设,努力收集数据以将假设变为实质问题的验证逻辑。并且大数据基于海量事实、充分信息判断和辅以机器、算法分析,动态关联的系统性分析能够有效地挖掘公共问题背后的本质,可将有限的资源和注意力用于解决紧迫的、最有价值的问题,这样框定问题的效率和精准性是小数据背景下有限数据和精英经验模式所无法比拟的。
三是大数据驱动问题模拟日益走进公共决策议程。在庞大决策数据库和数据分析工具支持下,问题模拟技术赖以发展的数据收集、参数处理和数据建模手段得到极大赋能。在数据挖掘、云计算、人工智能方法技术的支撑下,基于海量数据处理和参数优化决策问题的建模、预测、关联分析变得可能,可以帮助决策者构建复杂变量、超强算力模型以进行动态问题演化模拟。而问题模拟将极大改善决策对问题的感知与判断理性,在计算机构建的虚拟社会问题场景中系统地检验模拟过程和预测结果,精准感知问题结构与演化态势,发掘更多辅助决策的细节信息。
(二)大数据支撑公共决策科学规划
决策规划是公共决策的核心环节,数据密集条件下决策规划的理性增长逻辑在于嵌入大数据及其理性因素后的决策精细化、客观化、智能化升级,其生成机制是:
从决策方案设计来看,大数据可以驱动方案设计更加循证化。大数据对决策问题的详尽掌握,可以让决策者基于事实证据而非个人主观臆测来建构决策方案,提高决策方案设计的客观性。此外,大数据还可助力决策者整合决策方案设计中不可避免的利益与价值协调问题。通过对决策利益相关主体的需求动机、行为偏好的全数据采集、归纳分析,让决策者能更深刻地洞察决策对象的利益结构和汇总,使得决策方案能最大化平衡公共利益[40]。在知识层面,大数据对决策方案的理性迭代机制在于透过跨界、跨域的历史决策方案及其决策效果的探寻,找到同类决策问题的可行解决方案,让决策者从类似的政策问题、政策方案和政策效果研究中获取决策信息和知识,增加决策方案设计的合理性。
在决策方案的预测上,大数据可以提高方案评估预测的精准性。在数据密集条件下,决策问题与对象泛在的历史数据记录为决策方案的未来预测提供了充分的时间序列基础。利用深度学习、神经网络等人工智能方法,可以自动采集决策对象与问题的历史数据、价值信息和相关知识建立起仿真模型。在计算机构建的虚拟社会场景中进行更加细致的量化描述和相关分析,以镜像形式对其进行数字化处理,深刻揭示数据中隐藏的规律和趋势,对决策方案的趋势做出科学预测[41]。而精准的方案预测可以帮助决策者预测问题解决的发生概率、复杂性甚至成本收益,分析背后内在逻辑、后果以及解决思路,从而辅助决策者评估和比较不同的备选方案。
在决策方案选择上,大数据驱动决策方案选择更加客观化、智能化。大数据及其智能化的数据挖掘技术能够弥补决策者的心智、精力、知识等多方面的理性限制。基于持续的海量数据供给及其持续的深度神经网络的机器学习分析,可以构建一个自主化、智能化、精准化的决策选择系统。决策领域的智能化实现从运行模型到建构模型的突破使得具有自主学习能力的人工自主体的介入、协同决策规划与抉择成为可能[42]。综合运用仿真模拟、智能算法和前瞻预测等大数据技术资源对方案进行智能化和自动化的细致对比和遴选,为决策者最终的方案决策提供最具科学性和可行性的选择提示,甚至让机器帮助决策自动化做出理性选择,这将极大提升决策者的方案选择理性。
归纳起来,大数据驱动的公共决策规划以海量数据分析结果和价值判别作为决策选择的动因,决策方案的建构也不再是专家的模糊主观感知,而是借技术带来的循证知识和决策者交互形成的科学理性,这将减少政府决策的主观性和决策随意性带来的误差。
(三)大数据支撑公共决策智能优化
公共决策并不止于决策制定,而是一个伴随决策实施、决策反馈的持续优化过程。在决策优化阶段,大数据能给决策优化供给高效的数据和信息反馈,并提供高质量的决策优化新知识。
首先,大数据可以提高决策反馈的效率。大数据的实时感应、智能监控等技术为决策者提供掌握决策方案执行进展与效果的利器。通过在决策实施对象和场域嵌入互联网、物联网以及云计算等其他传感设备,可以实时感知决策方案施行后决策环境、对象与问题的变化。通过数据中心和数据平台对数据资源高效处理,理论上决策者可以动态、实时地了解决策方案所产生的任何产出与结果事实,这为决策者评估决策方案的效果提供全面和客观的事实依据。随着大数据技术支撑效果数据以实时或接近实时的自动生成、反馈,从决策到行动、从行动到效果的反馈回路大大缩短,决策者在第一时间便可得到决策执行效果数据,进而提高效果反馈的敏捷性。
其次,大数据可以改善决策效果评估的稳健性。科学、系统地评估决策效果,识别决策与决策效果之间的因果关系是决策优化的知识需求。大数据资源及其知识发现方法为探究决策效果提供了不同于小数据的新范式。大数据一改小数据时代基于样本的因果推断统计,转向全样本、全数据的因果性分析,得出的因果结论更为全面可靠;大数据的超强算力和算法可以改变小数据时代的有限自变量的因果识别,进而转向全变量因果关系检验,能够提高对复杂因果规律洞察的全面性。基于机器学习、深度分析提升知识分析效率和知识挖掘深度,发现一些表达隐晦的、缄默的潜在规律,提高决策知识获取与形势研判能力。可见,在大数据时代,决策效果评估将实现从部分评估到全面评估、从静态评估向动态评估、从滞后评估到实时评估的转变,有效增强公共决策效果评估结论的稳健性,进而提高决策优化的针对性。
再次,大数据可以提高决策方案优化的智能性。随着大数据决策感知与反馈系统的数据、信息和知识的可获得性和智能程度的显著提升,决策优化的方向与方案设计不再是一个难题。基于海量历史和当下数据,大数据和人工智能为底层支撑的决策系统可以通过自主感知决策实施中的事实变化,自主学习决策方案、执行、效果之间的因果机制,自主建立决策方案的调试和适应机制。智能化的大数据决策系统所识别的这种因果机制作为关键的决策优化知识和智慧可以及时生成并被处理并交付决策者施政,同时形成即时决策、即时反馈、即时评估、即时优化的决策自我优化机制。
至此,大数据嵌入公共决策的形态变革及其理性增长逻辑和路径已然清晰。在形态上,基于大数据技术的实时感应与监控能力、数据信息传输能力、强大的数据处理能力以及自主学习迭代能力,可以构建一个泛在互联的大数据决策全过程支持系统。在理性增长上,通过对决策全流程中理性要素的迭代,使公共决策获取了更高质量的数据、信息和知识,形成了一种显著不同于小数据时代的决策模式,其决策模式的转变路径如图2所示。随着大数据广泛应用于公共决策实践,基于大数据的决策数据、信息和知识生成能力持续改进,公共决策将逐步摆脱传统决策模式,尤其是弥补其在认知事实、价值判读和把握规律过程中的片面性、模糊性、滞后性、间断性和主观性等缺陷,提升理性公共决策所需全面性、精准性、时效性、客观性、智能性等理性标准,大数据驱动的公共决策最终将不断逼近真正意义上的决策理性。
图2 小数据与大数据驱动的公共决策效果对比
五、余论:重新认识公共决策理性边界
提高公共决策的理性水平是影响国家治理和社会进步的关键因素,在全面推进国家治理体系和治理能力现代化过程中占据举足轻重的地位。长期以来,受西方决策科学理论尤其是“有限理性”的影响,面对充满复杂性和不确定性的公共问题,决策者陷入一种理所应当地将有限理性当作借口和外衣从而导致决策失准甚至失灵的迷思之中难以自拔,失去了公共决策实现理性最大化追求的初衷和信心。这不仅限制了决策生命力,更成为决策科学化进路的梗阻。如今,信息技术取得辉煌成就带来了重新审视决策理性的契机。在从小数据资源时代过渡到更具复杂性的大数据资源时代,决策理性的增长具备了有力杠杆。
本文的研究表明,从小数据到大数据的转换使得公共决策理性生成的数据基础发生了根本转变。不仅助力其采集更多决策数据,还能获得更高质量的决策信息与决策知识增长,提升决策者认知事实、掌握价值和把握规律的能力与水平。而其背后,蕴含的是一条从“小数据—小知识”到“大数据—大知识”的决策理性化的转型之路。作为一种进行时甚至是未来时的决策模式,大数据之于决策理性的提升空间需要更多的经验证据,那些制约大数据对于公共决策的理性增长潜力的体制、机制和技术等诸多障碍还有待明确,决策者驾驭大数据的素养能力也被置于决策素质的重心[43]。未来,还需进一步从经验层面揭示大数据对于决策者理性增长作用的发挥条件,提高公务员尤其是领导干部的大数据素养以增进决策理性。