智库建设范式的转型:从专家驱动到数据驱动
2023-12-03李刚陈霏苏丹淳朱雍
李刚 陈霏 苏丹淳 朱雍
编者按:2013年,全球大数据权威、可穿戴设备之父、麻省理工学院人类动力学实验室主任亚历克斯·彭特兰(Alex Pentland)教授在《科学美国人》杂志上发表了《数据驱动社会》一文,认为人类社会正向21世纪数据驱动的数字社会转型,人类行为研究新范式需要以大数据为核心重新建构。随后,数据驱动社会的概念得到多维度传播和实践,数据被认为是继劳动、土地、资本、技术之后的第五生产要素。
在数据驱动的创新型数字社会,“循数增智”成为智库发展的新趋势,以兰德公司、CSIS为代表的全球领军智库已实现了走向数据驱动的范式嬗变。与之相较,则是我国的大部分智库依然是以专家为核心的研究组织,这种模式显然无法适应大数据时代的政策研究要求。因此,面向数据驱动转型成为我国新型智库研究与建设的当务之急。
基于上述背景,本刊特邀请南京大学中国智库研究与评价中心主任李刚教授组织了“数据驱动的智库建设理论与CTTI案例研究”专题文章。本专题文章以理论与案例相结合视角,在建构从专家驱动到数据驱动智库建设范式转型的概念、模型和路径基础上,对“中国智库索引”(CTTI)系统的缘起、元数据体系、功能与部署架构、机制等创新之处进行了归纳与总结,并基于CTTI积累的专家大数据研究了我国智库专家的画像、模型、方法和集体传记特征。
相信本专题可为数据驱动的我国新型智库发展转型提供一定的理论支撑及框架指导。
摘 要:“社会5.0”的智库提升决策咨询研究科学性的主要途径是从传统的专家驱动型智库转变为数据驱动型智库。数据驱动型智库的建设范式包括社会文化与政策环境层、核心理念与顶层设计层、智库业务运营与传播层和数据底座层等要素。智库需从强化数据驱动认知和充分利用国家数据驱动政策供给、沉淀数据资产、推动业务模式创新变革、重视数智“工具箱”的开发与应用、优化数据人才配置,强化数据团队建设等方面推动智库数据驱动转型。
关键词:智库建设;智库研究;数据驱动;数字化;数据资产
中图分类号:G644 文献标识码:A DOI:10.11968/tsyqb.1003-6938.2023063
The Transformation of Think Tank Construction Paradigm: From Expert-Driven to Data-Driven
Abstract The main way for think tanks in “Society 5.0” to improve the scientific nature of decision-making consulting research is to respond to the national strategy of digital social science construction, and transform the traditional expert-driven think tanks into data-driven think tanks. The construction paradigm of data-driven think tanks includes social culture and policy environment layer, core concept and top-level design layer, think tank business operation and communication layer and data base layer. Think tanks need to promote data-driven transformation in terms of strengthening important cognition and policy supply, accumulating data assets, promoting innovation and transformation of business models, emphasizing the construction and application of the data intelligence “toolbox”, optimizing the allocation of data talents, and strengthening the establishment of data teams.
Key words think tank construction; think tank research; data-driven; digitization; data asset
在第四次工业革命的推动下,人类社会正在经历“快速、大尺度、深层次”的数字化转型[1],科学研究进入了“第四范式”——数据密集型科学。“数据驱动”成为智库研究的重要议题。侯忠生和许建新认为数据驱动思想指利用受控系统的在线和离线数据,实现系统的基于数據的预报、评价、调度、监控、诊断、决策和优化等各种功能[2]。亚历克斯·彭特兰认为数据驱动是指利用不同来源的数据来理解和预测人类行为,包括社会互动和数据驱动的数字痕迹[3]。蔡蓉英和张志华认为,基于大数据驱动的智库研究是以新一代云计算、物联网、区块链技术为支撑,结合制度化和程序化的技术手段,借助数据挖掘、行为分析等先进方法,使传统的经验判断模式上升为智慧决策模式[4]。欧阳剑和周裕浩提出,在决策中,智库数据驱动型研究采取定性与定量相结合、人机协同等方法,基于数据为智库提供感知研究对象的量化维度,借助数据挖掘更多的因果解释机制,为决策者提供了新方案、新视角、新思路[5]。可见,目前学界大多是从数据对研究产生影响的视角来解释、理解数据驱动,而本文尝试从智库组织建设和能力建设视角理解数据驱动。2016年1月22日,日本内阁会议审议通过的《第五期科技技术基本计划》,提出了“社会5.0”(Society5.0)概念,描述最大限度应用信息通讯(ICT)技术,通过网络空间与物理空间高度融合,给人类带来富裕的“超智能社会”[6]。“社会5.0”是用于描述以数据智能为核心的全新社会形态的一个新概念。
当前,人类正从“社会4.0”(信息社会)向“社會5.0”(超智能社会)转型,“社会5.0”的核心是用物联网、大数据、人工智能和共享经济的融合一体来更新人类社会生产、生活、研究、治理等全部问题,触及人类社会每一个方面,每一个角落。智库作为现代研究组织也受到了“社会5.0”的深刻影响。2013年4月,习近平总书记对中国特色新型智库建设工作作出重要批示[7]。迄今中国新型智库建设恰好十年。十年来,我国智库建设主要是以专家群体为核心开展的,组织、激励和保障专家团队开展决策咨询活动是智库建设的主要问题。“社会5.0”时代,这种完全依靠专家驱动的智库建设模式已经不太适应形势的发展。本文基于科技发展对社会的影响(ST-S)的经典科学社会学分析思路,不仅讨论了超智能社会对智库发展的影响,而且阐述了数据驱动型智库建设的新范式及其实施路径。
1 数据驱动型智库建设的时代背景
“社会5.0”时代,智库的技术环境、社会角色和政策研究议程正在发生深刻的变化,数据驱动成为一切现代组织需要回应的“时代之问”。凡是形成不了数据驱动范式的组织和机构或许都终将会被时代淘汰,智库也不例外。所谓新型智库的“新”,除了体制机制之新外,主要就是手段、方法和技术的新,体现在数据驱动的政策分析模式、数据驱动的智库治理和营运模式的构建与实践之中。以下从三个方面探讨数据驱动型智库建设的时代背景。
1.1 超智能社会对智库研究议程与组织变革的影响
21世纪以来,人类社会加速从“社会4.0”(信息社会)向“社会5.0”(超智能社会)演化,这对人类的生产模式、生活方式和价值理念产生了全方位影响[8]。云计算、大数据、人工智能等新一代数字技术的兴起使得数据的获取、存储和处理效率按照指数形式来提升,智库已经身处数字社会的技术环境、文化环境和社会环境。对于智库而言,治理、营运和研究等工作均遭遇重大挑战,具体表现就是传统思维和数据智能之间的冲突,也就是说智库虽然身处数字社会,但是意识、思维、能力、业务模式还在“社会4.0”甚至“社会3.0”时代,面临着迅速适应数字智能社会的严峻挑战。
超智能社会对现代智库的影响主要体现在两个方面。一是政策议程的变化。超智能社会的战略研究与政策分析的问题、对象、议程已经发生了重大变化,经济、政治、社会和文化发展的信息化、数据化和智能化问题成为战略研究与政策分析的重要问题。传统智库缺乏数字智能的意识、技术和方法,不熟悉超智能社会数字政策议程,步履艰难,甚至有生存之虞;二是超智能社会对智库组织变革的影响。智库作为以问题为导向、服务公共决策的战略与政策研究机构,目前的组织文化、组织结构和组织功能是与专家驱动型智库相适应的。传统的专家驱动型智库的智力资源主要集中于专家头脑,大多数决策咨询活动主要依赖专家的知识和经验。建设数据驱动型智库的目标就是建设与超智能社会适应的组织文化,改变自身的内部结构,形成新的智库功能。
1.2 数字社科与新文科建设带来的政策机遇
2016年5月17日,习近平总书记在哲学社会科学工作座谈会上指出“要加快发展具有重要现实意义的新兴学科和交叉学科,使这些学科研究成为我国哲学社会科学的重要突破点”[9]。2019 年4月29日,教育部等在“六卓越一拔尖”计划 2.0 启动大会上提到,新文科建设的目标为“推动哲学社会科学与新科技革命交叉融合,培养新时代的哲学社会科学家”[10]。可以看出,新文科之“新”的其中之一就在于新科技革命与文科的交叉融合化发展,其核心是强调将人文社科的问题关怀和理论视野与海量坚实的数据相结合[11],利用先进的数字技术推动社会科学研究的数字化转型。在数字社科政策引领之下,教育部启动了部级文科实验室建设,浙江大学、中国人民大学、四川大学等高校、各文科教指委等部门也积极主动地开展了一系列实践探索。在各级文科实验室的方案中,都把新型智库作为实验室建设规划的重要目标之一。
数字社科和新文科建设是数据驱动型智库建设的重要政策机遇。数据驱动型智库建设本质上是全国数字社科新布局的有机组成部分,是新文科建设的重要内容,并非智库少数人的主观想法。因此,在数字革命之下,人文社科的资源建设环境与科研组织流程都面临着创新与转型,现代智库更应当抓住时代脉搏,用好政策机遇,领悟行业发展的新特征、新方向、新要求,不断适应智库数据驱动转型这一趋势,为推动数字社会转型发展夯实新基础,提供新动能。
1.3 提高政策研究的科学性和客观性的迫切需要
智库是基于证据的政策分析机构。证据指的是真实客观的社会事实、数据、情报和科学知识。然而,传统的专家驱动型智库政策研究模式是个人工作坊形式,有专家比喻之为“小米加步枪模式”,这种模式过于依赖专家经验。这种基于个人判断的研究模式难免会带有主观性,导致研究有失偏颇,实践证明这十年来智库专家提出了不少真知灼见,但是也有不少意见出现了误判情况,影响了决策咨询质量。出现这种情况的重要原因之一是智库没有长期的数据积累,智库的业务流程信息化、数字化、智能化不足,尚未形成数据支撑政策研究的一整套机制。因此,恪守循证原则,提高政策研究的科学性和客观性、赋能智库研究,建立健全的数据驱动体系是至关重要的。
数据驱动还能够提高智库政策研究的可重复性。可重复性是指针对同一研究问题,其他研究者的独立研究可以借助原研究者提供的数据、方法等再现实验结果[12]。在学术领域,坚持和重视可重复性是科学研究中最重要的原则之一,科学研究结果能够被反复验证才具有意义。然而,即使在自然科学领域,可重复性不足也是困扰当代科学研究客观性的一个难题。《自然》的一项调查结果表明,许多科研人员在科研过程中存在“重复验证危机”,接受调查的1576名科学家中有90%的人认为目前的科学研究存在可重复性危机,其中52%的科学家认为存在重大的危机[13]。对于智库而言,政策分析的可重复性就更低。原因就是我国当下的智库研究活动还是以定性研究居多,定性研究证据往往就是文献、访谈资料、档案资料、开源数据等非结构化资料,不仅无法量化处理,而且资料核查难度大、重复使用率低[14]。此外,即便许多智库开展定量研究分析,由于自身数据意识不强、缺乏统一的数据治理规则、数据平台基础薄弱,没有完备的数据库支持,研究过程中的许多数据极易流失,因此也导致此类定量研究无法复现,无法复核,影响研究的可重复性、科学性和客观性。而数据驱动型智库依据强大的数据底座支撑,公开研究过程,推动数据共享与开放,决策分析过程透明化,增强研究的可重复性,提高研究结果的可靠性。因此,数据驱动型智库的建设对于提高战略研究与政策分析的科学性和客观性意义重大。
2 数据驱动型智库建设范式的内容分析
范式作为一个经典的科学社会学概念,是指特定的科学共同体从事某一类科学活动所必须遵循的公认“模式”,它包括共有的世界观、基本理论、范例、方法、手段、标准等与科学研究有关的共识。当新的科学发现不能被传统的理论所解释,产生了颠覆性的变革,就会产生范式转型,形成科学革命。本文借用范式转型的概念,把智库建设范式归纳为“专家驱动”与“数据驱动”,认为当下智库建设存在着明显的范式转型。范式转型不是非此即彼的范式替代,而是后一种范式对前一种范式的兼容。
2.1 从专家驱动型智库到数据驱动型智库
一般而言,专家驱动型智库缺乏长期系统的数据积累和数据库建设,决策咨询活动的质量高度依赖专家的专业知识,专家不少政策建议来自经验直觉,并非循证分析的结果。以内参为例,由于内参这种文体对文本字数有苛刻的要求,一般都在3000字以内,因此除了关键数据外,不需要提供系统的数据分析过程,这给一些“专家”提供了方便之门,一些没有事实依据、缺乏严谨分析的内参也被送达领导机关。这就降低了智库决策咨询活动的科学性和客观性。
专家驱动型智库大致具有以下几个特征:第一是高度依赖专家个人判断,政策分析思路难以摆脱核心专家的个人主观经验与直觉判断,专家的知识和经验往往成为智库的“天花板”;第二是智库呈现出小团队和低组织的特征。智库成为少数专家的俱乐部,不少是因为专家学缘关系构成的小团队,难以开展规模性的团队协作研究;第三是决策咨询研究的低技术、低数据、低循证。专家驱动型智库往往缺乏现代科学的框架、模式、模型、流程,是一种基本不依赖技术的,数据密度低,浅实证的研究与分析。因此,传统的专家驱动型研究是个体化、在场性与经验化的,这种研究注重文献研究,依赖现场的调查走访,依赖小组讨论。但是,专家驱动型智库是智库建设的必经阶段,就是在数字智能时代,数据驱动转型也并不意味着专家驱动模式的智库会被完全取代,只是说下一个阶段智库发展的主要驱动力是数据。智库决策日益从传统的依靠直觉、经验判断逐步向数据驱动的科学模式演进,智库应转变“我觉得”“我认為”的直觉化、经验化思维,更多地依赖数据分析结果等“数据证明”[15],着力培育数据洞察、数据预见的能力,强调基于证据链的科学决策,形成“数据驱动+专家智慧”相结合的业务模式,推动智库研究与决策走向科学化、智能化、现代化。
2.2 新型智库建设的数据驱动范式
1965年,美国学者Leavitt提出组织钻石模型,认为组织变革的模式由四个变量构成,即结构(Structure)、任务(Task)、技术(Technology)、人员(People)[16]。Nerur等探讨了从传统软件向数据驱动迁移对组织变革的影响,构建了包含四个维度的模型:组织和管理(Organization and management)、人员(People)、流程(Process)、技术(Technology)[17]。Vidgen等使用钻石框架来研究数据驱动型组织面临的挑战[18]。Hupperz等则基于前人研究,进一步完善框架,并归纳了数据驱动型组织建设的关键要素[19](见图1)。
本文基于组织变革、数据驱动型组织的关键要素理论,构建出新型智库建设的数据驱动范式框架(见图2),主要包含思维理念与战略规划、数据资源、业务模式、数智工具、人才团队五个要素,将其分为三个层次,分别为核心理念与顶层设计层、智库业务运营与传播层与数据底座层。其中,智库组织的核心理念与顶层设计引领着智库的建设走向;建设数据底座则是智库资源数字化、数据资源化、数据资产化的过程,是基本支撑;而在数据驱动型智库业务运营与传播过程中,还涉及实体建设实践、业务模式创新、数智工具搭建三方面的内容。同时,智库的数据驱动转型过程也会受到外部的政策环境的影响,加速数字化转型是我国的基本战略,这种战略会逐渐营造出开放的数据文化,形成丰裕数据的环境,有利于智库数据驱动转型。此外,由于专家智慧在智库建设中依然有着不可忽视的地位,此框架也融入了专家智慧要素并作探讨。
2.2.1 核心理念与顶层设计层
组织价值观是组织成员共同具有的信念、假设和基本价值的表现形式[20]。重构数字化时代的组织精神内核,建构起顶层战略统领是实现智库数字化全局性转型的必要基础。智库的数据驱动转型并不是一蹴而就的,组织文化的重塑、组织战略的优化具有全局性意义,发挥着先导性的作用。只有智库共同体形成了数据意识、数据思维、数据能力,建立起数据驱动型智库建设与研究的共同愿景,才能塑造出超智能社会的智库数据驱动文化,塑造出以数据为基石,创新为动力的运营理念,并将这种理念贯彻落实到智库研究、决策流程的每一个环节,使得数据驱动文化成为智库的核心价值观。
智库的数据驱动文化要变成一种实践力量,要落实在智库的顶层设计中。如果空谈数据驱动文化而没有实际可落地的规划指南,智库数据驱动转型工作就永远停留在纸面,难以实现。在前端制定转型战略规划的过程中,具有远见卓识、独到见解的专家智慧也非常重要,专家的观点融汇了他们多年从事管理与研究工作的经验,对一些事件的前瞻性解读和深度剖析往往是数据智能也无法做到的,因此“数据驱动”肯定不是否定专家智慧,而是要善于借助专家洞察的能力,从多维视角思考、分析情况。智库数据驱动转型的顶层战略规划应是具有方向性、整体性、全局性、持续性的,主要目的是为智库数据驱动转型制定完整的路径体系、规范运营流程,并实时根据运行进展调整目标和方向,以确保能够最大程度激发出数据资产的潜力,提升智库的生产力。数据驱动型智库的战略规划设计包含环境分析、功能定位、价值分析、蓝图制定、路径规划、资源匹配等内容,有助于在智库组织内形成统一的理念、目标、规则、行为,保持智库数据驱动转型过程中的战略性、系统性、整体性、协同性。
2.2.2 智库业务运营与传播层
智库业务运营和传播工作的数据驱动转型首先是要加强智库实体建设,包含两方面内容:一是数据部门与数据岗位的设置;二是数据人才团队的培育。数据部门是智库组织架构的重要组成部分,主要功能包括维护信息与数据系统,为其他部门提供数据支持和信息服务等。数据部门与业务部门之间的良好协作是智库进行高质量政策研究工作的重要保障。当然,对于真正实现了数据驱动的智库而言,数据部门会负责更加顶层的工作,主导数字化转型的方向把控、进展评估与维护优化,与业务部门深度融合发展。数据驱动型智库的所有业务部门、运营流程都将与数据驱动紧密结合,环环相扣。除此之外,数据岗位设置与团队培育也是智库组织管理中的关键环节。算法工程师、数据分析师、数据科学家、AI工程师等新型人才的延揽与培育是提升智库竞争力的根本措施,智库在数据驱动的各项业务创新中更是离不开兼具技术与管理能力的复合型人才。非数据岗位的人员也需要提升数据素养,提高数据敏感度,丰富数据通识,培养较强的数据能力,以适应数据驱动型智库对人才的要求。在智库全员提升信息素养与相关技能的基础之上,才能更好地发挥专家智慧,更加高效、积极、主动、富有创造力地支持与辅佐智库专家以极高的敏锐性和预见性作出精准研究与决断,为智库建设发展提供内生动力。总之,齐全的部门设置、专业的人员配置、强大的数据能力是智库数据驱动转型的坚实基础。
其次是业务模式要素。智库的业务模式包括研究模式、治理与管理模式、運营模式等。数据驱动型智库则是通过运用大数据、云计算、人工智能融合一体的方法,构造出业务流程与数据智能相互链接、深度融合的新型决策咨询模式。如基于专业领域的大数据,辅以云计算技术,利用通用的生成式人工智能训练出细分的自动的政策分析系统,替代基础、重复、繁琐的人工工作;基于物联网、大数据、云计算、人工智能融合一体技术的新一代知识与信息管理系统能自动感知、记录、存储、处理智库的全部线上的管理活动和研究活动,不再有人工数据录入等耗时耗力的工作;智库内部的媒体实验室能够利用人工智能轻松地生产宣传需要的文字、图片、音频与视频内容。这些数据密集型产品是智库研究人员在全自动、标准化、智能化的业务流程中,人员智慧与数据价值深度融合协同的产物。
最后是数智工具要素。这是保障智库研究人员专业研发能力的必备手段。智库的积累优势在于对专业领域的数据和信息尽可能全面的进行长期收集、整理、分析、利用、跟踪,形成独特竞争力,若缺少数智工具、技术和方法的基础性支撑,也就谈不上专业、系统、全面的数据和信息积累。智库研究的数智“工具箱”主要包含经过生成式人工智能改造过的分析框架、量化模型、仿真系统、指数分析、文本分析、网络分析、关联分析、聚类分析等各类数智工具。这些新一代数智工具完全改变了智库运营管理和政策分析的方式方法,大幅度提高运用管理的效率、传播的精准性和政策分析的科学性。很多智库专家与研究人员本身具有扎实的社科方法论基础,或者具备过硬的软件、工具开发技术能力,他们结合自身研究需求,更能够开发、优化或是引进专业化、科学化的研究工具,赋能智库研究。
2.2.3 数据底座层
积累、沉淀数据资源是智库数据驱动转型最基础也是最为关键的第一步。一是资源数字化。当前智库研究过程中所产生或收集到的资源初始状态依旧是以纸质载体材料为主,那么想要将其中所蕴含的信息归集起来,第一步便是广泛利用数字技术,对非数字化的内容进行转换,形成数字形态资源,便于后续的开发利用,对数据资源进行有效的整体性管控和治理,这是搭建数据底座的首要任务;二是数据资源化。由于智库研究涉及跨学科、多主体等特性,导致采集到的数据资源通常存在内容、格式、结构、口径等方面的差异,因此将数据进行标准化定义、结构化处理,确保采集数据的完整性、准确性和规范化是智库数据资源集成的重要步骤,也是下一步数据能够被充分、快捷、有效应用的基本前提;三是数据资产化。智库数据资产是智库日常研究活动、传播活动和管理活动中积累或从外部渠道获取的,具有所有权或控制权的数据资源,具有可变现、可控制、可计量的特征[21]。因此,智库数据资产化的实质就是把数据资源进一步深加工为数据库和数据集,特别要注重将游离、分散在各个智库专家中的信息资源、知识数据沉淀下来形成独特的专有数据库、知识库,并通过数据驱动转型更好地将专家个人智慧与智库集体智慧联动起来,将原本是专家个人对知识的掌握转变为智库对于这些智慧结晶的最大化调用。智库拥有这些专门的、特色的数据库和数据集的完整知识产权,并基于此挖掘其中蕴含的知识、信息,提供更多数据产品,形成本智库的专业壁垒,不论在知识价值还是经济利益上都能促进数据资源的增值效应最大化,形成智库自身的核心竞争力。
3 新型智库建设数据驱动范式的转型路径
数据驱动作为智库发展新的动力,对智库的影响不仅是决策咨询研究范式的转型,更是业务模式的转变。智库的数据驱动转型并非单纯是数据库建设或团队建设,而是一种范式,囊括从价值观建设到部门重组再到整个组织的数据驱动化,智库可依据具体情况和自身能力,从顶层设计与底层设计多路径进行。以下结合海内外具有代表性的实践案例,从智库转型认知和政策供给、智库数据资产、智库业务模式、研究“工具箱”、团队配置和培养模式五方面展开阐述中国特色新型智库建设数据驱动范式的转型路径。
3.1 强化智库数据驱动转型的认知和完善政策供给
3.1.1 形成“数据驱动+专家智慧”双轮驱动的共识
智库需强化对于数据驱动转型的理解,智库共同体要确立数据意识,应重视制定数据转型的发展规划,明确数据驱动转型与发展目标,制定具有针对性的建设规划。美国国家医学图书馆(National Library of Medicine,NLM)美国生物医学情报创新中心,是美国国家医学智库。NLM历来非常重视战略规划的制定,于20世纪80年代开始制定长期规划,在最新的长期规划《美国国家医学图书馆战略规划:2017-2027》中,NLM阐述了未来十年的愿景,明确了未来十年的战略总目标,即“成为生物医学发现和数据驱动健康的平台”,并确定了未来十年的4个战略方向[22]。NLM的规划制定过程具有由专门的战略规划制定委员会和工作组负责、前期的调研和准备工作充分、最大限度吸纳领域专家和社会公众智慧等特点[23],NLM多年通过制定战略规划指导智库工作的方式也对其聚焦发展方向、应对外界变化、实现转型发展具有重要作用。因此,智库应将创新数字驱动发展的理论、技术、规则等方面置于战略位置,持续深入推进顶层设计,在实践探索中,为智库数据驱动转型夯基垒土。在此过程中,专家智慧发挥着至关重要的作用,特别是智库理事会、学术委员会、院务会的专家拥有多年丰富的智库建设与学术发展经验,具有独到的眼光和阅历,对于智库的组织领导、宏观管理、规划决策、监督检查等提出的经验性判断具有重要的参考价值。一方面,智库应当针对自身信息化、数据化建设现状制定短期及中长期规划,明确未来数据驱动转型方面的发展定位和目标,制定具体的行动规划和宏观纲要;另一方面,实行差异化定位,避免重复生产和同质化竞争,努力形成定位明晰、特色鲜明、制度创新、引领发展的独具特色的数据驱动型智库。此外,也要注意将智库数字化建设成果与实施情况纳入评价体系,深化数据驱动型智库综合评价指标体系研究,致力于实现智库数据驱动转型工作的质量把控,推动智库高质量转型。
3.1.2 完善智库数据中心从赋能部门转变为业务主体部门的政策供给与相关保障
过往智库的数据中心是支撑赋能辅助部门,是成本中心,但如今已经转变为价值创造部门和内容生产部门,成为智库的利润中心之一。因此,必须加强智库行业的制度保障,促进智库行业内的知识流动和信息沟通。首先,在政府层面,应加强政策引导,营造良好大数据发展环境,构建开放、平等、公正、有序的数据生态。加快推进大数据立法,完善智库大数据获取、存储、管理、交易、共享规范,逐步建立健全智库大数据风险分级、分类保护等的法律法规,明确智库大数据挖掘、传输、发布以及二次利用中的权责关系,在确保数据安全前提下,健全相关制度,加大对智库各类数字产品知识产权的保护力度;其次,在行业治理层面,联合国家标准化管理委员会、行业协会、智库管理部门等多方机构共同筹谋出台一系列行业规范与工作指南,为智库数据驱动转型提供更为细致的行业指引。如可以考虑构建一套智库数据标准体系,以元数据规范采集并整合历史数据、业务数据以及与智库领域相关的其他多源数据,严格执行数据质量和数据安全管理,确保数据准确、来源可靠且可追溯。将智库大数据标准体系总体上分为基础标准、数据标准、技术标准、管理标准等模块,重点解决数字内容创建、描绘、交汇与组织过程中的标准化问题。同时,智库行业要联合政府部门、企业等机构,合理扩展数据共享范围,更多地共享面向研究和决策的信息,努力形成覆蓋面广、分类开放的信息网络;最后,数据中心建设是智库数据驱动转型的重要抓手,制定和落实支持智库数据驱动转型发展相关财政政策,建立多渠道、多层次、多元化的资金投入体系是数据中心建设的关键。如中国科学院文献情报中心致力于建立科技文献情报的信息大数据平台,不仅能够为中国科学院的智库研究提供数据型文献情报服务,部分中文科技文献数据库已成为知名的数据库产品,在国际上销售和提供服务,服务于200多家国内外高校[24]。
3.2 储备、沉淀智库数据资产
3.2.1 注重通用数据库的利用
智库研究的综合性较强,单一学科的数据库难以独自支撑研究开展,集成各领域的通用数据库能有效解决该问题。通用数据库包括内部资源和外部资源两种类型,如兰德公司便在官网上开放了其自建的公共数据库,包括统计数据库、调查数据库、案例库等,此外,兰德公司还提供来自顶尖智库的超过200个社会科学统计数据库的免费或有偿订阅及使用服务;中国工程院作为首批国家高端智库,也构建了“1+34”的知识服务网络体系以实现跨领域专业数据融合与信息共享、资源共享、技术共享[25];江西省科学院江西科技创新战略研究院先后与中科院科技战略咨询研究院、中科院文献情报中心、中国科学技术发展战略研究院等建立合作关系,共享了中科院文献情报中心的数据资源,实现了科技情报资源的共享、专家人员的互动交流和科研项目的协同攻关。这类外部资源的数据库以其丰富的数据资源、庞大的数据规模有力支撑智库研究,结合其他开源数据库,智库能利用其实现数据、资料的复用,且智库基于内部资源,尤其是已成系统的研究数据建立起通用数据库,不仅能够提高自身研究效率,也可扩大其研究成果的影响力。
3.2.2 建立起自身特色化、资产化的数据库
智库研究是一项知识密集型工作,且智库所处领域、研究人员的学科范围和研究方向也决定了智库研究必然具有自身特色,如兰德公司各专业数据小组的数据分析结果,与其研究方向和需求高度匹配,基于此构建的数据库具有明显的自身特色[26]。通常而言,智库专家所拥有的知识资源是有价值的、难以被模仿和替代的资源,能够为智库带来持续性的竞争优势[27]。专家在日积月累的研究中不断创新方法完善学术理论体系、深入实践解决现实问题,对于智库研究具有“知识嵌入”的作用,其所具备的综合研判、战略谋划、调研实践能力依旧是目前人工智能所无法精准替代的。因此,在专家驱动到数据驱动的转型过程中,要及时将专家产出的成果数据化、资产化,形成特色专题数据库、专家数据库,最后基于这些沉淀的特色成果、权威的一手数据实现智库纵深化、个性化发展,这便是专家智慧与数据智能共同融汇、共同协作、共同驱动的展现。
智库数据库建设形式可依据智库要素禀赋进行调整,选择自行建立、与其他机构共建或依托其他单位建立。如中山大学粤港澳发展研究院是港澳治理与粤港澳合作发展领域的专业化高端智库,有充足能力自行建立了包括合作数据库、历史档案数据库、社会调查数据库等多个专题追踪数据库在内的粤港澳研究资源总库;上海社会科学院和中国国际经济交流中心两家国家高端智库合作共建了“丝路信息网络”数据库,数据范围涵盖至“一带一路”沿线65个国家及相关国家和众多节点城市,建成动态数据库和专题数据库两大系列。
3.3 推动数据驱动的智库业务模式创新变革
传统模式下智库实现咨政建言功能的主要方式是专家内参和会议咨询,而数据驱动模式下智库的业务模式呈现了流程化趋势。如中国科学院科技战略咨询研究院提出的DIIS理论方法中将智库研究划分为凝练问题、分析问题、综合问题和解决问题四阶段[28],在DIIS理论基础上提出的智库研究双螺旋结构,其中智库MIPS逻辑层的机理分析层次便侧重强调数据在围绕研究问题进行追根溯源、挖掘规律、预测趋势过程中的作用[29]。这种方法本质是数据的流程化分析。
数据驱动的智库业务模式变革重点是围绕数据获取、挖掘分析、数据增值三方面为决策咨询提供数据支持。首先是信息获取的数字化。智库数据信息的数字化旨在通过统一规划技术架构和数据标准来实现智库数据的积累,同时打破智库内各部门的信息孤岛,实现信息共享。《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》对数字中国建设提出了“推动各类场景数字化”的需求[30],智库决策研究业务作为一大场景,其数字化应依托基本信息系统的开发,包括管理系统、业务流程系统、成果系统、传播系统等,对智库工作进行流程再造,以获取更多信息数据。如江苏智库管理数字化平台的建成有效连接了对智库、专家的评估业务,对智库内部动态的监管工作,对智库成果、绩效、资金自上而下的数字化管理,将该流程中的信息价值通过数字化手段最大化;其次是挖掘分析的纵深化。利用自然语言处理、知识图谱、多模态识别等方法,对数据资源进行深度挖掘分析,既能对智库研究内容予以循证支持,又能有效开发智库的信息资源。有限的数据资源如果不加以挖掘,则会变成“死数据”,面对爆炸式增长的数据环境下的数据挖掘需求,这就要求智库业务模式不能单纯依靠智库研究人员,必须依托计算机手段,尽量配备专业的数据分析人员;最后是数据增值的智能化。数据-信息-知识-智慧(DIKW)模型为智库业务模式创新指明了路径,对于时效性较强的热点类研究和长远价值较高的预警类研究而言,数据增值情报的重要性更为突出。大语言模型等人工智能手段,为使用人员提供适用不同场景的智能化工具与服务,如上海前滩综研自主研发的全国首款“一带一路”研究机器人作为搜索引擎提供“一带一路”建设相关的知识服务。
3.4 重视智库数智“工具箱”的建设与应用
数据驱动型智库决策研究的数智化离不开“工具箱”的建设与应用。在研究方法方面,智库研究通常采取案例研究、比较研究、实证分析、政策模拟、评价模型等,智库数智“工具箱”主要用于特征提取,分解表示,实现数据洞察;在政策模拟时,运用可计算一般均衡模型(CGE)、多智能体模拟(MABS)、系统动力学(SD)等模型,结合数据分解、计量建模和深度学习等特征提取方法,使得智库决策研究不只基于专家经验判断,也以客观数据为依据;在研究技术方面,智库应不断完善建立自有的信息化计算工具、建模分析方法和数据分析算法。如兰德公司不仅开发了“MMIC”“PAT”等分析工具,还率先将人工智能应用于兰德战略评估系统,取代人工团队,综合运用信息技术、建模技术、数据技术和架构技术等现代技术,成为美军最早的一套战略分析工具;在传播工具方面,“工具箱”旨在协助形成专业化、规范化的传播模式。如兰德公司技术和叙事实验室(TNL)便着力于应用新兴技术来研究政策问题并创建新颖的政策解决方案,并研究新兴技术对政策的影响,TNL通过人工智能和机器学习,增强现实、虚拟现实和混合现实,数字游戏和物联网等技术从数据捕获、分析工具和传播方式三方面来增强向非技术受众传播研究成果的效果[31];在智库管理方面,主要是通过“工具箱”提升协同研究能力,包括智库内部开展决策研究工作时的协同以及与智库服务对象之间的协同。如江苏智库管理数字化平台中,智库管理部门端的主页实现了“一屏看”功能,有效促进智库管理部门、智库需求部门和智库三者之间的信息共享、流动、互通,推动智库协同工作开展。智库在提供服务的过程中,智库智慧的生产方和应用方需就需求开展多次分析,讨论筛选出最佳决策提供给客户,数据驱动下的“想法”协同机制工具可以形成以数据融合与关联、思想交互及智慧产出为过程的智库业务服务协同模式[32]。
3.5 优化数据驱动型智库团队配置,创新培养模式
第一,智库应进一步整合信息职能,设立智库数据中心。首先,数据中心作为智库数据驱动转型工作的领导部门,负责工作的总体规划、统筹智库各数据库、平台系统建设。一是确定智库数字驱动转型工作的指导思想、目标和任务,负责转型工作中的关系协调和重大问题的决定;二是审定智库数字驱动转型工作计划、建设方案、总体设计、项目实施及建设经费申报、使用等情况;三是监察智库数据驱动转型工作进度和数据库的应用效果。其次,智库数据中心也具有信息收集、数据组织、技术支持、知识服务等功能,可以和智库原来的技术研究部门、信息服务部门合并为一体。如英国国防科学技术实验室(Defense Science and Technology Laboratory,DSTL)下设知识服务部,旗下有波兰登图书馆、国防研究信息中心等信息中心部门,提供特色资源收藏与管理、网络信息服务、文献通报服务、深层次信息服务①,DSTL还在2021年新成立了“未来技术探索部门”,其中的变革性技术小组致力于数据科学和分析、数据利用、软件工程和模型开发、新型模拟训练等内容[33];日本著名的野村综合研究所建有自己的信息银行,专门收集国内外各类信息资料以及各地区、各行业的宏观与微观数据信息,为智库的咨询研究提供了完备的信息情报支持[34]。
第二,设立专门的级别比较高的信息和数据管理岗位,组织、指挥、协调智库的数据驱动转型工作。西方政府和公司已经广泛设立了首席信息官、首席数据官、信息主管和传播总监等职位,数据驱动型智库也应根据现实需求设置类似数据治理岗位,主要负责制定和实施智库整体的信息技术发展战略,把控智库数据驱动转型的建設方向与进程。除了数据驱动转型的规划编制、预算编制和政策制定等工作外,智库首席信息官工作还包括制定和落实智库信息化、数据化和智能化有关的重大项目,处理信息安全方面的威胁与风险等。
第三,打造背景多元、科学优质的智库数据团队,构建多样化人才培养模式。首先,设立较高标准的人才准入门槛,有意识、有计划地引进计算机、人工智能、大数据等领域的专门人才。数据科学属于硬科学,社会科学背景的人才转变为数据专家有一定的难度,如斯坦福大学胡佛研究所的数据经理岗位要求拥有硕士学位以及2年-3年社会科学研究领域的工作经历,同时必须精通MS Access、STATA、电子表格和大型数据集的各类操作。现有智库的人才存量往往难以胜任数据库和智能系统的硬科技工作,需要补充数据科学的增量人才[35];其次,应强调培育智库本地化(In-house)的数据素养和数据能力。由于智库人员自身的系统开发的数据能力水平薄弱,智库信息系统搭建、数据库建设等很多技术性工作不得不通过外包形式给智库外的技术公司来完成。这种技术外包做法不仅受制于人,而且及时响应性不足,无法适应超智能社会瞬息万变的现实情况[36]。美国战略与国际研究中心(CSIS)建立的“iDeas 实验室”是拥有网络开发人员、设计师、动画制作人员、音视频制作人员的智库数据与媒体中心,该实验室具有26名全职职员,这支团队便是一个独立的内容生产部门,他们制作出音视频、播客、网站、数字化报告等可视化产品来吸引受众,传达政策解决方案[37],推动智库思想传播,具有非常强劲的数字运营宣传能力。CSIS这种致力于智库本地化数据人才团队构建模式是值得借鉴的。
4 结语
中国特色新型智库建设模式应突破传统、突破边界,从专家驱动为主向数据驱动转型。智库的数据驱动转型本质上是数据文化、数据思维、数据环境、数据资源、数据工具的一个整体生态建设,它的要素包括战略、资源、流程、工具、团队。智库的数据驱动转型是一项复杂的工程,其过程受到政治、经济、科技等各种社会因素的影响,也牵涉到多方社会机构。因此,智库数据驱动转型工作更要加强统筹协调,强化国家在智库数字治理中的主导地位,积极引导多元主体融入智库大数据协同创新工作,从思想理念、战略规划到数据能力底座建设,再到人才团队搭建、业务模式重构和数智工具打造实现全要素、全方位转变,加快打造共建共享、协同演化的数字生态,增强智库情报服务能力,使智库保持旺盛的思想活力。同时,要认识到,现代智库是专家驱动和数据驱动的融合,没有专家就没有智,没有数据就没有库,新型智库就是二者的融合。不能因为强调数据驱动就否定专家驱动的价值,数据驱动仍然离不开专家智慧,循证政策研究的基础是数据,关键是专家智慧。未来仍需进一步探讨完善专家智慧与数据驱动结合的方法与细节,打造完美融合智与库的现代智库。
参考文献:
[1] 中国社会科学网.信息政治学:理解数字时代国家治理的新视角[EB/OL].[2023-09-15].HTTPS://THEORY.GMW.CN/2021-12/25/CONTENT_35406006.HTM.
[2] 侯忠生,许建新.数据驱动控制理论及方法的回顾和展望[J].自动化学报,2009,35(6):650-667.
[3] Pentland A S.The Data-Driven Society[J].Scientific American,2013,309(4):78-83.
[4] 蔡蓉英,张志华.基于大数据驱动的智库研究模式构建研究[J].图书情报导刊,2020,5(9):22-27.
[5] 欧阳剑,周裕浩.数据驱动型智库研究理念及建设路径[J].智库理论与实践,2021,6(3):20-27,36.
[6] 周利敏,钟海欣.社会5.0、超智能社会及未来图景[J].社会科学研究,2019,(6):1-9.
[7] 李国强.对当前中国智库建设若干问题的认识[J].智库理论与实践,2016,1(4):32-38,92.
[8] 樊丽明.“新文科”:时代需求与建设重点[J].中国大学教学,2020,357(5):4-8.
[9] 习近平.在哲学社会科学工作座谈会上的讲话[N].人民日报,2016-05-19(2).
[10] 王震宇,薛妍燕,邓理.跨越边界的思考:新文科视角下的社会科学实验室探索[J].中国高教研究,2020,(12):61-68.
[11] 中国网.教育部启动实施“六卓越一拔尖”计划2.0[EB/OL].[2023-09-06].HTTP://WWW.MOE.GOV.CN/JYB_XWFB/XW_ZT/MOE_357/JYZT_2019N/2019_ZT4/TJX/MTJJ/201904/T20190430_380243.HTML.
[12] Goodman S N,Fanelli D,Ioannidis J P A.What does research reproducibility mean?[J].Science Translational Medicine,2016,8(341):12.
[13] Baker M.1,500 scientists lift the lid on reproducibility[J].Nature,2016,533(7604):452-454.
[14] 王俊美.多維度推动社会科学的开放实践[N].中国社会科学报,2022-01-19(2).
[15] 董文轩,晏裕生,孙孟阳,等.数据驱动的国外防务智库建设实践[J].智库理论与实践,2020,5(2):58-62,76.
[16] Leavitt H J.Applied organizational change in industry:Structural,technological and humanistic approaches[M].Chicago: Rand McNally & Company,1965:1144-1170.
[17] Nerur S,Mahapatra R K,Mangalaraj G.Challenges of migrating to agile methodologies[J].Communications of the ACM,2005,48(5):72-78.
[18] Vidgen R,Shaw S,Grant D B.Management challenges in creating value from business analytics[J].European Journal of Operational Research,2017,21(2):626-639.
[19] Hupperz M J,Gür I,Müller F,et al.What is a data-driven organization?[A].Montreal:AMCIS 2021 Proceedings[C].2021.
[20] Sethia N,Von Glinow M A.Arriving at four cultures by managing the reward system[J].Gaining control of the corporate culture,1985:400-420.
[21] 李红光,王磊,李颖.数据资产化视角下企业增信机制研究——基于深圳的实践探索[J].价格理论与实践,2023,(4):33-37.
[22] The National Library of Medicine.Synopsis of A Platform for Biomedical Discovery and Data-Powered Health Strategic Plan 2017-2027[EB/OL].[2023-09-15].https://www.nlm.nih.gov/pubs/plan/lrp17/NLM_StrategicReport_Synopsis_FINAL.pdf..
[22] 赵栋祥.《美国国家医学图书馆战略规划:2017-2027》的解读与启示[J].图书情报工作,2019,63(5):138-146.
[24] 刘细文.中国科学院文献情报中心“十四五”发展思考——基于数据、信息、知识与情报的规划框架设计[J].数字图书馆论坛,2021(5):12-16.
[25] 吕岚,傅志杰,安达.浅谈国家高端智库数据建设与管理能力[J].中国电子科学研究院学报,2021,16(2):192-196.
[26] 勇美菁,钟永恒,刘佳,等.支撑兰德公司的智库数据体系建设研究[J].情报理论与实践,2019,42(9):69-75.
[27] 王娜,李辉,张玲.知识嵌入视角下智库专家评价框架的构建[J].智库理论与实践,2022,7(1):3-12.
[28] 潘教峰,杨国梁,刘慧晖.智库DIIS理论方法[A].中国优选法统筹法与经济数学研究会.第十九届中国管理科学学术年会论文集[C].北京:中国管理科学编辑部,2017:10-23.
[29] 潘教峰.智库研究的双螺旋结构[J].中国科学院院刊,2020,35(7):907-916.
[30] 新华网.中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要[EB/OL].[2023-09-20].http://www.xinhuanet.com/2021-03/13/c_1127205564.htm.
[31] Technology and Narrative Lab | Pardee RAND Graduate School[EB/OL].[2023-09-18].https://www.pardeerand.edu/research/tech-and-narrative-lab.html.
[32] 白陽,张心怡.汇聚想法:数据驱动下的智库协同创新服务模式研究[J].情报科学,2018,36(7):23-29.
[33] Defence Science and Technology Laboratory.Exploration Division[EB/OL].[2023-09-15].https://www.gov.uk/government/publications/dstls-divisions/exploration-division.
[34] 王世伟.试析情报工作在智库中的前端作用——以上海社会科学院信息研究所为例[J].情报资料工作,2011(2):92-96.
[35] 李刚.推动智库建设健康发展研究[M].北京:经济科学出版社,2022:514.
[36] 李刚.论新型智库及其核心能力建设[J].决策与信息,2023(5):38-43.
[37] CSIS.Dracopoulos iDeas Lab[EB/OL].[2023-09-15].https://www.csis.org/dracopoulos-ideas-lab.
作者简介:李刚,男,南京大学信息管理学院教授,研究方向:智库评价理论与方法、智库信息系统与知识管理、社会科学评价理论与方法、图书馆与档案学理论基础;陈霏,女,南京大学信息管理学院博士研究生,研究方向:智库理论与实务、档案学基础理论;苏丹淳,女,南京大学信息管理学院硕士研究生,研究方向:智库研究与智库评价;朱雍,男,南京大学信息管理学院硕士研究生,研究方向:智库理论与实务。