面向科技创新决策的情报分析方法
——理论与应用
2019-08-29刘志辉姚长青魏娟霞
刘志辉 姚长青 魏娟霞
(中国科学技术信息研究所,北京 100038)
0 引言
大数据技术的兴起与发展对不同学科的研究都产生了很大的影响。情报学领域对大数据的研究主要是从数据与技术视角探索方法论或面向特定应用场景的分析技术或平台研究。情报学方法论研究主要关注海量数据的集成组织、实时计算与情报分析方法相统一的方法框架研究,如面向大数据的情报分析框架[1],而在应用研究中主要是面向情报功能,如大数据环境下情报分析方法在技术预测中的应用[2],或者是基于特定数据类型,如科技文献大数据[3]。
大数据技术的影响也扩展到了科技政策研究领域,具有代表性的是政策证析方法设想的提出。政策证析是一种融合机器学习、计量经济学和统计学的政策分析方法[4]。除关注大数据给政策研究所带来的价值外,也关注在政策领域如何利用大数据平衡社会公众与个人利益,例如,如何在进行社会公共政策分析的同时有效地保护大数据中的公民隐私信息[5]。
当情报学与政策研究领域都关注大数据及其应用时,情报学领域的研究视角开始关注科技智库,特别是如何在大数据背景下发挥情报学优势推动科技智库建设。此类研究主要是从理论与平台建设两个视角进行,分别探索情报学在智库建设中的作用[6]以及面向科技智库的情报服务平台建设[7]与服务体系[8]等内容。尽管情报学和政策研究领域的相关学者分别对大数据的影响进行了探索研究,特别是国内学者围绕科技智库这一具体应用场景进行了分析,但我们还需要针对具体的应用问题,特别是方法论层次的问题进一步展开研究。
在学术研究中对情报学学科的界定虽有不同的表述,但多数学者还是认同情报学的跨学科属性。对于这种跨学科,特别是偏向于应用的学科,需要从实用主义的视角去关注领域从业者的研究与实践。本文基于这种视角从功能层次分析大数据背景下的情报分析方法,探讨在支撑循证决策时面临的挑战。
1 科技智库与科技情报融合发展
从国内科技情报机构的发展来看,许多机构都开始强化科技情报机构的智库职能,呈现出融合发展的态势[9]。这体现了全球智库发展的一种趋势,但也突显了中国创新驱动发展战略背景下科技决策对科技情报与公共政策研究的迫切需求。前者属于情报研究,而后者则是智库的关注重点。尽管在组织形式上有所区别,但从功能定位上来看两者具有相通之处。这是因为智库与情报研究之间存在着天然的密切关联。
1.1 决策支撑
智库研究与情报研究的共同之处是决策支撑。从智库研究的视角来看,智库的界定有两个突出特点:一是强调独立性,如将智库定义为致力于多学科研究以影响公共政策的独立组织[10];二是强调公共政策研究,如将智库描述成为国内和国际问题提供政策导向的研究、分析和建议的组织[11]。但在研究方法上强调智库要可靠地“编辑和验证”信息[12],从而使政策制定者和公众基于信息做出决定(Informed Decisions)[13]。
在中国科技情报实践中,情报研究被界定为以情报为对象,对情报的内容进行整理、加工、鉴别、判断、选择与综合,得出新的情报的科学研究活动。它是整个情报活动中一种创造性劳动,是一种科学研究工作,属于思想库范畴[14]。因此,无论是从研究过程还是从功能定位上来看,智库研究与情报研究间具有共同之处,特别是在决策支撑作用上具有一致性,智库更聚焦于公共政策领域。
1.2 情报分析
情报研究的核心环节是情报分析,其目标就是为特定决策者揭示选定目标信息的内在意义,其核心是服务决策。从整个情报循环[15]来看,如图1所示,情报分析的逻辑起点应该是决策者所提出的关键情报问题,即决策问题。在整个分析过程中,情报分析应该遵从“4F-1”原则,即分析人员应该以所确定的事实(Fact)为出发点,利用专业知识提出那些可能但尚未确信的发现(Finding),甚至在预测质量有所保证的情况下进行预测(Forecast)。但在这个过程中,分析人员不应提出毫无事实依据的臆测(Fortunetelling)[16]。根据这一原则,情报分析的输入应该是事实,其功能产出是面向决策而形成的新发现或预测。
情报分析的决策支撑功能在科技智库与科技情报机构呈现出融合发展的背景之下,将得到进一步的强化。
图1 情报循环
2 科技创新决策研究的跨学科方法论
在科技情报的视角下,情报分析服务的直接对象就是科技决策,或者将其泛化为创新决策。对于科技决策来说,除了科技情报研究之外,还有另外一个重要领域,即政策研究。而在政策研究领域,研究方法论问题正在引起学界的广泛关注。
2.1 创新政策研究方法面临挑战
决策者对创新的重要性已经有了充分的认识,但是创新政策研究者却因缺乏批判性反思而无法长期维持自己的关键作用。创新政策研究者正在面临种种挑战,如对理论原理与政策制定者过于理想化、政策工具化、政策设计与协调的过度理性化、政策分析的静态化[17]。解决这些问题除了理论观念的变化,也需要在研究方法上更具跨学科性,特别是在一个智库发展面临新的社会挑战的时代。在一个智库规模不断扩张,彼此竞争加剧,而社会公众对智库研究存在信任问题的时代,智库也需要在方法论上进行创新,需要用更多元、跨学科的理论方法研究支撑公共政策研究[18]。
2.2 循证决策方法论
循证决策(Evidence-based Policy Making,EBPM)的方法论起源于医学界,随后在社会科学领域得到发展。循证决策是指将研究领域形成的最佳的可用证据嵌入到政策制定与实施的核心过程中,从而为人们的政策、计划与项目决策提供有效的决策信息支撑[19]。循证决策在学术界引起关注的同时,政府也开始关注其在公共政策制定中的应用。
政府对循证决策的关注最早来自于英国政府。1999年英国政府发布的《现代化政府白皮书》中提出要改善政策制定过程,使政策更具战略性、结果导向、协作性、包容性、灵活性、创新性与稳健性。同年英国政府内阁发布的《面向21世纪的专业化政策制定》报告中,明确提出了采用循证决策的理念提高政策制定水平[20]。2016年美国国会成立了循证决策委员会(CEP)开始推动循证决策的应用,其后于2017年成立了两党政策中心提出循证决策倡议。2019年美国正式颁布循证决策基础法案(《Foundations for Evidence-Based Policymaking Act》),要求各个政府职能部门推出自己的证据建设计划,其中包括政策问题、为循证决策而收集的数据、分析方法以及其中可能存在的问题等。
日本经济产业研究所的一项调查表明,无论是政策制定者还是政策研究人员都非常肯定循证决策的必要性,但在实际应用中“缺乏理解统计数据分析和研究的知识”是阻碍循证决策应用的因素之一。提高政府机构人员的分析技能是循证决策必不可少的基础条件,它不仅仅局限于政府统计的微观数据,大数据和人工智能也可能应用于政策制定[21]。
3 基于证析的决策支撑方法论
无论是创新政策研究中对跨学科方法的需求,还是政府决策实践中对循证决策的关注,都表明了决策问题之复杂而带来的方法论挑战。当面向决策问题时显然需要不同学科、不同方法的跨学科研究,以提高政策的可靠性。而在这个过程中科技情报分析方法可以与其他学科方法形成借鉴与互补。
3.1 信息链视角下的决策
从决策过程来看,任何一种决策都是事实信息与主观价值观、观点和可能性组合的结果[22]。这个过程涉及客观事实到主观判断的一系列对象,即情报学领域所界定的信息链。这个信息链是一个由事实(facts)、数据(Data)、信息(information)、知识(knowledge)和情报/智能(intelligence)5 个链环构成的连续体,如图2所示[23]。这或许是因为情报要面向决策的本质所决定的:为支撑决策,情报分析需要关注决策所需要的从物理客观到主观认知的一系列要素。事实是决策的要素,同时也是情报分析的逻辑起点。
3.2 基于证析的情报循环
在大数据时代,在面向决策问题进行情报分析时需要采用一种新的分析范式,即证析。证析(Analytics)在韦氏字典中被定义为“逻辑分析的方法”,但这个词最早是以“business analytics”形式出现的。在商业证析领域,证析被描述为对商业问题进行定量或统计分析的模式[24],因此证析是基于证据尤其是数字化证据进行决策的实践[25]。商业证析是完全基于数据与统计方式进行绩效描述与预测,通过统计方法(包括解释性与预测性模型)以及基于事实管理(fact-based management)的方法为企业决策提供支撑[26]。
正如鉴于循证决策本身所存在的问题而提出政策证析(Policy Analytics)[27]那样,情报分析也需要基于证析的理念重构情报分析业务流,即一种基于证析的情报循环,如图3所示。这是一种数据流驱动的情报循环,是一种以决策问题为核心,以场景理解为基础,以建模分析为关键的数字化业务模式。
3.3 证据化和多重循环耦合
图2 信息链
图3 基于证析的情报循环
从证析的方法论视角来看,商业证析或政策证析只是应用场景不同,这与情报研究有相同的逻辑,如商业竞争情报、科技情报与战略情报。这或许在一定程度上说明情报分析与证析一样,属于方法论,而非某种具体的分析技术或技巧。证析更加侧重数据视角,情报分析则强调功能,但它们的作用是一致的,即决策支撑。当决策开始突出循证理念时,情报分析需要在证据与数据间建立关联。在这个过程中有两个核心问题需要进一步的关注。
一是多源情报分析与多元证据。在情报分析中一直强调多源情报与全源情报的重要性。全源情报分析不仅仅是简单地让更多分析人员获得更多的情报。它的核心特点是系统性思维方式,也就是在评估、解读和解释变化、发现或者政策难题时,多种不同来源信息的系统性利用方式[28]。而循证决策也特别推崇通过不同来源数据的严格评估而利用多来源知识支撑决策的价值[29]。从研究方法的视角来看,这种多源情报与多源知识利用的根本目的是克服研究偏见,提高研究信度。这也是面向循证决策时,情报分析首先需要面对的问题,即元分析的方法论问题。
二是多重循环的耦合。循证决策是一个过程,即围绕政策循环(议程设定、制定、实施和评估)提供证据支撑的过程。而情报循环可以是面向其中某环节关键情报课题,提供收集、分析、传递与反馈的过程;证析则是从数据视角为上述目标与功能提供定量分析支撑的数据流。因此,从情报分析视角来看,在循证决策过程中,存在数据(证析)、情报与政策3 个层次的循环。这3 个层次的循环并非是单一的嵌套关系,而是一种不同循环、不同阶段的耦合关系。对于决策者来说,需要在其政策场景下得到多种来源的基于事实数据的情报或证据的支撑,而不用关心这种支撑背后的功能问题。同时,循证决策支撑需要给决策者提供直接获取原始数据的能力支撑,即一种政策、情报与数据的证据级封装。这需要面向决策的多重循环耦合为前提。
4 面向科技决策的情报支撑
目前科技创新决策的复杂性日益突出,一方面各种创新理论(如内生论与外生论、线性创新与创新系统、创新网络与开放创新等)与相关学科(科学学、科学社会学、科学计量学等)的发展为科技创新决策提供更加丰富的理论支撑和政策工具选项;另一方面,全球创新体系的形成也使创新政策工具的边界难以界定。但从技术发展的视角来看,大数据技术的发展为支撑日益复杂的创新决策带来了可能性。大数据技术中的数据挖掘与知识图谱、人工智能中的深度学习都很好地为创新决策提供了技术支持,同时开放运动的兴起又为决策者提供了更高的数据可获得性支撑。
4.1 科技创新决策的技术支撑
在科技大数据可获得的前提下,如何通过相关技术支撑创新决策就成为了首要关注的问题。这个问题可以进一步分解为两个子问题:一是决策场景定义与描述:如何将决策循环中的问题解构为关键情报问题,并描述整个决策过程;二是基于多源数据的循证问题:如何围绕多源情报与多元证据构建情报分析功能。前者涉及科技创新决策需求挖掘与定义、数据建模与分析模型、决策流程描述,后者涉及多源异构融合、实时分析与交互计算、信息可视分析以及知识发现与情景化。
在具体实施过程中,证据化和多重循环耦合仍是优先实现目标。证据化的核心目标是将多源科技数据转换为多元证据,这是循证决策的前提条件。而这首先需要解决的是科技大数据组织问题,即需要面向创新决策,围绕复杂的创新体系来构建数据框架,囊括从微观到宏观,从科技供给到需求的不同创新环节。
实现多重循环耦合需要知识关联技术,可利用知识图谱实现创新政策视域不同类型主体与内容的关系构建。这种关系构建不仅仅局限于同一类型或同质关系,更重要的是实现跨数据、情报、政策循环的异质语义空间关联。在这种跨异质语义空间的知识图谱支撑下,可以利用数据操纵、可视证析、建模与实时计算实现数据循环、情报循环与政策循间的耦合,最终构成一个基于循证理念的数据驱动决策支撑体系。
4.2 实践项目:决策剧场与创新图谱
中国科学技术信息研究所依托资源与技术优势在基于情报分析的科技循证决策方面进行了尝试与实践,如决策剧场[30]和创新图谱[31]。前者可以视为基于循证理念的数据驱动决策支撑体系的硬件部分,而后者是软件部分,它们共同构成了一种面向复杂问题决策的、以可视证析为特点的科技创新决策支撑环境。决策剧场的建设目标是提供一种以交互与沉浸感为核心的物理环境,提供面向决策流程的资源、工具与功能支撑;创新图谱则是综合利用知识组织与知识图谱等相关技术所建立的一种基于知识图谱的循证分析平台,面向决策问题提供数据分析引擎,最终实现数据驱动的科技创新决策支撑。
5 对情报分析方法的思考
在大数据时代,情报分析方法面临的挑战是全方面的,但其根本原因在于情报用户,即决策者的需求变化。随着科技创新决策问题的复杂化,决策者对情报分析的功能要求将会越来越多,对分析精度与粒度的要求也将越来越高。在公共政策实践日益循证化的背景下,情报分析方法需要从理论、技术与数据等不同层次做好应对。
5.1 理论研究上需要跨学科方法论的支撑
正如公共政策领域强调跨学科方法论一样,情报分析也需要同样的思维。在大数据时代,面向循证决策的情报分析尤其需要关注数据的情景化问题,即数据的情报意义与证据意义,这需要创新政策、情报研究与数据科学等不同领域专家的支撑。其中最为关键的内容就是建模。在数据模型、(创新)理论模型与可视证析模型间建立统一的逻辑模型,为实现政策实验情景分析与预测提供基础。健壮的分析模型不仅可以有效地规避定量分析本身所存在的方法缺陷,如辛普森悖论,更重要地可以为决策者提供更为丰富的数据意义解释。循证决策中证据是最为核心的概念,而在决策过程中,证据是以因果为形式表达的。这与大数据分析中强调相关关系是截然不同的。如何界定证据、如何描述证据也需要一种跨学科的研究方法。
5.2 大数据技术上需要关注低频情报资源应用
尽管科技大数据的可获得性已经大大提高,但目前仍无法实现面向特定问题或特定对象的全样本数据收集。而且就具体决策问题来说,小数据分析足以支撑结论的效度与信度。因此,即使在大数据背景之下,情报分析也应关注小数据的应用,特别是在有时效性要求的情景之下。此外,在情报研究或科技创新决策中,大部分情况都是在无法充分获得相关数据的基础上进行分析的,因此如何利用低频资源获取更有效的结论也是一个重要挑战。
数据驱动决策的另一显著优势是可以提供情景模拟与预测,进而帮助决策者进行政策实施前的评估。这一方面需要群体决策工具帮助专家构建模型,另一方面也需要将已有历史数据中的经验纳入模型之中。后者需要知识推理技术的支撑,在证据集中构建出面向特定场景的证据链,特别是用以描述模型的动力机制。
5.3 完备的数据集是实现循证决策支撑的充分条件
有效的理论框架、健壮的数据模型是实现循证决策支撑的必要条件,但数据的完备性却是实现决策支撑的充分条件。在全源情报与多元证据理念之下,保持一定的数据冗余是有必要的,但一定要从整体上关注数据的完备性,即当前数据来源是否足以刻画决策问题,如描述中国的科技创新体系。此外还特别要关注每一种数据来源的权威性,这是研究结论有效性的根本保证。
在决策过程中,利用细粒度数据是提高分析精度与内在效度的有效途径,但如何确定这种粒度以及相应数据描述框架应该建立在循证决策理论框架之下。数据层需要一种面向循证的语义描述框架,特别是要纳入相关语用信息,从而实现证据描述以及证据链推理。
6 结语
从情报学的决策学派理论来看,决策支撑是情报学的核心功能,这一点与公共政策研究具有相通之处。从创新政策研究来看,目前需要一种跨学科的方法论进一步提高研究质量,而情报分析方法恰恰可以与之形成互补。在决策循证化的发展背景下,基于证析的情报循环可以为循证决策提供一个数据驱动的决策支撑体系。在这个体系中,情报证据化以及数据流、情报循环与政策循环的多重循环耦合是关键。未来研究中应该从理论、技术与数据等不同层次关注相关情报分析方法所面向的挑战,如多学科视角下的建模问题、低频情报资源挖掘技术以及面向循证的语义描述框架等。