美国能源部重大科技基础设施风险管理研究及启示*
2022-07-14李泽霞樊潇潇杨春霞杨光普
陈 娟 李泽霞 樊潇潇 杨春霞 李 玥 杨光普
(1.中国科学院条件保障与财务局,北京 100864;2.中国科学院文献情报中心,北京 100190;3.中国科学院大学经济与管理学院图书情报与档案管理系,北京 100049;4.中国科学院近代物理研究所,兰州 730000;5.中国科学院云南天文台,昆明 650216)
重大科技基础设施是国家投资建设的科研设施,其建设过程具有科学研究和工程建设双重属性;不同于一般基建工程,重大科技基础设施肩负重大科研使命,特点是科学技术集成度高、投资大、队伍规模大。一项重大科技基础设施从概念提出、立项、再到建设,通常会经历十几年甚至几十年的时间,面临各种各样的不确定因素,也就是所谓的风险。具有研发性质的设备建设由于不确定因素更多,工期可能延后计划时间的10%~54%,成本可能超支10%~200%[1],重大科技基础设施的建设更是如此。
重大科技基础设施是一个国家创新能力的重要体现,也是一个国家的国际名片。在申报规划项目阶段,设施即已开展选址、确定投资来源等工作,这使得风险管理的很多工作要更早考虑和更加规范地开展,树立强烈的风险管理意识以确保重大科技基础设施的顺利完成。
风险管理已成为重大科技基础设施管理要素中至关重要的一项。近些年,国内不少学者对重大科技基础设施风险管理进行了研究,如:高原等[2]曾系统分析和阐述了导致美国超导超级对撞机(Superconducting Super Collider,SSC)工程夭折背后的政治、科学、经济和管理等方面的深层次原因;罗小安等[3]细述了风险的类型和风险处理的策略;郭桐等[4]给出了量化风险的模型应用;还有些学者就具体某个风险进行细致研究,如共担风险、采购风险等[5,6]。但目前仍缺乏对重大科技基础设施风险管理全流程的深入分析研究。美国能源部在重大科技基础设施管理方面有悠久的历史,具有丰富的管理经验,在重大科技基础设施管理的过程中已经制定了非常完善和系统的风险管理程序,形成了规范的管理流程和框架。因此,本文以美国能源部为例,深入解析重大科技基础设施的风险管理架构和程序,并结合我国重大科技基础设施风险管理的现状进行对比分析,以期对我国在重大科技基础设施风险管理措施的优化和完善方面提供支撑和参考。
1 重大科技基础设施风险及其影响分析
关于重大科技基础设施风险的分类,往往有不同的方式,相关研究文章一般根据国外文献分为技术风险、环境风险、科学风险、管理风险等,每种大的风险类别还可以细分[4]。从中也可以看出,重大科技基础设施面临的风险非常多样化,而且由于重大科技基础设施的自身特点,风险的发生会产生相对严重的后果。本文实例列举一些重大科技基础设施曾经确实面临和经历的风险事件,以及这些风险产生的部分影响。
1)科学影响
重大科技基础设施风险处理不当,可能对科学发展产生长期负面影响。20世纪90年代初期,随着超级大国苏联的解体,俄罗斯经济面临崩溃,相继关闭了前苏联时期许多雄心勃勃的重大科技基础设施项目[7],严重动摇了俄罗斯的基础研究及其再发展的基础。1988年批准建设的美国SSC,由于风险防控不到位,实际支出与经费预算严重不符,导致最终停建,但其对美国高能物理界的影响是深远的,SSC的停建被认为是美国失去物理研究的国际领导地位,世界核物理研究中心从美国转到欧洲的重要原因[8]。
2)技术影响
重大科技基础设施是科技发展和高技术研发的重要支撑手段。同时,重大科技基础设施的一些衍生技术催生了新经济,推动了人们生活的变革。高能物理学家用于数据共享的技术催生了万维网的出现[9],彻底改变和颠覆了人们的生活方式;用于提取射电望远镜数据信号的算法解锁了无线通信技术[10],推动了网络应用的发展与普及。疫情之下,旧的全球化秩序正在解体,“中美脱钩”“逆全球化”的形势越来越明显。美国商业管制清单的文本越来越厚,内容越来越多,很多涉及重大科技基础设施建设的仪器设备技术也被列入其中,自由电子激光被全面禁止出口,高性能的激光器、传感器也受到限制。[11]重大科技基础设施的建设不仅影响到科技发展,还有可能对我国产业技术造成影响,扼杀我国未来创新发展的很多可能性。
3)经济影响
通常,经济损失或投入增大是众多风险产生的最直接后果。同样以SSC为例,其在建设到20%的时候停工下马,不但前期的投入(20多亿美元)打了水漂,后来美国政府还投入了5亿美元用于填埋设备,其经济损失高达30亿美元,约为SSC的最初预算成本[12,13]。国际热核聚变实验反应 堆 (International Thermonuclear Experimental Reactor,ITER)项目也面临类似的窘境,由于参与国之间决策过程繁复等因素,导致工程拖延现象严重且成本超支,经费约增加20%左右[14],美国差点因此退出ITER计划。
4)环境影响
重大科技基础设施建设过程中通常要求对环境的影响降到最低。例如,SSC在设施预研阶段的环评报告就达到7000多页[15],但仍有疏忽导致的意外发生。意大利格兰萨索国家实验室曾由于管理人员疏忽,在一项寻找太阳中微子的实验过程中,50升有机化合物三甲基苯不慎泄露,导致周边的环境水遭到污染。意大利政府下令实验暂停,对该设施的安全系统进行翻新,花费超过8000万欧元[16],但对环境的影响却需要更多时间和金钱来修复。
2 美国能源部重大科技基础设施风险管理程序
2.1 概述
风险管理有两个目的:其一是预测可能发生的事件对项目的成本和进度的影响,其二是为减少一个事件造成的经费和进度影响,优化替代方案的决策,或增加系统或子系统的技术效用边际。前者(定量风险分析)搭建了一个框架,根据现金成本,进度和绩效量化项目目标的风险,以预测整个项目的最终成本、进度和绩效。后者(定性风险分析)可对数百甚至数千种风险进行分类,以识别和解决最有可能对项目产生最大影响的风险。
美国能源部(Department of Energy,DOE)是美国在基础研究方面最主要的管理和资助机构,承担了美国绝大多数最先进、最大规模的重大科技基础设施建设,管理着30多个用户设施。已经制定了一整套完善并且行之有效的风险管理程序和管理措施,也充分体现出美国在重大科技基础设施方面的管理模式和特点。
DOE的设施在风险管理各个层面均采用一致的综合系统风险管理程序[17]。DOE风险管理过程的包括规划、评估、识别、分析和处理、监督和反馈,整个风险管理过程一直持续至设施建设完成。其中,风险规划、识别、分析和处理为其核心环节。设施应在批准任务(类似于我国的项目建议书批复)之前开展风险规划,确定项目的整体风险性质和风险水平(图1)。风险管理也是连续、反复的过程,有顺序、有调整、有反馈(如图2),当项目变更时,特别是在预算、进度或范围方面或者当需要强制性评审或更新时,至少应该部分重复风险确定过程。以下将详细阐述DOE重大科技基础设施的风险管理过程的核心环节。
图1 建设阶段的风险管理时间线[17]Fig.1 Timeline of Risk Management During the Construction Phase[17]
图2 风险管理过程Fig.2 Process of Risk Management
2.2 风险规划
DOE要求,风险规划过程应始于项目的早期阶段,在项目建议书批复之前即启动规划过程。规划确定风险管理的阶段和基调,并涉及许多关键的初步决定。风险规划的总体目标是:确定项目的整体风险性质。
这个阶段应制定针对各种风险管理任务的最初责任分配矩阵(图3)。通过这种责任分配矩阵,明确责任主体,确定专业知识方面的差距,制定获得专业知识的各种计划,也可制定一个单独的风险管理沟通计划。
图3 风险责任分配矩阵Fig.3 Risk Responsibility Distribution Matrix
风险规划过程要形成风险管理计划文件。风险管理计划是一个路线图,它告诉政府或建设法人单位,如何从项目概念到基于初步的风险管理项目规划文件预知项目将来怎样,来对项目进行风险管理。风险管理计划是项目风险管理过程的指导文件。此风险管理计划应当至少在年度基础上进行复审和校订。风险管理计划主要包括项目简介、责任分配矩阵、拟采用的风险管理过程等。
2.3 风险识别
风险识别工作应在整个项目生命周期进行。当项目预算、周期或内容变更时,或者当需要强制性评审或更新时,至少应该部分重复风险识别过程。
风险分解结构是一种风险识别的重要方法。它是一种结构化的组织方法,即提出项目的风险,并以一种或多种层次方式了解这些风险,显示出最有可能的风险来源。风险分解结构提供了一个有组织的风险清单,代表对项目风险的系统连贯描述,并有助于进行更广泛的风险分析。为了有效识别风险,风险分解结构应可以划分为多个层次(图3)。最上层的结构可以概括为项目风险、技术风险、外部风险和内部风险;第二层可设定为费用、进度和范围。每个层次还可以进一步细分,使之与项目本身的具体问题建立对应关系,从而更好地进行风险识别。
图4 风险分解结构示例Fig.4 Demonstration of Breakdown Structure of Risk
所有识别的可能风险最终都将量化为对重大科技基础设施项目范围、费用和进度的可能影响。例如,表1展示了大型强子对撞机(Large Hadron Collider,LHC)的紧凑型缪子螺线管探测器(Compact Muon Solenoid,CMS)实验升级的不同等级的技术风险在多大程度上影响成本和进度,后期会基于更加有利于项目完成的原则对相应的风险进行处理。
表1 CMS实验升级中技术对成本和进度影响的风险打分表Tab.1 Risk Scoring Criterion for the Impact of Technology on Cost and Schedule of CMSUpgrade
对风险的分解只是一种方法,可以采取不同的分解方式。因为不同的项目可能会使用最佳的风险分解结构。项目类型的模板可在软件项目、建设项目等文献中找到;但是,这些模板应当根据正在开展的具体项目进行修改。也就是,所要采用的分解方法常常根据具体的项目来定。
2.4 风险分析
风险分析是个技术和系统的过程,目的是审查风险,确定有关这些风险的假设,找出那些风险的潜在原因,并确定任何与其他已知风险的关系,以及如果出现风险,可能的后果是什么。也就是说风险分析有两个关键要素:概率和后果。概率是事件发生的可能性,表现为定性和/或量化的指标;后果是事件的结果,事件的结果可包括表现为质量和/或量化指标的费用和/或进度影响。
DOE规定设施采用定量与定性结合的方式进行风险分析。对于定性分析,需制定定性风险分析矩阵,也称为概率影响图(图5)。而定量分析对单个风险的概率和后果进行数值或更客观的分析,往往借助先进的统计建模技术,如蒙特卡罗,准蒙特卡罗,灵敏度模拟和其他随机的方法,从输入的时间和费用范围随机抽样被用来估计对项目关键环节的影响,模拟产生一系列可能的项目成果。定量分析也可为风险管理者提供确定应急费用、管理储备金、进度不可预见费、和进度储备金水平的估算方法。其中图5中黑色折线为风险的容忍曲线,曲线右上方的风险情况(即高风险)是不能容忍的,应当尽可能采取措施避免或消除。
图5 定性风险分析矩阵Fig.5 Qualitative Risk Analysis Matrix
对费用/进度的影响风险程度可以划分为5个等级,对项目的费用和进度没有影响或影响相对较小时,将不做干预或适当干预。对项目的费用和进度影响较大时将对风险采取干预措施,后果特别严重时,有可能终止项目的进行(表2)。
表2 对费用/进度的影响风险程度划分Tab.2 The Degree of Impact on the Cost/Schedule
每一个特定的技术及其对费用和进度的影响将分别打分,并最终给出一个综合的风险等级。表3给出了质子改进计划第二阶段(Proton Improvement Plan II,PIP-II)设施低温系统的风险分析,可以看出低温系统供应商的制造能力不足是一个高风险事件,需要审慎选择合适的供应商;而低温系统的参数变化则为中风险,可以在一定的程度容忍。
表3 PIP-II设施低温系统的风险打分表[18]Tab.3 Risk Scoring Board of Cryogenics of PIP-II[18]
2.5 风险处理
处理风险的目的是通过化解已经探测到的风险和威胁,将不确定性转化为组织机构的利益。任何一个处理风险的措施都是“内部控制”的一部分。一般而言,处理风险的目的是限制风险而不是消除风险。
风险处理策略通常分为四类:1)风险规避、2)风险转移、3)风险降低,以及4)风险接受。表4描述了每种策略的目标和特点,其中风险降低是到目前为止采用最多的方式。
表4 风险处理方法的目标和特点Tab.4 Objectives and Characteristics of Risk Treatment Methods
1)风险规避:指终止某些具有高风险的环节,而将项目的总体风险控制在可接受的水平。如果很明显已经感知到预计的成本/收益关系处于巨大风险中,则选择此选项。
2)风险转移:对于某些特定风险,最好的应对方法是转移风险。通常通过保险来实现或者付费请第三方来承担风险从而转移机构的风险。例如工程建设过程中的人身意外风险,可以通过保险来完成;而一些高难度的技术设计环节和工程建设环节可以请更有能力有效管理风险的机构来完成。
3)风险降低:指为保证工作正常继续进行,采取控制措施将风险控制在可接受的水平,主要包括四种控制措施。(1)预防控制。旨在极大限制发生风险结果的可能性。(2)纠错控制。旨在纠正已经发生的风险结果。(3)指令控制。通过制度约束从而达到降低风险的目的。(4)检测控制。通常是在“事后发生”,通过评估、审计,从而汲取经验改进管理制度和模式。
4)风险接受:此类风险可能是可以容忍的或者无法采取措施避免和降低,无需采取任何进一步的措施。此选项可以通过应急计划进行补充,以应对在意识到风险后会产生的影响。
针对每个识别出的风险,选择一种风险处理的管理策略。除非风险被接受,否则应根据所选的管理策略为每个已识别的项目风险指定控制措施。对于每个已识别的风险,还需规定完成控制措施的日期、责任行动联络点、风险处理后的成效、实施控制措施的成本估算、每个控制措施的状态等。DOE要求在风险登记簿中跟踪为每个已识别风险选择的管理策略和控制措施。
3 思考与建议
风险管理已成为重大科技基础设施建设和运行的重要管理要素,鉴于国内外大量正面的和反面的案例,我国也越来越重视风险管理。在重大科技基础设施的项目建议书和可行性研究等重要节点文件中有专门章节要求设施进行风险分析,项目评审时,风险情况也成为项目能否立项的一个重要考核点,比重有增大趋势。但风险管理的系统性和规范性仍有待提高和完善。针对目前国内外在重大科技基础设施方面的科学管理流程和创新管理实践,本文提出对风险管理的思考。
1)强化风险管理意识,建立符合重大科技基础设施特点的风险管理制度。重大科技基础设施建设属于基建范畴。凡是基建项目都有一般的项目管理规范可以参考和执行,当然也包含风险管理。但我们也应该意识到重大科技基础设施不同于一般基建项目的特点,体量大、资金投入大的特点使得风险发生后造成的影响也更大。应时刻紧绷风险防控这根弦。
建议我国重大科技基础设施建立自上而下的完善的风险管理体系,制定在操作层面开展风险规划、风险识别与分析、风险处理等的规范化文档和符合设施特点的相关细则。在管理过程中注重以下三点:(1)将风险管理工作具体职责明确到人。借助风险分解结构和风险责任分配矩阵明确具体的职责和相应的责任人,建立各层级负责人之间的沟通机制。(2)加强风险量化分析。我国对重大科技基础设施风险描述仍是以定性为主,缺乏深入的量化分析,且风险分析往往只在建设前进行,缺乏动态的跟踪调整过程。应加强量化分析方法在风险管理中的应用。(3)强化风险管理的意识。大力营造风险管理的生态环境,促进风险管理相关的学习、实践、创新,为我国重大科技基础设施建设的顺利实施、超效实施保驾护航。
2)针对不同类型的风险,综合研判,提前部署。操作层面来看,对于可干预和可控制的风险应当实时监测,在重大设施全生命周期配备一体化的风险管理程序。紧跟国内外形势和国家政策,随时了解设施建设的过程和状态,提前部署,减少或规避风险。一旦有风险发生,才有可能通过加强管理降低风险带来的后果。
举例来说,对于选址,要多重考虑,综合评判。选址优先考虑设施科学目标能否实现,一般来说地质条件是直接的因素,在多个可选的地址中,要充分考虑当地的政治环境、社会稳定性等,同时与国家政策和规划紧密结合,也应当考虑发挥设施集聚效应等。
现在我国对于重大科技基础设施立项引导多元化投资,除中央预算内投资以外,鼓励设施吸引地方投资以及其他投资。要尽早落实经费来源,考虑如果超支,经费该如何解决,是地方兜底支持还是自筹,都应该落实相关协议;对于整体项目管理,应当细化预算,加强经费估计。经费估计要尽可能细化,充分考虑技术难度、技术路线替代等风险带来的经费增加,本着“实事求是”的原则,尽可能避免和减少出现实施过程中各种因素导致的经费超支。
面对国际技术管制,虽然无法从管理上根本解决,但可以做好防范预案。当前中美贸易摩擦,大力发展关键技术自主研发。积极与国内相关仪器设备生产商合作研讨,共同研发生产国产化的关键设备与仪器,丰富完善其功能性能,提升改善其稳定性、可靠性,促进国产设备的进步提升与市场化。设施方面还可以加强与相关企业合作,从机制上加速技术的转移转化,培植具有世界竞争力的关键设备和仪器研发企业。
3)加强过程监理,及时发现和调整风险和处理策略。加强设施建设过程监理,及早发现问题。依托第三方进行建设过程监理,可评估设施建设和经费支出等方面的问题,帮助承担单位准确识别和分析风险。监理队伍要稳定持续,熟悉设施情况,有工程管理经验。问题越早发现,越可及时采取措施,风险带来的危害越小。承担单位根据过程监理发现的问题及时做出风险评估,调整风险处理策略,促使风险管理的动态调整,使风险管理贯穿建设的始终。
4)开展设施建设管理评估,将风险管理作为重要的考量因素。近几年,国家强调预算绩效管理,出台了相关文件[19]。在制定重大科技基础设施建设经费的绩效目标时,建议将风险管理作为其中的一项指标,将识别风险的能力和处理风险的水平作为考量因素。如果在建设过程中准确预估风险并及时规避或有效解决,则视为该项指标达到绩效目标,反之,视为未完成,应进行整改。