对加快推进科技评价制度改革的理论思考和政策建议
2021-08-25卢阳旭中国科学技术发展战略研究院
■文/卢阳旭(中国科学技术发展战略研究院)
加快推进科技强国建设,需要进一步深化科技评价制度改革。本文分析了量化评价的基本逻辑及其被“异化”的原因,并从降低信息需求、优化信息结构的角度,提出了科技评价制度改革可参照的理论分析框架和政策建议。
一、同行评议和量化评价面临的突出问题
科技评价的本质,是借助一定的方法和工具尽可能真实地反映科研成果的价值、科研工作的绩效和科研人员的能力。同行评议和量化评价是两种主要的评价方法,各有优势,但运行中也都存在一些亟待解决的问题。
(一)同行评议面临的三个问题
同行评议有学术“看门人”之称。理想的同行评议应坚持科学规范中的普遍主义和无私利性等原则(楚宾、哈克特著,谭文华、曾国屏译,《难有同行的科学:同行评议与美国科学政策》,2011年)。但在实际运行中,同行评议的有效性受到了一些质疑,主要有三个方面:一是同行评议的“过载”。随着科研规模的迅速膨胀,待分配科研资金、待评审项目、待发表论文等的数量都大幅上升,但优秀评议专家的数量没有相应地大幅增长,造成评审专家疲于应付,影响了评审质量。二是同行评议的“退化”。同行评议本质上是一种定性评价,高度依赖评审专家个人的专业判断,但学科多样性和交叉性的增加,以及评审专家选取、评审流程设计等方面的问题,导致评审专家“不得不”依赖论文数量、期刊影响因子等量化指标——这相当于放弃了同行评议的优势。近年来,学术界普遍呼吁“负责任的计量”(responsible metrics),认为定量评价不能代替同行评议,要避免滥用计量指标(Hicks D、Wouters P、Waltman L,2015)。三是“人情评价”。学术界客观存在着师生关系、同门关系、同事关系、合作关系等复杂的人际关系甚至“圈子”,必须要有科学、有力的机制才能限制它们对同行评议公正性的影响。
(二)量化评价的流行及其问题
同行评议存在的不足加速了量化评价的流行。在政府大规模资助科学研究、高校和科研机构规模迅速膨胀的现实约束下,机构管理方必须采取某种信息简化机制,以保证资金分配、绩效评价、人员管理等工作的开展。以论文数量、专利数量、引文数量、期刊影响因子等为代表的计量指标,因信息高度浓缩和简化、客观性强、可比性强,在科技评价工作中“很好用”而被广泛使用,并进而出现了各种“唯数量”的异化现象。
(三)量化评价的困境源于科研活动复杂的信息结构
足够的信息是准确评价的前提,有效的信息载体是信息披露的基础。在科技评价活动中,科研资助方(政府)、科研管理方(科研机构)、科研执行方(科研人员/团队)构成了多重委托代理关系(卢阳旭、龚旭,2019),形成了复杂的信息结构。有关科研活动真实信息的分布存在结构性差异,对于科研机构(人员)的科研能力、科研成果的创新性,同行比外行、管理方比委托方拥有更准确的信息。
不同评价方式所需的信息量、应对复杂信息结构的能力是不一样的。结果评价比过程评价所需的信息量少,数量评价比质量评价所需的信息量少。但是,对信息简化的过分追求会造成“激励扭曲”问题。比如,激烈的论文数量竞争会导致科研机构和科研人员事事求“短平快”,学风浮躁浮夸、有意规避创新性高但不确定性也高的高质量研究,甚至出现学术不端行为等现象。
二、深化科技评价制度改革的三个基本坐标:信息经济学视角
科技评价活动需要面对三个基本问题:即科研活动的不确定性、科研主体的多重角色,以及科研信息分布的不对称性。进一步深化科技评价制度改革必须更好地回答这三个问题。
(一)任务类型:工作目标的不确定性
不确定性是科研活动的重要特点,越具创新性的研究,其不确定性越强,越可能只有少数人掌握相关信息。在这种情况下,科研执行者(科学人员/团队)如何“发送”其工作信息(比如发论文、工作过程及进展信息等),科研管理方和科研资助方可以采信哪些信息,就越难在事前明确,委托方和代理方之间就相关研究工作的约定就越可能是“不完全契约”。对不确定性的解释权,将会影响科研人员探索的勇气和研究的雄心。将基础研究、应用研究、试验开发区分开来,把颠覆型、跟踪型研究区分开来,基本逻辑是它们的不确定性有高有低。但在实践中,这几类研究通常很难甚至也不必要截然分开,这也使得简单的分类评价常常难以奏效。
(二)主体属性:角色和任务的多重性
科研机构和科研人员常处于多重角色、多重任务的状态。激励理论研究的基本结论,是对多任务机构(人员)不宜实行强激励(比如论文奖励、评职称必须有某种类型的论文和项目等),否则容易导致偏废(比如科研目标和教学目标、科研任务和医疗任务等)和角色紧张,甚至催生学术不端等失范行为。实践中,任务分类与机构和人员分类相互交织,科技管理制度与人事、财政管理制度改革的逻辑和节奏并不总能匹配,这在一定程度上造成了分类评价工作中的各种变通和乱象。
(三)信息结构:信息的完备性和对称性
在科技评价活动中,信息有两个基本维度:一是完备性,即对科研目标(成果)、科研进度、科研条件等都有明确的标准和判断,相关信息也能完全获取。二是不对称性,即关于科研目标、活动、条件等方面的信息在不同主体之间存在差异,有人知道、有人不知道,有人知道得多一些、有人知道得少一些。总体而言,信息的完备性、对称性越高,“外行”越可能判断工作进展和质量,量化评价的负面作用也相对较小;反之则越依赖同行评议。
三、建议
近年来,以“破四唯”、代表作评价等为代表的一系列科技评价制度改革正在重塑科技评价的信息需求结构,减少由于不恰当的信息简化造成的“激励扭曲”和异化问题。下一步改革要从信息获取的可能性和成本、信息简化的有效性和风险等角度出发,平衡好“破-立”“量-质”和“标-本”三个方面的问题。
第一,深化机构分类评价改革,着力增加机构多样性。一是以机构评估改革为抓手,深入推进机构分类评价,加快落实机构自主权改革要求,减少机构评估指挥棒造成的人才评价扭曲、项目管理失当。二是加强科技和教育等部门政策协调,推进学科评估与“科技三评”改革形成合力,学科评估要突出人才培养本位,落实好“破四唯”各项举措,鼓励学科多样化发展,淡化学科和机构排名,为“体制内”机构的多样化发展创造更友好的评价环境。三是鼓励“体制外”机构(比如民间科学基金会、新型研发机构等)创新发展,为“体制内”机构多样化发展提供资金来源、管理创新和倒逼压力。
第二,积极探索落实科技评价改革关键举措的路径和方式方法。一是探索人才分层评价机制,鼓励相关机构探索对不同类型人才实行差别化的评价机制,引导不同能力和职业追求的人各得其所,减少“千军万马过独木桥”造成的过度竞争和资源浪费。二是完善代表作评价的规范和流程,鼓励高校、科研院所建立联盟(网络),就评价标准、规范等进行协商和协调。三是按照“独立、负责、公开”的原则改进同行评议制度,进一步优化评审机制和流程设计,为专家评审留出足够时间,并建立适当的成本补偿和激励机制。