医学科技评价方法及研究进展*

2015-02-12游顶云王振宇卢敏南

云南科技管理 2015年6期

关键词：德尔菲人工神经网络评议

游顶云，王振宇，卢敏南

（昆明医科大学，云南昆明 650000）

医学科技评价方法及研究进展*

游顶云，王振宇，卢敏南

（昆明医科大学，云南昆明 650000）

医学科技评价是医学科研活动中的重要组成部分，也是科技管理中的核心内容。一种好的科技评价方法与体系,可以优化科技资源的配置,提高科研人员的积极性,并对推进科技制度创新的完善和发展,营造良好的科研氛围，都有着极为重要的作用。德尔菲法、层次分析法、同行评议方法、文献计量方法、综合评价法、数据包络法和人工神经网络方法是目前常用的科技评价方法，它们各有优缺点，适用范围也不尽相同，需根据实际要求进行选用。

科技评价；医学科研；评价方法

0　引言

近年来，随着我国在科学研究领域投入的急剧增长，科技评价成为政府和社会各界共同关注的焦点之一。科技评价的重要性也愈显突出，并越来越成为科技管理中的一个核心内容。科学合理的科技评价方法与机制对于提升我国科学研究水平，进一步与国际接轨，都具有重要意义。

1　研究背景

自20世纪50年代以来，科技评价在美国、德国和法国就已兴起，现在已呈制度化、常规化和系统化趋势，并已成为一个快速增长的产业[1]。我国开展科技评价工作相对较晚，1986年同行评议法等评价方法才正式引入我国，并率先在国家自然基金委、科技部、教育部等部门的科研项目评审应用。上世纪90年代初，中国科学院开始对其下属的各研究所进行评价，这一实践为科研机构的评价积累了宝贵经验。

科技评价方法经过多年的发展，在实际应用中形成了基本操作思路，大部分国家，包括主要的欧美国家及日本等，都是采用定性为主的方法进行评价，而定量分析往往为辅助手段，尤其是在较为微观或者中观的层面上[2]。而在定性评价这一方法上，为克服其受主观因素影响大的问题，人们逐步把不同学科的方法和思想引入到科技评价中，如文献计量学、数学和经济学等[3]。

科技评价的方法主要有德尔菲法、层次分析法、同行评议方法、文献计量方法、综合评价法、灰色系统模型、数据包络法和人工神经网络方法等。在实际应用中，文献计量法和同行评议法是科技评价中最常用的方法，德尔菲法、层次分析法和综合评价方法具有较好的应用前景，而灰色系统模型、数据包络法、人工神经网络和TOPSIS方法是科技评价中较为前沿的方法[4]。下文将对不同方法的优缺点及适用范围进行综述。但限于篇幅，每一方法的算法不再赘述。

2　科技评价的方法

2.1德尔菲法

20世纪40年代，O.赫尔姆和N.达尔克首次提出德尔菲法（Delphi Method），其后又经过戈登和兰德公司进一步发展和完善。德尔菲法是一种主观的、定性的方法。德尔菲法的提出主要是为了避免专家在讨论时，受到权威专家的影响而改变最初判断的情况发生。德尔菲法一般采用专家匿名、独立提出意见的发放进行，收集专家意见后需要研究者综合判断专家意见是否一致，如果专家意见之间发生了较大分歧，应该再进行下一轮调研，直至专家达成基本一致的看法，作为最终的结果。其具有匿名性、统计性和反馈性的特点。这种方法具有广泛的代表性，较为可靠。其优点是能够充分发挥专家作用，并将分歧意见表达出来，取各家之长，避免权威人士控制群体意志[5]。德尔菲法的主要缺点是过程繁琐，需要耗费较大的人力，征询意见的时间也比较长。但随着互联网的普及和便捷，可大大减少意见征询的时间。可以预见，德尔菲法将在未来被越来越广泛地应用。在医学科技评价领域，德尔菲法主要用于初步确定指标体系的合理性。

2.2层次分析法

20世纪70年代初，美国运筹学家T.L.Saaty教授提出了层次分析法（Analytic Hierarchy Process， AHP），它是一种定量和定性相结合的多目标决策方法[6]。层次分析法通过将某一复杂问题分为多个指标，并依据其隶属关系，将不同的指标分为不同层次，在同一层次通过两两比较确定每个层次不同指标的权重。再通过对目标的两两比较进行权重的确定，综合指标和目标的权重做出综合判断的方法。层次分析法简单、灵活而又实用，它是一种层次化、系统化的分析方法。其既可避免如今在科技评价的过程中，尤其是微观评价中常使用的同行评议方法中专家判断的主观性和随意性的缺点，又可以充分发挥专家的经验和智慧。层次分析法所提出的通过两两比较和矩阵计算不同指标权重的思想，可以将定性和定量评价结合起来，因而有着重要的应用价值[7]。在医学领域，主要是用于确定指标权重等。

2.3同行评议方法

早在500多年前，人们就开始使用同行评议法。300多年前，同行评议方法就应用在论文评审中[8]。20世纪50年代，美国国家科学基金会率先确定了多种用于项目评审的同行评议方法[9]。经过60余年的不断发展与完善，同行评议法已经被公认为是一种最基本的，使用最为广泛的科技评价方法之一，在科研项目立项评审、科研成果鉴定、科研机构绩效评估、学位和职称评定、学术期刊论文评审等科技评价的实践中广泛应用。同行评议法从评价实施的形式上划分，可分为通信评议、会议评议、调查评议和组合评议。在同行评价的过程中，一般要遵循同行性原则、代表性原则和回避性原则。同行评价的缺点主要是由于其是基于专家智慧和经验的一种方法，与德尔菲法类似，其不可避免地会带来一些由于主观性所造成的确定，如迷信权威，通常会高估权威的申请者的项目或成果的价值，而低估乃至忽视新人的项目和成果，也会低估、甚至完全否定一些创新性强的项目和成果的科学价值。在科技评价领域，同行评议法一般用于项目立项、中期检查、结题验收，以及科技奖项的评价。

2.4文献计量方法

1969年，英国人A.普里查德首次提出文献计量学（Bibiometrics）这一术语。文献计量学是以文献计量和文献体系特征为研究对象，采用统计学、数学等计量方法，研究文献的数量关系、分布结构、定量管理和变化规律，并进而探讨科学技术的某些结构、特征和规律的一门学科[10]。文献计量方法是指利用科技成果来评价科研绩效的一种定量评价的方法，科研成果一般指出版物、专利、引文等。[11]。文献计量方法克服了一些主观评价方法，如德尔菲法、同行评议法的缺点，但由于很多文献问题尚难以量化，其文献数据的客观性具有高度的复杂性和不稳定性。因此，在应用文献计量方法时，应该特别注意其非常适用于宏观评价和中观评价，在微观评价活动中则应该受到限制，并要警惕计量指标的滥用和对某些指标的片面强调[12]。在医学科技评价中，文献计量方法也主要用于指标体系的建立。

2.5综合评价法

在科技评价活动的过程中，文献计量方法是中观和宏观评价中的常用评价方法，而微观评价则以同行评议方法为主。但是，文献计量方法由于受指标以及文献问题客观化的限制，缺乏综合性，而同行评议方法则由于专家主观认识的性质，并不能客观地、全方位地反映评价对象的情况。因此，在评价复杂问题和对象时，我们可以选择综合评价方法13]。综合评价法一般将评价对象看做一个复杂的对象，评价的内容通常有多个指标、多个层次，且评价内容往往涉及多个目的。综合评价的方法主要是通过指标的确定和权重的确定，采用专家评分的方法进行评价。其中，最关键的问题是指标体系的建立、指标权重系数的确定、指标评价值的确定以及合成关系的处理。综合评价的数据合成方法除了加权求和法之外，还有加权秩和比法、TOPSIS法、模糊综合评价法等[4]。

2.6数据包络法

数据包络分析法（Data Envelopment Analysis，DEA）是在1978年，由著名的运筹学家A.查恩斯、W.库伯和E.罗兹首先提出的。数据包络分析法是一种非参数方法，其采用数学工具进行多投入、多产出的绩效评价，数据包络法为科研绩效评价提供了一种新思路，在科研绩效评价中具有广泛的应用前景。绩效评价的特点是它不需要以参数形式规定函数，只需最终用极值的方法，以相对效益这个变量作为总体上的衡量标准，从最有利于决策的角度进行评价，进而避免了由于人为因素所引起的各指标权重的主观性。在国外，1993年英国学者首次采用数据包络法分析了英国大学经济系的科研绩效。在我国，2005年田东平等人采用数据包络法对我国重点院校的科研绩效进行了评价。数据包络法的非参数这一特征，使得其具有广泛的应用范围，但同时由于其操作的复杂性和统计学处理的困难，影响了其进一步的应用，但相信在统计学软件不断得到普及的背景下，其应用范围会越来越广泛[14-16]。

2.7人工神经网络方法

人工神经网络（Artificial Neural Network，ANN）是受生物神经网络功能的运作启发而建立的一门学科。人工神经网络是一个能够学习，能够总结归纳的系统，它能够推理产生一个可以自动识别的系统。在推理计算法则集合的基础上，它们能够进行推理，其广泛应用于人工智能领域。人工神经网络是综合评价方法中的一种，人工神经网络对资料类型没有要求，只需要采用训练样本，计算出各个神经节点参数，再代入新的样本即可得到最终的评价结果。其缺点是该方法较为复杂，较难掌握[17,18]。在国外，人工神经网络早已得到广泛应用。然而，在我国，人工神经网络运用于科技评价较晚。但在医药科技方面也有不少尝试。如2010年张蕾采用RBF神经网络对中医药科研绩效评价方法进行了探讨与研究。

3　讨论

在信息化时代的背景下，不同学科相互渗透、交融，国内外关于科技评价方法的研究可谓日新月异、硕果累累。由于篇幅所限，本文仅介绍了其中7种具有代表性的科技评价方法，其他方法如熵值法、主成分分析法、维度测评、灰色决策评价方法、模糊综合评判法都未能一一详述。虽然我们在科技评价的理论研究中取得了很多成果，但遗憾的是，在实际应用中，科技评价实践和手段远远滞后于对评价的方法研究[1]。科技评价方法研究和科技评价实践的这种“脱节”现象，主要是由于科技评价活动的特殊性所造成的，由于科技评价活动往往涉及不同的学科领域，几乎不可能有可以适用于所有学科的统一的、客观的指标体系，因此，专家学者的主观判断就显得尤为重要，这也是同行评议法这一古老方法长久不衰的本质原因。

[1] 龚旭，夏文莉.美国联邦政府开展的基础研究绩效评估及其启示［J］.科研管理，2003，24（4）:1-8.

[2] Luukkonen,Terttu.The impacts of research field evaluations on research practice［J］. Research Policy，1995，（3） :349-365.

[3] Christina Segerholm. Researching Evaluation in National （State）Politics and Administration: A Critical Approach［J］. American Journal of Evaluation，2003,24（3）:353-372.

[4] 戚湧，李千目.科学研究绩效评价的理论与方法［M］.北京：科学出版社，2009.

[5] 徐国祥. 统计预测和决策（第三版）[M]. 上海：上海财经大学出版社，2008.

[6]［美］Eliezer Geisler. 科学技术测度体系[M]．周萍等译，武夷山审校．北京：科学技术文献出版社，2004.

[7] 王莲芬，许树柏．层次分析法引论[M].北京：中国人民大学出版社，1990.

[8] 刘文达等．关于基础研究同行评议的约束机制构建问题[J]．科技管理研究，1999，6:13-18.

[9] 郭碧坚，韩宇．美英等国科学基金组织改进同行评议的方法[J]．科研管理，1996，1:58-61.

[10] 郭亚军，潘德惠．多属性综合评价的一种新方法[J]．系统工程理论与实践，1994，9:58-62.

[11] 姚永翘．科技文献定量评价方法[J]．科技进步与对策，2001，5:120-121.

[12] Garfield,E.The 1991 Nobel-prize Winners Were All Citation Superstars. Current Content,1992,5（2） :3-9.

[13] 陈敬全．科研评价方法与实证研究（博士学位论文） [M]．导师：邱均平．湖北：武汉大学，2004.

[14] Luke Georghiou a,David Roessner.Evaluating technology programs:tools and methods[J]. Research Policy,2000（29） :657-678.

[15] Cooper W W，Seiford L M and Zhu J．Handbook on Data Envelopment AnMysis[M] .Springer（Kluwer Academic Publishers），Boston，2004．