h指数在研究人员评价中的应用
2009-02-18梁振辉魏顺平
梁振辉 魏顺平
【摘要】文章运用 Hirsch 指数(简称 h 指数)方法以及与之相近的 w 指数方法,通过对中国知网(CNKI)中国引文数据 库收录的教育技术学领域的 CSSCI 来源期刊在 1998 年至 2007 年所刊发论文的被引用数据进行统计分析,对 1998 年至 2007 年
10 年间中国大陆地区教育技术学领域研究人员的科研绩效进行了评价,评选得到了“1998 至 2007 年段中国大陆地区教育技术 学领域最具科研绩效的前 30 位研究人员”,并对 h 指数与其他评价指标进行了相关性分析。分析结果表明,利用 h 指数来评价 研究人员的科研绩效,一定程度上可以反映“总被引频次”、“论文数量”、“篇均被引频次”三项指标的评价结果,h 指数可以 说是一项更为综合的评价指标。
【关键字】h 指数;教育技术学;研究人员;科研绩效评价
【中图分类号】G40-051 【文献标识码】A 【论文编号】1009—8097(2009)01—0021—07
一 问题的提出
h 指数是美国加州大学圣迭哥分校的物理学家 J.E.Hirsch 教授在 2005 年提出的一项旨在评价科学家个人绩效的指标。h 指数的定义是:一个科学家的分值为 h,当且仅当在他(她) 发表的 Np 篇论文中有 h 篇论文每篇获得了不少于 h 次的引文 数,科学家剩下的(Np-h)篇论文中每篇论文的引文数都小于h 次。[1]根据 h 指数的定义,假如一个研究人员的 h 指数为 9,则意味着他发表了至少 9 篇论文,并且仅有 9 篇论文的被引次 数不少于 9 次。在计算某位研究人员的 h 指数时,可以将这位 研究人员的论文按照其引文数降序排列,然后从排序最高的论 文开始向下逐条计数,一直到某篇论文的排序号大于该篇论文 的引文数,则该篇论文的序号数减 1 就是该位研究人员的 h 指 数数值。Hirsch 讨论了 h 指数在评价研究人员个人绩效中的应 用,并且提出了他们晋升应达到的门槛。例如,他认为研究型 大学教师晋升为正教授的指数的典型值应约为 18。[2]
在 h 指数的基础上,中国科技大学的吴强提出一种新的科学家个人绩效的评价指标——w 指数。[3]w 指数与 h 指数类似, 但做了些巧妙的修改。举例来说,假如一个研究人员的 w 指数 为 9,意味着研究者发表了至少 9 篇论文,并且仅有 9 篇论文 的被引次数不少于 90 次。吴强指出,w 指数是对 h 指数的重要 改进,因为它“更准确的反映了一个科学家的高质量论文的影 响”,并且他也承认这一指数“可以被称为 10h 指数”。根据 吴强的研究,研究人员的 w 指数为 1-2 意味着他“已经具备了 某一领域的基础”。w 指数为 3-4 意味着这位研究人员已经掌 握了“科学活动的艺术”,而“杰出的研究者”属于那些 w 指数为 10 以上的人。吴强把“顶尖科学家”留给了通过 20 年工作 w 指数达到 15 或者通过 30 年工作达到 20 的科学家。
在 h 指数提出之前我们通常是采用信息计量学的方法来 评价研究人员,从信息计量的角度定量地对研究人员进行评 价,其结果比较客观、比较准确。在信息计量学中,研究人 员的学术成就和对学科贡献主要体现在发表的文献数量和文 献被引次数两个方面,其中文献数量说明作者生产的文献产 量或科研能力,而文献被引频次则更能说明作者生产的文献 的质量,交流程度和学术水平。因此,一般从论文数量和被 引频次两个方面考察作者的影响力。路秋丽、田雨等人(2008) 曾从论文数量、总被引频次、篇均被引频次三个方面考察中 国教育技术学领域研究人员的科研绩效,并评选出了 16 位教 育技术学领域的关键学者。[4]然而,正如 J.E.Hirsch 教授 所指出的,应用“论文数量”、“总被引频次”、“篇均被 引频次”等单项评价指标存在一定的缺陷。他认为“论文数 量”的缺点是不能测度论文的重要性和影响力;“总被引频 次”的缺点是作者的影响力会被少数重要的合作论文夸大; “篇均被引频次”缺点是数据不容易获得,容易造成奖少惩 多。[1]J.E.Hirsch 教授认为 h 指数能够测度科学家个人工作 的主要影响力,并能够避免上述指标的一系列缺点。 J.E.Hirsch教授进一步指出,即使两个科学家的论文数或 引文数量有很大差别,但假如他们具有相似 h 指数,那么仍 然可以认为他们的整体科学影响力是可比的。反之,科学生 涯相同的两个科学家,即使具有相近的论文或引文数量,假 如他们的 h 指数有很大差别,同样可以认为具有较高指数的科学家是一位更加“优秀”的科学家。因此,本研究将采用 h 指数作为主要指标来对中国大陆地区教育技术学领域的研究 人员进行科研绩效评价(这里“中国大陆地区”用于限定研 究人员的学术活动范围,而不是限定研究人员的所在研究机 构),并辅之以 w 指数的计算,同时与“论文数量”、“总被 引频次”、“篇均被引频次”等三项指标的评价结果进行比 较,以发现不同评价指标之间的差异。
二 研究方法
本文的研究对象是中国大陆地区教育技术学领域的研究 人员,我们可以从中国大陆地区教育技术学领域重要的学术期 刊中获得该领域研究人员发表论文的信息以及论文被引用的 信息,并以此为基础开展对研究人员科研绩效的评价。笔者参 考《CSSCI 来源期刊(2006-2007)》[6],选取该引文索引来源期 刊中属于教育技术学领域的学术期刊包括《电化教育研究》、《中国电化教育》、《中国远程教育(上)》、《开放教育研究》、《现代教育技术》、《现代远距离教育》等六个期刊(后文简称 为“六大学术期刊”),并获得这六大学术期 1998 年至 2007 年 所刊发的论文及其引文信息以作为分析数据(尽管在《CSSCI 来源期刊(2008-2009)》[5]中,《现代远距离教育》已经不在其中, 但这并不影响对该期刊 2007 年以前的论文的分析)。本研究所 选择的期刊范围较路秋丽、田雨等人(2008)选取的期刊范围 更广,可以对中国大陆地区教育技术学领域的研究人员科研绩 效做出一个更为客观的评价。研究的具体过程包括利用中国知 网(CNKI)的中国期刊全文数据库[7]完成“六大学术期刊”论 文基本信息下载与整理、利用中国知网(CNKI)的中国引文数 据库 0完成“六大学术期刊”被引用信息下载与整理、研究人 员所发表论文的数量、总被引频次与平均被引频次计算、研究 人员的 h 指数和 w 指数计算、各项评价指标的综合比较等环节。
这里笔者没有采用 CSSCI 数据库,因为从 CSSCI 数据 库中下载相关数据效率较低。当然,CSSCI 的引文数据库更 具权威性,其引文来源仅限于 CSSCI 为数不多的来源期刊。 而中国知网(CNKI)的中国引文数据库的引文来源则更为广 泛,其来源包括中国知网(CNKI)的中国优秀硕士学位论文全文数据库、中国知网(CNKI)的中国博士学位论文全文数 据库、中国知网(CNKI)的中国期刊全文数据库、中国知网(CNKI)的中国重要会议论文全文数据库等,相比于 CSSCI 引文数据库,更能反映论文的影响范围。两个引文数据库各 具特色,在本研究中笔者选用中国知网(CNKI)的中国引文 数据。感兴趣的读者可以采用 CSSCI 的引文数据库来分析。
1期刊论文基本信息下载与整理
中国期刊全文数据库提供专业检索界面,可编写检索语句,于是笔者编写了如下检索语句,如图 1 所示。
经检索(检索时间为 2008 年 9 月 2 日),返回 14102 条 记录,其片段如图 2 所示。
在中国知网(CNKI)的中国期刊全文数据库的初级检索系统中不能进行每个作者所发论文数量的分类汇总计算,我们需要将这些结果逐页复制到 Microsoft Excel 软件的表格中, 并清除所有格式,可得到如图 3 所示的 Excel 表格。
在这个表格的基础上我们便可以进行分类汇总计算了。由于具有 10000 行以上记录的 Excel 表格操作起来非常缓慢, 于是笔者将 Excel 表格中的数据导入到 SQL SERVER 2000 数 据库中,得到“论文数据表”,其片段如表 1 所示。
通过 T-SQL 语言对论文数据表进行查询分析,可对“六大学术期刊”的所有作者及发表文章情况进行统计。经对“论 文数据表”以“第一作者”作为分类字段(这里忽略同名作者 的干扰),以论文计数作为汇总方式进行分类汇总,得到“作 者-论文分类汇总表”,共有 6462 名作者(这里指第一作者, 下同)以及每位作者发表论文的数量,其片段如表 2 所示。
然而,仅仅依据“论文数量”进行排名,大量来自“六 大学术期刊”的编辑将进入前列(如表 2,论文数量位居前 5 位的就有 4 位期刊编辑),这就会大大影响研究人员在“论文 数量”上的排名。这里,笔者将借助下文提到的“引文数据 表”(因为通讯稿或评论等文章的被引频次往往很低),先查 询“引文数据表”得到“总被引频次”居于前 100 位的作者 列表,再查询“论文数据表”得到“论文数量”排名居于前100 位的作者列表,然后取这两个列表的交集,发现“论文数 量”排名居于前 100 位的作者列表中有 34 位作者不在交集 中。通过查询这 34 位作者的单位信息,发现有 16 位是期刊编辑。这 16 位编辑的文章需要从“论文数据表”中剔除出去。 另外,笔者发现,编辑所撰写的文章在论文记录的“单位”信 息上均有“本刊记者”的字样,于是笔者先查询论文记录的 “单位”字段包含“本刊记者”的记录,并对这些记录中的作 者字段进行分类汇总,发现共有 40 位作者。将前后两次得到 的编辑名单加以合并,并将这些编辑发表的论文从“论文数据 表”中剔除。然后对“论文数据表”以“第一作者”作为分类 字段,以论文计数作为汇总方式再次进行分类汇总,并以“论 文数量”逆序排列,得到新的“作者-论文分类汇总表”,其 中发表论文数量居前 50 位的研究人员列表如表 3 所示。
2期刊被引用信息下载与整理
笔者通过中国知网(CNKI)的中国引文数据库的专业检 索界面,编写如图 4 所示检索语句。经检索(检索时间是 2008 年 9 月 2 日下午 3 时),共得到 7927 条记录,结果如图 5 所示。
同样,在中国知网(CNKI)的中国引文数据库中无法进 行每位研究者的被引频次求和计算,也需要将这些结果逐页 复制到 Excel 表格中,在去除标记并对一些列如“被引文献作 者”、“被引文献来源”进行分列操作后,如图 6 所示。
为方便计算,笔者将这个 Excel 表格导入到 SQL SERVER 2000 的数据库中,得到“引文数据表”,其片段如表 4 所示。
然后通过 T-SQL 语言对引文数据表进行查询分析。通过SQL SERVER 的查询分析器,可以对每位作者的“总被引频 次”、“平均被引频次”、“被引文献数”等三项指标进行 计算。经对“引文数据表”以“第一作者”作为分类字段, 以“被引频次”求和作为汇总方式进行分类汇总,接着再以 论文计数作为汇总方式进行分类汇总,并计算每位作者的“篇均被引频次”,最后以“总被引频次”逆序排列,得到“作者-引文分类汇总表”(这里忽略同名作者的干扰),该 表共有 4211 名作者(这里的作者指的是第一作者,下同)以 及每位作者的“被引文献数”、“总被引频次”和“篇均被 引频次”。其中,“总被引频次”居前 50 位的研究人员列表 如表 5 所示。
3研究人员的 h 指数和 w 指数计算
按照 h 指数和 w 指数的定义,笔者利用 SQL SERVER的查询分析器编写相关算法对“引文数据表”中所有作者进行两个指数的计算,并将计算结果按 h 指数逆序排列,得到“作者-h 指数-w 指数数据表”,其中 h 指数不小于 7 的作者 共有 36 位,如表 6 所示。
笔者认为,导致教育技术学领域研究人员 h 指数偏低的原因有两个:一是本研究选取的文献数据持续时间不长,只有 10 年,相对于一个研究人员的科研生涯还是比较短暂的;二是国 内论文的参考文献数量普遍偏低,根据张伟远(1999)的一项 比较研究[9],中国大陆地区有参考文献的文章中,60%的文章只有 1 到 4 份参考文献,在英美两国的期刊中,60%的论文有9 份以上的参考文献,45%的论文有 20 份以上的参考文献。
前文已经提到,w 指数为 3-4 意味着这个研究者已经掌握了“科学活动的艺术”。表 6 是依据 h 指数排名得来,可能会 将一些发文量较少、然而“篇均被引用频次”却很高的作者排除在外。下面笔者再以 w 指数为条件,选取 w 指数不小于 3 的作者名单,仍然按 h 指数逆序排列,得到如表 7 所示结果。
表 7 中灰色区域部分的作者是表 1 中未曾出现的作者, 这些作者虽然发表论文较少,但论文的被引频次却很高,如 李克东教授 1998 至 2007 年间在“六大学术期刊”以第一作者名义发表论文 8 篇,有 5 篇论文的被引频次在 50 次以上。
4各项评价指标的综合比较
为了比较研究人员科研绩效评价不同评价指标之间的差异,下面笔者把按照三项不同的评价指标即“论文数量”、 “总被引频次”、h指数分别得到的“作者-论文分类汇总 表”(取前 50 条记录,记为数据表 T1,其内容即文中的表 3)、 “作者-引文分类汇总表”(取前 50 条记录,记为数据表 T2, 其内容即文中的表 5)、“作者-h 指数-w 指数数据表”(取 h 指数不小于 7 的记录,记为数据表 T3,其内容即文中的表 6) 进行整合,把这三个表中所包含的所有作者的三项指标计算 出来,并对作者是否在 T1、T2、T3 等三个数据表出现加以标 识(1 表示出现,0 表示未出现),并按 h 指数为主关键字, “总被引频次”为次关键字,“论文数量”为第三关键字, 三个关键字均为逆序排列,得到“作者-三项指标综合数据 表”。笔者将在 T1、T2、T3 等三个数据表均出现的作者选择 出来,形成如表 8 所示的研究人员列表,共 30 位作者。笔者 将这 30 位作者界定为“1998 至 2007 年段中国大陆地区教育 技术学领域最具科研绩效的前 30 位研究人员”。
关于表 8,这里需要做一些说明:
(1) 列“T1”用于表示该作者是否在数据表 T1 出现,
1 表示出现,0 表示未出现;列“T2”用于表示该作者是否在 数据表 T2 出现,1 表示出现,0 表示未出现;列“T3”用于表 示该作者是否在数据表 T3 出现,1 表示出现,0 表示未出现。
(2)每位作者在“作者-论文分类汇总数据表”中的排 名在列“论文数量排名”中给出,在“作者-引文分类汇总数 据表”中的排名在列“被引总频次排名”中给出。读者可以 比较表 8 中的三个不同排名以了解不同评价指标的差异。
(3) “作者单位”根据每位作者最新发表的论文的署 名单位得来。
(4) 表 8 中,有两位作者是例外,即张倩苇和胡小勇, 这两位作者由于论文数量的关系未能在 T1 中出现,但是由于 这两位作者的 h 指数较高,因此笔者仍然将这两位作者纳入 到“1998 至 2007 年段中国大陆地区教育技术学领域最具科研 绩效的前 30 位研究人员”行列。
以表 8 为基础,笔者对不同评价指标进行相关性分析, 以进一步了解不同评价指标之间的关系。笔者采用 SPSS 15.0 For Windows 的 Pearson Correlation 相关性计算方法对四项评 价指标即 h 指数、“总被引频次”、“论文数量”、“篇均 被引频次”两两之间的相关性进行计算,其结果如表 9 所示。
从表 9 中我们可以看出,h 指数与其他三项指标均呈显 著的正相关,且与“总被引频次”的相关性系数非常高,达 到了 0.906;论文数量与篇均被引频次的相关性系数为 0.038, 相关性不显著。以上相关性分析表明,利用 h 指数来评价研究人员的科研绩效,一定程度上可以反映“总被引频次”、“论文数量”、“篇均被引频次”三项指标的评价结果,h 指 数可以说是一项更为综合的评价指标。当然,在使用 h 指数作 为评价指标时,仍然需要结合其他评价指标来对具有相同 h 指 数的作者进行内部排名。
为进一步了解大陆地区教育技术学领域科研机构的科研绩 效情况,笔者对表 8 以“作者单位”作为分类字段,以“第一 作者”计数作为汇总方式进行分类汇总,得到如表 10 所示结果:
如表 10 所示,上述 30 位作者中,有 7 位来自北京师范大学,4 位来自华南师范大学,占总人数的 36.7%,说明这两 所学校在教育技术学领域有着较强的学术实力。
三 研究结论
本研究采用 h 指数作为主要评价指标,并辅之以 w 指数,对中国大陆地区教育技术学领域 1998 年至 2007 年 10 年间研 究人员的科研绩效进行了评价,评价得出了“1998 至 2007 年 段中国大陆地区教育技术学领域最具科研绩效的前 30 位研究 人员”,这是对路秋丽、田雨等人(2008)评价得出的“中 国教育技术学领域的关键学者”的一次较大调整,有助于对 当前阶段中国教育技术学领域的研究人员状况有一个更为客 观的认识;并与其他评价指标进行了相关性分析,分析结果 表明利用 h 指数来评价研究人员的科研绩效,一定程度上可 以反映“总被引频次”、“论文数量”、“篇均被引频次” 三项指标的评价结果,可以说是一项更为综合的评价指标, 一定程度上改进了路秋丽、田雨等人(2008)采用的科研绩 效评价方法。当然,本研究所作出的科研绩效评价结果并不 能完全真实的反映当前中国大陆地区教育技术学领域研究人 员科研绩效,究竟此次得出的“1998 至 2007 年段中国大陆地 区教育技术学领域最具科研绩效的前 30 位研究人员”是否客 观还需交由教育技术学领域的广大研究人员一起来评议。
本研究所采用的论文和引文数据的持续时间只有 10 年, 这对于一个研究人员的科研生崖和研究人员 h 指数的计算都 显得过于短暂,这可以说是本研究的主要缺陷。由于国内的 期刊数据库起步较晚,许多期刊虽然创刊较早,但是期刊数 据库中的数据却只存储了近十几年的数据,而不是全部的数 据。以《中国电化教育》和《电化教育研究》为例,两个杂 志创刊于 20 世纪 80 年代初,中国知网(CNKI)期刊数据库 中所收录的这两个期刊的论文却是从 1994 年开始的。因此, 要利用 h 指数对中国教育技术学领域的某一代研究人员作出 更为全面的评价,还需等待 15 到 20 年时间。
参考文献
[1] J.E. Hirsch.衡量科学家个人成就的一个量化指标[J].科学观 察,2006,(1):2-7.
[2] Henk F. Moed,刘俊婉,金碧辉. h 指数构建有创意 用于评价 要慎重[J].科学观察,2006,(1):15.
[3] Qiang Wu. The w-index: A significant improvement of the h-index[DB/OL].
[4]路秋丽,田雨,魏顺平.教育技术领域关键学者研究[J].电化教 育研究,2008,(8):26-31.
[5] 南京大学中国社会科学研究评价中心.CSSCI 来源期刊(2008-2009)学科分类[DB/OL].
[7] 中 国知网 (CNKI). 中 国期刊 全文 数据库 [DB/OL].
[8]中国知网(CNKI).中国引文数据库 [DB/OL].
[9]张伟远.中、英、美三国开放与远程教育研究论文的比较 研究[J].开放教育研究,1999,(Z1):59-62.