我国科技期刊引证指标数据库的对比分析与评价*

2015-10-29熊水斌彭桃英骆超周红梅

中国学术期刊文摘 2015年6期

关键词：维普影响力科技期刊

熊水斌，彭桃英，骆超，周红梅

1）河海大学期刊部《水利水电科技进展》编辑部，江苏南京 210098

2）河海大学期刊部《水资源保护》编辑部，江苏南京 210098

研究与动态

我国科技期刊引证指标数据库的对比分析与评价*

熊水斌1），彭桃英2），骆超1），周红梅1）

1）河海大学期刊部《水利水电科技进展》编辑部，江苏南京 210098

2）河海大学期刊部《水资源保护》编辑部，江苏南京 210098

对科技期刊进行科学、客观的评价是科技期刊工作的重要组成部分。目前在科技期刊评价方面，对具体评价指标和核心期刊的研究一直是热点，但对科技期刊评价相关机构、产品或系统本身的研究却很少［1］。国内从事期刊评价的机构众多，其中与科技期刊评价相关的主要有中科院文献情报中心、中国科学技术信息研究所、北京大学图书馆、武汉大学中国科学评价研究中心和万方、维普、知网三大数据库，这些机构发布（出版）的具有科技期刊评价功能的相关产品、出版物或在线数据库等主要有《中文核心期刊要目总览》［2］、《中国学术期刊评价研究报告》［3］、中国科技期刊引证指标数据库（CSCD-JCR）、《中国科技期刊引证报告（核心版）》（CJCR）［4］以及万方数据的期刊统计分析与评价（以下简称万方）、维普资讯的中文科技期刊评价报告（以下简称维普）和中国知网的个刊影响力统计分析数据库（以下简称知网）7个。文献［1］对其各自的基本情况作了详细的介绍和简单的对比分，其中《中文核心期刊要目总览》、《中国学术期刊评价研究报告》是采用文献计量学方法按一定的周期（2～4年）对期刊进行的综合评价，根据评价结果将期刊划分为核心期刊和非核心期刊；其他5个则是依托相关数据库得到的各种期刊计量指标及依据相关指标对期刊进行分析评价，本文将其统称为引证指标数据库（CJCR为每年印刷出版的报告，但其是依托中国科技论文与引文数据库（CSTPCD）进行的统计分析，为方便论述，一并称为引证指标数据库）。引证指标是用于分析和评价期刊的重要指标，了解和掌握期刊相关引证指标对提高办刊水平、科学评价期刊有着极为重要的意义，为此，本文在文献［1］的基础上，对上述5个科技期刊引证指标数据库进行对比分析，为科技期刊工作者了解这些科技期刊引证指标数据库及其评价科技期刊的功能等提供参考。

1　分类对比分析

5个引证指标数据库中，CSCD-JCR、CJCR依据各自的源期刊统计得到相关的引证指标，其统计分析的对象不是所有的科技期刊，万方、维普、知网则是依托三大数据库庞大的数据资源对期刊的年度引证指标进行统计分析（万方和知网统计分析的对象包括人文和社科期刊，本文只分析其科技期刊方面的功能），两者存在较大的差别，本文将其分成源期刊引证指标数据库和大型数据库引证指标数据库两类进行分析讨论。

1.1CSCD-JCR和CJCR

CSCD-JCR统计数据以CSCD核心库为基础（2013—2014年度源期刊1141种，其中核心库780种），CJCR的统计源是CSTPCD源期刊（中国科技核心期刊），两者统计分析的都是我国科技期刊中比较优秀的部分，评价主体为专门的研究机构，是国内科技期刊评价最为权威的两个部门。

CSCD-JCR和CJCR基本情况已在文献［1］中有详细的分析说明，以下重点对比分析两者的异同。表1为其2012统计年（2013年出版或上线）相关情况对比。

表1　CSCD-JCR和CJCR对比

两个引证指标数据库虽然都具有较好的口碑和较高的权威性，但各有特色。

（1）两者对源期刊都有一套严谨完整的遴选程序和方法，要对期刊作严格的评估，选出的期刊是我国科技期刊中有代表性的、学术质量较高的期刊，其中CSCD选刊更为严谨，入选核心源期刊数量少，是国内科技期刊中最优秀的部分。

（2）在期刊的分类上，两者有一定的差距。CSCD-JCR按照《中国图书资料分类法（第四版）》将期刊分为66类，且采用复分法，依据期刊所发论文的学科进行分类，每种期刊最多可赋3个类目；CJCR依据《中国图书资料分类法（第四版）》和GB/T 13745—2009《学科分类代码》，将1994种源期刊归类到113个学科类别，每种期刊只归入一个类目。从类目上看CJCR分类更多，学科划分更细，但一种期刊只分入一个类目，对于刊载多于一个学科论文的期刊尤其是综合性期刊，不能反映期刊在不同学科的学术影响力情况；CSCD-JCR采用复分法可以一定程度上弥补这种缺陷。

（3）CJCR提供的引证指标比CSCD-JCR要多，因而能从更多不同的角度对期刊进行分析评价，尤其是设计了较多的学科类别内期刊计量指标（综合评价总分、离均差率、学科扩散和影响指标）来度量期刊在学科领域内的学术影响力、期刊之间互引关系分布和期刊单项指标在学科内的相对位置；CSCD-JCR除常规计量指标外，还引入了h指数来反映期刊整体被引用情况和期刊的整体影响力［5］。

（4）在对科技期刊评价功能方面，CSCD-JCR只提供单一指标，主要按照总被引频次和影响因子这两个国际通行评价指标对期刊排名，还可根据学科被引频次对期刊的学科影响力进行排名，相对影响因子、学科影响力排名能从另一个角度更准确反映期刊在某一学科的地位和真实影响力；而CJCR除可按总被引频次和影响因子对期刊排名外，还设计了综合评价总分这一综合评价指标来对期刊进行综合评价，相比单一指标，综合评价指标更为科学，能更全面、更准确反映期刊的真实情况和影响力。

（5）两者都有较强的检索功能，可从不同的角度查找源期刊的各项指标及排名情况，具体可见文献［1］介绍。

（6）在特色引证指标方面，CSCD-JCR根据学科被引频次对期刊的学科影响力进行排名很有意义，也对期刊分析自身在行业的地位和影响力有较大的参考价值。相对总被引频次和影响因子排名，学科被引频次排名更能反映期刊在某一学科的真实影响力，因总被引频次和影响因子反映的是期刊的总体被引用情况，没有区分不同学科所发论文对被引用的贡献程度，对于不少发文涵盖两个及两个以上学科的期刊，无法真正反映期刊在某一具体学科中的影响力。以《岩土工程学报》为例，该刊一般被认为是建筑（土木）工程类期刊，但CSCD-JCR在2012统计年将其分在水利工程类，按影响因子在水利工程类排名第二，排名高于水利行业公认的最好期刊《水利学报》，但按学科影响力只排名第9，与排名第一的《水利学报》相差甚远（学科被引频次分别为1046和190），相应在建筑科学类《岩土工程学报》学科影响力排名为第3，很明显学科影响力排名比影响因子排名更准确地反映了该刊的学科地位和影响力（2013统计年《岩土工程学报》已改为建筑科学类）。学科影响力排名虽从一个侧面可更准确反映期刊的学科影响力，但其以学科被引频次这一绝对量指标作为排名依据仍存在较大的缺陷，因为学科被引频次没有考虑期刊年发文总量的差异，这对年发文数较少的期刊明显不利，如能像计算影响因子一样计算学科影响因子用于反映期刊的学科影响力会更客观和准确。特色引证指标方面，CJCR除采用综合评价总分来衡量期刊的学术水平和学科地位外，还采用离均差率反映期刊单项指标在学科内的相对位置，采用权威因子反映期刊的权威性。权威因子考虑了不同引用之间的重要性区别，重要的引用被赋予更高的权值，弥补了传统的总被引频次、影响因子只是单纯计算次数的弊端，综合考虑引用次数和引用质量能更客观反映期刊的权威性［6］。

另外，根据CJCR评价结果，中国科技信息研究所从2002年开始每年遴选发布“中国百种杰出学术期刊”，在国内产生了较大的影响。

1.2万方、维普和知网引证指标数据库

万方、维普和知网引证指标数据库基本情况对比见表2（仍以2013年上线的2012统计年为例说明）。

表2　万方、维普和知网引证指标数据库对比

3个引证指标数据库中，维普相对简单，只提供在线查询，而万方和知网既提供在线查询，也正式出版研究报告（万方的《中国期刊引证报告（扩刊版）》和《中国期刊高被引指数》知网的《中国学术期刊影响因子年报》）。

（1）从统计数据来看，万方统计了《中国期刊引证报告（扩刊版）》约6000种期刊（每年会有少量变化），维普以维普资讯收录期刊中的8000余种作为来源期刊进行引文加工，对4000余种中文科技期刊的载文和引证情况作引证分析评价，知网则将统计源从数据库收录的8097种学术期刊扩展到其收录的学位论文和会议论文，数据源更加广泛和有代表性，能更全面反映科技期刊论文被引用和传播情况。但因为对统计源不加区分，将所有引用等同计算影响因子（不同类型、不同水平的引用权重相等），并不能更准确反映期刊的学术水平和行业影响力。

（2）对科技期刊评价方面，都只能按单指标给期刊排序，其中万方不提供学科指标排名，维普排序功能最强，可按学科和地区查询期刊所有8个指标的排名情况，知网以复合影响因子对期刊进行学科排名。

（3）在特色引证指标方面，知网最大的特色是将统计源进行了扩展，设计了复杂的被引指标体系，根据统计源不同区分不同的被引指标，将影响因子分为复合类、综合类、基础研究类和技术研究类4种。知网的研发者对影响因子指标做了大量工作，根据统计源的不同对影响因子进行区分，客观上促进了业内对影响因子的认识［7］，而将影响因子分为不同的类别，如区分基础类和技术研究类，有利于区分不同期刊的属性，对不同期刊分析各自的真实影响力具有较大的参考意义；此外，知网基于对被引期刊文献的学科分类和复合统计源，引入了“学科复合影响因子”，该指标对于准确度量专业科技期刊在某个学科的影响力具有较大的价值（类似于CSCD-JCR的学科影响力指标）。由于影响因子在评价期刊方面存在的缺陷［5-6，8-9］，要科学准确评价期刊，应尽量采用综合评价指标，要提高影响因子评价期刊的客观性，则应提高高影响论文引用的权重，而不是过度扩大统计源和细化影响因子指标体系。采用复合影响因子作为评价期刊的主要指标和期刊排名的依据，虽然能更全面地反映期刊论文被引用和传播情况，但并不能更准确反映期刊的权威性［6］和学科影响力，将其作为对期刊进行排名的依据可能不如基于源期刊的影响因子准确。

（4）万方的高被引指标体系提供5年被引指标，比影响因子和总被引频次基于两年的数据能更准确反映期刊的被引真实状态，而学科高被引文章分布数（某学科被引最高的100篇文章中，该期刊所贡献的篇数）指标可从另一个侧面反映期刊在行业中的影响和地位，具有较大的参考价值。以水利工程学科为例（表3），2005—2011年学科高被引文章集中分布于《水利学报》和《水科学进展》，其他期刊只有零星分布，准确反映了这两份期刊在行业中的领导地位。

表3　水利工程学科高被引文章分布数

（5）在检索功能方面，万方只能查询个刊数据，不能按学科检索，没有排序功能，只提供选择最多5个期刊进行对比；维普统计指标偏少，对期刊的评价功能相对较弱，但检索较方便，可按地区和学科排名，其按省份检索引证指标有一定的特色；知网有较强的检索功能且有很强的文献网络传播追踪功能，能查询到网络文献下载的详细情况（下载的时间、地区等），也可查询学科复合影响因子排名情况，还可选择最多5个期刊进行对比分析。另外，知网从2012底开始发布中国最具国际影响力学术期刊名单和《中国学术期刊国际引证年报》，在国内产生了一定的影响。

2　引证指标数据库的科技期刊评价功能比较

如前所述，5个引证指标数据库均提供了一系列的相关统计指标，可供评价分析者从不同的角度来评价分析科技期刊，部分引证指标本身也可直接用于评价科技期刊（如《中国科技期刊研究》每年均刊登中国科技期刊CSCD被引频次和影响因子300名排行表，知网以复合影响因子对期刊排名等，都是对期刊的一种评价结果）。因此，各引证指标数据库每年发布的引证指标可视作对期刊的一种评价。由于各数据库提供的引证指标相差较大，相应在期刊的评价功能上也各不相同。

（1）统计源不同。任何引证指标数据都是基于对统计源的统计分析得到的，因此采用的统计源不同得到的指标数据必定不同。5个引证指标数据库统计数据源差距较大，CSCD-JCR统计源为CSCD的源期刊，CJCR为中国科技核心期刊（CSTPCD源期刊），万方、维普、知网则各自依托其庞大的数据库所收录的期刊，且知网还将统计源扩展到学位论文和会议论文。

（2）可评价的对象不同。大型数据库的引证指标数据库可评价的对象基本涵盖了所有正式出版的科技期刊，而基于源期刊的CSCD-JCR和CJCR对象仅是其相关数据库的源期刊，范围较窄。万方、维普、知网几乎可以查到国内所有科技期刊的相关引证指标，利用这些引证指标可对绝大部分科技期刊进行分析评价，而CSCD-JCR和CJCR只能用于评价分析CSCD和CSTPCD收录的期刊（CSCD-JCR除源期刊外，在被引频次排行和学科影响力排行中也能查到部分具有可显示度的非源期刊的相关指标）。

（3）评价方法不同。对期刊的评价有单一指标评价和综合指标评价两种方法。除CJCR外，均只能采用单一指标来对学科期刊或全部期刊排序，如知网是根据复合影响因子对期刊进行学科排序来评价期刊。针对单因子难以全面、准确评价期刊的学术水平和学科地位的缺陷，CJCR则采用综合评价指标——综合评价总分来对期刊进行综合评价，该指标根据科学计量原理，系统地综合考虑被评价期刊的各影响力指标在其所在学科中的相对位置，采用层次分析法确定各指标的权重，对这些指标进行综合集成，因此能屏蔽各个学科之间总体背景值的差异，可以跨学科比较，即对所有源期刊进行总排名比较［4］。

（4）评价指标不同。各引证指标数据库提供的评价计量指标相差较大，万方提供了3类26个指标，而维普只有8个指标。由于提供的指标不同，不同数据库用于评价科技期刊的功能差距也很大，如CSCD-JCR引入h指数来反映期刊整体被引用情况和期刊的整体影响力［5］，根据学科被引频次对期刊的学科影响力进行排名；CJCR采用综合评价总分来对期刊进行综合评价，采用离均差率度量期刊学科内的相对位置，采用权威因子反映期刊的权威性；知网则通过引证指标、出版指标和网络传播指标3大类27项具体指标来从各个方面对期刊进行分析，并将影响因子细分为复合类、综合类、基础研究类和技术研究类4种来对期刊在不同数据源情况下的影响进行深入的评价分析；万方的高被引标指标体系具有一定的特色，如学科高被引文章分布数对于了解期刊在某一学科中的地位具有重要的参考价值。尽管评价指标的多少不能说明一个评价体系的客观及科学性，但提供可评价期刊的指标越多，越能从不同的角度反映期刊的影响力和学术水平，因此在分析研究期刊影响力的时候，选择的评价指标应尽可能囊括对影响力有关的指标进行考量是必要的［7］。

3　引证指标数据库用于期刊评价的分析

正如引证指标数据库名称（“期刊统计分析与评价”、“中文科技期刊评价报告”和“个刊影响力统计分析数据库”等）所反映的，引证指标数据库主要功能就是对期刊进行评价（如CJCR综合评价总分排序、知网的复合影响因子排序本身就是对期刊的评价结果）或提供相关的引证指标供分析者用于对期刊进行分析评价，因此，其评价结果或采用的引证指标的科学性合理性就显得非常重要，深入分析和了解各引证或评价指标，对于准确评价期刊以及正确理解和认识各引证指标数据库各种排序结果具有十分重要的意义，从而能客观看待对期刊的各种评价结果，不人云亦云，不被各种“指标”牵着鼻子走。

（1）期刊的分类方法。各引证指标数据库对期刊分类依据以中图法为主，少数依据GB/T 13745—2009《学科分类代码》，划分的类目也多少不一，CJCR对科技期刊分类最细（113类）；分类方法也不相同，CSCD-JCR采用复分法；CJCR、万方、维普每种期刊只归入一个类目，知网按期刊在不同学科发文总数分类，将期刊分在发文数最多的学科，综合类期刊可分在两个类中。总体上，对期刊的分类或多或少都存在与实际情况不相符的现象，由于期刊的评价主要是按照学科进行的，合理划分学科和对期刊合理分类尤其重要［7］，是期刊评价的基础，如知网将电气工程类期刊《电网与清洁能源》分在水利工程类，复合影响因子排在第3，而在电气工程类则只排到15，可见分在不同类中的评价结果差距巨大。此外，对学科更细致划分，分类类目更多更可能准确给期刊分类。

（2）对期刊评价方法和评价指标方面，CJCR采用综合评价总分这一综合评价指标来对期刊排序，其他4个都只能提供单指标数据来分析和评价期刊.由于一个指标只能反映期刊某一方面的情况，提供一种参考视角，用任何单一指标评价学术都是片面的［10］，因此采用单一指标评价期刊也具有一定的片面性；而以综合评价指标评价期刊则相对更为科学，能更准确反映期刊的学术水平和学科影响力，评价结果会更符合实际情况。虽然采用综合评价指标较单一指标用于评价期刊更具合理性，但综合评价指标的科学性和合理性依赖于其计算采用的多指标综合评价方法是否能构建全面衡量我国科技期刊质量的评价指标体系以及确定稳健有效的多指标赋权方法［11］，很多多属性评价方法的权重或者评价本身严重依赖数据［12］，如指标体系及确定指标权重的方法存在缺陷，则得到的综合评价总分用于度量科技期刊的学术水平就可能不准确，用于学科内期刊综合排名仍会存在一定的误差。对于单指标评价，CSCD-JCR以学科被引频次来评价学科影响力较影响因子在评价期刊学科排名上更有优势，它排除了影响因子计算不区分学科引用的缺陷；但由于学科被引频次是一个绝对量，没有考虑期刊发文量的影响，且和影响因子一样也没有区分不同引用的重要性差异，用其评价期刊的学科影响力仍有较大缺陷。知网等以影响因子对期刊进行学科排名，与期刊实际学术地位和影响力会存在一定的误差；对于学科影响力的评价，知网的学科复合影响因子比其他类型影响因子会相对更准确一些。

（3）由于统计数据源存大较大的差距，不同引证指标数据库统计得到的引证指标相差很大，依托大型数据库的引证指标与基于源期刊的引证指标相比，前者基于更广泛的统计源，能更准确、更全面反映期刊被引用和传播情况，但用于度量期刊学术水平和学科地位及影响力则不如基于遴选的源期刊的引证指标更具有代表性，与实际情况的差距可能更大，因为源期刊是经过严格遴选的期刊，基于源期刊统计得到的引证指标相比基于大型数据库的数据，相当于进行了一次筛选，即没有统计非源期刊（影响力相对源期刊较低的期刊）上发表论文的引用数据，因此其影响因子相对更为可靠（相当于提高了高影响论文引用权重），能更准确反映期刊的学术影响力和学科地位，也获得了更高的认可度。

（4）作为最重要的引证指标，影响因子在期刊评价中得到了广泛的应用，也成为最重要的期刊评价指标。由于统计源不同，单纯比较影响因子来评价期刊误差较大，必须是同一个引证指标数据库的影响因子才具有可比性，现实中常见的某某期刊的影响因子达到多少实际参考意义不大，宜明确是基于哪个引证指标数据库的数据才有参考价值。对于影响因子在评价期刊方面存在的缺陷已有深入的研究，其主要缺点是只重数量而不区分不同引用（不同层次引用、不同学科引用）间重要性程度的差异［6，8-9］只反映期刊出版后第一年和第二年的平均影响力，且意外的少数引用次数很高的论文会对影响因子产生很大的影响［5，13］。文献计量学研究表明，由于学科规模和性质不同，不同学科领域论文被引用概率会有较大差距［6，8］。期刊发文一般会涉及多个不同学科，分在同一学科类别的期刊，因发文主题有差距，涉及的学科就不同，被引用的概率就会相差很大；而不同类型文献、不同水平期刊论文的引用其影响也不一样，影响因子的计算对这些因素并不加以区分，将所有引用等同计算，将其用于学科期刊排名，自然难以准确反映期刊在学科中的学术地位和影响力。一般而言，高水平期刊上发表论文的引用更有价值，而学位论文和会议文献的引用价值又低于期刊论文，尤其会议论文，水平参差不齐，引用文献较为随意，而高水平的会议论文大多会在期刊发表而造成引文重复计算［13］；知网将统计源扩大到学位论文和会议论文，其被引指标能更全面反映期刊传播和被引用情况，但统计得到的复合影响因子不仅没有提高高影响论文引用的权重，反而增加了低影响论文的引用数据，用于评价期刊特别是用于学科期刊排名可信度会降低，产生的误差有可能比普通影响因子更大。

4　结语

目前我国与科技期刊引证指标相关的数据系统或产品主要有基于源期刊的CSCD-JCR、CJCR及万方、维普、知网三大数据库的引证指标数据库，他们提供的引证指标数据都可用于从不同的角度来评价期刊，或者直接给出对期刊的评价结果（如CJCR的综合评价总分排名和知网的复合影响因子学科排名等。由于统计数据源不同，各引证指标数据库的引证指标数据差距较大，用于评价期刊结果也会不同。总体来说，综合评价指标排名较单一指标排名能更准确反映期刊的学术水平和行业影响力；基于大型数据库的引证指标能更准确、全面反映期刊被引用和传播情况，但基于源期刊的CSCD-JCR和CJCR引证指标更具有代表性，能更准确反映期刊的学术影响力和学科地位。

*摘编自《中国科技期刊研究》2015年26卷2期198～204页