国外学术期刊评价的历史演进与发展趋势分析
2021-11-14齐东峰
文/齐东峰
学术期刊作为报道、传播科研成果的重要载体,自17世纪中叶第一种学术期刊《学者杂志》(Journal des Scavans
)问世以来,就成为文献信息资源的重要组成部分。学术期刊诞生初期,期刊的种类少、刊载的文章数量小,它所承载的文献信息很容易获取。随着社会的进步、科学技术的不断发展,学术期刊的种类快速增长,其所刊载的文献信息数量也随之成倍增长。如今,科学技术更是突飞猛进,社会的进步日新月异,全球每年出版的学术论文数以百万计。据《乌利希全球连续出版物指南》(Ulrichsweb Global Serials Directory
)统计,至2020年12月,全世界在发行中的(Active)学术期刊已达21万种。学术期刊数量及其刊载文章从无到有,由少至多。对于学术期刊的使用者而言,面对逐渐增加且浩如烟海的学术文献,如何更快速有效地获取自己所需信息?对于图书馆而言,如何在期刊数量庞大与资源建设经费有限的矛盾下合理配置资源?这些逐渐成为复杂而艰深的问题,需要科学地、系统地加以解决。因此,随着图书馆学、情报学、文献计量学等科学的逐步发展,学者们基于对学术期刊的性质、特点、功能及人们利用文献的规律等诸多方面进行研究,逐步发现并建立了适合学术期刊不同历史发展阶段的方法、体系和工具。国外学术期刊评价的历史脉络
(一)二次文献的出现与其评价功能
自第一种学术期刊产生后,学术期刊很快在欧美各国成长起来,并表现出强劲的影响力与生命力,至19世纪末,其数量已有10 000种。为了让更多的需求者获取学术期刊刊载的学术成果信息,文摘或索引等二次文献期刊登上了学术期刊行业的历史舞台。虽然这一时期的学术期刊也已经细化到数学、物理、化学、生物、医学、动物学、人类学、工程、地质学、考古学、语言学、经济学、政治学等方方面面,但由于出版规模尚不算宏大,并且各种期刊分散在不同的国家,在当时能够获取相关的期刊信息已实属不易,更无法谈及对世界上的学术期刊进行系统性的评价。20世纪初,社会的文明程度逐步提高,科学技术快速发展,尤其是在自然科学领域,科学研究的经费投入越来越高,科学发现和科研产出越来越多。全球的学术期刊品种,尤其在发达国家,呈现出现螺旋上升的趋势。19世纪中叶欧美各国的科技期刊仅有1 000余种,19世纪末时达10 000种,到20世纪中叶,已猛增到35 000种。学术期刊,不仅在数量上不断地发生着变化,涉及的学科领域也越来越广,很多期刊的品质越来越高。与此同时,相同领域的不同学术期刊之间也出现了一定的质量或业界口碑的差距。受此影响,文摘索引类期刊也不断地随之变化。一方面,大量的文摘索引类刊物应运而生,截至20世纪60年代,全球的文摘类期刊已到达了1 500多种。另一方面,在许多学科领域,为了适应学术期刊刊载内容的精细化发展,文摘类期刊开始分辑出版,从每种出版一辑增至多辑,有的文摘期刊甚至出版几十至上百辑。然而,即便文摘索引类期刊能够随着学术期刊出版的迅速发展而发展,但它们作为检索工具已不能且不应该将世界上某一学科领域的所有论文文献都收录进来。因此,一些文摘索引类期刊检索工具开始制定选择来源期刊的标准,有选择性地对学术期刊及其所刊载的论文进行收录。这些检索工具对编辑出版、论文评审制度、学术期刊刊载论文的质量、编委、是否采用同行评议等方面均有一定的要求,在某些学科领域甚至对期刊刊载论文自身的时效性和国际性也有一定的要求。所以说,除具备文献检索、为学术期刊评价提供基础数据的功能外,它们对学术期刊的筛选也间接地起到期刊评价的作用。
(二)学术期刊评价的萌芽
文摘或索引等二次文献期刊在产生之初,主要目的在于发现存世的学术期刊并让更多的需求者获取相关信息,并没有特意针对哪些期刊更加重要、更具价值等方面的问题有选择地去收录或编制。然而,全球学术期刊数量的急剧增长给文献管理与利用带来越来越大的困难。学者们因此开始注重期刊文献数量与质量的规律以及文献科学管理的研究。学术期刊评价就是在这样的社会背景下开始萌芽的。
19 世纪下半叶,美国一位叫作弗兰克·谢泼德(Frank Shepard)的法律出版商注意到了美国联邦法院和州法院以及美国其他联邦机构各种判例之间的关系,在判例和援引案例之间建立索引,使之形成援引和被援引的关系,并统一编制成一览表。1873年,谢泼德成立了谢泼德引文公司,将该一览表编制成法律判例的检索工具出版,这就是著名的《谢泼德引文》(Shepard’s Citations
)。《科学引文索引》(Science Citation Index
,简称SCI)的创始人尤金·加菲尔德(Eugene Garfield)曾这样评价《谢泼德引文》:“它用施引与被引的关系将判例和法律条文形成了一个关系网,很多法律诉讼因为在该引文中查到了相关判例而诉讼成功,这是其他检索工具无法做到的。”加菲尔德在回忆创建《科学引文索引》的历史时也亲口承认《谢泼德引文》是他创造《科学引文索引》的灵感来源和原始模型。19世纪末至20世纪初,文献与情报研究人员在《普尔期刊文献索引》与《谢泼德引文》的基础上对文献计量分析开始了尝试性的工作。比较重要的有,英国动物学教授、文献学家弗朗西斯·科尔(Francis J.Cole)与动物学家内莉·伊尔斯(Nellie Eales)的《比较解剖学的历史,第一部分——文献的统计分析》,英国专利局图书馆学家爱德华·温德姆·休姆(Edward Wyndham Hulme)提出的“统计书目”的说法,P.L.K.格罗斯(P.L.K.Gross)与E.M.格罗斯(E.M.Gross)提出的“引文分析”概念等。
(三)学术期刊评价基础理论的诞生
20世纪30年代至60年代,研究者们在期刊文献研究方面的一个显著特点是开始注重理论研究。一些研究者在文献统计与分析的基础上,开始从典型到一般进行归纳,从局部到整体进行发掘,寻找文献的规律,以期建立具有普遍指导意义的理论性结论。一些从载文、引文与使用等角度对学术期刊进行评价的相关理论与定律因此而相继出现,如布拉德福定律、加菲尔德定律、普赖斯指数和特鲁斯威尔定律等。
布拉德福定律、加菲尔德定律、普赖斯指数和特鲁斯威尔定律分别从期刊的载文规律、引文规律、生命周期、使用规律等四方面构成了期刊评价的理论基础。布拉德福定律从期刊载文量的角度揭示了科学文献的分散与集中,为图书馆核心期刊遴选提供了最基本的理论支持。加菲尔德定律从期刊论文与参考文献之间引证关系的角度,为核心期刊遴选提供了重要的量化测度指标。普赖斯指数从期刊论文的科学价值生命周期的角度对于引文数据的量化提供了时效性的参考。特鲁斯威尔定律则从用户的角度出发,以文献传播与流通的数据作为量化准则,为学术期刊评价及图书馆期刊的续订与撤订提供了理论依据。
(四)学术期刊评价的深化发展
20世纪30年代,布拉德福在提出文献分散与集中定律的同时,第一次提出了学术期刊“核心区”(nucleus)的概念。最初的“核心区”主要反映特定学科领域相关论文分布的情况。20世纪60年代,加菲尔德通过对期刊参考文献的大量统计与分析,既证明了布拉德福定律的正确性,又从引文的角度发现了期刊文献集中与分散的规律,在学术期刊“核心区”的基础上提出了“所有学科的核心期刊加在一起不会超过1000种,实际上,各学科最重要的核心期刊总和甚至少于500种”的论断,并相继推出了《科学引文索引》《社会科学引文索引》《艺术与人文引文索引》等具有期刊评价功能的工具。引文分析法的出现和引文工具的使用,使图书情报领域对期刊评价的理解发生了根本性的变化,它不仅仅反映了特定学科领域相关论文分布的规律,同时也反映了学术论文的学术价值以及相应期刊的质量。此时,期刊评价由对期刊论文数量的统计的评价转变为对期刊文献质量和学术价值的评价。1969年,特鲁斯威尔又从文献利用的角度验证了80/20法则在文献领域的适用性,也从文献利用的角度为期刊的评价及核心期刊的遴选实践提供了重要理论支撑。从此,学术期刊的评价开始向指标化、体系化的方向深入发展。
在学术期刊评价理论的基础上,国内外文献信息服务机构、各领域的科学家、出版机构等通过深入的研究与实践活动逐渐形成了一些具有实操性的期刊评价工具。只是不同的期刊评价工具研究与运用主体,对期刊评价的目的略有不同。例如,图书馆等文献信息收藏与服务机构通常以采选期刊和剔除老化期刊为目的;科学家们则试图利用期刊评价工具找出其研究领域最具有影响力的期刊去发表学术成果;出版机构则希望通过期刊评价工具指导其编辑实践与出版政策的制定等,从而提高其出版物的质量与影响力。基于此,国外陆续诞生了由各种不同期刊评价工具研究主体研制的具有不同评价功能的学术期刊评价工具。
国外学术期刊评价的未来趋势分析
随着期刊出版、网络技术、学术交流以及信息传播等相关环境的不断变化与发展,未来学术期刊评价的指标与方法也将更加多元化、更加公众化、更加注重用户的体验与评价、更加注重评价的深度与广度。
(一)新兴媒体相关数据被纳入评价数据
虽然布拉德福定律、加菲尔德定律、普赖斯指数和特鲁斯威尔定律分别从期刊的载文规律、引文规律、生命周期、使用规律等四方面构成了期刊评价的理论基础,但由于加菲尔德发现的引文规律与分析方法逐渐形成了成熟的理论体系并被广泛地接受,因此传统的期刊评价在20世纪下半叶至21世纪初更多地围绕着学术期刊载文的引文关系展开,影响因子、五年影响因子、即年指标等学术期刊计量指标一直在学术期刊评价活动中发挥着重要的作用。基于引文分析的学术期刊评价虽然具有文献检索、发现研究前沿、预测研究趋势等作用,但由于学术成果从发表到被引用的周期较长,所以无法即时反映学术期刊的影响力。在学术社交网络如此发达的今天,在线科研交流的周期更短、评审制度更加自由、交流单元逐渐细化到了科研工作者个人或科研机构,学术成果的发布形式更具多样化,许多学术成果的贡献者与使用者通过不同的社交媒体对学术期刊作出了重要的评价。这些评价恰好可以弥补传统引文分析方法重现象轻质量的缺陷,同时也能够从用户的角度出发开展学术期刊评价,使学术期刊的评价更具真实性与全面性。因此,近年来基于新兴媒体的学术期刊评价模型逐渐进入学术期刊评价领域。它们对学术期刊的网络使用情况、被获取情况、被提及情况、社交媒体的引用和评价情况进行数据挖掘和分析,形成了重要的评价方法,这就是“替代计量学”(Altmetrics)的方法。随着替代计量学的进一步发展,许多替代计量学相关工具不断涌现,如Altmetric.com、ImpactStory、PlumX Metrics、PLoS ALMs等。针对新兴媒体的相关数据,这些不同的替代计量学工具都拥有着许多相同的计量指标。从替代计量的数据来源看,替代计量指标主要包括博客替代计量指标(Blogs altmetrics)、推特替代计量指标(Twitter altmetrics)、新闻替代计量指标(News altmetrics)、政策文件替代计量指标(Policy document altmetrics)、脸书替代计量指标(Facebook altmetrics)、视频替代计量指标(Video altmetrics)、同行评议替代计量指标(Peer review altmetrics)、问答平台替代计量指标(Q&A altmetrics)等。从网络活动与交互的类型上看,替代计量指标还可以分为阅读替代计量指标(Readership altmetrics)、下载替代计量指标(Download altmetrics)、收藏替代计量指标(Favorite altmetrics)、分享替代计量指标(Share altmetrics)、提及替代计量指标(Mention altmetrics)、评论替代计量指标(Comment altmetrics)、再利用替代计量指标(Reuse altmetrics)等。
当然,相较于传统的学术期刊评价指标,利用新兴媒体数据形成的学术期刊替代计量评价指标和评价工具是全新的学术交流评价体系。这虽然是学术成果影响力的综合评价,但由于数据源的查询方式不同、更新频率不同、收集方式不同等因素,仍缺乏统一遵循的最佳实践标准,仍有待进一步地规范与完善。
(二)不同评价指标深度融合
学术期刊的评价总是一种相对的评价,是在特定的时间范围内,利用特定的指标与评价体系,在某些特定的条件下进行的。因此,这种评价只能是一种特定历史阶段的评价,存在缺陷是在所难免的。例如,影响因子这一指标就会受到发行频率、刊载论文容量、学科领域、时间窗口界线等诸多因素的影响而导致期刊影响因子计算值难以公平、公正、合理。h指数存在对高被引和低被引文章均不敏感、未充分考虑时间窗口界线等问题。特征因子存在着对学科敏感性较弱、评价结果区分度较差、受网络结构影响较大等问题。SCImago期刊排名指数存在着未对原创文章与综述文章进行区分,造成测量值评价准确性降低的问题。引用分数这一指标同样存在着将期刊论文、综述、评论等类型的文章赋予相同权重的问题,它在数据的计算方法上与影响因子差别不大,无法从根本上解决影响因子目前已存在的问题。
在新媒体融合时代的大背景下,学术期刊评价经历了从传统的单一简单指标到复合指标、由单一的评价方法到综合性评价方法、由单一维度到多维度的演化及动态发展过程。在当前期刊评价指标及其评价方法存在众多问题的情况下,学术期刊评价也应根据时代特征与环境做出一定的改变,多维度、多指标融合地进行学术期刊的综合评价。未来的期刊评价将会更加深入地分析各评价指标的优缺点,充分利用不同评价指标的侧重点,有针对性地改进不同指标的缺陷,形成多指标融合的评价方法。这种深度的融合,将更加契合学术期刊需要从载文、引文、网络关注、社交媒体评价等不同的侧面反映其影响力的需求。深度融合的综合性评价,既可以根据特定的需求,从某一个侧重点,如引用频次、网络关注度、用户行为数据等,深入评价学术期刊,也可以将多个指标进行综合,通过测度学术期刊多方面的不同特征值,全面反映其综合影响力。
目前,专注于学术期刊评价与研究的一些机构,已经尝试迈出多评价指标深度融合的第一步。2017年6月,科睿唯安宣布与Impactstory建立一种全新的公私战略合作伙伴关系,致力于开发并创新型分析与工作流解决方案。同年,PlumX Metrics被爱思唯尔收购。如今,在所有Scopus界面下,用户可以查到学术文献的PlumX Metrics相关数据。
结语
从索引文摘类期刊的出现算起,国外学术期刊的评价已经有200余年的历史。在这200余年中,期刊的评价由简入繁、由浅入深、由粗至精,不断地积累经验、创新方法,尽最大可能地满足学术期刊在不同时代的不同需求。然而,学术期刊评价作为一个实践性非常强的科学评价活动,它永远不会是完美的,不可能普适于与学术期刊相关的所有利益相关者,如编辑、作者、用户、出版机构、文献服务机构等,而是会在不同的环境下,将评价方法本地化,更加科学合理地为相关评价活动服务。