APP下载

Web of Science 数据服务平台及其在科研工作中的应用

2022-02-19李静芳蒋建龙

甘肃科技 2022年24期

张 勇,李静芳,甄 乾,蒋建龙

(甘肃省科学技术情报研究所/甘肃省科技评价监测重点实验室,甘肃 兰州 730000)

1 WOS简介

1964年美国科技信息研究所(ISI)正式发行了科学引文索引(Science Citation Index,SCI)[1],2000年,ISI推出学术信息资源整合平台(ISI Web of Knowledge),以WOS平台为核心。目前WOS平台归属于Clarivate Analytics,是全球最大、覆盖学科最多的综合性核心期刊引文索引数据服务平台[2]。如果一本杂志被WOS平台的其中一个引文库索引,那么它的所有文章都会被WOS平台覆盖,在互联网、大数据以及与云计算的背景下,WOS平台已成为基于网络的学术信息资源数据平台之一。WOS平台由2个部分组成,即“所有数据库”和“信息分析工具和信息管理软件”,前者包含WOS核心合集(Web of Science Core Collection,WOSCC)、美国生物学数据库(BIOSIS Previews,BP)、韩国期刊数据库(KCI-Korean Journal Database,KCI)、生物医药文献库()、拉丁语区引文索引(SciELO Citation Index,SCIELO)、俄罗斯科学引文索引(Russian Science Citation Index,RSCI)、中国科学引文数据库(Chinese Science Citation Database,CSCD)、德温特专利索引(Derwent Innovations Index Derwent Innovations Index,DII);后者包含科研评估与分析平台(InCites):科研评估与分析数据库(InCites Benchmarking and Analytics,In-Cites:B&A)、基本科学指标(Essential Science IndicatorsSM,InCites:ESI)和期刊引文报告(Journal Citation Reports,JCR);参考文献管理者(Reference Manager)、学术信息市场化和开发学术软件(EndNote)和文献检索插件(EndNote Click)。在“所有库中”以WOSCC最著名、使用最广,其以收录自然科学、社会科学、艺术与人文学科的论文为主,数据来源于期刊、图书、专利、会议录等,收藏了3个经典期刊引文索引,即科学引文索引(Science Citation Index Expanded,SCI)、社会科学引文索引(Social Sciences Citation Index,SSCI)和艺术与人文引文索引(Art&Humanities Citation Index,A&HCI);2个化学信息事实型数据库(Current chemical Reactions,CCR和Index Chemicus,IC),科技会议文献引文索引(Conference Proceedings Citation Index-Science,CPCI-S)和社会科学以及人文科学会议文献引文索引(Conference Proceedings citation index-Social Science &Humanalities,CPCISSH)。WOS平台通过检索技术和基于内容的连接能力,将高质量的数据资源、文献分析和管理软件高度融合,成为科研人员进行论文检索、分析、管理、写作与发表的创新型研究平台。

2 WOS平台数据库的特点

2.1 质量

截至2022年,WOSCC收录了2万多种全球权威的、最具影响力的自然科学、工程技术、生物医学、社会科学、艺术与人文等领域的学术期刊,超过20万份会议录以及10万多种科技图书的题录摘要。历经半个多世纪,WOSCC一贯坚持严格的选刊机制,其依据布拉德福定律,仅收录世界上各学科领域中被高关注度的学术期刊和最著名的会议、座谈、研究会和专题讨论会的会议录资料,包括柳叶刀(The Lancet)、自然(Nature)、细胞(Cell)、科学(Science)等著名学术期刊。WOS平台借助期刊引文报告(JCR)精心筛选和编制的数据,使科研人员充分感受和了解学术界对学科创新的快速反应和巨大影响。2021年《柳叶刀》的期刊影响因子(Impact Factor,IF)为202.731,在全科医学和内科类期刊中排名第一,《自然》成为有史以来第一本在一年内总引用次数超过一百万的期刊。WOS平台推出的JCR、学料规范化的引文影响力值、学科排名、立即指数等成为学术界评价国家地区科研实力、了解“高被引科学家”的发展规律,探析世界科学领域研究热点的重要指标。IF现已成为国际通用的评价期刊有用性、显示度、学术水平,以及作者论文的质量、创新度、影响力的重要指标之一。

2.2 深度

科研人员利用WOS平台获取来自全球出版机构的各种学术期刊收录的自己感兴趣的最新学术论文,并能对部分数据库论文进行近百年的文献回溯。WOS平台通过引用这条主线把数据库收录的论文编织在一起,绘制出一张以时间为轴线,以国家地区、科研机构、研究方向、著名学者、资助基金等为节点的巨大知识网,成为科研人员在有组织科研活动和自由探索活动中快速获得高质量科学数据的知识库。InCites是分析WOS中权威引文数据(SCI/SSCI)的评价工具,其利用计量指标和学科国际标杆数据,将自己研究与全球和学科领域的水平进行深度对比,增加科研人员寻求潜在创新的机会。ESI是跟踪学科领域发展趋势的基本分析工具,是收录12 000多种学术期刊的1 000多万条文献记录而建立的计量分析数据库,它为科研人员提供了对科学活动进行多角度、全方位分析的数据源,以及发现基于多学科交叉知识网结构的重要特征。

科研人员从一篇与自己研究相关的高质量论文开始,利用WOS平台的数据库及文献分析管理工具,通过参考文献发现研究基础,通过被引文献了解后续进展和发展势态,通过相关记录发现学科之间的交叉渗透关系,使得论文检索越查越深,越查越新。WOS平台正如GS,DOI,Sci-hub等论文专门网站一样,也提供了原文链接检索和获取原文论文的窗口。

2.3 广度

WOS平台收藏内容涵盖了超过7 480万个学术数据集,以及254个学科中15亿个引用的参考论文,数据库的子集除了WOSCC外还包括BP、KCI、DII、MEDLINE、SCIELO、RSCI以及CSCD。其中,BP涵盖了100多个国家5 500多种生命科学期刊和1 650多种非期刊文献,收录内容包括揭示生命科学各领域,生物学(植物学、生态学、动物学等)及交叉科学(生物化学、生物医学、生物技术等)和诸如医疗器械和实验方法等广泛研究领域的研究成果;KCI收录超过2 300本韩国学术领域核心期刊,数据可以回溯至1980年,文献多涉及社会科学、人文领域,展示韩国最有影响力的科研学术成果,其引文数据均设置有通往全球研究数据库的链接;MEDLINE收录1966年以来世界70多个国家和地区出版的9 075余种生物医学期刊的文献,近1 100万条记录,数据来源为《医学索引》、《牙科文献索引》和《国际护理索引》;DII收录60个知识产权组织涵盖100多个国家公开的1 300万条基本发明专利,3 000万项专利,每周更新2万5千多个专利数据,回溯至1963年;SCIELO为合作式电子出版物,其期刊覆盖了农业、植物学、动物学、医学等多个领域,数据库直接链接拉丁美洲国家的开放存取期刊,共有200多种期刊;CSCD收录我国数学、物理、化学、天文学、地学、生物学、农林科学、医药卫生、工程技术和环境科学等领域出版的中英文科技核心期刊和优秀期刊千余种。记载1989年到现在的论文记录500余万条,具有一般检索和引文索引检索功能,有助于对交叉学科和新学科的发展研究。WOS平台的JCR覆盖114个国家地区,提供了全面丰富的可按学科和排名进行筛选的文献数据指标,从技术创新和新技术发现,到知识产权的管理保护,直至实现科研创新成果的商业化,涵盖学术研究和政府机构,生命科学与健康,专业服务,消费,制造和技术等各个领域。

WOS平台具有的专业知识和技术解决方案可覆盖创新生命周期的每一个关键环节,WOS的独特之处在于,对每个研究输出中的所有元数据进行索引,包括每个被引用和引用的参考文献,从而在被索引的研究与更广泛的学术文献之间建立了联系。

3 WOS平台数据库的功能

3.1 论文检索、收录与引用

基于WOS平台,科研人员通过论文的已知条件可检索获取该论文的收录、引用、作者、基金、期刊JCR报告等论文基础信息,根据需要跨库检索获取原文。论文检索项支持对已知标题、作者、出版物、出版年、数据库、作者地址、论文类型、研究领域等单独或集成进行,达到检索目标论文及其参考论文、被引论文等的目的。表1为通过已知论文标题Mass Measurements of the Neutron-Deficient Ti-41,Cr-45,Fe-49,and Ni-53 Nuclides:First Test of the Isobaric Multiplet Mass Equation in f p-Shell Nuclei(以下简称目标论文)在WOS平台进行论文检索获得的论文数据。检索结果显示,该篇论文是由中国科学院近代物理研究等作者发表,收录期刊为PHYSICAL REVIEW LETTERS(109卷、第10期、2012年出版);该篇论文在WOS平台所有库中共被引用118次;收录期刊是SCI期刊,其JCR分区为Q1、2021年的影响因子为9.185。需要注意,一篇论文能在WOS平台上检到,并不代表该篇论文是SCI论文,确定该篇论文是SCI论文必须在核心集中的Science Citation Index Expanded中检索到。同时,检索一本期刊是否被SCI收录是通过下拉WOS平台页面“产品”菜单,找到“Master journalist”主期刊列表,输入期刊名称进行检索得到包括期刊官网、被SCI收录的相关信息。

表1 基于WOS平台的目标论文的著录数据

利用WOS 平台进行主题检索的方法与在Springer、Elsevier Science Direct等平台上类似,即将提炼的主题词放入检索页面的添加行,创建检索式,以获取与研究课题主题相关的论文数据;通过添加日期范围、发表日期、出版物语种、论文类型等项目来缩小检索范围,精炼检索结果;利用检索结果页面“Analyze Results”按钮,对检到的数篇论文进行多角度排序,发现诸如引用作者和机构、引证论文的地区分布、高被引科学家等重要信息。

3.2 评价论文、期刊的学术影响力

IF由美国著名论文信息检索专家Eu.gene Garfield博士于1955年提出,是衡量期刊学术影响力的重要指标之一[3]。近年来,IF已成为最重要的论文计量学动态指标之一,被广泛应用于科学研究的辅助工作,帮助科研人员评价来源论文的学术实力、研判科研项目与世界科学热点的聚焦度,同时给科研机构提供了评价科研绩效和人才创新能力的重要依据。Clarivate Analytics每年通过更新JCR推出新的IF,根据IF值的大小排序划分不同区域,形成期刊JCR分区,直观反映不同刊物在同一领域内的水准和排位,某领域1区的期刊即是该领域的顶级刊物。通过JCR可创建感兴趣论文的引文报告,以图表等可视化形式将引文按时间段进行统计并逐年列出,揭示引文的分布情况。科研机构可根据JCR等期刊影响力指标制定期刊订阅政策,论文作者可根据JCR及IF排名决定投稿方向。但JCR只包含SCI和SSCI两个数据集的期刊,只有包含在JCR里的期刊才会有影响因子。表2说明,目标论文的收录期刊PHYSICAL REVIEW LETTER在2017—2021年的JCR分区均在Q1区、学科排名在6~8间、IF 5年平均值为9.319,表明这是一本在本研究领域中具有高质量、高影响力的SCI学术期刊,目标论文同样是一篇具有高价值、影响力显著的SCI学术论文,故通过WOS索引可以提高期刊的可发现性,并且也是获得期刊影响因子的前提。

表2 WOS收录期刊PHYSICAL REVIEW LETTER的学术影响力数据

3.3 构建个人文献图书馆

Reference Manage、EndNote和EndNote Click是WOS平台提供的三款文献管理、检索工具。Reference Manager是建立个人参考文献书目数据库的管理工具,每个自定义数据库可容纳65 000条数据。可通过作者、期刊名、关键词、出版年份等进行查询,制定的参考文献书目与Word等文字处理软件兼容;EndNote是文献管理软件,帮助科研人员进行论文收集、写作、管理。EndNote支持7 000种国际期刊的参考文献格式,同时还提供了几百种涵盖各个领域的杂志写作模板[4],使软件中Output Styles的编辑功能非常流畅、好用;EndNote Click是一款基于浏览器插件的在线获取文献PDF全文的检索工具。EndNote Web个人图书馆基于Web利用EndNote和EndNote Click进行在线搜索论文、建立论文库、定制论文、编排引文。根据目标论文的检索结果创建的EndNote Web个人图书馆的具体操作是:勾选在WOS平台检索到的批量论文中的感兴趣论文,选择“产品”下拉菜单中的EndNote,进入操作界面,在file中选择new创建文件夹,即My EndNote library,选择EndNote的online模式导入Reference Manage或存储在个人电脑;通过EndNote Click在线跨库获得PDF全文;通过Reference Manage对论文进行科学管理,包括标记已读论文、已读论文打分、论文去重、排序、查找。

科研人员可利用EndNote Web个人图书馆建立自己的科学网档案,展示学术影响力;通过导入自己的出版物并添加同行评议,记录填充个人资料,包括WOS核心集的收藏引用计数和h索引等。EndNote Web个人图书馆提高了学术论文的全文获得、撰写、整理和投稿的工作效率,大大提升了科研效率。

4 WOS平台在科研工作中的应用

科研单位利用WOS平台了解区域内科研机构、著名学者、科研动态、发文质量等情况,进行高质量科研论文产出和影响力的调查,研判区域科研实力,评价科研质量,优化科研政策,指导和建议科研工作。科研人员通过WOS平台挖掘学术信息、发现潜力学科,了解近期研究热点、学科全貌及热点聚焦,优化课题布局,实时跟踪课题最新研究进展,提升科研能力。科技服务机构利用WOS平台,掌握基金支持、发文期刊动态、学者信息、会议发布,从海量信息中,创建定题跟踪、引文跟踪、论文检索、查找与引证等增值服务,增强机构人员定向提供科研趋势信息的能力,提升服务机构在学科服务中的价值,丰富增值服务的内容。

4.1 甘肃省科研发展趋势与动态

以2012年1月—2022年8月年被WOS平台收录的甘肃省学术论文为研究对象,采用文献计量分析法,利用InCites数据库中区域、机构、人员、研究方向模块,从多角度分析WOS论文的相关数据,评价基于高质量科研论文产出的甘肃省科研状况。InCites数据库筛选条件设定:区域,State/Province GANSU,CHINA MAINLAND;国家地区,Gansu province;学科分类体系,Web of Science;文献类型,Article、Review;出版年:2012年1月—2022年8月。检索结果显示,2012年1月—2022年8月(InCites数据集更新日期2022年8月26日,WOS平台标引为2022年7月31日)甘肃省发表的WOS论文数量为87 823篇,见表3。

表3 WOS论文数、被引频次、被引频次排名前1%的论文百分比统计

WOS论文的质量指标可直接反映国家地区、科研机构、科研人员的研究实力。甘肃省2012年1月—2022年8月被WOS平台收录的论文中:被引总频次为1 145 104次,被引用过的论文数百分比为77.02%,被引次数排名前1%的论文百分比为1.25%,高影响力论文801篇(0.89%)、热点论文21篇(0.02%)、Q1期刊中的论文30,925篇,见表4。

表4 WOS论文的质量指标值

以表4WOS平台收录的甘肃省87 823篇论文为数据,统计显示,研究方向排名前五的学科主要集中在MATERIALS SCIENCE,MULTIDISCIPLINARY(材料科学,多学科);ENVIRONMENTAL SCIENCES(环境科学);CHEMISTRY,MULTIDISCI PLINARY(化学,多学科交叉);CHEMISTRY,PHYSICAL(化学物理);PHYSICS,APPLIED(应用物理),由此产生的科研论文分别为9 786篇、6 181篇、5 917篇、5 583篇、5 337篇,五类共计发文量占发文总量的39.07%,见表5。

表5 2012年1月—2022年8月甘肃省基于高质量WOS论文产出的优势学科类别统计

分别从被引用过论文百分比、WOS论文数2个维度进一步分析甘肃省WOS论文的产出特征。研究发现,主要发文机构集中在科研院所和高校,见表6。其中,中国科学院兰州文献情报中心的被引用过论文百分比达93.75%,中国科学院寒区旱区环境与工程研究所为93.27%,兰州大学为81.56%;兰州大学发文量达33 265篇,占甘肃省发文总量的39.62%,甘肃农业大学发文量为3 051篇,中国科学院兰州化学物理研究所为6 950篇,中国科学院现代物理研究所为4 706篇。

基于表6分析表明,甘肃省在2012年1月—2022年8月间,基于WOS学术论文的科研产出呈逐年增长趋势,近两年发文量处在历史较高水平;期间论文被引频次表现为波动态势,振幅有限,2020年初达到最高值,但高被引论文数量少、占比低,热点论文占比仅为0.03%;收录期刊的JCR分区在1区中的数量比较多,且学术论文的学科规范化的引文影响力大于全球平均水平。兰州大学、甘肃农业大学等高等院校,中科院近物所等中科院在甘机构成为甘肃地区WOS论文的主要发文机构,甘肃省优势学科为材料学、环境学、物理、化学及应用物理,此类论文在WOS论文中的占比大、集中度明显。研究表明,近十年来甘肃省科研工作呈现稳步发展态势,优势学科在全球范围内具有一定数量的科研产出和影响力,但研究主题与全球聚焦热点有一定差距,WOS论文的发文机构数量偏低,类别单一,区域科研的学科领域发展不均衡,科研创新有待拓展。

表6 研究机构发表的WOS论文数、被引用过的论文百分数统计

4.2 助力国家自然科学基金选题

科研选题是有组织科研活动的组成部分,是科研流程的关键一步,选题过程中要遵循科学性、创新性、可行性以及应用性的基本原则。目前,科研人员仅通过科学基金网络信息系统(ISIS)的公开数据无法满足有组织科研选题的需求,利用WOS平台,包括Incites数据库、ESI和JCR[5]定量分析与选题相关的高水平研究论文,为科研选题提供清晰的研究脉络和可信的评价依据。具体为:科研人员借助WOS平台找到与选题相关的重点论文,查看其中最新发表的核心论文,了解领域学者现阶段研究前沿的主题;深度分析与选题相关的高质量综述性论文,发现学科领域的主题演化态势、交叉学科及衍生主题;掌握与选题相似的论文数量,分析选题的科研趋势、可拓展方向,探明增长较快的新兴主题。利用Incites数据库的多元化指标,通过可视化信息加工工具对相关论文进行深度加工和分析,避免重复选题浪费科研经费,优化选题路径,辅助制定选题策略。以ESI高被引论文和热点论文为出发点,通过探究相关论文的共被引关系,避免只依据基金支持作为选题的单一性。使用ESI数据库的Research Fronts对选题进行横向比对,选取与之热点词关联的研究论文进行深度阅读和全面揭示,提高选题与课题指南的贴合度。

4.3 挖掘研究基础、发现研究方向、追踪领域学者的最新研究成果

早在1955年,Dr.Garfield在Science发表论文,提出将引文索引作为一种新的论文检索与分类工具,即将一篇论文作为检索字段从而跟踪一个Idea的发展过程及学科之间的交叉渗透的关系,WOS平台凭借互联网引文网络,把海量信息进行了有组织、有关联性的梳理,利用Citation Index串联起每一篇论文,构建了一个巨大的科学知识网络,使这种理论成为现实。科研人员在自由探索活动中,通过检索论文,获得与自己感兴趣领域相关的论文及其参考文献、施引文献、相关记录;通过论文、收录期刊、学者、机构、国家地区等维度梳理引文之间的相互关系;通过IF、JCR、h-index等层面判断自己感兴趣领域的最新动态,对即将进行的课题进行评价;通过高被引论文,发现领域研究热点、主要科研机构、知名科研人员及新一代领军人物对领域的推动作用;通过引文报告查看领域论文发文数,关注论文被引用的进程,判断即将进行课题的研究前景;通过“定题跟踪”实时追踪领域最新论文,了解最新进展。具体为:科研人员在WOS平台检索自己感兴趣的论文,挑选一篇核心论文,通过分析论文的参考文献发现其得以延续的理论基础;追踪论文的施引文献,发现其后续研究进展;查看论文的相关记录,扩展论文检索的视角和阅读范围,找到跨学科领域与其相关的论文,从中梳理论文主题的发展进程;创建引文跟踪,实时跟踪某论文、某作者、某机构、某期刊等的最新研究进展。表7为目标论文的引文网络。科研人员从一篇高质量的论文出发,通过引文观察它的发展历程及多学科交叉作用的关系,做出课题发展潜力和趋势的预判,做出这个领域值得研究的选择,助力科学自由探索活动,提升科研创新能力。

表7 基于目标论文构建的引文网络

4.4 扩展选刊视角和范围

WOSCC严格遵循选刊标准,动态遴选全球最具学术影响力的高质量期刊和核心文献资源,完整收录一篇文章的多维度信息。有关“经济学”方向的期刊在CSSCI中只收有74种,如果作为领域文献资源就显得比较有限了,但在WOSCC关于经济与商业Economics &Business相关期刊有21个细分的学科方向超过1 600种期刊。科研人员在投稿选刊时,利用WOS平台优质丰富的文献资源,扩展了选刊视角和范围,借助WOS平台的领域影响力,在国际舞台更好地发出中国学者的声音。以WOSCC下SCI作为数据源,将这项研究的时间跨度限制为20年,研究发现,中国SCI出版物的年产量迅速增长[6]。2018年,美国国家科学基金会发布的一项报告显示,中国成为世界上科学出版物总量最多的国家,中国期刊被SCI数据库收录的数量也发生了巨大变化,根据2000年公布的JCR_S1999,SCI收录的中国期刊仅35种,2010年,这一数据为114种,到2019年,这一数据上升到224种,2020年公布的JCR_S2019,SCI收录的中国期刊达到250种左右。与此同时,出现许多影响因子破10的中国期刊,例如《细胞研究》《真菌多样性》《国家科学评论》《分子植物》等。在WOS平台“分析检索结果”中选择“出版物标题”找到与研究课题合适的推荐期刊,借助JCR了解这本期刊的影响因子、分区、所属学科类别、发文国家/地区、机构发文等,综合判断一本期刊是否适合投稿选刊。利用EndNote中“自动匹配”,输入论文标题摘要,通过大数据的运行算法,推荐与自己论文关键词匹配的信息,帮助找到合适的匹配期刊,确定期刊后,通过“期刊信息”找到投稿指南,进行投稿。

5 结论

通过介绍WOS平台的特点、功能及其在科研工作中的具体应用,阐述了基于WOS平台数据库构建的论文引文网络对科研活动的利用价值,期刊JCR、IF,论文h-index等指标对评价科研绩效、发现区域科研状况的重要性,Incites、ESI数据库的多元化指标在基金选题中的作用以及EndNote在论文管理、创建个人图书馆和投稿选刊中的应用。研究揭示,WOS平台已成为科研人员进行有组织科研和自由探索活动的文献数据支撑,成为科研人员进行检索、分析、管理、写作的创新型研究平台。