“双一流”背景下理性应用WOS系列数据库助推学科服务
2020-06-22吕茜倩
吕茜倩
[摘 要]WOS系列数据库(包括Web Of Science、InCite及ESI数据库)作为学科绩效的评估工具,在国家遴选“双一流”中发挥了重要作用,并受到国内各高校与研究机构的广泛关注。现阶段,各高校重视利用该平台进行机构评估、学科分析等,以优化学科布局、发展潜力学科,有目的地提升本机构的“双一流”建设能力。文章基于该系列数据库在使用过程中的问题,提出理性应用该系列数据库,思考并提出了如人工规范与比对、纳入权重分析、鼓励申请ORCID、结合其他学科评估指标、增强提供科研趋势信息的意识等在学科服务中的参考策略,给学科分析工作提供思路,助推高校学科科学发展与规划。
[关键词]WOS系列数据库;评估工具;学科建设
[中图分类号] G209 [文献标识码] A [文章编号] 2095-3437(2020)06-0192-03
继《统筹推进世界一流大学和一流学科建设总体方案》印发后,“双一流”建设受到了我国各级政府及高校的高度重視,现阶段国内对于“双一流”的评价主要是基于科睿唯安旗下的WOS(Web Of Science)数据库、InCite科研评价与分析平台、ESI数据库(以下简称WOS系列数据库)的统计指标。WOS系列数据库主要以引文分析数据作为基本指标对国家、机构、学科等进行排名,是当前世界范围内比较公认的学科绩效评估工具,其中ESI数据库提供的1‰学科成为国家“双一流”筛选的重要参考指标。但该系列数据库作为一个国际论文统计数据库应用于我国学科建设与分析时,存在着是否与我国高等教育实际相符、能否满足高校科研人员需求、结果能否代表机构科研实力等问题。本文通过对其功能进行思考与分析,提出相应对策,为高校图书馆学科分析服务提供参考。
一、WOS系列数据库简介
WOS数据库以Web Of Science核心合集(科学引文索引数据库SCIE、社会科学引文索引数据库SSCI等)为核心,提供了自然科学、工程技术、生物医学、社会科学、艺术与人文等多个领域中高质量、可信赖的学术信息。而InCite科研评价与分析平台是基于WOS核心合集的引文数据进行出版物计数和指标计算建立起来的科研评价工具,数据每月更新。利用InCite科研绩效平台可以多角度、时效性进行成果分析和绩效研究,对科研战略决策制定起到辅助作用。ESI数据库是基于WOS数据库的SCIE(Science Citation Index Expanded,科学引文索引扩展版)和SSCI(Social Science Citation Index,社会科学引文索引)数据库收录的Article、Review两种类型文献建立的参考型数据库,并将这两个数据库的数据进行合并划分为22个学科领域,这有利于在学科分析工作中对学术科研指标的实时参考比对。
WOS系列数据在具体应用时需要将三者结合起来,其在开展机构、人才评价及学科分析、发现研究前沿与热点方向、寻找高水平合作、发现友好期刊等方面发挥了重要作用[1-4],可以帮助高校与科研机构优化学科布局、定位高影响力人才、了解研究前沿、扩展高水平国际合作。而且数据库实行定期数据更新,这种统计设置保证了结果的科学性与前沿性,有利于实时分析学科产出与影响力。
二、使用时发现的问题
WOS系列数据库本质可以作为学科绩效的评估工具使用[5],既然是工具则必然存在不足与需要改进之处,在使用中,我们发现该系列数据库在学科分类、积分规则、数据处理等方面存在一些问题,现进行分享与讨论。
(一)ESI的学科分类与我国教育实际不符
ESI将SCIE与SSCI收录的上万种期刊划归到其固有的学科分类中,共分为22个学科,其中既有精细分科,如免疫学、分子生物学和遗传学,也有粗略统计,例如工程学。就我国教育实际而言,《教育部学位授予和人才培养学科目录》中的110个一级学科分类更为符合我国高校的院系和专业设置,但该一级学科分类并不能与ESI下的22个学科一一映射,如上述提到的ESI工程学就涵盖了我国除计算机学和材料学以外的其他工科一级学科;还有部分学科根本无法和ESI学科建立映射关系,如马克思主义、军事学等共计33个一级学科未包括在学科映射表中,导致高校的这部分学科成果在统计过程中出现不能够系统化查找、学科归属不明确的问题。可见,运用ESI平台进行学科统计分析对我国学科馆员来说不是十分便利,结果存在一定的迷惑性和误导性。
(二)InCite分析平台中对标机构规模不统一
InCite分析平台对其中涉及的机构并没有按照规模进行比对,这样就出现了例如国内对标机构中既含有北京大学、清华大学这样的综合性大学,也有成都医学院这样的专业性院校,还有包括研究所在内的社会企事业单位,将所有涉及机构不分规模与性质进行对标和排名时,一方面难免会造成相对于综合性大学来说,专业性院校实力欠缺,学科表现不够;另一方面,不同专业性质的机构由于对比数据和水平不一致,排名的参考性较弱。这两方面可能会打击某些专业性大学和小规模研究机构学科建设的积极性。
(三)WOS与InCite检索结果存在出入
虽然InCite分析平台中的资源是基于WOS的核心合集数据库建立的,但是由于二者更新频率、后台算法等一些原因,导致在同样的检索条件下,两个数据库呈现的结果略有差别,带来了学科分析与评估时的比对困难。由于InCite平台与WOS数据库更新时间不同导致在相同检索条件下检索出的发文数量存在差别,以“成都医学院(Chengdu Medical College)”为例进行检索,在设定同样的检索条件之后,WOS显示的检索结果同InCite显示的结果在数量上存在20余条的出入。再者,因为WOS与ESI后台纳入文献范围及算法的区别,在相同检索条件下两者提供的“高被引文献”和“热点文献”也时常会出现数量上的不一致。
(四)数据统计未引入权重概念
笔者在使用过程中发现,InCite平台及ESI数据库在计算学科影响力时未引入贡献度权重与引用权重。计算规则不区分发文的通讯作者、第一作者或参与作者,只要是参与发表有作者和机构署名的论文,都会计算为某机构或某作者的成果产出。同理,在计算论文影响力(被引频次)的时候,也是采用累积相加模式。
以上计算方式导致的结果是即使在没有主研项目或撰写论文的情况下,只要参与的发文多,且被引次数多,平台便自动将其计算划归为高产量或高影响力的机构和作者,这种“利益均沾”的计算方式可能会打击一部分学者的科研积极性,也可能会导致一些机构采取“抱大腿”的方式提升本机构的学科产出和影响力。
(五)机构分析未细化到具体二级部门
InCite及ESI数据库在计算学科产出与影响力时,是以一级机构名称进行统计的,没有相应选项可以细化到某个机构的具体二级部门,这对于统计某一机构二级部门的学科贡献来说较为烦琐。平台未将结果细化到具體二级部门的原因,可能在于学者对同一个机构相同二级部门的英文表达未能统一规范,导致数据无法有效抓取。以成都医学院“检验医学院”署名为例,在InCite数据库成都医学院发文检索中,用以表达该院系的方式共有五种,分别是“Sch Med Lab SCI”“Lab Med Sch”“Sch Lab Med”“Dept Lab Med”以及“Dept Med Lab Sci”,不仅平台无法进行有效统计,对学科建设与规划工作中的数据清洗也带来了一定的难度。
(六)作者署名处理欠妥
WOS系列数据库对于作者的署名统计,存在以下两个方面问题:1.相同发文作者由于署名完整拼写、缩略拼写、格式不同等原因,导致发文成果不能累加计算;2.不同发文作者在署名英文拼写相同时,会将发文成果归于一人名下。
举例说明,第一种情况表现在以同一机构检索出的学术论文,显示该机构中发文作者有“Li,LM”“Li,L-M”和“Li,LiMei”三位学者,署名经查证规范后应属于同一人,但是平台在计算产出和影响力时是分别按照三位不同发文作者进行统计的,不经后期规范很容易丢失数据。第二种情况表现在当我们需要检索学者“Zhang,Tao”近十年的发文情况时,出现了上万条结果,既有来自南开大学的“Zhang,Tao”,也有来自中国中医科学院的“Zhang,Tao”,还有来自西南大学的“Zhang,Tao”,造成择取信息的不便与混乱。
三、学科分析服务的相应策略
WOS系列数据库统计的结果仅应作为我国学者国际论文发文的情况参考,其相关统计不能完全作为机构、学者科研能力与影响力的评价指标,也同科研绩效无必然关系,为高校学科建设建言献策还需要客观对待并灵活运用该系列平台工具,广泛纳入评价指标。
(一)学科手动比对
对于ESI数据库学科分类与我国实际教育情况不符的问题,我们在呼吁ESI平台改善的同时,现阶段可利用手动比对的方式进行ESI学科分类与我国学位委员会一级学科分类的初步映射。具体操作如下:1.在InCite平台的“Schema”选项下按照ESI学科分类检索并导出所需的X学科论文;2.根据导出论文信息表中的“入藏号”一栏,在WOS数据库核心合集中进行入藏号字段检索(保证文献准确)查找X学科全部文献,每次检索都暂存“标记结果列表”,以防数据丢失;3.将检索结果勾选后选择“保存至InCite”一项,结果将会保存在InCite平台的“My Folders”中;4.在“My Folders”中打开保存文件,选择Schema中的“China SCADC Subject 77 Narrow”,呈现的分析结果便是ESI某学科文献在我国一级学科分类中的分布情况。当然,这种操作方法中提到的X学科必须是在ESI学科分类和我国一级学科分类中都涵盖的学科,像马克思主义理论、军事学等ESI中无涉及的学科,仍需要根据学科特点、学术成果内容及国家相关学科政策等制定手动映射表并由专业人员进行分析比对。
(二)注重WOS与InCite、ESI功能紧密配合
在具体应用时,需要将WOS、InCite及ESI中的数据与功能结合使用。WOS数据库具有每日更新的特点,并且其根据文献内容有其自己的WOS研究方向划分,在对标高校成果时,将ESI与WOS结合起来不仅有助于及时追踪发文情况与学科阈值,同时也能够弥补一些学科不对应造成的统计难题。在对待分析结果时,考虑多方位因素,结合WOS数据库的“创建引文报告”“分析检索结果”与ESI数据库提供的各项阈值,并利用InCite平台对机构、国家/地区、研究领域等不同分类进行综合分析,这有助于获得更为理性客观的结果。同时重视对InCite平台中学科规范化影响力(Category Normalized Citation Impact, CNCI)和期刊规范化影响力(Journal Normalized Citation Impact, JNCI)指标的利用,这有助于成果在限定学科范围内的横向对比。将三个数据库结果综合分析,能够减少由于检索结果不一致而造成的混乱,也能够针对具体发文与学科进行多角度、多方面综合分析。
(三)理性选取对标与合作机构
在进行机构学科分析与未来规划布局时,必定要选取对标机构以清晰地认识自身的不足,并向对标机构学习寻求解决方案。上述提到WOS数据库在统计时本身存在纳入机构类型不统一的问题,因此以非“双一流”高校为例,我们在数据库中选取对标机构时,应考虑高校自身的优势与不足,尽量选取与学校历史发展、师资水平、专业类型等软硬件相同或相近的院校,而不是一味求高求好,否则可能会导致目标过高而产生失望心理,不利于调动学科发展的积极性。在对标分析的同时,也鼓励学者、研究人员加强与实力较强的综合性高校、国际科研机构的合作与联合成果产出,这一方面能增加学校的成果产量,另一方面也从本质上提升科研队伍的学术水平。
(四)设置责任方式积分制
建议按照发文责任方式设定统一的评分标准计算二级部门或学者的贡献值。以10分为最高分,在文献署名中,作为通信作者的学者和其所在院系便累计10分,作为第一作者的学者和院系累计5分,作为参与者的作者和院系则累计1分。以评分制计算ESI发文权重更有利于学科贡献产出的统计,增强学者的科研动力。引用权重方面同时也可引入评分制进行计算,结合“高水平论文(Top Paper)”“前沿核心论文(Research Front)”期刊分区等指标,后续还可细致地结合文章他引论文作者的学术地位等进行分析与处理。责任方式积分制的计算方法有助于机构及学者认清自身实际水平,确定学科努力方向。
(五)规范二级部门英文表达
ESI平台目前暂未做到对机构中的具体二级部门论文产出数据进行统计,因此具体到某机构的二级部门贡献值就需要人工统计整理,为了便于相关筛选工作的有效进行,建议机构以官方名义发布其具体二级部门的指定英文表达,以利于后期数据处理与分析,同时解决了由于表达不规范可能造成的数据遗漏问题,这也为具体二级部门科研贡献度计算及学科规划带来便利。
(六)鼓励学者建立ORCID
ORCID是英文Open Researcher and Contributor ID的缩写,即“开放研究者与贡献者身份识别码”,ORCID作为学者在数据库、媒体、引文、专利、实验等对象上的唯一身份标识,很好地解决了跨学科、跨机构、跨国界合作产生的大量的多样化研究信息检索处理问题。学者ORCID的建立有助于保证相关学者发文、引文、专利等一系列科研成果与产出检出数量上的完备性和时间上的延续性,也有助于节省统计时间,提高工作效率。
(七)纳入综合成果,扩展分析范围
应多方位、扩大化考虑学科体系与科研绩效指标,保证学科分析的公平。例如结合英国“QS世界大学学科排名”、泰晤士高等教育“世界大学专业排名”、上海交大的“世界大学学术排名”等指标进行学科分析;再比如统计我国期刊分类中的北大中文核心期刊、南大中文核心期刊、统计源核心期刊等发文情况,不仅可以按照期刊级别进行评分,还可以利用中国知网的引文检索功能、机构数据库平台和知网节等进行分析;同时也需要纳入机构及学者的国家级项目基金、省部级项目基金等科研项目情况;学者撰写的专著与编写的教材也不能忽略,可以在學科分析中体现。以上许多指标都是高校学科建设与规划中需要分析与参考的内容,广泛地纳入分析范围,综合进行学科评价,这样才能为高校学科建设与规划提供科学、公平的参考体系。
(八)关注研究领域热点与前沿
类似医学、化学、物理等学科具有更新发展迅速的特点,学科建设不仅需要评估既有成果,还需要关注学科领域的热点方向与前沿动态,这样才能够为高校未来的学科发展与优化提供参考和策略。在当前学科交叉互融深入、多学科发展迅猛的形势下,需要结合数据分析平台、引文分析方法、分析参考指标等综合因素评估国际国内发文,并进一步分析学科研究热点、预测研究方向,尤其是在成果分析时要注重发现综合学科交叉领域,寻找灵感,还可以在目前发文量较少、偏冷门的研究方向中发掘科研思维。
综上所述,WOS系列数据库能够受到国际范围内的广泛关注与认可必然有其科学性和实用价值,该数据库在促进学科建设与规划中能够起到不可替代的作用,但它不是万能的,我们在认识到其价值并加以利用后也需要在具体工作中灵活改进,从而使学科分析工作深入、科学地进行,加强高校学科优化发展。
[ 参 考 文 献 ]
[1] 颜惠, 黄创. ESI评价工具及其改进漫谈[J]. 情报理论与实践, 2016(5):101-104.
[2] 张晓阳,韦恒,杨权海. 2013—2014 年中国大陆高校ESI学科发展态势与结构分析[J].情报杂志, 2015(7):77-88.
[3] 顾东蕾, 武莹, 邱家学, 等. 基于WOS 的学科发展预测研究[J]. 现代情报,2014(6):32-40.
[4] 汪莉. 基于ESI和InCites的高校潜力学科发展预测[J]. 情报杂志, 2017(2):53-55.
[5] 史竹琴, 朱先奇. ESI在世界一流大学与学科评价中的问题与对策研究[J]. 重庆大学学报:社会科学版, 2017 (6):84-91.
[责任编辑:陈 明]