高校学术成果管理中学者身份关联应用与研究
2017-06-03施晓华
施晓华
〔摘要〕本文围绕介绍高校在建设学校学术成果基础架构与服务过程,对高校学术成果管理系统与校园认证、评估系统之间学者身份的关联,以及多机构管理系统之间学者身份的关联,进行系统化的应用与研究。
〔关键词〕高校;学术成果管理;学者;身份关联;学者统一身份;ORCID;国际标准名称识别码(ISNI);机构知识库(IR);研究信息系统(CRIS)
DOI:10.3969/j.issn.1008-0821.2017.05.022
〔中图分类号〕G252〔文献标识码〕A〔文章编号〕1008-0821(2017)05-0132-05
Research of Correlation for Researcher Unified Account in
Academic Output Management ProcessShi Xiaohua
(Library,Shanghai Jiaotong University,Shanghai 200240,China)
〔Abstract〕This paper conducted a research on how to deploy the Researcher Unified Account service in the process of constructing the universitys academic output basic infrastructure,such as connection with CRIS system,SSO authentication with Campus Users,and inter-connection with different institutions.
〔Key words〕university;academic management;researcher;identity associated;unified researcher ID;ORCID;international standard name identifier;institutional repository;current research information system
全球信息需求者身处于信息爆炸的时代,如何能在大量的学术资源中,正确、方便的识别作者身份,并将学术研究动态、正确地归属至作者名下,已經成为一项极其重要的课题。正确地识别作者不仅能协助科研机构进行学术研究产出的追踪与纪录,有效提升研究者的学术能见度,对于优化学者的各个研究工作流程,推动跨学科、跨机构乃至跨国的协同合作,都至关重要[1]。
根据分析统计,2011-2014年间署名上海交通大学发表的2万多篇SCI科技研究论文中,其作者名为‘Zhang,Jie者多达158篇,缩写为‘Zhang,J的有701篇,分别在物理、生物、医学和教育学等学科发表。结果显示中文音译的英文名称为符合期刊或机构库平台的呈现格式而转换为英文名称及其缩写后,容易导致产生同名同姓的问题。若考虑到不同语言的命名及缩写规则时,姓名的标准化控制问题将更为复杂[2]。
目前国内外关于文献数字对象的惟一标识符使用DOI(Digital Object Identifier,数字对象标识符)[3]方式来表示,国内基金项目也有对应的惟一项目立项号,而学者身份标识则还存在各种不同方式[4],如表1,常用有ORCID(Open Researcher and Contributor IDentifier)、ISNI、Research ID、Scopus Author ID和中科院的iAuthor等。
2009年,汤森路透和爱思唯尔等公司为解决全球学术圈的人名混淆问题,倡导设立了ORCID项目,并建立了Research ID和ORCID、Scopus Author ID和ORCID的关联,目前各高校、研究机构和组织普遍开始使用ORCID作为学者惟一身份标识符,应用在各个学术系统和学术数据交互中学者的惟一标识[5]。本文将以ORCID为主要的学者统一身份方式,对其在高校学术成果管理中的各类应用进行研究
1学者惟一身份应用
如图1,以学者惟一身份ORCID在大学中除了与不同方式账号关联,还可以有效支持学校研究信息系统(CRIS),融入不同学术工作流。总体来讲,部署学者惟一身份可以为机构单位和学者带来以下一些帮助[6]:
1)学者惟一身份将成为数字化校园的关键基础,协助院系和研究教师完成基于学者维度的基金项目研究数据管理和开放获取需求;
2)实现机构、基金项目、出版商以及其他学者标识符系统的相互关联;
3)通过内部系统和外部系统之间的自动数据交换,实现学者个人CV自动更新;
4)支持更多的机构流程化应用,如外部资源在机构学者成果管理中的自动甄别;
5)方便实现学者在更换单位时的成果迁移工作;
6)支持国内及国际间不同机构和系统间的学术成果信息关联;
7)提升研究数据质量,保障国内和国际上学术系统间的数据交换。
2014-2015年,英国的JISC-ARMA组织与美国的Sloan基金分别资助本地区的部分大学进行学者惟一身份的应用与实践研究[7-9]。Jisc-ARMA试点项目(Jisc-ARMA ORCID Pilot Project)曾在英国的8所高校开展ORCID应用实践[10],有效推动了本地区学术机构的学者统一化,在机构学术成果管理系统中部署ORCID应用,推动了区域内机构间的学术成果标准数据交换活动。
如图2,有效的学者统一身份将会支持从基金申请、论文投稿、审稿过程、成果发表直至成果组织展示和评估的整个学术生命周期过程(Research Lifecycle)[11]。2015年8月起,作为世界最大的生物医学研究基金之一,惠康基金(Wellcome Trust),已经要求基金主要申请者必须提供统一ORCID账号来提交申请表[12],另有多个国家的基金也已要求申请者提供ORCID账号[13]。基金组织可以根据ORCID账号跟踪受资助者的成果和获奖数据、以及成果中对本基金的声明。
PLOS、Hindawi、IEEE和Springer Nature的投稿平台也已经要求作者在投稿时提供ORCID[14],有超过3 000种期刊已经通过稿件提交系统收集作者的ORCID账号,以便后续的出版[15]。作者成果信息在其投稿、发表过程中即已形成,有效减少了用户成果信息的重复录入;同时基于如Crossref等文献关联平台的自动更新功能,学者可以选择通过ORCID自动更新他们的论文成果列表,并支持大学和其他系统与其同步更新,大大减轻学者机构学术成果清理、统计、评估和考核等各方面人员的负担。
2学者统一身份在高校的应用部署
对于不同的组织机构,在学术生命周期过程中对学者统一身份的需求不尽相同,研究性大学主要是使用ORCID来建立起研究信息管理系统(CRIS)和ORCID信息资料之间的交互访问。ORCID支持各种研究信息管理系统,如Converis、Elements、IRMA、DSpace CRIS、Pivot、PlumX、Profiles、Pure和Vivo等[16],一些主要的案例有[17]:
Notre Dame大学将ORCID嵌入其自建机构知识库平台Hydra;
Purdue大学将ORCID嵌入其研究合作平台HUBZero;
Missouri大学将ORCID整合至DSpace平台;图2高校学术生命周期中的学者统一身份应用
Cornell大学将ORCID整合至VIVO平台;
Boston大学的成果通过ORCID整合至Harvard大学成果系统;
香港大学Scholars Hub实现ORCID个人页面(Researcher Page)与ORCID个人页面的互相链接。
ORCID在国内高校的部署,主要包括ORCID在学校的普及,实现与ORCID的数据交互,与情报分析平台和统一认证系统对接,以及校际之间的学术数据互操作。全校师生将能确信地实现作者与学术成果进行关联,帮助图书馆、院系和科研管理部门获取其成果的标准信息,并可以与其他高校、机构或平台进行自动化信息交互,提升数据质量。
21学者统一身份与机构知识库的自动数据交互
目前基于学者统一身份ORCID的在线成果(ORCID Profiles)錄入,主要有以下4个方式:
1)用户手工录入成果信息;
2)用户导入BibTex文件进行录入;
3)查询数据库上或其他研究管理软件,进行批量导入;
4)从机构知识库中,通过专用API接口,批量推送成果数据至ORCID。
总体比较,通过ORCID录入外文成果比较方便,中文成果(如CSSCI)的录入较复杂;而中文iAuthor或各机构库产品,对外文的数据录入支持不够全面。所以,通过ORCID与机构知识库的数据交互(图3),可以互相弥补,有效完成不同成果数据的录入和推送;既能提升机构知识库成果收缴全面性,也能提升ORCID揭示更多中文或非出版成果[18-19]。
图3ORCID与机构知识库的数据交互
22学者统一身份与替代计量学(Altmetric)的结合应用在数字时代,基于惟一标识符DOI和学者统一身份如ORCID的惟一表示,使特定论文可以在网络上被永久使用、下载和统计,让特定学者得以整合完整的学术成果、建立动态学术履历,作为积累研究产出、评价研究成果、寻求合作者和申请基金项目的依据。学者统一身份的应用将会有效甄别学者,提升成果数据纯度,极大简化情报分析中的数据预处理流程,节省情报分析工作量[20]。
最新的Altmetric(替代计量学)主要评判依据为使用(Usage)、获取(Captures)、提及(Mentions)、社会媒体(Social Media)和引文(Citation)等五大方面。Altmetrics具有更全面的客观性、公正透明性、社会性、补充性和实时性等特征。通过文献研究、整理,得到在社交媒体中Altmetrics即时测量出的学术论文的影响力,与科技期刊的学术影响力相吻合。在开放存取领域中,Altmetrics学术影响力计量方法已得到认识、关注和应用,并为科技期刊的影响力计量化、可视化评价提供依据[21]。
以替代计量学的分析工具之一PlumX为例,在2015年,PlumX开始支持ORCID,通过搜索ORCID 账户查询学者,并将ORCID账号作为自动化元数据收割的标准之一。当学者建立ORCID后,通过PlumX可以很快速的连接其学术成果并跟踪分析其研究影响力。PlumX使用ORCID API来查询获取研究者的个人信息和和学术成果,并生成学者个人页面、收集学术影响相关的评判依据[22]。
高校机构知识库在支持PlumX计量体系基础上,融合学者统一身份,可以在从构思、设计、实验、论文撰写和发表研究过程中,通过永久标识符将机构内学者的主要研究工作流的各部分串联起来。如基于整合带有ORCID标签的各类数据PlumX应用,可以立体化揭示谁正在使用或讨论学者的研究成果[23-24]。
23学者统一身份与校园统一认证的结合
通过不同学者统一身份的API可以实现校园统一认证平台与在线成果揭示平台的SSO单点登录,前提是校园认证平台支持OAuth 20协议的应用开发高级接口[25-26]。UCLA(美国加州大学洛杉矶分校)的教师信息系统(Opus)项目将使用UCLA Shibboleth SSO(校园统一认证)进行身份验证。通过用户校园身份与ORCID账号的结合,将可以使用Opus来跟踪用户标识和应用授权规则,基于ORCID账户返回口令认证联合身份验证和本地SSO[27]。这将有助于解决教师的校内或校外机构身份的变换所导致的难以判断学者归属问题。
以上海交通大学的jAcccount校园认证系统为例[28],该系统已经支持OAuth 20协议,提供支持接入的两个基础设施:OAuth授权体系和开放API[29]。具体的登陆过程为:
1)ORCID网站通过OAuth获取到访问登录用户基本信息的Access Token;
2)ORCID网站使用Access Token调用Profile接口,获取用户的基本信息。
在申请jAccount接入后,学校网络信息中心提供的Siteid和Secret同时也是OAuth应用的id和Secret,如图4,设计访问流程如下:
1)校内用户在各校内认证系统登录,客户端获取用户认证登录的信息;
2)进行ORCID认证前,首先在校园ORCID中心,通过jAccount返回信息,获取对应的ORCID账号;
3)使用用户ORCID账号,通过ORCID Member API进行登录授权信息,授权通过后,返回授权令牌;
4)使用令牌,直接登录进入ORCID个人中心。访问令牌主要包括授权用户信息,编辑权限信息和授权代码(格式如8623f26a-41b5-433f-be2f-b7865020c71a)。
24校际系统之间学者统一身份的互操作应用
由于每个高校都有本地的认证和信息管理系统,学术管理系统中用户的标识不尽相同,导致高校学术信息系统之间无法有效互操作。如图5,学者惟一标识符使得不同地域、高校和研究机构之间学术成果可以准确、有效地进行沟通交互[30-31]。
为了促进研究人员和各类数据之间的关联,欧洲的THOR项目正在开发支持包含ORCID账号的学术数据库和服务的有效方法[32],有效将ORCID整合至各类机构现有的关键数据仓储中,进一步实现数据库之间的互联。通过开发,项目成功实现在3个不同学科的合作研究机构中,即PANGAEA(地球科学),EMBL-EBI(生命科学)和CERN(高能物理),来集成ORCID账号和服务[33]。
每个合作机构在数据提交时使用ORCID账号作为首选认证方式,通过ORCID进行身份验证。因为基于作者关键字容易出现不同研究区域而同名学者的情况,具有可靠性和完整性的ORCID认证方法可以允许THOR的应用程序获得认证许可,通过用户独有凭据保证惟一性,并获取他们的ORCID成果记录和提供一个其惟一的ORCID账号和一些基本个人信息,如姓名、电子邮件和国家。以EBI(欧洲生物信息学机构)核心数据服务为例,提供各类下属网站也可接受在数据提交时的ORCID注册信息进行注册。
意大利的Cineca组织也开发推出了在其DSPACE-CRIS系统中支持ORCID HUB(机构ORCID认证中心)功能[34-35],将促进各地区、各机构研究人员采用ORCID惟一标识符,将所有购买ORCID成员的机构,通过统一授权在多个服务中使用其标识符,获得ORCID授权的人员可以在同一时间登录到不同机构的不同应用程序服务,并在不同系统中实现用户成果数据同步。ORCID HUB提供了支持全国性学术交流社区系统所需的技术和基础设施,而ORCID是此架构的基础部分,以在研究社区中标识服务的角色信息。
3展望
国外越来越多的期刊与會议投稿系统已经开始推广学者统一身份(如ORCID等),从建设学术基础数据架构和提升本校学者的学术成果影响力来讲,尽早推行可以从根本上解决学者甄别和学者与学术成果的关联问题,为机构知识库建设节省大量的数据清洗工作量,也为今后情报分析服务提供了强有力的数据支撑[36]。针对目前国内中文期刊仅有CSCD的数据可以通过Scopus或Airiti导入到ORCID系统的问题,也急需进一步完善对应的数据交互接口规范,支持各种中文成果批量导入功能。
国内高校可以开展测试本校统一认证与不同学者统一身份认证的交互,以学术成果管理系统或机构库系统与统一身份数据的互同步,完成一定数据交互应用。长远来讲,各高校应该积极参与校级联盟合作(如ORCID联盟),共同进行需求调研、功能推广和联盟会员申请,既节省每个单位的费用支出,也能促进校际间的学术成果共享,支持高校科研合作中的成果统一揭示与管理。
参考文献
[1]台大医学院Research Portal建置与ORCID导入经验分享[EB].http:∥ifii-enews.blogspot.com/2014/12/research-portalorcid.html.
[2]Tang,J.,Fong,ACM.,Wang,B.and Zhang,J.A unified probabilistic framework for name Disambiguation in digital library[J].IEEE Transactions on Knowledge and Data Engineering,2012,24(6):975-987.
[3]Digital Object Identifier System[EB].https:∥www.doi.org/.
[4]贤信,曾建勋.科研实体惟一标识系统研究[J].图书情报工作,2015,(12):113-119.
[5]王海花,黄金霞.ORCID在机构知识库建设中的应用研究[J].图书情报工作,2015,59(17):134-140,133.
[6]Benefits-About ORCID-UK ORCID consortium membership[EB].https:∥www.jisc.ac.uk/orcid,2016-08-28.
[7]Jisc-ARMA ORCID pilot project[EB].https:∥orcidpilot.jiscinvolve.org/wp/,2016-08-28.
[8]HEI based projects[EB].https:∥orcidpilot.jiscinvolve.org/wp/hei-based-projects/,2016-08-28.
[9]Brown,Josh;Wilmers,Catalina;Haak,Laurel.Final Report:Sloan ORCID Adoption and Integration Program 2013-2014.figshare[EB].https:∥dx.doi.org/10.6084/m9.figshare.1290632.v1,2015.
[10]Henderson ,Helen,Johnson,Rob and Woodward,Hazel.Institutional ORCID Implementation and Cost-Benefit Analysis Report.2015.
[11]Katherine G.Akers,Alexandra Sarkozy,Wendy Wu & Alison Slyman.ORCID Author Identifiers:A Primer for Librarians[J].Medical Reference Services Quarterly,2016,35:2,135-144.
[12]Open Researcher and Contributor ID(ORCID)[EB].https:∥wellcome.ac.uk/funding/open-researcher-and-contributor-id-orcid,2016-08-26.
[13]Funder Mandates for ORCID[EB].http:∥orcid.org/blog/2015/12/04/research-funders-and-orcid-new-members-mandates-and-platforms.
[14]Seven Publishers Will Make an ORCID ID a Requirement For Publication;Springer Nature Reaches ORCID Milestone[EB].http:∥www.infodocket.com/2016/01/07/metadata-seven-publishers-making-orcid-id-requirement-for-publication-springer-nature-reaches-orcid-milestone/.
[15]Step by Step:Collecting and Connecting ORCID iDs in the Publishing Process[EB].http:∥orcid.org/blog/2016/04/20/step-step-collecting-and-connecting-orcid-ids-publishing-process.
[16]SUPPORT FOR ORCID IN CRIS SYSTEMS[EB].https:∥members.orcid.org/cris-tools,2016-08-26.
[17]General program integration categories[EB].https:∥orcid.org/organizations/institutions/usecases,2016-08-26.
[18]Bruce R,Weigert V.How to take advantage of ORCID in institutional repositories[J].Open Repositories 2014,2014.
[19]Troll Covey D.ORCID@ CMU:Successes and Failures[J].Journal of eScience Librarianship,2016,4(2):6.
[20]Baessa,M.,Lery,T.,Grenz,D.,& Vijayakumar,JK..Connecting the pieces:Using ORCIDs to improve research impact and repositories.F1000Research,4,195[EB].http:∥doi.org/10.12688/f1000research.6502.1,2015.
[21]Plum Analytics partners with ORCID[EB].https:∥www.researchinformation.info/news/plum-analytics-partners-orcid.
[22]Madjarevic N.Connecting Altmetric:Integrating with Institutional Publications Systems[version 1;referees:1 approved,1 approved with reservations][J].F1000Research,2015,(4):192.
[23]Maximizing the power of ORCID with PlumX interoperability[EB].http:∥plumanalytics.com/wp-content/uploads/2015/06/ORCID-Poster-2015.pdf.
[24]ORCID and Plum Analytics Work Together to Easily Provide Altmetric Information to Researchers[EB].http:∥plumanalytics.com/orcid-and-plum-analytics-work-together-to-easily-provide-altmetric-information-to-researchers/.
[25]INTRODUCTION TO THE ORCID APIs TECHNICAL WORKSHOP[EB].https:∥members.orcid.org/sites/default/files/orcid-api-workshop-OR2015-handout.pdf.
[26]Identity Management and Authenticated Session Management[EB].http:∥jenkins-1.dataone.org/jenkins/job/API%20Documentation%20-%20trunk/ws/api-documentation/build/html/design/Authentication.html.
[27]ORCID Use Cases[EB].https:∥wiki.refeds.org/display/OUT/ORCID+Use+Cases.
[28]http:∥developer.sjtu.edu.cn/wiki/JAccount[EB].
[29]https:∥developers.google.com/oauthplayground/[EB].
[30]Haak L L,Fenner M,Paglione L,et al.ORCID:a system to uniquely identify researchers[J].Learned Publishing,2012,25(4):259-264.
[31]Chen C,Ko M W,Lee V T.Migrating researcher from local to global:Using ORCID to develop the TLIS VIVO with CLISA and Scopus[M].Digital Libraries:Social Media and Community Networks.Springer International Publishing,2013:113-116.
[32]The THOR mission[EB].https:∥project-thor.eu/the-thor-mission/.
[33]de Mello,Guilherme et al..(2016).Demonstration of Services to Integrate ORCIDs into Data Records and Database Systems.Zenodo.10.5281/zenodo.58971.
[34]Mendes Moreira J,Cunha A,Macedo N.An ORCID based synchronization framework for a national CRIS ecosystem[J].F1000 Research,2015,(4):181.
[35]Galimberti,P.,& Mornati,S.The Italian model of distributed research information management systems:a case study.2016.
[36]Meadows A.Everything you ever wanted know about ORCID…but were afraid to ask[J].College & Research Libraries News,2016,77(1):23-30.
(本文責任编辑:孙国雷)