研究者标识系统的整合及其应用
2014-07-07姚长青
李 颖 徐 硕 姚长青
(中国科学技术信息研究所,北京 100038)
研究者标识系统的整合及其应用
李 颖 徐 硕 姚长青
(中国科学技术信息研究所,北京 100038)
本文阐述了研究者标识系统整合的重要意义,介绍了国外主要研究者标识系统及其整合案例,并从应用目标出发,结合现有体系,设计了一种与全球研究者标识系统相接轨的“中国研究者标识体系”。最后,进行了问题分析并给出结论。
中国研究者标识体系;中国研究者;唯一标识符;研究者解析;ORCID;DOI
1 引言
科研信息的可靠性取决于研究者信息,研究者唯一标识的作用重大。非歧义性的研究者数据不但可以保障科研信息的循环利用,更重要的意义是,研究者数据是科研活动及其支撑服务的基础,可视为构建技术创新型国家的基础设施之一。
唯一性的研究者数据在技术发展的预测与跟踪、研究立项、研究成果评价、研究合作以及研究成果的出版传播等研究活动中起着桥梁的作用,是整合相关系统的有效保障。换言之,它直接影响到研究者、大学与研究机构、学会、资金资助机构、出版机构之间的业务无缝关联和管理的透明化,影响到干系机构之间的合作共赢。
目前,研究成果的开放获取长足发展,机构知识库及SNS越来越普及,科研信息的公开化,科研活动的公共性进一步凸显,注重公共性的研究者标识系统已成为全球共识。研发地图、研究者名称解析、ORCID等相关系统陆续出台,它们的发展动态受到了学术界及业界的广泛关注。然而,就重视程度而言,国内与国外、国家与地方、学界与产业界、科研实体与科研信息服务机构等之间存在较大的差异,研究者标识系统处于“孤岛”状态的案例较多,与标识本身的初衷相悖。针对这些必须解决的问题,需要构建“中国研究者标识体系”。本研究开展了跨国、多领域、多元化的调查分析,与日本、韩国进行了深入的技术交流。结合中文DOI系统、科研本体、人才数据库、科研成果资源数据库、机构知识库、期刊投稿出版系统等,重点设计了应用框架,为后续工作奠定了基础。
2 国外两家研究者标识系统
2.1 汤森路透公司Research ID
Researcher ID[1-4]是提升研究者可视度、强化学术研究效益的国际研究者社团,是将研究者信息进行准确和完备索引的全球性组织。Researcher ID是针对学术研究社团中,作者歧义问题的解决方案。它给每个成员赋予独一无二的标识符,使研究者能管理他们的全部出版文献,跟踪其出版文献的被引用次数和h-指数,确定可能的合作者,避免作者辨识的错误。同时将研究者的Researcher ID信息与Web of Science进行整合。
通过http://www.researcherid.com 网站,用户可检索利用Researcher ID信息。在Researcher ID中,研究者,即著者被赋予唯一识别的编码,作者与其已出版发行的著作进行了关联,著者名称和引用文献进行了标准化处理,实现了高相关性的检索。网站的登录、注册、浏览全部免费。研究者可上载自己的prof l le和著作一览,使其研究业绩获得广泛的认识。
2.2 ORCID
ORCID[5]是集合各利益团体,共同赋予研究者标识符的国际组织,于2008年8月在美国特拉华州成立的非盈利机构。其利益相关组织覆盖研究机构、大学、出版社、学会、基金机构、以及学术信息有关企业等。
ORCID分配的研究者标识符称作ORCID ID,在ORCID ID中,研究者prof l le与研究成果一览关联在一起。针对每个研究者,梳理其学术信息,不同立场的干系人都可从中获益。比如,研究者可在论文投稿、谋职、申请研究资金时加以利用。研究者可将同行评审、数据监护(data curation)、软件开发等各种学术性的记录登记到ORCID中。通过检索ORCID公开的信息,可以发现新的共同研究者,构建研究网络。大学及其研究机构利用ORCID可以评价本组织成员的研究业绩,还可用于研究者招聘时的评价基准。机构通过利用ORCID,可容易地辨识机构的强项领域,追踪成员的研究成果。学会通过利用ORCID,可强化会员的prof l le信息,用于支持会员研究成果的公开及会员间的合作。出版社能确保投稿系统中的著者及评审者的跟踪,通过关联著者论文及其合著者,发现相关的学术著作。科研资金资助机构,在处理申请资料时,通过使用ORICD ID,能便捷地获得申请者信息,从而简化处理,在研究评价阶段,用于项目的评价。
3 日本研究者名称解析系统与ORCID的整合
日本国立信息学研究所NII开发的研究者名称解析系统[6-7]于2008年5月公开。它是以日本研究者为对象的研究者标识符系统,是实现与Web上研究者资源关联的服务系统。
为实现名称解析功能,必须解决名称歧义问题,比如,研究者同姓、曾用名、异体汉字等。为此,NII构建了独自的研究者同定框架。它基于日本科学研究费补助金(即科研费)和ReaD(日本科学技术振兴机构开发运行的研究开发支援综合目录数据库)中的研究者编码。在科研费研究者编码中,研究者个人的名称与科研费的研究课题实施时的所属机构相关联。为同定研究者,该系统充分利用了大学研究者目录中所登载的研究者信息。
研究者解析系统的特征是面向Web资源的链接,它不断扩大与充实研究者的有关项目,建立与外部研究者典藏目录的相互关联,可将大学研究者目录的研究者对象向全国扩展。研究者解析系统与ORCID的整合应用是将日本研究者解析ID系统与全球研究者唯一标识符ORCID ID进行关联。这种关联意味着全球统一的研究者标识符与日本国内研究者唯一标识符之间的对应。另外,研究者解析系统与日本国内有数个研究者系统之间的直接链接已经形成,所以,通过与ORCID的整合,可实现ORCID与日本国内数个研究者信息系统之间端对端的链接[8-10]。
研究者名称解析系统的唯一标识符与全球研究者赋予唯一标识符的IRCID之间可建立对应关系。如图1所示,在研究者解析系统注册有主页的研究者,可从ORCID着手,建立个人ORCID ID与研究者解析系统ID之间的对应。ORCID未登录研究者,个人需要在ORCID网站登记,再完成关联。在图1中,ORCID的网页与研究者解析系统的网页之间相互增添了链接(inter-linked)。
4 中国研究者标识系统
4.1 系统框架设计
根据上述的研究工作,中国研究者标识系统应定位如下:进行中国研究者名称的消歧工作,为中国研究者赋予唯一标识。既要能涵盖全部中国研究者,又要与ORCID等全球系统接轨。应当以公益性的类似中信所中文DOI系统为基础,利用其与DONA(Digital Object Numbering Authority数字对象命名规范机构,基于the Handle System架构的全球名称解析国际组织)的合作关系,对全中国的研究人员分配标识符,提供不同机构之间、国与国之间的不同系统间的互联与整合功能。通过Web上研究人员的出版物,向用户提供无缝的信息检索与浏览功能,使用户能检索浏览不同级别作者唯一标识符系统整合的结果,实现研究者数据在多种学术信息服务系统之间的“穿越”。
在中国研究者标识系统框架设计中,充分应用中文DOI、科研本体、研究者数据库、机构知识库等研究成果,通过与汤森路透Research ID、Scopus的Author ID、CorssRef的Contributor ID、日本NII人名解析系统和JST的Researchmap、韩国KISTI的人名控制系统等的国际合作交流机制,使中国研究者标识系统的开发及应用服务简单易行。如图2所示,它可多角度、多层面地支持我国的科研创新活动,同时,也支持全球化的科研创新合作。
系统的基本特征是:(1)能强化中国学术社团的研究活动,提供Web服务;(2)可与国内外的外部相关学术系统进行互联。
图1 研究者名称解析系统与ORCID的互相链接
图2 中国研究者标识系统与国内外相关系统之间整合的概念示意
4.2 与ORCID的整合
中国研究者标识系统除了面向中国机构提供Web服务之外,在科研活动全球化的机制下,应当与全球化系统,比如ORCID接轨。ORCID提供API用来获取研究者的prof l le和出版物,有权限的外部系统可以浏览用户的ORCID唯一标识符并添加外部的唯一标识符到用户记录之中。ORCID已经实施了原型Web应用,利于研究者在他们所拥有的ORCID主页和RNR(Resolver,解析系统)主页之间建立链接。ORCID某一研究者主页可以链接到RNR通讯作者主页,反之亦然。为此,RNR与ORCID之间具有了一种关联,在相关的学术系统之间,RNR提供源于/向(from/ to)ORCID的重新定向服务。Web应用场景的UML活动图如3所示。
5 问题分析与结论
中国研究者标识系统实施中面临的风险与困难很多,如果不能预先考虑,很难实现设计目标。例如,在研究者ID以及prof l le方面,存在着“分散性对统一性”问题:分散性的优势是责任主体明确,劣势是必须统合维护同一性的ID;统一性长处是一元化管理,短处是必须有运营的主体,哪个机构负责唯一编码,需要明确。“管制数据的主体”问题:研究者本人还是所属机构,或者第三方(比如,资金机构、国家、出版社,或数据集成服务商等)?研究者本人→所属机构→第三方,按照这个循序,研究者本人的干预程度和数据的可靠性会逐渐下降,而数据的覆盖性会拓宽,要平衡考虑。“研究者prof l le的多样性对单一性”问题:prof l le的多样性优点是可以反映研究机构的主动性,缺点是对prof l le理解的歧义性,统合困难。单一性的长处是整合容易,而短处是难以决定,应当由权威决定,还是大家决定?如此诸多的问题都是构建中国研究者“身份证”系统所面临的挑战。
图3 中国研究研究者标识系统与ORCID交互场景的UML活动图注:CRNR代表中国研究人员的名称解析Chinese Researcher Naming Resolver。
尽管问题重重。中国研究者ID的引入,会深远地影响国家及各级科研管理机构,以及事业链条上所有企业的发展。号召的力度越大,相应的机构越多,可完成度就会越高。对于依赖学术名声生存的研究者,通过ID的分配、prof l le的注册登记,就能实现目标。相信众多的研究者不会拒绝参与,国家也不会“视而不见”,关键在于草根研究者的努力与付出。
本研究通过全球研究者标识系统及其整合应用的调研分析,提出了中国研究者标识系统的设想,并设计了其应用框架,重点设计了它与全球标识系统ORCID的互操作场景,迈出了中国研究者标识系统的构建与应用的第一步。
[1] Thomson Reuters.Research ID[EB/OL].[2014-04-01]. http://www.researcherid.com/.
[2] Thomson Reuters.What is ResearcherID?[EB/OL]. [2014-04-01] . http://www.researcherid.com/Home.act ion?SID=S2zb2jjUeiWNUT3veE4&returnCode=ROUT ER.Success&SrcApp=CR&Init=Yes.
[3] Thomson Reuters.世界の研究者をつなぐコミュニティサイト[EB/OL].[2014-04-01]. http://ip-science. thom-sonreuters.jp/media/ps/fs/RID_fs.pdf.
[4] Thomson Reuters.インパクトファクターの質問にお答えします[EB/OL].[2014-04-01]. http://ip-science. thomsonreuters.jp/media/training/jcr/recorded_jcr_ 20131126.pdf.
[5] ORCID (the Open Researcher and Contributor ID)[EB/ OL]. [2014-04-01].http://orcid.org/.
[6] Kei Kurakawa,HideakiTakeda,MasaoTakaku.Researcher Name Resolver: Identifier Management System for Japanese Researchers[J].Int J Digit Libr, 2014, 14(1/2): 39–58.
[7] NII. The Researcher Name Resolver[EB/OL].[2014-04-01].http://rns.nii.ac.jp/.
[8] 蔵川圭,武田英明.研究者識別子ORCIDの取り組み[J].情報管理, 2012, 54(10):622-631.
[9] Kei Kurakawa, Hideaki Takeda. Redirecting Web Service for ORCID to Scholarly Systems via the Researcher Name Resolver[EB/OL].[2014-04-01]. http:// rns.nii.ac.jp/html/orcid_integration_help.html.
[10] Kei Kurakawa, Hideaki Takeda. Redirecting Web service for ORCID to Scholarly Systems via the Researcher Name Resolver[EB/OL].[2014-04-01].http:// rns.nii.ac.jp/html_us/help_en.html.
Integration of Researcher Identifi cation System and Its Application
Li Ying, Xu Shuo, Yao Changqing
(Institute of Scientiflc and Technical Information of China, Beijing 100038)
The article states important significance of the integration of Researcher Identification System, introduces the typical digital identifi cation systems and integration cases in home and abroad, and combining with the current systems, it designs "Chinese Researcher Identification System” compatible with the Global System ORCID. Finally, it analyzes problems and educes the conclusion.
Chinese Researcher Identification System, Chinese researcher, digital identification, researcher resolver, ORCID, DOI
G250.76;TP39
:A
10.3772/j.issn.1674-1544.2014.05.015
李颖*(1964- ),女,中国科学技术信息研究所副研究员,研究方向:科技信息系统;徐硕(1979- ),男,中国科学技术信息研究所副研究员,研究方向:数据挖掘;姚长青(1974- ),男,中国科学技术信息研究所副研究员,研究方向:信息管理。
“十二五”国家科技支撑计划课题“基于多源信息的电动汽车数据挖掘关键技术研究”(2013BAG06B01);2014年中信所预言项目“中国科研人员数字化唯一标识体系的构建研究”。
2014年5月12日。