参考文献数字对象标识符规范著录的编校实践
2018-09-10包雅琳
■史 强 包雅琳
中华医学会杂志社《中华医学杂志英文版》编辑部, 北京市东城区东四西大街42号 100710
随着科技期刊数字化和网络化的不断发展,越来越多期刊论文注册了数字对象唯一标识符(Digital Object Identifier,DOI),同时,许多期刊要求在论文引用文献信息中加入DOI,作为文后参考文献著录项目之一。为了适应网络环境下数字出版蓬勃发展的新形势,我国于2015年12月1日开始实施新的GB/T 7714—2015 《信息与文献 参考文献著录规则》,该标准明确指出将DOI作为著录项目[1]。Web of Science 于2015年11月推出新的期刊引文数据库——新兴资源引文索引(Emerging Sources Citation Index,ESCI),要求新申请进入的中、英文期刊须在参考文献中增加DOI著录项信息。新国标的实施及权威数据库的导向,有力地推动了国内DOI规范著录的发展,与此同时,各期刊编辑部在进行DOI著录的实际工作中,也遇到了诸多新问题。目前已有研究关注的问题多为DOI在期刊出版中的应用及著录现状等[2-4],而从期刊编辑编校实践角度出发,探讨如何提高DOI规范著录水平的研究较少。本文在概述国内期刊DOI著录现状及中华医学会杂志社系列杂志著录情况的基础上,介绍了《中华医学杂志英文版》(ChineseMedicalJournal,CMJ)编辑部在DOI规范著录方面的编校实践经验,并对存在的问题进行分析,以期在提高DOI规范著录水平这一实际问题上起到抛砖引玉的作用。
1 DOI系统的创建及其注册机构
1997年,国际DOI基金会(International DOI Foundation,IDF)注册成立,随后于1998年开始进行DOI系统的构建工作,其初衷是解决互联网环境下出版物著作权保护等问题[5]。DOI是标识数字资源永久且唯一的编码符,独立于数字资源的物理存储位置、复本数量、应用系统和存取协议等信息,被喻为数字资源的条形码。随着DOI在国际上的广泛使用,DOI逐渐成为数字出版、信息服务等行业的事实标准。2010年11月,DOI系统被批准成为国际标准化组织(International Organization for Standardization,ISO)通用的国际标准;2012年5月,《ISO 26324: 2012信息与文档——DOI系统》正式版本发布[6]。Crossref成立于2000年,是IDF授权的第一个DOI注册机构,由出版商国际链接协会(Publishers International Linking Association,PILA)组织和管理。Crossref旨在促进不同出版商的联合协作,实现不同网络平台上出版的科学、技术、医学,及社会科学等领域内容资源的跨平台链接,从技术上确保DOI和网络信息资源的有效、持久链接,以及动态更新。2007年3月,中国科学技术信息研究所和北京万方数据股份有限公司联合向IDF申请并取得了中文领域的DOI注册与管理权,成为国内首个IDF授权的注册机构(Registration Authority,RA),这是我国在数字出版及信息标准化方面的重要节点。2013年1月,中国知网也正式获得RA授权,在国内开展DOI注册及服务工作。
2 国内期刊DOI著录现状
随着DOI在数字出版中的广泛应用,国内外很多学术期刊的参考文献著录规范均要求或推荐将DOI作为参考文献的著录项。对DOI进行规范著录,有利于文献检索、数字优先出版以及增强引文的网络链接功能[4]。从中国知网(http://www.cnki.net/)的学术期刊数据库检索可知, 2002年我国开始有期刊在参考文献中著录DOI,之后著录DOI的论文数量呈指数式逐年增长;随着新国标GB/T 7714—2015 《信息与文献 参考文献著录规则》的发布,2016年参考文献中著录DOI的论文数量的增长率明显提高,2017年共有32242篇论文在参考文献中著录了DOI(图1)。参考文献中著录DOI的论文主要为自然科学类论文,但总体占比仍然较低,以医药卫生科技类论文为例,2017年在参考文献中著录了DOI的论文占比仅为3.53%(16505/467435)。在此需要说明的是,由于中华医学会杂志社系列杂志与万方数据库独家合作,在中国知网中无法检索,且万方数据库目前暂未提供限定参考文献内检索功能,因此,以上分析均未纳入中华医学会杂志社系列杂志论文的参考文献DOI著录数据。
图1 中国知网检索到的我国期刊2002—2017年在参考文献中著录DOI的文章数量增长情况
3 中华医学会系列杂志DOI编码及著录情况
3.1 DOI编码规则
中华医学会杂志社很早就意识到数字化建设的重要性。早在2008年2月,中华医学会与万方数据股份有限公司签订了数据库合作协议,并于2009年全面启动了中华医学会系列中文期刊论文的DOI标注工作,标注规则为“doi:统一前缀/学会标志.信息资源类型.杂志ISSN.年.期.论文流水号”。样式如“doi:10.3760/cma.j.issn.xxxx-xxxx.yyyy.nn.zzz”[7]。
CMJ是中华医学会会刊,也是中华医学会杂志社内办刊历史最久的医学学术期刊,为了更好地实现国际化,提高期刊影响力,CMJ从2014年底开始与国际最大科技出版商之一——威科公司合作进行数字化出版。通过合作,CMJ获得了Crossref 提供的DOI标注服务,因此,CMJ的DOI标注规则与中华医学会杂志社的中文期刊不同,其标注形式为“doi:10.4103/0366-6999.xxxxxx”,“/”后依次是ISSN号和文章编码,不体现年期信息。这一编码规则突破了年期卷号等纸刊固定元素的限制,无须等待纸刊排期的确定,即可为论文编制正式的DOI号,为网络优先出版工作的开展提供了极大的便利,同时也为其他富媒体数字内容资源如信息图、视频材料等的DOI号灵活编制预留了空间。目前,CMJ已为部分文章提供了网络优先出版(Ahead of Print)服务,网络优先出版的文章一经录用,在编辑加工和签发流程结束后即可获得DOI号,并迅速在期刊官方网站正式发布,据估计发表时滞可比常规纸质期刊出版缩短2个月左右。
3.2 DOI著录情况
中华医学会杂志社在新国标GB/T 7714—2015《信息与文献 参考文献著录规则》发布后积极贯彻响应,全面启动期刊参考文献增加DOI著录项的工作。中华医学会杂志社依据新国标并参考国际期刊做法来制定具体规则,将DOI号放在参考文献的最后,即页码或索引号的后面,中文期刊著录格式为“主要责任者.题名[文献类型标志].刊名,年,卷(期):页码.doi.”,或“主要责任者.题名[文献类型标志].刊名,年,卷(期):索引号.doi.”。“doi”前采用“.”,符合GB/T 7714—2015 《信息与文献 参考文献著录规则》中“.用于……获取和访问路径……前”的规定;“doi”采用小写英文字母形式,也和国外大多数期刊做法一致。
4 DOI规范著录实践中的问题及思考
4.1 DOI信息的录入
(1) 投稿环节。在具体的编校实践中,各期刊DOI著录实施方法有所不同,但均是由论文作者提供参考文献的DOI信息,编辑部在编辑加工的环节进行准确性核查、格式校对和缺项补遗。在实际工作中,编辑部应尽量创造便利条件,帮助作者在投稿时就做到DOI的规范著录。科技论文写作者通常使用EndNote、LaTeX、医学文献王等专业参考文献管理软件进行文献标引,利用这些软件的参考文献模板功能,可以一次性、自动化地将全部参考文献按照某期刊的格式予以著录,如该期刊参考文献模板中列有DOI著录项,则软件会从各大文献数据库中提取每一条参考文献所对应的DOI信息,并以正确格式完成著录。然而,这些软件的基本参考文献模板库无法涵盖所有期刊,若刊物不在基本库中,就需要作者自行编辑模板,这对于时间宝贵的科研工作者来说殊为不易。因此,编辑部应尽可能在期刊网站中提供各种常用文献管理软件的参考文献模板文件,供作者下载套用,既方便了作者按期刊格式要求投稿,也有效避免了手工录入DOI信息可能导致的誊录错误,更有利于减轻后期编校工作量。
(2) 编辑加工环节。在稿件的编辑加工过程中发现,尽管DOI在出版领域已是业内主流标准,但仍有不少作者对DOI一知半解,甚至完全不了解,特别是英文文献的DOI信息,很多作者不知道如何获取。针对这种情况,CMJ编辑部制作了PDF格式的说明文件——《参考文献后补充DOI号的说明》,在文稿返修时一并以邮件附件形式发送给作者。该文件以图解的方式告知作者如何进行DOI的查找和著录,绝大多数作者在阅读后均能很好地完成DOI著录,这也显著提高了编校效率。另外,CMJ编辑部还制作了图解说明“通过Crossref网站获取DOI的方法”,并发布在CMJ网站上,该说明采用了可视化的呈现手法,有助于作者迅速掌握英文文献DOI的检索技巧和著录要求(图2)。中文文献DOI信息的获取相对容易,使用中国科学技术信息研究所的中文DOI网站(http://www.chinadoi.cn/)提供的“查找DOI”功能,或中国知网的CNKI DOI网站(http://chndoi.org/)提供的“元数据检索”功能,在输入文献题名、第一作者等信息检索后即可获取。
图2 CMJ编辑部制作的图解说明——通过Crossref网站获取DOI的方法
由于收录时滞、元数据录入缺失等原因,通过Crossref、中文DOI网站等均无法检索到DOI时,可通过PubMed、Embase等数据库,以及百度学术和必应学术等搜索引擎提供的文章链接跳转到网站原始页面进一步查询,有的文献DOI号会置于文章网络版的文题附近,有的则在下载PDF全文后,在文章页眉、页脚、脚注等处可以找到。对于少数参考文献数量大,DOI信息缺失、错误较多的文章,还可考虑利用Visual Basic(VB)编程,通过PubMed及Crossref等数据库和网站批量、自动化地获取著录信息,以减少编辑加工环节的工作量[8-9]。
4.2 DOI著录信息中的常见错误
(1) DOI信息格式错误。笔者在DOI规范化著录的编校工作中发现,相当一部分作者在“doi:”字样后误将“https://doi.org/”或“http:dx.doi.org/”字段信息一并录入,即:不是以“10.”开头,而是写成“doi: https://doi.org /10.xxxx/xxxx.”或“doi: doi.org/10.xxxx/xxxx.”等,这一错误屡见不鲜,反映出许多作者对DOI的格式及语法规则缺乏基本了解。此外,不少作者在DOI著录时,在参考文献尾部以“https://doi.org/10.xxxx/xxxx.”或“http:dx.doi.org/10.xxxx/xxxx.”的形式标注DOI,尽管这一写法也是Crossref推荐的一种标注方法(目的在于使PDF等格式的电子文档中的DOI信息便于复制到浏览器中进行直接解析),但在不符合期刊格式要求的情况下,仍需由编辑予以修改。上述问题在编校实践中颇为常见,逐一校对既耗时费力,又容易遗漏。在日常编校工作中,尤其是针对多篇PDF文稿的校对时,可利用PDF编辑软件提供的在多个文件中进行内容查找的功能,设定搜索范围为选定的多篇待校对文稿,查找“doi.org”字样,即能将所有目标文件中的此类著录格式错误定位出来,方便随后逐一修改,有效提高编校效率。另外,在网站上登载关于DOI的图解说明,也是希望能起到向作者普及DOI相关知识,提高其规范著录意识的作用。
(2) DOI信息内容错误。由于作者的粗心大意或对DOI编制标准规范的不了解,在著录时常导致DOI信息内容的错误。编辑通过DOI逐条解析到论文页面进行核对,是最为有效的校对方法,另外,在编校中,通过对DOI后缀内容的判读,可在很大程度上规避此类错误,许多期刊在DOI后缀中会体现刊名缩写和年份期号等信息,有助于判断是否和标引文献具有正确对应关系。同时,编辑还需特别注意加强DOI语法规则知识的学习,以及时发现作者著录或编辑编校过程中不经意间造成的DOI信息著录错误,比如:DOI字符串语法区分大小写字母,在作者誊录或编辑加工过程中,如果不注意严格保持DOI字符串内字母的大小写形式,改变了原始著录内容中的字母大小写形式,就会造成DOI信息的错误。另外,DOI字符串中用于分隔字符段的符号为“.”,当出现“,”时,就要检查是否存在著录错误。还有一些DOI字符串信息中包含下划线,在誊录时尤其容易发生下划线(_)被错误地用短横线(-)表示的情况,也须要特别留意检查。
5 结语
我国科技期刊DOI的标注和著录已取得了很大的发展,此举有利于期刊内容资源的管理、开发、交流和研究等工作,但在规范化著录DOI信息方面,由于相关知识的普及程度不足,许多错误和问题时有发生。期刊编辑在实际工作中,要注重自身相关理论知识的学习,也要加强对作者的宣传工作;在编校实践中,要善于总结经验,利用各种工具手段提高DOI著录的规范化水平。未来DOI规范著录问题的最终解决,还有赖于集约化、高度专业分工、成熟的现代出版管理流程体系的建立,使著录工作借助更为智能和自动化的手段实现,届时期刊内容资源的组织整合和规范化程度将会呈现出一种全新的面貌。