APP下载

增强出版驱动的科学数据出版:动因、模式及路径

2019-08-31邢文明

中国科技期刊研究 2019年8期
关键词:论文期刊科学

■邢文明 刘 婷

湘潭大学公共管理学院,湖南省湘潭市雨湖区羊牯塘街道 411105

科学数据(Scientific Data),或称科研数据(Research Data),是科学研究不可或缺的主要组成部分,也是科研数字化时代的重要战略资源。作为学术成果的结论来源、数据支撑和复核基准,科学数据与科学论文都被视为重要的科研产出,也是学术研究的重要成果之一。因此,推动科学数据的共享利用,最大化实现其潜在价值,越来越受到国家、科研教育机构等主体的高度重视。2018年3月17日,国务院办公厅印发的《科学数据管理办法》(以下简称《办法》)指出:“主管部门和法人单位应积极推动科学数据出版和传播工作,支持科研人员整理发表产权清晰、准确完整、共享价值高的科学数据”[1],表明通过数据出版以促进科学数据的共享与利用受到国家的认可与肯定。

在科学数据共享的热潮中,科学数据的有效共享成为学术界关注的焦点,数据出版作为一种新的数据共享方式受到高度重视。现有研究主要围绕3个方面展开。(1)科学数据出版的动因。如Sayogo等[2]认为促使研究人员发表科学数据的原因主要有三方面:政策法规的要求、(科研管理部门及学术界)对发表科学数据行为的认可与致谢、相关机构或组织为科研人员发表科学数据提供帮助与支持等。(2)科学数据出版模式。如涂志芳[3]认为科学数据出版模式主要包括独立的数据出版、作为论文附件的数据出版和数据论文出版3种;宋立荣等[4]指出,基于数据服务视角的科学数据出版模式包括产品传递模式、交流互动模式、问题解决模式和知识服务模式。(3)数据生命周期和利益相关者二维视角的科学数据出版关键性问题。如邱春艳[5]从科学数据出版的生命周期视角,梳理了科学数据的出版形式、体系与模式、引用、元数据、与学术文献的关系、隐私保护、质量控制等关键问题;Nevzorova等[6-8]则主要关注科学数据出版的高校、出版平台等利益相关者的权责要求。文献调研结果表明,增强出版驱动的科学数据出版研究与实践仍较薄弱,然而,面向增强出版的科学数据出版作为一种新兴、高效的出版模式,对推动科学传播与交流、科学数据共享与利用具有重要作用。基于此,本研究将重点探讨基于增强出版的科学数据出版的驱动因素、主要模式及发展路径,为我国科学数据共享与出版的技术提升和人才队伍建设等提供参考,为我国科学数据共享与出版的法律政策的制订提供参考。

1 增强出版驱动的科学数据出版动因

1.1 开放科学交流与传播的现实需要

增强出版是在传统论文的基础上增加或链接各种必要相关信息的一种出版方式,这些信息可以是任何能够辅助说明论文的主要内容及与论文相关的任何类型的数据[9-11]。根据与论文的关联形式,这些信息可分为两类:(1)针对整篇论文的增强内容,如Nature中的相关新闻与评论、音视频、编辑总结、相关论文推荐,Elsevier中的图片摘要、论文亮点、相关书籍、引证文献等,PLoS中的媒体报道、读者评论等;(2)针对论文中某个知识点或片段的增强内容,如支撑数据、研究/实验方法、推导过程、公式、图表、视频、源代码等[12]。

传统科研成果大都以学术论文的形式呈现,由于受篇幅和出版方式的限制,作为论文支撑的实验与推导过程、制备方法、研究数据等得不到展现,当其他研究者希望重复研究过程或在此基础上进一步探索时,往往由于缺少关键数据或细节而难以如愿。随着增强出版时代的到来,与论文相关的研究数据、实验记录、照片、录音录像、调查问卷、幻灯片、电子表格、公式推导、研究感悟、出版后数据补充等类型的材料都可以适当的方式集成到论文中[13]。总体来说,在增强出版驱动下科学数据出版需要满足如下需求(图1):(1)提高评价、审稿的科学性和效率,有利于科学数据的快速发表;(2)拓展传统论文中研究思想与成果表达的空间和手段,有助于实现知识的充分交流与共享;(3)提高论文被发现和引用的概率,并且可以有效地遏制学术不端行为[12,14]。总之,增强出版驱动的科学数据出版提升了开放科学交流与传播的效能。

图1 增强出版示意图

1.2 科学数据共享与利用的必然要求

作为一个新兴事物,科学数据出版在理论与实践中面临诸多有待探索与完善的问题,例如:如何激励科研人员/机构积极出版所拥有的数据并确保其质量、如何对数据的质量进行评审与把关、如何对已出版的数据进行管理维护与组织整合以便于再利用、如何保证使用者严谨规范地进行数据引用等。与此同时,以科技期刊为代表的学术出版在数字出版、全媒体出版和媒体融合等方面进行探索与实践,新的出版方式方法不断出现,在增强出版的驱动下,科学数据出版拥有更多的选择。

为了更好地促进科学数据的共享与利用,政府部门、科研院所、企事业单位等组织建立了机构知识库、数据中心等支持数据存储与共享的平台。这些平台虽然在一定程度上促进了科学数据的共享与再利用,但受数据开放的时效、深度、广度等的限制,仍然难以满足快速发展的科研范式的要求[15]。增强出版驱动下的科学数据出版,一方面可以保证数据的来源与质量经过审查编排,具有较高的规范性与可信度;另一方面有助于促进科学数据作为一种科研成果被认可和引用,从而提高数据生产者公开和共享数据的积极性[16]。可见,增强出版驱动下的科学数据出版将成为推动科学数据的传播与共享利用、充分发挥数据价值的重要途径与方式。

2 增强出版驱动的科学数据出版模式

由以上分析可知,作为科研论文支撑的科学数据属于增强出版的第二种类型,即作为整篇论文或某个知识点/片段的补充信息。当前增强出版驱动的科学数据出版主要有以下五种模式:基于纸质、基于网页、基于数据库/平台、基于微信和基于App 的增强出版。

2.1 基于纸质的科学数据增强出版模式

尽管越来越多的学术期刊开始采用网络出版,但毋庸置疑,纸质出版仍然受到许多人的喜爱并仍将存在较长一段时间。由于受版面和载体的限制,传统期刊无法将科学数据一并刊出。随着信息技术的发展,这一问题有望得到解决,二维码就是一种较好的解决方案。它是特定的几何图形按一定规律在平面(二维方向)上分布的黑白相间的图形,是信息数据的一把钥匙。随着二维码应用的普及,越来越多的期刊开始采用二维码技术来丰富和拓展期刊的内容,如提供论文的作者、标题、年、卷、期、起止页码等基本信息,以便于读者查询引用;在标题旁印制二维码,读者扫码即可阅读或下载论文电子版;在正文中插入二维码以提供彩色原图、动画或者视频;在参考文献处附上全文链接的二维码等[17]。基于此,笔者认为,完全可以将支撑论文的相关数据、公式推导、音视频讲解等的链接以二维码的形式印制在论文中。读者在阅读的时候如有需要,可以随时通过手机等移动设备扫描二维码,查看或下载相关支撑信息。

基于纸质的科学数据增强出版模式在不改变原有出版模式的基础上,借助现代信息技术实现科学数据及相关补充信息的协同出版,既丰富了学术论文的信息内容,也有助于增进科研人员之间的知识交流与传播。

2.2 基于网页的科学数据增强出版模式

在传统的数据库出版模式下,科研人员需要先下载文献并借助阅读器才能阅读文献内容,大大限制了知识吸收的效率。随着人们对信息获取便捷化与高效化需求的不断提升,一些科技期刊从提供PDF格式论文过渡到基于XML/HTML的在线阅读模式[18-19]。前者需要下载论文全文并安装相应阅读器才能阅读;而后者可以直接阅读或浏览全文,更受读者的欢迎。当前,已有不少期刊在其网站提供科研论文的HTML全文阅读[20-21],国内外的知名数据库如ScienceDirect、EBSCO、SpringerLink、Wiley、中国知网等,也都开始提供论文的HTML全文阅读。

在这一背景下,一些期刊尝试将科学数据、图表、音视频等补充信息集成到学术文献中。这些附加信息既可以作为附件附在论文的末尾或正文相应位置供用户下载,也可以通过折叠/展开的方式供用户按需查看。如《中国工业经济》将论文的相关数据作为附件附在期刊网页的论文中(图2),而纸质版却无法提供这些信息。基于网页的科学数据增强出版模式借助网络技术实现学术文献的增强出版,既提高了科研人员获取与利用文献的效率,也提升了读者的阅读体验,必将具有广泛的应用前景。

图2 《中国工业经济》科学数据增强出版

2.3 基于数据库/平台的科学数据增强出版模式

为了提高论文的严谨性并促进数据的重复利用,越来越多的期刊要求作者在论文发表的同时将支撑数据发布到相关数据库/平台中,或在文献发表前将科学数据公开。如美国生态学会(Ecological Society of America,ESA)所创办的期刊自2000年起要求作者将与论文相关的数据发布到由该学会创建的数据库中[22];Nature要求作者在投稿时必须向期刊证明与论文相关的科学数据已存储到可公开访问的相关数据库中,并且要求自数据出版当日开始就提供免费获取[23]。国内一些期刊也积极采用这一方式,如《图书馆杂志》数据管理平台开创了“数据论文”“论文+数据支撑”“论文+富媒体格式”的网页增强出版方式,具体流程为上传数据、在线投稿、编辑审核、数据引证和优先发表[24];《中国工业经济》自2016年第11期开始,在期刊官方网站(www.ciejournal.org)公开所刊发论文的原始数据和程序、处理数据、案例研究材料、因正文篇幅所限而未刊发的附录等,并发布《〈中国工业经济〉编辑部关于公开数据附件的使用说明》,提醒读者注意保护作者对公开的数据、程序等原创内容的知识产权,如有使用,务必在研究成果上注明引文和数据附件出处,并提供引用格式示范,其2018年第11期刊登的《市场竞争加剧是否助推国有企业加杠杆》一文就提供了论文的原始数据、数据处理与分析的程序、结果等相关附件(图3和图4),而该论文的纸质版却无法提供这些信息。

基于数据库/平台的科学数据增强出版模式理顺了科学成果与数据出版的流程关系,有助于规范科学数据的出版流程:一方面,使科学数据整合、标识、引用与评审等关键性问题集中在一个数据库/平台,并得到系统处理;另一方面,增强了科学数据传播与交流的效果。

图3 《中国工业经济》期刊平台科学数据增强出版

图4 《中国工业经济》期刊平台科学数据增强出版

2.4 基于微信的科学数据增强出版模式

随着数字技术和新媒体技术的快速发展与普及,科技期刊纷纷尝试向数字出版和新媒体转型,利用新媒体进行出版与传播。有学者指出,传统期刊转型的关键是实现全媒体出版,而增强出版则是全媒体出版的必然选择[10]。作为受众广、功能扩展性强的新媒体平台,微信公众平台受到学术期刊的普遍青睐。相关调查显示,截至2015年5月30日,1200种中国科学引文数据库(Chinese Science Citation Database,CSCD)收录的科技期刊中有283种期刊开通了微信公众号,占样本期刊总数的23.58%[25];截至2016年1月,533种中文社会科学引文索引(Chinese Social Sciences Citation Index,CSSCI)收录的学术期刊中有164种开通了微信公众号,所占比例为30.77%[26]。随着新媒体技术的快速发展,开通微信公众号的期刊正呈井喷之势。有研究者指出,利用微信公众平台实现学术期刊的增强出版切实可行,其具体的实施方式主要包括论文检索平台的搭建、单篇论文增强出版、基于开放研究者与贡献者身份识别码的作者信息增强出版、整体期刊的增强出版、搭建读者与作者的沟通平台等[27]。利用微信小程序可以实现多种功能的扩展和多类型学术信息的展示,用户既可以直接下载相关数据,也可以通过“扫描二维码”或“阅读原文”等方式链接到原始数据。

基于微信的科学数据增强出版模式通过利用社交网络媒体,顺应了现代读者的阅读习惯,在加快科研论文传播速度的同时,实现了科学数据在信息发布者与使用者之间的高效传播,极大地推动了科学数据的传播与共享。

2.5 基于App的科学数据增强出版模式

随着数字化出版技术的发展,各出版社、期刊等对App(Application Program)的开发与应用不断深入,学术期刊也不断推出自己的App以实现增强出版。如Nature推出nature.com,Science推出Science Mobile。在基于App的科学论文增强出版模式中,出版方通过移动端App的开发与运用,高效地整合科学信息,为信息使用者提供便捷的信息获取方式。如通过《中国医学期刊》App,不仅可以阅读各类医学期刊,将各期刊论文按专业方向分类整理为病例库、视频库,方便信息使用者检索与利用论文和科学数据。不仅如此,出版商还利用App将期刊文献与科学数据关联起来,以增强用户体验。如Elsevier与可信赖的数据仓储之间建立了紧密的合作,已经开发了许多数据App,集成在ScienceDirect的文献页面中,例如Protein Viewer(PDB)、PANGAEA Related Data、Genome Viewer(NCBI)等,信息使用者可以在阅读文章的同时,看到外部数据仓储中的科学数据内容[28]。

基于App的科学数据增强出版模式不仅可以高效整合信息资源,提升用户体验,还能通过与外部数据库关联,实现科学数据的传播与共享,是科学数据在移动互联网环境下拓展传播渠道的有效途径之一。

2.6 科学数据增强出版模式的比较

对上述5种科学数据增强出版模式进行对比分析,结果如表1所示。可见:增强出版驱动的科学数据出版符合数字出版时代发展的需求,具有注重流程化管理、技术支撑、质量控制和服务于多元用户群体等特征。整体上,数据整合与出版供给更为重视数字型方式,数据标识多采用“HTML/XML+标识符”的方式,为基于DOI(Digital Object Identifier)或OID(Object Identifier)等的科学数据引用奠定了基础。从面向增强出版的科学数据出版全流程来看,这5种模式各有侧重,但也各自存在一定的缺陷:(1)存在个性化与标准化建设的偏离,缺乏规范性标准、政策的调控;(2)新技术应用存在一定盲点,如基于微信、App的科学数据增强出版标识与引用方式单一,与相关工具的兼容性较差;(3)在数据评审方面,偏重于技术质量控制,智能化审查、工作人员质量控制和同行评议并行亟待强化,科研人员数据素养、工作人员专业能力等仍需提升;(4)科学数据增强出版宣传不到位,间接导致开放获取(即传播与交流)效果不佳,表现为知悉和利用度较低、不易检索和复用等。鉴于此,增强出版驱动的科学数据出版应从数据出版的生命周期进行考量,积极探寻优化的路径。

表1 科学数据增强出版模式的比较

3 增强出版驱动的科学数据出版路径优化

3.1 制定与实施科学数据增强出版政策

学术期刊作为支持学术交流的重要载体,其数据政策对于推动科学数据的存储与管理、促进数据共享与最大化使用、实现科研过程的可重现都有着重要意义。当前,国际上主要的科学技术与工程以及医学领域的学术期刊都已经制定了与数据开放、数据共享和数据利用相关的政策。如Science与Nature明确要求作者在提交文章的同时,必须将与文章结论相关的研究数据一并上传,或存储于公共数据仓储,文章正式发表后将研究数据完全开放共享;《美国科学院院刊》(ProceedingsoftheNationalAcademyofSciencesoftheUnitedStatesofAmerica,PNAS)要求作者在投稿时提交或存储与研究相关的科学数据,并对数据的可用性限制进行说明;开放获取期刊出版商PLoS、生物医学中心(BioMed Central,BMC)也推出了数据共享政策。相关研究分别对国外学术期刊的数据政策进行了调研分析[29-31],其调查结果可供我国学术期刊参考借鉴。我国学术期刊界对于科学数据的存储与管理起步较晚,亟待制定相关政策以推动科学数据的增强出版与共享,这些政策至少应包括标准化与规范化政策、个性化与自主技术研发驱动政策等维度;同时遵循科学数据出版生命周期模型,如科学数据增强出版的采集、标识、出版、分发、重用、评价等层面的政策[32]。

3.2 关注与重视新技术的发展和应用

学术期刊的增强出版是建立在信息技术特别是新媒体技术的快速发展与广泛应用的基础上。当前,世界正处于新一轮科技革命和产业革命突破爆发的历史交汇期,以互联网为代表的信息技术和人类生产生活深度融合,成为引领创新和驱动转型的先导力量。然而,信息技术和新媒体技术的突飞猛进也给部分科技期刊的编辑人员带来了巨大挑战,一些人难以适应层出不穷的新技术和新应用,无法充分利用这些技术和应用推动学术出版的转型。而实际上,一些组织和团体正致力于使新技术的应用更加简单、便捷。如秀米、135编辑器等致力于解决用户在使用微信公众号编辑时遇到的困难,直接套用模版就可以编辑出一篇图文并茂且有简单链接的微信公众号推文。这些新颖的技术对于提升科学数据增强出版平台(应用)的传播效率具有重要作用。因此,科技期刊需要转变观念,积极关注与利用新技术和新应用,成为具有科研选题、组稿策划、知识服务、新媒体运营等能力的综合传媒机构。

3.3 联合建立标准化的科学数据增强出版存储库

增强出版驱动的5种科学数据出版模式具有个性化特征,在数据标识、引用等方面标准不一,因此可考虑联合建立科学数据增强出版存储库。科学数据的出版与共享离不开相关数据存储平台的支持,单独的学术期刊在数据管理、共享和长期存储方面并不具有明显优势。一些期刊因此联合起来成立专门的数据中心(Data Repository),如Dryad(http:∥www.datadryad.org/)就是一个由生命和生物领域国际期刊联合发起成立的数据中心,负责各个期刊出版数据的统一注册、管理与共享,目前已经有20多种期刊与Dryad合作。联合建立增强出版存储库,旨在为科研人员提供良好的数据共享平台,与单一期刊数据库相比,它一方面降低了数据管理(尤其是数据标识)的成本,丰富了科研数据库的数据内容;另一方面由于联合数据库对多个学科、多种数据格式的兼容性,不仅降低了科学数据存储与共享的难度,也提高了数据检索和引用的效率。与此同时,这种方式也可通过新技术的“使能”作用,与基于纸质、网页、微信、App等科学数据增强出版模式连接起来,成为科学数据增强出版发展的重要支撑。

3.4 规范科学数据的引用

科学出版物由观点以及支持该观点的论据组成,而数据就是最具说服力的论据。为了更好地推动科学数据的出版、传播与共享,实现科学数据的规范引用势在必行。科学数据的引用是采用文献引用的方式对所使用的科学数据资源进行描述[33],其目标是对数据创建者所作出的贡献给予承认,并表明数据的可利用性。数据引用有助于数据创建者的贡献得到承认,并实现数据使用的溯源,提供验证科研过程的途径[34]。

尽管数据引用规范化的重要性在学界已得到重视,但实施过程依然困难重重。其中最重要的原因便是研究人员尚未形成对数据使用进行标识的习惯,致使数据引用行为随意而凌乱。针对我国的国家自然科学基金、社会科学基金资助的学术成果中科学数据引用的实证调研显示,无论是自然科学领域还是人文社会科学领域的基金项目论文,对科学数据引用的规范程度都不高,表明我国学术界在数据引用方面存在着意识淡薄及引用行为不够规范等问题[35],这不仅难以对研究成果进行考证和追溯,也阻碍了科学数据的发现、共享和再利用,需要引起我国各相关利益群体的重视。

可喜的是,中国科学院计算机网络信息中心主持编制的《信息技术科学数据引用》(GB/T 35294—2017)已于2017年年底正式发布,并于2018年7月1日起正式实施。该标准规定了科学数据引用元素描述方法、引用元素详细说明、引用格式等方面的内容,适用于科学数据传播机构、数据使用者等。其中,科学数据传播机构可根据该标准设计数据引用规则;数据使用者可根据该标准著录科学数据引用信息[36]。该标准的发布,标志着科学数据可以像学术论文一样被学术同行以标准化的方式引用,将在一定程度上促进数据的出版与引用。因此,出版界和学术界应协同合作,加强对该标准的宣传推广,鼓励科研人员根据该标准对所使用的数据进行规范化引用。此外,应以开源合作或自主研发为驱动,开发适用于多种增强出版模式的科学数据引用工具,支持标准中“通用科学数据引用格式”和“基于OID的科学数据引用方式”。

3.5 重视多维度的科学数据增强出版质量控制

基于增强出版的科学数据出版与利用,离不开科研人员提供高质量的科学数据资源,这必须建立在多维度的科学数据增强出版质量控制的基础之上。

(1) 关注科研人员的数据素养。相关研究发现,大多数科研人员认可科学数据共享的积极作用,但却不会与他人共享自己的科研数据[37],且科研人员的数据获取与处理能力较差[38]。因此,加强对科研人员的数据素养教育,提升其获取、收集、分析、处理数据等的能力,对进一步促进科学数据出版与利用至关重要。图书馆、期刊社等具有科学数据组织管理优势的机构,可以通过开展讲座以及专题研讨会等方式提升科研人员的数据共享意识和数据处理能力。如北京大学图书馆开设了《数据素养与统计数据资源介绍》讲座,山东大学图书馆开设了《事实数据的网络检索》《SPSS工具使用》等相关讲座;美国爱丁堡大学和美国北卡罗莱纳大学共同筹建的《研究数据管理与分享》,旨在帮助网络学习者提升研究数据管理和分享等技能[39]。这些形式多样的课程有助于提升科研人员的数据素养,进而提升基于增强出版的科学数据出版质量。

(2) 重视面向增强出版的科学数据的质量。重视智能化审查、工作人员质量控制和同行评议并行,监管与服务并重,实现面向多学科、多领域增强出版的数据质量控制[32]。一些有利于科学数据的出版质量控制的方式值得借鉴,如图书馆杂志数据管理平台的数据出版需经“编辑审核”这一重要环节[24];Dryad、DataONE等引入数据质量控制计划和同行评议制度,在数据出版之前工作人员与同行评议人员会对数据的技术正确性、安全性、学术性等方面进行质量审查和管理[40]。因此,在提升科研人员数据素养的前提下,可考虑在科学数据增强出版流程中引入质量控制计划和制度,从多维度切实提升增强科学数据出版质量,实现科学数据出版与共享的应有价值。

4 结语

作为对未来学术出版方式的一种探索,增强出版受到学术领域和出版界的一致欢迎。在科学数据领域,数据出版是实现数据的公开与广泛传播,促进共享与利用的重要且最具可行性的途径,成为当前科学数据开放共享的新热点。在此背景下,本研究探讨了基于增强出版的科学数据出版动因、模式及实施路径,有助于推动科学数据的传播与利用。由于当前基于增强出版的科学数据出版案例并不多,本研究存在实证研究不足等问题。在后续研究中,笔者将密切跟踪科学数据增强出版的发展动态,深入探讨数据的传播途径与机制等问题,以期更好地推动科学数据的共享利用。

猜你喜欢

论文期刊科学
期刊更名启事
期刊简介
期刊问答
点击科学
科学大爆炸
科学拔牙
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登
2013年5—12月最佳论文