APP下载

数据论文联合出版模式及数据论文出版

2018-07-28马瀚青杨小梅侯春梅李晓燕李红星

中国科技期刊研究 2018年7期
关键词:数据中心论文期刊

■马瀚青 杨小梅 侯春梅 李晓燕 李红星

1)中国科学院兰州文献情报中心《遥感技术与应用》编辑部,甘肃省兰州市天水中路8号 7300002)中国科学院兰州文献情报中心《地球科学进展》编辑部,甘肃省兰州市天水中路8号 7300003)中国科学院兰州文献情报中心《天然气地球科学》编辑部,甘肃省兰州市天水中路8号 7300004)中国科学院西北生态环境资源研究院,甘肃省兰州市东岗西路320号 730000

数据是科学研究最重要的成果之一,也是对科学结论最有力的支持,数据密集型科学成为科学研究的最新范式[1]。数据的共享和数据生产者的版权、权益问题,已经成为科研过程中各方人员最关心的问题[2-3]。刘凤红等[4]认为期刊出版界应该开拓新兴出版内容,为科研群体提供多样化的发表通道。针对科研人员和期刊共同的需求,国际上兴起了数据论文(Data Paper 或Data Descriptor)和数据期刊(Data Journal),通过出版科学数据,促进科研结论的验证、审核和科学价值评估。数据论文出版将从机制上改变当前数据共享所面临的困境,从而改变出版机构与数据中心的关系,创造期刊出版与数据中心关联集成的新格局[5]。

刘晶晶等[6]以ScientificData数据期刊,欧阳峥峥等[7]以F1000Research、GigaScience等典型国际数据期刊为研究对象,对其发展现状、出版方式、引用机制、版权协议以及出版费用等进行了分析研究。地球科学的数据期刊有EarthSystemScienceData(ESSD)和GeoscienceDataJournal等。ESSD (https://www.earth-system-science-data.net/)是国际性、跨学科的期刊,发表于 ESSD 的文章包含固定长度的文章、短篇补充的数据集、注释等几个板块。数据期刊都具有很高的影响因子,ESSD从2009年发展到2015年,影响因子达到8.286,后来略有下降。ScientificData(https://www.nature.com/sdata/)2017年才刚有影响因子,就高达4.836,说明科学界对数据期刊或数据论文有很高的认可度。

在整个科研产出中,科学论文展示的结果仅仅是其中的一部分,还有大量的其他科研要素未能发表和共享[4,8]。对于数据使用者来说,通过数据论文对数据进行详细、全面的描述,可以有效促进数据的合理使用[9]。而且,地理科学的研究非常依赖于观测数据、遥感数据、社会经济数据等的获取。然而,实验站点观测人员、遥感数据生产人员、测绘数据制作人员等数据生产者所生产的数据支撑了大量的科学研究,但其数据贡献的价值无法明显体现出来;很多科研人员拥有大量的数据,但不愿意共享,根本原因是怕别人窃取导致无法拥有其数据版权。可以说,数据论文在一定程度上促进了对数据生产者贡献的肯定和对数据版权的保护[10]。

我国数据论文和数据期刊方面的研究和实践发展也较快。2015年,中国第1种数据期刊《中国科学数据》(http://www.csdata.org/p/)创刊,现在已经成为中国科学引文数据库(Chinese Science Citation Database,CSCD)核心库来源期刊。中国科学院地理科学与资源研究所与多家单位联合建成了全球变化科学研究数据出版系统,数据论文以长摘要形式发表,其第1期数据论文在《地理学报》增刊出版[11],2017年1月,《全球变化数据学报》第1期创刊出版[12],正式成为数据期刊。然而,期刊出版单位如何开展数据论文出版,如何解决数据的存储、质量控制与发布,尚缺乏充分的讨论。针对这些问题,《遥感技术与应用》开展了科学数据论文联合出版研究与实践工作。科学数据联合出版是指数据中心与传统学术期刊通过合作以数据论文的形式完成数据的正式出版[10,13]。本研究在科学数据论文联合出版实践基础上,分析在这个过程中形成的数据论文联合出版模式和流程,以推动数据论文的发展。优秀数据带来的引用,有助于提高期刊影响力,这也是在数据密集型科学下形成的一种新的出版机制。

1 数据论文联合出版模式

数据论文联合出版是一种高效的数据出版模式。该模式的核心是有机结合期刊的论文发布资源和数据中心的数据发布资源,其关键是通过两种资源的合理结合,有效推进数据论文出版工作。其基本流程与常规论文一样,都要经历投稿、初审、外审和终审。但数据论文的评审侧重点不在于科学发现,而在于对数据的详细描述和质量控制。联合出版的具体流程包括以下4个阶段(图1)。

图1 科学数据联合出版流程[13]

(1) 数据与数据论文投稿。数据论文由两部分组成,作者将数据投至数据中心,把数据论文投稿到编辑部。数据中心负责数据的评审工作,使数据包含有设定的元数据字段,以符合数据中心的规范,并分配DOI,这是与数据论文相关联的重要标识。数据中心一般会对数据的质量进行说明,如评审意见、数据下载方式、数据责任人等,为数据论文外审、接受和发表提供参考。同时,作者选择方向合适的期刊投稿,并附上数据中心提供的评审与质量控制等数据信息。

(2)数据与数据论文评审。数据论文不涉及方法和科学发现,而仅仅是对数据获取、质量控制、数据处理等过程的详细描述,写作的格式也与常规论文不同。所以,数据论文的评审重点在数据本身,数据期刊在选择外审人时,必须遴选有数据生产和数据使用经验的综合专家。数据中心也可以根据数据情况来推荐审稿人,而且审稿人和数据审核人可以是同一个专家。作者根据外审意见认真修改论文和补充数据信息。数据论文的评审意见和结果不但要反馈给数据作者,还要将评审报告发送至数据中心,以及时更新和完善相关数据集。

(3) 数据论文发表。在数据和数据论文都通过评审,达到发表要求后,就可以发布和出版。数据中心正式发布数据集,给予该数据集永久的DOI,并与正式出版的数据论文相关联,数据页面显示引用中,首先推荐引用数据论文,也可以引用数据。这种通过数据的使用带来了数据论文的引用,能有效提高期刊的影响力。

在数据论文被退稿的情况下,数据是否也要继续发布?这个问题可以根据具体情况进行具体分析,如果数据论文退稿的理由为数据质量问题、或科学价值不足等情况,可以将出版的数据撤回。如果退稿的原因是数据论文本身写作的问题,可以先发表数据,再审核数据论文。

(4) 数据共享与推广。通过前期的投稿、评审、修改、规范等一系列流程后,数据与数据论文正式发表和共享,同时向科研群体推广数据论文这种方式。数据共享可以吸引很多研究人员访问,而且都需要填写个人及数据用途信息,也就是说,可以看到这些数据应用在接下来的哪些研究,这样有助于挖掘数据的潜在价值。对于数据论文来说,可以带来很高的关注度和影响力,从而增加期刊的被引频次,提高期刊的影响力。数据论文作者可以定期收到数据中心提供的数据访问量、下载量、被引频次及用户和用途等信息,可以更加深入地了解数据用途和实际意义,更能激发数据制造者的创造能力。

2 数据论文联合出版实践

2.1 与数据中心建立合作关系

发表数据论文,首先需要建立长期存储期刊数据的在线平台。对于期刊来说,数据存储问题的最便捷、稳定的解决办法是与数据中心合作。数据联合出版的第一步,就是期刊与相应的数据中心建立合作关系。不同学科的期刊可以根据自己的特点,寻找本学科的数据中心,并与其进行合作。

以《遥感技术与应用》为例,其学科特点是研究都是以数据为基础,因此该期刊与寒区旱区科学大数据中心(原中国西部环境与生态科学数据中心)开展数据联合出版模式实践。该数据中心是世界数据中心成员之一,从2009年开始与中国科学技术信息研究所合作,依托国家自然科学基金重大研究计划及大型科学试验,在我国首次开展了数据出版试点研究[13-14],被汤森路透遴选为我国首个开展数据引用索引 (Data Citation Index, DCI)合作的数据中心。

与数据中心建立关系后,数据中心委派负责人与期刊接洽,协调好数据中心、期刊编辑部、外审人员和作者之间的合作。按照数据论文联合投稿流程,推进数据论文按步骤投稿、评审和发布。

2.2 寻找优秀的数据资源与作者

数据论文的核心是高质量的数据,只有高质量的数据才能带来广泛的使用,促进数据论文的高被引,进而提高期刊的影响力。期刊应该像寻找优秀论文一样去寻找优秀数据,出版优秀的数据论文。首先登录到相关学科的主要数据中心,检索高访问、高引用的数据,然后联系数据作者,跟他们商议撰写数据论文,并给他们提供相关的模板、写作要点等信息。有时候为了调动作者的积极性,要讲清楚数据论文的意义,和所提供的优惠条件,如尽快发表、减免版面费等。如《遥感技术与应用》发表的《中国2000年1 km植物功能型分布图》[15],就是在寒区旱区科学数据中心查询,发现“中国地区土地覆盖综合数据集”这一数据下载量高达2900多次,是高下载、使用广泛的优秀数据,通过联系数据作者,最终将其变为一篇优秀的数据论文。

此外,通过跟踪已发表的数据来挖掘潜在的数据论文作者。一般来说,数据作者会持续生产数据,联系已发表数据的作者,关注该作者的数据,及时邀约他们撰写数据论文。同时也可以关注相关领域的论文和项目,通过分析这些论文或项目,判断是否有数据产出,可密切关注有大量数据产生的项目团队。

2.3 寻找优秀数据论文评审人员

数据论文评审与常规论文评审是有细微差距的,数据论文是以描述数据收集、处理、验证、过程等细节为主,对于评审人的要求是既要有学科背景,还要有采集数据或使用数据的经验,所以,首先是要遴选优秀的数据论文评审人员。其次要选择合适的评审流程和方式。刘传玺[16]分析了10种数据期刊的评审流程,认为每种期刊根据各自的学科特点,选择了封闭式和开放式等不同的评审方式。因此,数据论文出版单位可以参考这些刊物的流程,结合自身特点设计符合自己需求的出版流程。

3 数据论文联合出版实践的启示

数据论文联合出版是在科学研究第四范式推进下产生的一种出版形式,使数据成为科学研究的核心,符合期刊发展的趋势。ScientficData、ESSD等期刊的快速发展,也说明了数据论文的未来一片光明。2015年被称为“大数据元年”,数据研究已经成为各行各业关注的重要内容之一。《遥感技术与应用》联合数据中心共同出版数据论文,是传统期刊联合数据中心的一次尝试,并得到了业内科学家的肯定,从而推进了数据论文出版的发展,同时也提高了期刊的影响力。

3.1 数据联合论文出版是共赢

科学数据作为科学研究最重要的资源和科研产出,是最重要的论文要素。数据论文是开放科学[17]发展的必然结果,是新时代对期刊转型的要求。对于数据中心来说,通过出版数据论文,对优秀数据进行详细说明,扩展了数据中心的功能,有利于科研人员使用数据。对于期刊来说,通过优秀数据的高使用率和下载量,带来期刊论文的被引和访问量上升,扩大期刊的影响范围,不断提升期刊的知识服务价值。在开放科学发展大趋势下,数据论文出版工作的开展可实现共赢。

3.2 数据可作为期刊增强出版

增强出版是未来科技论文出版的数字模式,出版内容不仅有文本,还包括数据、代码、视频等。从论文的角度讲,数据论文所关联的数据,可以认为是论文的增强出版。论文数据作为附件或者放到数据仓储,随论文一起发表,也将会是未来的趋势,特别是以观测数据为基础的地学领域。在以知识服务为核心的阶段,要考虑科学家的使用需求和习惯,他们不仅需要阅读文献,也希望数据触手可得,所以科学数据的增强出版,揉合知识获取和数据获取为一体,能为科学家提供更好的阅读体验。

3.3 数据论文与期刊集群结合发展

数据论文的推广和发展,需要政策和期刊集群的支持,也是期刊集群建设的重要方向。地理与资源期刊集群(http://www.geores.com.cn/)是我国最早关注地理数据出版的平台,并且集成了数据期刊《全球变化数据学报》,把数据论文出版作为集群平台发展的重要方向[18]。资源环境科学期刊集群平台(www.lores.ac.cn)的二期建设[19],从最初的图片库建设,逐步发展到期刊数据平台的建设,把数据期刊和期刊的数据仓储集成到平台,能为更多的期刊提供数据论文与期刊数据仓储服务。

4 数据论文联合出版工作展望

4.1 引用数据论文要优于引用数据

数据论文发表后,会在数据界面显示数据的引用格式和数据论文的引用格式。使用的是数据本身,但使用过程中参见的是数据论文中的说明解释。2012年10月,DCI才起步,对于数据引用及在此基础上的评价还不完备。一般情况下,可以引用数据本身,但对于更多科学家来说,引用数据论文的意义更大,国际上都是以引用数据论文为主,这样可以提高论文的影响力,间接提高数据的价值。

4.2 加强期刊与数据中心的协调能力

数据论文中的数据需要开放和长期保存,联合出版过程中,要选择权威的数据中心,这样才能维持数据的开放性、安全性。同时,也要和数据中心加强协调能力,在数据和数据论文双重投稿、退稿等过程中,要制定协调机制,互相配合,完成数据论文和数据的存储、修改与退稿。

4.3 建立数据论文审稿人专家库

与传统研究论文评审相比,数据评审具有自身特点,审稿人不但应具备相应专业的知识背景,最好还有使用或制备同类数据的经验,具备相应的软件使用技能;同时审稿观念也应是全新的、不同于传统研究论文,通过评审应将所有具有再利用价值的数据筛选出来,而非仅仅关注数据本身表达的科学含义。所以,期刊与数据中心共同遴选和建立数据论文审稿专家库,是做好数据论文出版的基础。

4.4 数据论文出版工作推广

“互联网+”时代的学术传播从开放、全息化、非线性为特征向小众化和个性化方向发展[20]。从整体上看,数据论文的认可度在不断提高,更多科学家和数据工程师认识到数据论文的价值。但不熟悉数据论文的格式和投稿流程,所以数据论文出版单位还需要通过多种平台去推介数据论文。一方面利用期刊的网站等,介绍数据论文的意义,并提供相应模版,告知注意事项;另一方面需利用现有的社交媒介等实现其广泛传播。

5 结语

数据论文已经是国际上被科研界所认可的形式,可以更加体现科研人员与数据工作的贡献。《中国科学数据》和《全球变化数据学报》的成立与迅速发展,也反映出我国期刊界对数据论文的重视程度。

“期刊+数据中心”是数据论文的联合出版模式,是以期刊为主体,联合数据中心,发表数据论文的便捷模式,能够有效促进数据作者权益保护和数据质量控制。本研究梳理了数据论文联合出版的模式与流程、以及相关的政策、数据共享方式和数据评审、论文发布、引用等具体问题。并通过《遥感技术与应用》联合寒区旱区科学大数据中心,以“数据论文专栏”的形式,成功发布数据论文的实践分析,为其他期刊开展数据论文出版工作提供参考。

在数据联合出版工作中,发现还有一些问题有待解决。如根据不同学科,建立适合的数据政策;建议在数据使用中,提倡引用数据论文来提高影响力;此外,还需要遴选一批有数据处理经验和科研能力的外审专家,全面推进数据论文联合出版工作。

地学期刊和资源环境领域期刊的论文研究内容大多基于地理空间数据,资源环境期刊对于数据论文的重视程度还远远不够,在大数据与人工智能成为科学焦点的时候,学术期刊也应该更多关注数据共享的推进工作,联合数据中心形成有机平台,进一步融合期刊和数据,更好地服务于科学家团体,推动知识更加便利、完善地传播。

猜你喜欢

数据中心论文期刊
期刊更名启事
期刊简介
酒泉云计算大数据中心
浅析数据中心空调节能发展趋势
期刊问答
关于建立“格萨尔文献数据中心”的初步构想
基于云计算的交通运输数据中心实现与应用
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登