我国科技期刊数据政策制定及实施模式研究
2021-12-21申艳
摘要:[目的/意义]数据出版与科技期刊融合发展是一条“双赢”之路。针对目前期刊论文关联数据出版量少,论文作者数据出版的意识和积极性还没有被充分激发出来等问题,调研国际出版商数据政策的实践经验,在此基础上提出我国科技期刊参与数据出版的机制和政策,为推动我国数据出版、建设世界一流期刊提供有力支撑。[方法/过程] 通过文献综述、案例分析、网站信息采集等方法分析我国数据与论文关联出版现状及Elsevier、Springer Nature、Wiley、SAGE Publishing和Taylor & Francis五大国际出版商的数据政策及运行机制。[结果/结论] 五大出版商实施数据政策的模式基本一致:整体政策说明+旗下期刊自由选择。Elsevier、Springer Nature、Wiley、SAGE Publishing和Taylor & Francis旗下分别有68%、99.9%、92.2%、47.0%和69.3%的期刊明确提出数据政策,但以鼓励为主。我国出版界可以借鉴国际出版商的实践经验,结合我国科技期刊的特点,制定科技期刊数据政策标准规范和实施模式,由少到多、由点到面逐步推动数据出版与科技期刊在广度和深度上融合发展。
关键词:科技期刊;数据出版;数据政策;运行机制;融合发展
分类号:G254
引用格式:申艳. 我国科技期刊数据政策制定及实施模式研究[J/OL]. 知识管理论坛, 2021, 6(5): 252-262[引用日期]. http://www.kmf.ac.cn/p/258/.
1 引言
科学数据,或者是研究数据、科研数据,是国家的重要战略资源。随着以数据为驱动力的第四科研范式的兴起与发展,科学数据共享作为数据流通和再利用的关键手段,变得尤为必要和迫切。数据出版是促进数据共享的有效途径[1]。数据出版大致可分为3种模式:①独立数据出版,即将数据单独存储在公开的数据仓储中心;②数据作为论文的辅助资料,以附件或附录的形式和论文一起网络出版;③关联出版,实体数据存储在期刊指定的数据仓储中心并建立和科学发现论文/数据论文的关联,形成一种可互操作的科学环境[2-5]。数据与论文关联出版,在阅读论文时直接获得相关数据的链接,能够促进科学数据的再利用。反过来,在发表论文的同时(或之前)出版其包含的数据集,能够减少数据造假等科研诚信问题,提高数据质量,保障论文研究结论的准确性和有效性,进而提高论文和期刊的质量。因此,数据出版与期刊发展是可以相辅相成、相互促进的,但是,目前无论是从数量还是从关联程度上看,数据出版与科技期刊均没有达到融合发展(你中有我、我中有你、相互促进、共同发展)的程度。
我国对数据出版与科技期刊融合发展已有一定的探索。2014年6月,由中国科学院主管、中国科学院地理科学与资源研究所和中国地理学会联合主办的全球变化科学研究数据出版系统(Global Change Research Data Publishing & Repository,GCdataPR)正式上线[6],为实体数据和数据论文的关联出版提供了平台。2016年3月,GCdataPR与全球变化及地学领域科技期刊签订了“论文关联原创数据出版与共享联合倡议书”,目的是推动科技期刊论文关联数据出版,促进数据出版与科技期刊的融合发展。目前60多个国内外科技期刊加入了这一倡议。我国也陆续出现了《中国科学数据》[7]、《中国地质》(增刊)[8]、《农业大数据学报》[9]、Big Earth Data[10]等以刊登数据论文为主的数据期刊,《图书馆杂志》[11]、《遥感学报》[12]等一些传统学术期刊也开始刊登数据论文。数据出版与期刊融合发展出现了良好的氛围,然而,目前论文关联实体数据集的出版数量却不尽如人意。据GCdataPR网站显示,2016-2020年期间共有65个期刊的论文关联数据在GCdataPR出版,但出版关联数据论文占期刊有数据论文篇数的比例不到2%[8]。由此可见,论文作者出版数据的意识和积极性还没有被充分激发出来,数据出版与科技期刊融合发展的深度和广度还有待进一步提高。
数据政策是期刊推动数据出版与科技期刊融合发展的重要举措。期刊数据政策是指期刊对其刊登论文所关联的数据的政策,主要包括:对数据开放共享益处的描述;论文关联数据的类型、格式及相关的说明(如数据引用);对数据的数量限制;不同类型数据的保存方式;数据可获取性以及数据访问方式;作者提供数据的时间;数据是否公开、免费获取或受其他限制;数据重用的条件;是否允许数据政策的特例存在;遵守该政策的方法及如何控制等[13]。我国现有中文科技期刊4 477种[14],期刊平均年载文量为324篇[15]。通过对部分地理资源类期刊进行调研发现,数据论文篇数占发表论文篇数的29.4%-100.0%,平均75.7%(见表1)。按平均值75.7%来算,每年将产生100多万个论文关联实体数据集。期刊的数据政策直接影响这部分数据集的出版,如果作者在投稿时就了解数据政策,将极大地提高数据出版的几率。目前,国际上许多出版商和期刊制定了数据政策[16-18],鼓励或强制作者将论文关联数据存放在公开的数据仓储中心,并提供数据和论文的互联服务。作者因国际期刊要求进行数据出版的案例也越来越多。但是,我国鲜有期刊提出明确的数据政策[19]。因此,我国可以借鉴国际出版商的经验,构建本地化数据政策及实施模式,即确定什么样的数据政策才能适应我国科技期刊的特点以及什么主体(机构)应该采取什么样的措施、手段才能保障数据政策的有效实施。
關于国际出版商及旗下期刊的数据政策,国内一些学者基于不同研究目的进行了不同层次的分析。刘颖等[20]从数据类型、数据存储位置、数据可利用声明等方面对医学领域国际学术期刊数据出版政策进行了分析;陈全平[21]以国际典型期刊为例对数据政策制定的主体、内容等进行了研究;孔丽华等[22]在研究数据出版的趋势、机制与挑战时也分析了部分国际出版商的数据政策。这些研究为国内期刊数据政策理论研究提供了参考,但从实践角度来全面探讨国际出版商及旗下期刊的数据政策并提出我国科技期刊数据政策运行模式的还未见报道。因此,笔者选取Elsevier、Springer Nature、Wiley、SAGE Publishing和Taylor & Francis五大出版商,通过遍历网页的方法调研了它们的数据政策及运行模式,在此基础上提出我国科技期刊的数据政策及运行模式,以促进我国数据出版与科技期刊的融合发展。
2 五大国际出版商的数据政策
2.1 运行模式
五大出版商实施数据政策的运行模式基本一致:整体数据政策说明+旗下期刊自由选择。出版商在其官网专门设置一个模块进行数据政策的整体介绍,包括科学数据的定义、数据共享的作用以及数据共享的方式、级别等。旗下每个期刊根据实际情况选择适合自己的数据政策,并根据需要链接到出版商官网让作者全面了解数据政策。以Elsevier[17]旗下期刊Examples and Counterexamples[23]为例(见图1),在其作者指南中,有单独的“research data”(科学数据)模块,这个模块给出了该期刊对数据共享的态度,“encourages and enables”(鼓励并可实现),即鼓励作者进行数据共享,支持通过DOI、公共数据仓储获取号、数据库标识链接等方式实现科学数据与期刊论文之间的关联;并可以通过图1右下角的超链接实现和Elsevier官网数据政策的衔接。
2.2 数据政策类型
除Elsevier外,Springer Nature[18]、Wiley[24]、SAGE Publishing[25]和Taylor & Francis[26]均制定了不同共享程度的数据政策供旗下期刊选择(见表2-表5)。虽然各出版商数据政策的制定标准、种类数量不同,但都是从鼓励向强制过渡,对作者数据共享的要求越来越严格。以Springer Nature为例(见表2),其数据政策类型包括4类,其中“数据存储在数据仓储中心”以及“允许作者以参考文献格式列出所引用的数据集”是4种类型都强制要求的。除了上述两项内容,类型1对其他项均无要求;类型2与类型1的区别是提供了数据集标识符和数据可利用性声明的选项,但是不强制;类型3则是强制作者提供数据集标识符并提供数据可用性声明;类型4的要求最为严格,对数据引用、数据同行评议等均做了强制要求。
Wiley的“鼓励数据共享”、SAGE Publishing的“支持和鼓励数据共享”、Taylor & Francis的“基本政策”和Springer Nature的“类型1”相比要求更宽松,它们并没有实质性要求作者必须做什么,一切以鼓励和作者自愿为主,但是却向作者宣传了数据共享的作用及可实现的途径。从最严格的数据政策来看,Wiley的“强制数据共享+数据同行评议”和Springer Nature的“类型4”类似,均从数据存储在数据仓储中心、数据引用、数据链接的核实、数据可利用性声明、数据同行评议等方面进行了强制要求。在此基础上,Taylor & Francis的“开放数据+FAIR原则”还对数据集遵循的许可进行了要求,要求出版的数据集必须遵循CC0、CCBY或等效原则。相比之下,SAGE Publishing的最严格级别“要求数据共享”则相对宽松,仅从数据存放至仓储中心、数据可用性声明、数据引用规则3个方面进行了强制要求,对数据同行评议只是“may be asked”(可能要求)。
2.3 旗下期刊的选择
Elsevier旗下共有2 761个(去除期刊关停并转,实际期刊数为2 532个)期刊[27],由于Elsevier對数据政策并没有分级,所以旗下期刊对“research data”的描述相同且比较简单(Cell系列期刊除外),约有1 723个(68%)期刊明确表示鼓励数据共享(见图1)。Cell系列期刊对论文关联数据的要求更加细化,以The American Journal of Human Genetics[28]为例,期刊要求核酸、蛋白质序列、单核苷酸多态性、拷贝数变异、微阵列数据以及射线衍射晶体分析法测定的大分子结构(包括结构因子)等数据必须存储到合适的、公开的数据仓储中心,且自发表之日无条件公开;对于基因型数据,虽不强制要求作者将数据存放在公开的数据仓储中心,但是鼓励作者这样做,并要求作者将基因型数据作为附加材料提供或者将数据放在网站上以使读者能够获得这些数据。在提交修改稿之前,作者需将新描述的单核苷酸多态性数据提交到合适的数据仓储中心,将在控制样本(control samples)中获得的所有拷贝数变异数据存放到染色体结构变异数据库(Database of Genomic Variants Archive,DGVa) 或者基因组结构变异数据库(Database of Genomic Structural Variation,dbVAR)中。期刊还鼓励作者将论文中使用的其他材料的数据存放到合适的数据仓储中心。
图2-图5给出了各出版商旗下期刊所采用数据政策类型的统计结果。从图中可以看出,除SAGE Publishing(47.0%)外,其他出版商超过68%的期刊明确提出了数据政策,但以鼓励数据共享为主。Springer Nature、Wiley、SAGE Publishing和Taylor & Francis旗下期刊采取鼓励数据共享政策的比例分别为37.6%、75.5%、46.9%和59.1%。Springer Nature采取过渡等级(类型2和类型3)的期刊的比例较Wiley(14.0%)、SAGE Publishing(0.8%)和Taylor & Francis(1.3%)高,约占60.1%,说明Springer Nature旗下期刊论文数据共享提出了更高的要求。但是,SAGE Publishing要求作者必须进行数据共享的期刊比例却是最高的(11.5%),其他出版商该比例均小于3%。这可能与他们旗下期刊的学科分布差异有关。
笔者对采取最严格数据政策(要求数据同行评议)的期刊(SAGE Publishing最严格数据政策也没有要求数据同行评议,故此表中没有列出)进行了进一步的统计(见表6)。从表6可以看出,Springer Nature、Wiley、Taylor & Francis旗下分别有9个、2个、6个期刊采取了最严格数据政策,除Scientific Data、Geoscience Data Journal、Big Earth Data为数据期刊外,其他为传统期刊,但17个期刊均为开放获取期刊或部分开放获取期刊,说明传统非开放获取期刊在数据审核、追踪、保存等方面还存在人力、物力和财力等方面的问题。值得指出的是,Taylor & Francis 6个期刊中有5个期刊是地球科学方面的期刊(见表6),说明地球科学尤其是地球信息科学在数据共享方面起了引领作用。
五大国际出版商的实践证明,期刊数据政策在推动数据出版与期刊融合发展方面发挥了重要作用。因此,要推动我国数据出版与科技期刊融合发展,必须充分发挥期刊的作用。我国科技期刊可以借鉴国际出版商的经验,从工作机制、政策内容、试点示范等方面去推进科技期刊数据政策的制定及运行。
3.1 期刊数据政策制定
我国科技期刊目前还处在数据政策“有没有”阶段,在这一阶段,应以宣传和鼓励作者进行数据出版为主旋律。借鉴国际出版商的经验,首先对数据出版、数据出版带来的益处进行知识普及,然后对论文关联数据的存储、数据引用、数据可用性声明等方面的要求进行不同程度的分级,以便期刊根据自身条件进行自由选择。在具体条目方面,Springer Nature数据政策涵盖最为全面(见表2),可以参考,可对等级分类数量和选项进行适当调整,比如最宽松的数据政策类型可以不强制将数据存储在数据仓储中心。但笔者建议,即使是最宽松的数据政策,也应对数据可利用性声明进行强制要求,因为数据可利用性声明只是用来说明论文关联数据是否可以访问以及在何处、何种条件下可以访问(见表7),这不会增加作者的心理负担和工作量,但是却能提高作者和读者对数据出版的关注。
3.2 科技期刊数据政策实施模式探索
我国科技期刊存在“小、散、弱”特点,在国内大多数作者还没有建立数据共享意识的当下,靠单个期刊去制定数据政策,不规范、不系统,也很难推进。因此,要有效实施期刊数据政策,不仅需要完善旧的基础设施、文章结构、运营方式、评价方法等,还需要数据仓储中心、科技期刊等各方良好的配合。如图6所示,期刊数据政策的实施模式由“数据出版与科技期刊融合发展行动小组”“组织实施单位”“数据仓储中心”“科技期刊(含数据期刊)”4个上下联动、相互配合的系统构成。
3.2.1 “数据出版与科技期刊融合发展行动小组”的宏观调控
由上级领导部门(如中宣部、中国科协)负责“数据出版与科技期刊融合发展行动小组”的组织实施和考核评估。“数据出版与科技期刊融合发展行动小组”主要成员包括:中宣部、中国科协主持相关工作的领导,具有出版经验的学会主管领导、全国科技期刊出版方面的专家、数据专家等。“数据出版与科技期刊融合发展行动小组”的职责是负责全国数据出版与科技期刊融合发展的领导、组织、协调,研究制定推进数据出版与科技期刊融合发展工作的部署和落实,推动各级部门配合联动,全面完成确定的目标任务;督促检查各专业领域有关单位对相关政策的落实情况及任务完成情况,协调解决工作中的重大问题;研究确定年度工作要点和阶段性工作计划,定期汇总工作情况并及时通报。
3.2.2 组织实施单位的上传下达
组织实施单位是连接上下的枢纽,是执行期刊数据政策的关键一环,主要组成单位为中华医学会、中国地理学会、中国高校科技期刊研究會等一些有出版经验、影响力大的学会及中国科技期刊卓越行动计划集群化试点项目主持单位,主要职责是将“数据出版与科技期刊融合发展行动小组”的战略规划或构想细化成具体可执行的实施方案,组织构建科技期刊与数据仓储中心的合作机制,组织双方专家协商制定数据政策,对数据仓储中心和科技期刊进行培训、指导和监督,对方案预期成果进行判断、分析,并定期向“数据出版与科技期刊融合发展行动小组”汇报。
3.2.3 数据仓储中心和科技期刊的分工合作
数据仓储中心一个最基本的作用就是提供数据储存的软硬件设施,确保数据能够安全、永久保存,因此,必须强化基础设施建设,构建标准化数据服务体系,建立综合的、适于分析的、体系化的信息存储环境,实现数据存储与科技期刊(包括数据期刊)的互联互通;厘清数据版权信息,为每个数据集提供唯一永久标识符;制定数据评审机制体制,严把数据质量关;建立数据引用标准,保护数据作者权益;构建数据影响评价指标体系,提高数据共享程度与影响力。
科技期刊是数据政策的具体执行者,应根据期刊学科特性,从组织实施单位制定的数据政策中选择适合本期刊的数据政策类型,并因地制宜地细化数据政策;对投稿系统、论文模板进行升级改造,增加数据政策相关内容,比如数据可利用声明、数据集引用格式规范等;充分利用期刊编委会,尤其是主编的影响力,对期刊数据政策进行宣传;调研作者对数据出版的意见及数据出版过程中遇到的问题,及时解决作者的问题,逐步提高作者数据出版的意愿;跟踪实施数据政策后投稿量、引用次数、论文关联数据出版数量及期刊社会影响力等指标的变化,及时向组织实施单位反馈情况,以便作出调整,逐步提高数据政策在我国的适应性。
4 结语
科技强国离不开一流科技期刊的支撑。2019年8月,中国科协等四部委联合印发《关于深化改革 培育世界一流科技期刊的意见》,明确提出探索数据出版等新型出版模式。数据出版与科技期刊融合发展,是推动我国科学数据共享的需要,也是建设世界一流科技期刊的需要。数据政策是科技期刊推动数据出版的重要手段。我国出版界要充分利用国家重视数据出版和期刊发展的这一契机,借鉴Elsevier、Springer Nature、Wiley等国际出版商的实践经验,制定适合我国科技期刊的数据政策和运行模式,切实推动科技期刊论文数据的出版与共享,实现双赢。
致谢
感谢中国科学院地理科学与资源研究所刘闯、何书金老师以及中国科学院文献情报中心顾立平、曾燕老师对本文内容完善提出的建议。
参考文献:
[1] 李红星, 吴立宗, 南卓铜,等. 科学数据联合出版模式与内容研究[J]. 遥感技术与应用, 2016, 31(4): 801-808.
[2] 王丹丹. 数据论文: 数据集独立出版与共享模式研究[J]. 情报资料工作, 2015(5): 95-98.
[3] 马建玲, 曹月珍, 王思丽,等. 学术论文与科学数据集成出版研究[J]. 情报资料工作, 2015(2): 82-86.
[4] 邬金鸣, 钱庆, 崔佳伟,等. 数据出版中数据仓储与期刊关联方式研究[J]. 医学信息学杂志, 2019, 40(9): 70-76.
[5] 刘兹恒, 涂志芳. 数据出版及其质量控制研究综述[J].图书馆论坛, 2020, 40(10): 99-107.
[6] 全球变化科学研究数据出版系统[EB/OL]. [2021-03-28]. http://www.geodoi.ac.cn.
[7] 郭华东. 问渠哪得清如许, 为有源头活水来——《中国科学数据》发刊词[EB/OL]. [2021-03-28]. http://www.csdata.org/paperView?id=55.
[8] 地质科学数据出版中心. 投稿指南[EB/OL]. [2021-03-28]. http://geodb.cgs.gov.cn/.
[9] 农业大数据学报[EB/OL]. [2021-03-28]. http://agbigdata.aiijournal.com/CN/2096-6369/home.shtml.
[10] Big Earth Data [EB/OL]. [2021-03-28]. https://www.tandfonline.com/toc/tbed20/current.
[11] 专业学术期刊数据管理与出版前瞻——写在“数据论文”栏目开栏之际[J]. 图书馆杂志, 2018, 37(8): 83.
[12] 遥感学报.数据论文投稿须知 [EB/OL]. [2021-03-28]. http://www.jors.cn/jrs/ch/reader/view_news.aspx?id= 20170329110913428.
[13] BALL A, DUKE M. How to cite datasets and link to publications [EB/OL]. [2021-03-28]. http://www.dcc.ac.uk/resources/how-guides/cite-datasets.
[14] 中国科学技术协会. 中国科技期刊发展蓝皮书 (2019) [M]. 北京:科学出版社, 2019: 244.
[15] 何晓燕, 王婧, 张芳英, 等. 2020年我国中文科技期刊发展盘点[J]. 科技与出版, 2021(3): 67-77.
[16] American Association for the Advancement of Science. Science: editorial policies [EB/OL]. [2021-03-28]. http://www.sciencemag.org/authors/science-editorial-policies.
[17] Elsevier. Sharing research data [EB/OL]. [2021-03-28]. https://www.elsevier.com/authors/tools-and-resources/ research-data.
[18] Springer Nature. Research data policies [EB/OL]. [2021-03-28]. https://www.springernature.com/gp/authors/ research-data-policy.
[19] 傅天珍, 陈妙贞. 我国学术期刊数据出版政策分析及建议[J]. 中国出版, 2014(23): 31-34.
[20] 劉颖, 王旋. 医学领域国际学术期刊数据出版政策分析[J]. 中国科技期刊研究, 2017, 28(8): 685-689.
[21] 陈全平. 学术期刊数据政策及相关研究[J]. 图书与情报, 2015(5): 9-15.
[22] 孔丽华, 习妍, 张晓林. 数据出版的趋势、机制与挑战[J]. 中国科学基金,2019(3): 237-245.
[23] Examples and Counterexamples [EB/OL]. [2021-03-28]. https://www.journals.elsevier.com/examples-and-counterexamples/.
[24] Wiley. Wiley’s Data Sharing Policies [EB/OL]. [2021-03-28]. https://authorservices.wiley.com/author-resources/ Journal-Authors/open-access/data-sharing-citation/data-sharing-policy.html.
[25] SAGE Publishing. Research Data Sharing Policies [EB/OL]. [2021-03-28]. https://uk.sagepub.com/en-gb/asi/ research-data-sharing-policies.
[26] Taylor & Francis. Understanding our data sharing policies [EB/OL]. [2021-03-28]. https://authorservices. taylorandfrancis.com/data-sharing-policies/.
[27] Elsevier. Journals [EB/OL]. [2021-03-28]. https://www.elsevier.com/catalog?producttype=journals.
[28] The American Journal of Human Genetics. Information for authors [EB/OL] .[2021-07-01]. https://www.cell. com/ajhg/authors.
Data Policy Promotes Integrative Development of Data Publication and Sci-tech Journals in China
Shen Yan
Institute of Geographic Sciences and Natural Resources Research, Chinese Academy of Sciences, Beijing 100101
Abstract: [Purposes/significance] Integrative development of data publication and sci-tech journals is a win-win solution. However, nowadays the publication of data related to journal articles is few and the awareness and initiative of authors about data publication have not been activated yet in China. Therefore, this paper investigated practical experience for data policies of international publishers, on this basis, the operation mechanism and data policies which suitable for sci-tech journals in China were put forward, as to provide strong support for data publication and world-class journal construction in China. [Methods/process] The data policy and operation mechanism of five international publishers (i.e., Elsevier, Springer Nature, Wiley, SAGE publishing, Taylor & Francis and so on) and the current situation of the publication of data related to journal articles in China were obtained through literature research, case research, and network information collection. [Result/conclusion] The implementation mode on data policies of five international publishers is basically same: general policy introduction + free choice of individual journals. Results showed that 68%, 99.9%, 92.2%, 47.0% and 69.3% of journals under Elsevier, Springer nature, Wiley, SAGE publishing, and Taylor & Francis clearly put forward the data policies, respectively. However, most of them adopted the “encouragement” policy. Their practical experience for data policies is worth learning for Chinese journals. Based on characteristics of Chinese journals, we should formulate the journal data policy standards and implementation mode, gradually promoting the breadth and depth of the integrative development of data publication and sci-tech journals.
Keywords: sci-tech journal data publication data policy operation mechanism integrative development