国内外期刊机构科学数据出版政策研究*
2022-04-12宋立荣
方 恒 宋立荣
(北京联合大学应用文理学院 北京 100191)
0 引 言
科学数据出版最早是学术期刊机构为了防止科研数据造假,保证学术论文结论与数据的可再现性以及数据被复用,要求作者将与论文相关的原始科学数据进行提交和出版[1]。为进一步规范在科学数据提交、保管和利用的行为,各个期刊机构陆续制订了一些针对科学数据出版的一般性说明,规定了科学数据出版过程中可能存在的数据格式、信息安全、资源描述、数据引用等问题进行规范约定,以确保科学数据被有序、合理地管理。为此,业内常借用原来表述政府部门、政党组织等制订的“政策”一词来描述这一规范行为。可以说,以期刊机构为行为主体,科学数据出版政策是使科学数据获得“可溯源”“可引用”“质量审查”“承认作者贡献”和“长期保存”等特征的活动和过程更具规范和有序[2]。
但目前关于“科学数据出版政策”这一学术性概念还没有一个较为统一、普遍认可的定义。这缘于“科学数据出版”仍在不断拓展、与时俱进。尤其随着大数据技术、信息网络的普及应用,依托海量科学数据资源进行的科研活动已对人类社会发展、各国科技战略决策,乃至科技创新争夺等都产生了深远的影响[1]。比如2020年3月中共中央、国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》[3](以下简称《意见》)将数据纳入生产要素范围,数据的共享与利用被提升到一个新的高度。此情形下,科学数据出版也日渐由期刊出版商驱动的传统科学数据出版拓展到科研领域众多主体协同合作、共同推动的科学数据出版方式,成为促进科学数据共享一种新的有效方式之一。这使得“科学数据出版政策”的概念内涵、外延不断拓展,并不断被赋予新的含义。已不仅限于过去传统期刊机构仅从数据提交流程、结构描述、格式规范、保存及引用规范等方面的约束,而拓展到如何将科学数据作为重要的生产要素发挥其核心作用,如何进行数据确权,如何开放利用实现数据重用中数据价值等内容。由于目前在科学数据出版过程中尚缺乏透明、清晰的数据出版政策和可持续的运行模式,一些正在积极探索数据出版方式的数据中心、期刊杂志等主体机构对于如何制订既符合数据出版基本传播规律,又要面向科学数据出版发展趋势的科学数据出版政策尚缺乏明晰的思路,仍处于探索阶段。为此,有必要梳理国内外一些期刊机构的科学数据出版政策制定的现状,把握科学数据出版的政策趋势,以便为我国期刊机构制订科学数据出版政策提供借鉴和参考。
1 科学数据出版政策研究现状
目前,国内外学者围绕数据出版概念、模式流程、数据开放共享、同行评议与数据质量控制、实践问题与挑战等相关问题已经取得了许多成果,但对于期刊机构科学数据出版政策的研究稍显不足和分散。所说的“科学数据出版政策”是指期刊和期刊所属出版机构对数据集与数据论文的相关内容、规范提交、数据审查、指定存储、利用与传播及其所涉及的隐私与伦理问题等方面进行说明与管理的一般性说明。在这方面,目前系统研究不多,相关内容仅就涉及相关内容提出作者的看法。本文围绕期刊机构数据出版政策的研究进行汇总整理,具体如表1所示。
表1 科学数据出版政策研究现状
涂志芳[4]将数据出版/发表总结为三种模式:“作为论文附件的数据出版” “独立的数据出版”“数据论文出版”。在科学数据出版/发表的三种模式中,最先出现的论文附件出版模式更加强调数据的佐证价值,政策制定主要围绕传统论文本身,对论文附件没有严格的政策要求。而“数据论文”形式的数据出版包括数据集和对数据的方法、内容、价值等进行描述的数据论文两类, 更强调数据的重用价值。但无论何种数据出版/发表模式下,都没有形成共识性的政策的要求和约束。
综合来看,学者对期刊机构科学数据出版的政策主要是从政策归类、实施主客体、实施效果等方面进行研究。但目前对科学数据出版政策的相关理论研究较少且较为分散,多是针对某一主题或领域的国外科学数据出版政策的介绍。尤其《意见》使得数据的共享与利用被提升到一个新的高度,也对科学数据出版提出新的要求,有必要围绕其新的发展趋势,探索、完善科学数据出版政策内容。
2 国外期刊机构科学数据出版政策调研
刘凤红[12]统计分析了全球162家数据期刊杂志,分类发现:科学数据出版大多是以某一领域期刊发表其领域数据为主,相关的政策规范也多是从某一领域或行业来提炼共性管理要素进行说明和要求。目前国外科学数据出版是以期刊为导向实现数据开放共享,主要采用“独立的数据出版”和“数据论文”两种形式。为此,本文通过广泛调研,选取在数据出版较集中的几个领域中进行科学数据出版较成熟的期刊机构的科学数据出版政策进行典型性分析。本研究选取8家国外典型数据出版集团和期刊机构的科学数据出版政策进行调研(见表2),涉及生物学、医药学、气候学、地球学等学科,覆盖了主要的数据出版学科。
表2 国外数据期刊基本信息
通过调研发现,国外相关政策涉及内外部的约束,内容包括了数据描述符格式、内容类型、同行评议、引用规范等方面。比如,Nature出版集团创办的ScientificData期刊数据出版政策从论文作者和出版编辑两方面设定。对作者的规范包括数据描述符格式、内容类型、同行评议、提交出版、引用规范和确权复用等方面;对出版编辑的规范包括编辑和出版政策、评审指南、数据政策和推荐的数据库等。为此,本文按照政策内容将其分为质量控制政策、版权与开放政策与其他政策三大类,具体如图1所示。其中,质量控制政策包括对描述符格式、内容类型、同行评议和引用规范等几方面要求;版权与开放政策主要包括提交出版、数据确权和出版费用等规则。第一大类质量控制政策分别对应控制提交数据格式、提交内容类型、专家编辑审核和引用与被引用规范,同属于刚性约束条件;第二大类版权与开放政策分别对原创性、版权与共享协议以及费用等内容进行规定。
图1 国外期刊机构科学数据出版政策内容分类
2.1质量控制政策
2.1.1 描述符格式 将科学数据转换成为统一、有序且计算机可识别与存储的标准格式是科学数据出版的前提。 标准化限定可分为期刊自定义标准和第三方外部标准。标准化限定内容包括对图、表文件格式、数据论文内容格式和数据(集)文件大小的限定。为方便作者出版高质量的科学数据,国外很多出版集团和期刊给出了格式模板或开发专门的数据提交系统。如BiodiversityDataJournal要求文章的所有结构元素、文本、形态描述、数据表等方面都将按照Pensoft Publishers的数据发布政策和准则(即:Data Publishing Policies and Guidelines)进行处理并存储。GenomicsData通过在线投稿系统(EM)控制数据格式。作者可以使用该系统在任何地方通过Internet的访问和处理已提交的论文,按照数据准则进行调整和标准化。可见,针对描述符格式的政策规定较为具体、分散,设定的标准各有差异,尚缺少普遍适用的描述符格式标准。各数据期刊的描述符格式政策内容见表3所示。
表3 国外数据期刊描述符格式政策内容
2.1.2 内容类型 科学数据出版的内容类型不仅限于实体数据及其描述的元数据,还包括图像、视频、模型、推演和报告等其他形式的科学数据,能够对科学数据集起到丰富内容、佐证科学与解释说明的作用。如OpenHealthData不仅可以发表案例研究数据、计算机模拟数据、实验数据、访谈和调查数据、神经影像数据等作为论文佐证材料,还可以发表灰色文献,如白皮书、同意书、研究方案等。总的来说,国外期刊机构对于出版内容的类型并没有过多的限制,只要与作者研究相关的一切数据或佐证、研究材料都可以出版。这样也能最大程度的丰富数据集,便于数据开放共享与复用传播。表4整理汇总8家期刊机构数据出版的内容类型。
表4 国外数据期刊出版其他内容类型
2.1.3 同行评议 对作者提交手稿的描述符格式和内容类型进行要求与约束,是对科学数据外在格式和内容类型的一般性要求,而对科学数据的科学性、创新性与价值性的质控需要同行评议(post publication review)来完成。同行评议是指通过论文提交发表后的评价来试图复制或验证研究结果的监督审议行为[3]。一般主要有单盲审查(审阅者匿名)、双盲审查(审阅者和作者匿名)、三盲审查(作者、审阅者和编辑者匿名)、公开审查(彼此认识审阅者和作者)和社区审查(面向读者公开)等五种形式。调研的8家期刊均采用同行评议,如表5所示。特别之处在于国外数据期刊探索“社区审查”的新模式,鼓励广泛读者参与同行评议,通过社会参与最大程度的拓宽了科学数据的传播性。比如,BiodiversityDataJournal要求作者参与以社区为基础的预发布和后出版的“社区同行评议”。而EarthSystemScienceData采取同行评审和发布过程交互式社区审查两个阶段,以在ESSD论坛中发布论文为界,在发表论坛前和后都会进行同行评议。在初步进行同行评议后论文要被发布在论坛讨论8周,完成二次同行评审后才能在在ESSD网站中发布最终修订稿。由于科学数据的不易读取、不易演绎等特点使得数据出版中的同行评议面临困境。由此,破除同行评议的专业壁垒、制定同行评议的标准机制、申诉机制成为亟待解决的问题。
表5 国外数据期刊同行评议政策
2.1.4 引用规范 引用规范既包括对稿件引用其他数据集的规范,又包括引用本期刊数据集的规范。一般有四种主要方式:遵循数据引用规则、使用标记工具、通过数据对象标识符链接和明确数据引用格式。国外数据期刊多采用DOI(数字对象唯一标识符)[7],要求稿件参考文献应完整准确;引用本期刊数据集应包括DOI或指向的链接;大多有明确的引用要求并给出了引用示例。如OpenHealthData要求先对数据文件引用,然后对存储库本身中的数据进行引用,且必须包含DOI或存储库使用的其他标识符,并给出标准引用格式。也有期刊对过度自我引用、相互引用等行为提出规范约束。8家数据期刊引用规范政策如表6所示。
表6 国外数据期刊引用规范政策汇总
2.2版权与开放政策
2.2.1 提交出版 提交出版科学数据是指所提交的稿件尚未在其他期刊或出版物数据集公开发表,将原创性作为出版的重要前提。调研8家期刊机构,大多要求提交给期刊的稿件都必须是原始稿件,并且该稿件(或其中实质部分)不得投稿给任何其他期刊。期刊默认作者提交出版的稿件已获得所有合作者以及工作机构的默许(或明确批准)。还有一些期刊特别要求,如BiodiversityDataJournal要求支撑文章的所有数据,包括在其上生成图表的数据表都必须与论文一起发布,并要求论文和相关数据应足够新颖。GenomicsData严格要求作者一般不应在多个期刊或出版物中发表描述基本相同研究的稿件,但一些摘要形式的出版物、作为学术论文发表、作为电子预印本出版等除外。InternationalJournalofFoodContamination要求作者根据ICMJE(International Committee of Medical Journal Editors)标准对手稿的准确性和完整性的各个方面负责,要求文章是尚未在某期刊上发表,并且目前投稿尚未由另一期刊审议。
2.2.2 数据确权 调研所选国外数据期刊绝大对数提到作者保留对其数据论文的著作权合法权利。而从出版协议看,数据期刊的主流形式是采用“知识共享许可协议” ( The Creative Commons License,又称创作共用许可,简称 CC )作为许可协议。CC协议根据开放程度与开放领域限制不同主要分为“知识共享署名许可4.0”(The Creative Commons Attribution License 4.0,简称CC-BY)、“知识共享非商业许可4.0”(The Creative Commons Non-Commercial License 4.0,简称CC-NC)、“知识共享禁止演绎许可4.0”(The Creative Commons Prohibited Deduction License 4.0,简称CC-ND)和“知识共享相同方式共享许可4.0”(The Creative Commons Share Alike License 4.0,简称CC-SA)[14]。四种知识共享协议可以相互组合形成最终协议,都允许自由复制、散布、展示及演绎数据论文。不同的是CC-BY协议要求保留原作者署名;CC-NC协议禁止商用;CC-ND协议禁止改变、转变或改作;CC-SA协议要求改作、传播的前提是遵守与本著作相同的授权条款。许可协议影响数据重用效果,两者关系为:协议的限制越少,重用的可能性就越大。如ScientificData允许作者保留其手稿及其最终期刊文章的版权。由作者自行选择开放程度不同的许可方式,如CC-BY 4.0 、CC BY-NC 4.0(署名-非商业共享协议)、CC BY-NC-SA 4.0 (署名-非商业性使用-以相同方式共享协议)。相关数据确权政策如表7所示。
表7 国外数据期刊数据确权政策汇总
2.3数据隐私、数据安全及道德伦理约束政策国外期刊机构尤其注重对个人隐私和网络行为数据的保护。其数据隐私政策一般包括承诺最低程度收集作者个人信息隐私和要求数据集涉及个人信息隐私进行脱敏处理两方面规定。由于在收集数据过程涉及病人的个人隐私和伦理道德, 生物、医药、健康等学科数据期刊要求不能完全公开研究数据。如OpenHealthData要求作者在提交医药与健康数据相关数据时需要隐去涉及隐私的元数据。另外,在保护数据安全方面,国外期刊机构有明确的内部数据处理政策。主要的措施有定期备份数据库、备份定期轮换、限制对数据的访问和备份、旧数据被永久删除和使用可靠的云服务提供商进行安全保存等。此外, 大多期刊机构参与制定并遵循出版联盟、行业组织的统一道德伦理规范原则。如EarthSystemScienceData是COPE(Committee on Publication Ethics,出版道德委员会)的成员,同意其《Code of Conduct》(行为准则)、《Best Practice Guidelines for Journal Editors》(期刊编辑最佳实践指南)与《Ethical Guidelines for Peer Reviewers》(同行审查者道德指南)原则。目前EarthSystemScienceData遵循面向COPE期刊出版者的行为准则,在研究和出版过程中尊重所有利益相关者的隐私,保证编辑的独立性,确保作者的版权和自由发行许可。
2.4国外期刊机构科学数据出版特点国外期刊在数据出版政策制订较早且发展相对成熟,并在实践中不断完善政策内容。总结其主要特点:绝大多数都已形成稳定的、连续的正式出版的数据期刊,多以网络出版为主,表8所示。对提交数据格式政策描述都有很清晰明确的要求,但目前尚未形成普遍认可、统一的格式要求,各期刊制定标准不一、表述存在差异等;出版内容不限于元数据、数据论文和实体数据的出版内容,与实体数据集相关的报告、方法与程序都可以出版;普遍采用同行评议来控制出版质量,主要方式为单盲、双盲、三盲审查,也有期刊采取公开审查和社区审查;都要求数据引用并给出标准的引用格式;提倡数据集的原创性、科学性和开放共享,并遵照一定的开放协议;数据出版逐渐由免费向收费方向过渡。
表8 国外科学数据期刊出版政策比较
3 国内期刊机构科学数据出版政策调研
国内科学数据出版发展起步较晚,一些领域权威期刊积极探索数据出版。目前主要集中在生物医药学、化学和地理学等领域。 本文对《中国科学数据》 《生物多样性》和《全球变化数据仓储(中英文)》三家数据出版政策进行比较分析,如表9所示。
表9 国内期刊机构基本信息与数据出版政策
3.1《中国科学数据》的数据出版政策《中国科学数据》是目前中国唯一的面向多学科领域科学数据出版的学术期刊[15]。除了关注基础数据及数据产品,还包括我国重大科研项目、科研院所、高等院校等形成的数据集。该期刊采用自主研发的出版平台和存储库(中科院系统),实现了一站式投稿,保证了数据格式规范。对数据论文没有字数和页数上的限制,一般5000~8000字为宜。对数据集要求存储在期刊自建或认可的存储库中;在数据论文内容方面,要求充分介绍该数据集生产背景、内容组成、大小、数据格式生产加工方法和质量控制措施等方面的信息;该期刊评审环节包括责编初审、数据初审、同行评议(公开评议)、编委复审、编委会投票等并引入社区评议,共分两阶段(Ⅰ区和Ⅱ区):来稿经初审通过即在出版平台Ⅰ区在线发布,同时接受同行评议和读者公开评议。完整通过全部审核步骤后的论文则由编辑部组织正式发表于Ⅱ区。在版权与开放政策方面,该期刊强调收录的原创性科学数据论文,论文遵循CC BY 4.0协议在线发表和分发使用。
3.2《生物多样性》的数据出版政策《生物多样性》主要以传统学术论文为主,并不是完全意义上的科学数据期刊,而是在期刊主要栏目包括“数据论文”一栏。因此,在科学数据出版政策要求和约束方面并不是很完备。比如,对于描述符格式和引用规范并没有严格明确的要求,仅仅是要求数据具有一定的科学意义、数据结构完整、真实可靠,并达到一定的数据量的建议性约束。对于数据论文正文要求对数据集进行详细描述,包括数据集采集和处理方法、数据格式、数据凭证(如凭证标本号等)、数据集链接、数据质量控制和评估、数据价值、使用方法等信息;要求的数据类型包括植被样方调查数据集、物种分布数据集、物种性状数据集、组学数据、DNA序列数据等。论文评审实行责任编委负责制, 即受理的每篇稿件均由编辑推荐审稿专家, 并向主编提出退稿或推荐发表的建议。在版权与开放政策方面,除了禁止一稿多投外,对开放获取和知识共享协议没有仔细说明。
3.3《全球变化数据仓储》的数据出版政策《全球变化数据仓储(中英文)》出版和传播全球变化相关领域(包括地理,资源,生态,环境,可持续发展等)科学研究数据和数据论文[16]。该期刊依托全球变化科学研究数据出版系统,数据格式采取国际通用数据格式。对于特殊格式数据需要将该数据格式配备的计算机程序同时归档。而且期刊给出数据论文提交模板,其中对数据论文的格式和主要内容给出示例,包括数据可用性声明、前言、数据集元数据简介、数据研发方法、数据结果与验证、讨论与总结。该期刊采用作者与审查者双盲流程进行同行评议,多数情况是3~5名评审专家且要做到利益相关者回避。对于引用规范,该期刊规定使用数据需要按照引用格式在参考文献或适当的位置标注数据来源。在版权与开放政策方面:对于提交与确权出版,该期刊刊载首次出版的、具有自主知识产权的稿件。提倡开放获取但并没有给出采用何种知识共享许可协议。
国内期刊机构数据出版政策对比如表10所示。
表10 国内3家期刊机构科学数据出版政策
3.4国内数据期刊科学数据出版政策特点相较于国外,国内尚未建立严格的科学数据审查机制。国内数据出版还处于起步状态,对科学数据的重视程度和开放获取理念相对较弱,政策内容参差不齐[4]。主要表现在:数据出版期刊数量还较少,其政策多参考国外相关政策内容及要素;政策制定的内容中建议性或引导性政策多于强制性政策;国内数据期刊在权威性或者数据确权等方面不如国外数据期刊做的好,比如在新冠疫情研究过程中,国内专家更希望将发现的数据及时上传到国外知名的数据库中,而不是优先考虑国内的数据期刊或者数据库;从出版主体意愿看,多数作者出版意识不强,不愿公开发表研究数据;从政策体系看,政策分散且完备程度不足;从政策宣传看,网站科学数据出版政策的透明度不强,作者难以找到出版政策,在网页的导航条和目录设置方面政策内容显示不够清晰和方便阅读。
4 国内外期刊机构科学数据出版政策的思考
4.1国内外期刊机构科学数据出版政策的不足尽管国内外科学数据出版政策要求和约束存在很多共性,但由于科学数据出版在不同科学领域不断拓展,不同期刊机构制订的科学数据出版政策的内容科学性、完善程度存在很大的差异。结合我国推进科学数据开放共享的进展和要求,总结目前科学数据出版政策中存在一些不足:
4.1.1 缺乏国家层面的政策引导 国内陆续有各数据出版机构制定了其内部的数据出版政策,但尚缺乏国家层面的政策引导,仅在《科学数据管理办法》(以下简称《办法》)中提倡了科学数据出版[29],但缺少具体的实施指导以规范或约束各数据期刊、数据中心的数据出版和引用规范建设,使有利于社会整体层面各类科学数据资源的集成、融合,实现数据的聚合价值。
4.1.2 面向读者的服务利用方面的政策不多 目前科学数据出版主要是解决数据的可再现性、数据确权等问题。但如何强化这些数据资源再利用问题,在目前众多数据期刊机构的数据政策中描述较少。尤其是在应对网络环境下向科研人员提供智能化、专业化、便捷化和知识化的数据共享服务趋势下,探讨如何更方便实现科学数据的FAIR原则,比如数据解读的工具化、数据聚合的标准化、数据服务的智能化等。这些尽量在科学数据出版政策中应有所体现。
4.1.3 规范和约束科学数据出版中数据伦理方面的政策尚不够全面 现有多数科学数据出版政策中都出台了保护数据隐私的政策或者规则约束(比如在生物、医学、心理学等领域)。尤其对数据发布源头规定必要的保护隐私的办法,如要求知情同意并获取许可、遵守欧盟《通用数据保护条例》,或者要对数据进行“脱敏”处理等。但政策中较少有关于道德伦理方面全面、具体的规范或约束,比如对一些数据的无道德底线的算法滥用或数据挖掘,或者是无约束的“基因编辑”或者“基因治疗”导致“基因歧视”,破坏自然的生物多样性规律等,因此需要在数据出版尤其一些关联数据发布方面,制订支持数据伦理审查的例外政策。
4.1.4 各个数据期刊机构的数据政策有所差异 体现在:a.从学科分布来看,科学数据出版主要集中在自然科学领域。不同的是,国外开始向经济学、社会学等领域拓展,如美国的罗普中心、英国的(国家)数据档案馆(UK Data Archive,UKDA)和数据管护中心(Digital Curation Center,DCC)等在社会统计科学数据方面制定一些规范。b.从政策强度与完备程度来看,建议性政策在国内外期刊普遍存在,国外期刊强制性条款更多一些。同样国外数据期刊政策表述相对清晰、规范,而国内在相关政策描述上相对模糊,细化程度不足。c.从政策内容来看,国内期刊数据出版政策多参考国外权威数据期刊的数据出版政策,在质量控制政策、版权与开放政策与其他政策等三方面制订政策时结合科学数据发展新趋势及期刊自身发展的创新政策较少。
以上不足的原因主要还在于科学数据出版尚未形成完善的数据出版生态体系。由于新技术应用、资源剧增、责任主体不断扩展等因素,使得数据出版各要素尚处于动态变化过程中,还没有形成成熟的科学数据出版的模式。
4.2进一步完善科学数据出版政策的对策建议2020年的《意见》提出加快培育数据要素市场,意味着数据资产化、数据确权得到强化,而科学数据出版作为数据确权的一种方式将更加得到重视。因此,有必要进一步完善科学数据出版政策内容,以适应新的宏观环境下对科学数据出版的新要求。
a.制定宏观层面的科学数据出版实施办法,培育数据出版生态体系。在《办法》中明确科学数据出版,从政策上给予了支持。因此,各个数据期刊机构应以《办法》为指导,不仅加强数据库系统等硬件投入建设,而且也要从制度层面上完善相关约束规范,明确各责任主体的主体责任,约束其数据出版行为,分工协作。这不仅能促进科学数据出版发展,也有助于培育科学数据出版的生态环境体系,发挥其系统功效。
b.增强共享意识,明确科学数据出版政策相关主体责任。 科学数据共享利用是数字时代发展的必然趋势,国家发布一系列政策措施都在强化数据共享利用的社会氛围。培养学界科学数据出版意识需要各方努力,如《办法》鼓励科学数据出版,明确提出“主管部门和法人单位应积极推动科学数据出版和传播工作,支持科研人员整理发表产权清晰、准确完整、共享价值高的科学数据”[17]。为进一步提高学术论文质量、增强论文相关数据的再利用,提升期刊的国际影响力,我国学术期刊亟须重视对数据共享意识和行为的政策引导,合理制定并完善数据出版政策[3]。
c.制定和完善科学数据出版的标准规范,重视数据存储与安全。国外研究表明,期刊政策的导向和实施力度直接影响作者的实际共享行为。期刊的数据存缴政策和可用性声明越强,在相应数据仓储库中存储的数据也越多[18]。为此,有必要结合科学数据出版全生命周期过程,从数据提交、数据审查、数据发表、数据存储、数据开放与共享等各环节明确数据提交要求、质量审查标准、存储方式与开放共享形式等进行规范,使在提交元数据、数据论文、实体数据的格式,以及数据存储和安全等方面能够形成可参考的通用标准。
d.制订和完善科学数据出版质量控制约束规则。科学数据出版质量在一定程度上依赖于数据提交格式控制和同行评议内容控制。尤其同行评议是把握科学数据出版质量的关键。目前,科学数据出版同行评议遇到了数据集复现难度大、数据集储存要求高、质量评议量化难等问题。审查专家获取、打开、评议不同类型海量科学数据的难度远超过对纸质论文的那种“可见即可得”的同行评议。为此,除了期刊通过统一规范数据格式,提升数据质量,增加数据处理软件的辅助专家同行评议功能等外,还需要不断细化和完善同行评议规章制度,探索公开审查和社区审查以外其他新颖的评议模式,完善科学数据出版同行评议的指标体系构建,不断丰富数据出版评价机制。
e.丰富和完善科学数据出版数据伦理的例外政策。科学数据出版面对的数据规模大、类型多、使用方式千差万别,因此,很难制定一个统一的科学数据伦理规范。故可采取例举方法,将目前违反科学数据伦理道德或者禁止的数据发布(或出版)行为进行逐一列举,以明确科学数据出版的道德伦理规范。并在此基础上不断完善、规范数据应用标准、流程和方法、数据伦理准则和责任,建立“敏感”数据发布(或使用)的审查机制,以及数据共享伦理监管和申诉机制。
f.探索提高科学数据出版安全和有效利用的管理办法。这部分的内容包括数据保密与数据共享的数据边界确定问题、数据存储安全要求与数据便捷获取之间的平衡问题、数据出版评价方法与数据引用行为规范之间的匹配度问题等。这些问题除了科学数据本身复杂的内在特性的原因外,还在于科学数据出版外部要素还没有充分发展起来,以形成成熟的数据出版体系。故需要结合各个出版机构自身业务不断创新管理办法,探索适合新环境下促进科学数据利用的数据出版模式。
g.提高科学数据出版政策的透明度,加强政策内容宣传。科学数据出版政策,只有被生产者、使用者都看明白、能够理解,才能够获得支持,并按照一定的规则、格式和标准提交科学数据,并实现有效的质量控制和数据监护。这也有助于科研人员能够便捷、有效的检索、获取和利用科学数据,因此需要加强科学数据出版政策宣传,广而告之,使政策内容更清晰的表达。
5 结 语
科学数据出版成为促进科学数据开放共享的主要方式之一,已得到了普遍的认可。我国科学数据出版还处于起步阶段,对科学数据出版的政策、模式还处于探索阶段。本研究通过对国内外较有影响的数据期刊机构的数据出版政策进行梳理和归类,总结了目前科学数据出版政策中的不足,并提出应对策略。但由于我国科学数据尚未形成成熟的数据出版生态体系,在科学数据开放共享推进过程中,科学数据出版模式也将随着发展呈现出新的情况,为此,需要相关机构时刻关注科学数据出版的新趋势、新变化,及时调整、完善科学数据出版政策,以适应新的科学数据出版的变化要求。