科学数据共享研究概述
2020-03-22
(湘潭大学 湖南 湘潭 411105)
一、科学数据及科学数据共享的概念
(一)科学数据。科学数据是在领域或学科知识指导下,对研究对象进行抽象和概念化后形成的、以科学证据形式存在的、并用于科学研究活动的原始和衍生数据等相关事实记录。科学数据也是联合国教科文组织界定的三种开放存取信息资源(科学出版物、教育资源、科学数据)之一,近年来国际上对其关注热度已超过另外两种,现如今已经成为科技创新、社会进步和国家发展的重要资源。
(二)科学数据共享。科学数据共享是指机构或个人将科研观测、科研活动的成果进行共享,获取,使用和再利用的过程。为加快科研进程,全球掀起了科学数据共享的热潮,世界各国的政府和相关组织也对科学数据共享给予有力的支持,英国决定由政府资金支持的科学数据、研究成果免费向公众开放,不受版权等因素的影响;欧盟委员会也发表了类似声明,通过保证科学数据的长期可获取、共享及重复利用,为其未来发挥更大的作用奠定基础。
二、常见的科学数据分享模式
(一)开放平台模式。该模式具有统一的数据库和共享服务系统,系统具有开放性,数据能在平台中进行长期保存。此模式又可分为以下三类:面向普遍性数据存储和共享需求的通用数据存储库,如科学数据存储库;面向特定学科领域的学科数据存储库,如地理空间数据云;用于特定机构数据统一归档和共享需求的机构数据储存库,如北京大学开放研究数据平台。
(二)监测网络模式。该模式是将采集的数据既存储在中心节点服务器上,又存储在本地服务器上,数据通过共享服务门户网站和各分节点合作为科研人员提供服务。如中国气象数据网等。
(三)科学数据出版模式。该模式是科研人员按照标准化的管理流程,以数据论文的方式,通过因特网公开发布其原始数据,或通过对已有的数据进行系统化地处理后形成的数据及相关数据产品,使其他科研人员能更便捷的进行再利用和创新,并在新发表的科研论文和新发现的成果中直接引用。该模式在我国的代表刊物有《中国科学数据》。
三、科学数据共享产生的效益
科学数据共享主要可以产生以下效益:
(一)经济效益。科学数据共享加快了研究成果向产品和服务的转化速度,并使这些成果更快地进入市场,也能刺激下游应用和商业创新,以此来促进经济增长。
(二)社会效益。科学数据共享有助于社会了解国家的科学研究和政府或者相关机构资助的研究成果,增加了政府或相关机构资助科学研究的透明度,提高了政府相关机构的信誉。科学数据共享也促进社会参与到科研中来,提高了社会对科研的参与度和满意度。
(三)科研效益。科学数据共享能最大限度地发挥数字技术和网络的功能,使用户可以高效获取和再利用科学数据再现和验证研究过程与结果,避免了重复工作,提升了科研效率。通过科学数据共享,科研机构和人员能更便捷地进行开放科学调查,这有助于产生更多样性的分析和意见,利于发现新的研究主题,促进新研究的产生。科学数据共享也利于创建更完整和透明的科学记录,提高科研透明度和准确性,能显著提升科研影响力。跨学科、跨部门、跨机构及国际间的科研合作依然可以得益于科学数据共享,加速研究成果的升级转化与推广。科学数据共享直接提高科学数据及其所在论文的引用率,间接提高研究机构和人员的学术声誉和知名度。
四、制约科学数据共享的因素
制约科学数据开放共享的主要因素如下:
(一)个人因素。制约科学数据共享的个人因素是指个体在心理、认识和知识上可能存在的问题。①个人心理问题。个人担心失去对数据的控制导致研究数据被他人抢先发布,降低自身的核心竞争优势。②个人认识问题。个人缺少获取他人研究数据和挖掘科研数据潜在用途的意识。③个人知识问题。个人缺少理解和合理利用以及挖掘数据价值的知识。
(二)法律因素。制约科学数据共享的法律因素是指科学数据共享在知识产权、个人隐私、数据安全等方面可能存在的问题。①知识产权问题。科研机构和科研人员存在知识产权的控制,他人难以获取科学数据共享的许可。同时,我国知识产权保护机制不完善,未解决多作者数据共有权问题,相关作者面临诉讼的风险。②个人隐私问题。科学数据共享易侵犯数据提供者和相关参与者的隐私。③数据机密问题。例如因科学数据较敏感,考虑到组织、社会和国家安全而不能公开数据。④法律不健全问题。我国目前缺少明确的国家层面的法律体系,已制定的相关政策并不具备法律效力,数据共享和数据使用权的法律条款相互矛盾。
(三)技术和设施因素。制约科学数据共享的技术和设施因素是指科学数据开放共享过程中所存在的相关的技术与设施问题。①数据质量问题。例如科学数据的相关性、完整性、准确性与及时性差,没有关于数据质量的描述信息。②数据标准问题。例如如数据的保存和维护缺少标准化,相关机构或人员提供的数据格式不标准,新旧数据格式不兼容。③数据访问问题。例如缺少共享数据的公共数据库和平台,用户难以访问获取数据。同时,数据库中外文数据占比较大,用户存在语言障碍。④数据处理问题。面对数据的标准化、保存、维护和再利用,相关机构和个人可能缺少有效的的技术解决方案。⑤基础设施或辅助工具问题。例如缺少进行数据共享活动的基础设施、辅助工具。
(四)管理因素。制约科学数据共享的管理因素是指机构或个人在科学数据共享中遇到的各种管理问题。①管理政策问题。机构缺少数据共享管理和协调机制,缺少有效统一的科学数据共享政策。②管理程序问题。机构可能存在数据管理程序繁琐,措施混乱。③数据输入和发布问题。机构或个人缺少科学数据输入和发布的途径,缺少对用户输入和发布过程的数据管理,无法保证用户输入和发布数据的质量。④激励机制问题。管理者缺少有效的数据共享激励措施,数据生产者和管理者之间缺少互利机制。⑤共享文化问题。如机构或个人存在规避风险的文化,缺少数据共享的文化。⑥机构之间缺少合作资助途径。机构或个人缺少互相合作资助的途径,导致大量科研数据资源被闲置。