高校图书馆开展科学数据管理与服务模式研究
2020-07-14周荣双周荣伟
周荣双 周荣伟
摘 要 随着E-research的发展,高校图书馆应创新工作模式,开展科学数据服务,本文从数据管理人员和研究者、技术应用于基础设施、相关法规政策、元数据管理与标准制定四个方面研究了高校图书馆开展科学数据服务的模式,提出高校图书馆应从开展数据素养教育和培训、探讨科学数据管理与共享新技术、组建并参与数据联盟等方面的建议。
关键词 E-research 元数据 科学数据服务 科学数据素养
引言
全球数据量以每年60%的速度递增,世界已经进入网络化大数据时代,随着E-research的发展,学术研究发生着本质的变化,高校科研人员的工作方式的改变,科研工作不再从头开始,而是建立在对科学数据的重新认识、组织、解析和利用的基础上,使用不同的工具和方法开展研究,科学数据的重要性突显,同时,高校在科研过程中形成了海量的科学数据,但是,这些科研数据一般在研究结束和论文发表后,分散保存在科研团队或者研究者个人存储设备中,共享程度不高,还会带来数据丢失、重复研究和科研资源浪费的风险。如何对高校科学数据进行有效的管理并开展相关服务值得深入研究的问题。高校图书馆具备学科服务馆员,元数据编写经验和数字资源管理硬件设施和软件环境等,具有开展科学数据服务的优势,同时,随着图书馆馆藏资源的价值的降低,图书馆开展新的科学数据管理服务,是其发挥信息组织和传播中心的职能和支持科研工作的必然要求,本文重点研究如何在高校中开展科学数据管理与服务。
1国内高校开展科研数据管理服务现状
高校是科学研究和科技创新的主体,国内部分高校根据实际教学和科研需求,开展相关数据服务,实现科学数据的开放和共享,为我国其他高校开展相关服务提供了参考依据。2007年起,中国人民大学依据SDA开发了中国调查与数据中心,主要针对中国的经济和社会数据,开展数据采集、存储和开发工作,研究成果包含中国发展指数,中国大学生发展报告等,开创了我国社会科学数据开放与共享的先河。2011年武汉大学图书馆联合学校人文科学科学、自然科学两个部门共建,以开源软件Dspace为基础,开发了高校科研数据管理平台,研制了数据提交、组织、保存、共享、使用等规范,并以生命科学院蝎物种资源数据库为试点,对图片、文件和文献进行管理,提供科学数据服务。2013年复旦大学经过充分的调查,基于开源软件Dataverse开发了社会科学服务平台,面向社会科学、自然科学和人文科学的开展数据研究服务,采集和汇集最新发布的社会科学研究数据资源,同时购买、交换外部的社会科学数据资源,为复旦大学打开数据交流和国际合作的窗口。2013年北京大学以开源软件Dataverse为基础研制了开放研究数据平台,具备完整的数据提交、管理和发布功能,实现数据检索、浏览、授权下载和评论等功能。2016年清华大学中国经济社会数据中心以中国经济社会数据为研究对象,开展数据分析、市场调查、决策支持和教育培训等工作,为世界一流大学建设提供优质的数据服务。
2高校开展科研数据服务需要具备的条件
在高校开展科学数据服务,对其产生的科学数据进行的有效管理和利用,实现数据开放与共享。本文从科学数据管理人员和科研工作者、计算机技术和基础设施、相关法律政策和元数据管理与标准制定四个方面展开研究。
2.1高校科研人员是科学数据生成者,也是科学数据服务的主体
由徐坤,曹锦丹抽取吉林省3所高校共46名科研人员针对科学数据管理需求情况的调查可知,科研人员具有数据管理的需求,需要学校提供科学数据管理服务,保证科学数据能被正确保存、检索和共享。因此,高校在开展相关工作时,可充分考虑科研人员共享科学数据的意愿,认真核查其提供的数据的知名度和可信度,更新科研工作人员的理念,制定学校层面的管理政策和鼓励措施,保证科学数据服务顺利开展。另一方面,在图书馆增设数据图书馆馆员职务,他们是科研数据服务的主导者,决定服务的广度和服务质量,是协调科研人员与学校各部门、图书馆之间、数据中心及出版机构之间的纽带,制定科学数据管理与服务的相关标准和政策,在工作过程中,可为科研人员提供科研数据支持,协助改善数据管理计划、收集和管理科学数据、分析数据、存储数据等专业服务。因此,高校在开展科学数据服务过程中,应设置数据馆员专业岗位,发挥专长,为科研助力。
2.2计算机基础设施和技术是科学数据服务开展的保障
高校师生在进行科学研究过程中,会产生海量的、格式多样的、数字化形式的科学数据,对其进行管理需提供相应的信息管理方法和性能稳定的硬件设备来保证科学数据管理顺利进行,这些基础设施主要有高容量的数据存储设备、网络设备、数据备份构架、科学数据管理平台,数据分析模型和软件等。除硬件设备外,数据管理平台是高校开展科学数据管理的先决条件,合理有效的科学数据管理平台是科学数据服务开展的保障,其创建主要有两种方式,一种是基于detaverse和despace等开源软件创建的数据管理或开放平台,另外,根据高校实际情况,自主研发的适合本校的数据管理平台;数据管理计划是科研数据服务中必不可少的组成部分,是研究人员在项目研究过程中和项目完成后如何处理科学数据的指导性文件,它能协助科研数据服务工作的顺利开展,常用的数据管理计划工具有英国数据监护中心研发的DMPonline、加州数字图书馆开发的DMP Tool等,根据机构要求,设定的数据管理计划模板,研究人员根据研究情况填写和上交。在此期间,图书馆可以起到桥梁的协调作用,协助研究人员制定数据管理计划,并提出数据管理建议;对科学数据进行在线实时分析,可提高数据被利用的效率和更易被檢索,使用合适的数据分析工具可使数据更明确的被展示出来,便于读者利用,常见的数据分析工具有在线分析软件SDA的分析功能、dataverse和Nesstar等,分析结果可以按表格、条形图等多种方式展开,也可以单独跳出到浏览器窗口的形式展示,便于科学数据服务工作的开展。
2.3國家、科研资助机构和学校制定的数据管理政策是高校科研数据管理服务开展的有效保障
2018年4月,国务院下发了《科学数据管理办法》,文件规定了使用国有资金开展科研项目,产生的科研数据必须在所在单位交割后,才能在国外期刊发表论文,文件从宏观方面规定了强制数据交割政策,但没有从微观上明确数据类型、数据标准、数据获取与共享详细细节。因此,个科研资助机构和高校应指定详细的管理政策,进而有效管理本单位的科研数据。清华大学、武汉大学,北京大学和复旦大学在开展科学数据管理过程中,都制定了校级科学数据管理方案和管理的具体要求和措施,这些都为高校开展科学数据服务政策的指定提供参考。因此,高校在开展科学数据管理过程中,必须依据本校实际,缜密考虑本校学科特点和产生科学数据的类型,从科学数据服务整体设计和工作流程出发,制定切合实际的数据政策,保障科学数据服务工作顺利开展。
2.4元数据是科学数据管理服务的重要工具和技术保障
科学数据管理计划制定、数据仓储的设计与运作、科学数据的出版与共享等工作都离不开元数据。依据开源软件Despace为基础开发的科学数据管理服务平台,采用DC元数据作为其元数据标准,以Dataverse为基础开发的科学数据服务平台以DDI元数据作为其元数据标准。北京大学和复旦大学在制定元数据标准时分两套方案,对于通用的元数据,引入DDI元数据标准,对于专用数据,设置元数据设计按钮,不同学科不同作者,均可设计自己的元数据方案,高校在开展科学数据服务过程中,涉及元数据管理时,可充分考虑元数据建立与管理、元数据标准制定等的通用性,满足数据共享、交换和整合需求。
3对我国高校开展科研管理与服务的建议
3.1积极开展数据素养教育和培训
科学数据素养是指科学研究中收集、加工、管理、评价和利用数据的知识和能力,提高科学数据素养能力,需针和科研人员开展科学数据素养教育和培训,数据管理人员具备怎样的数据统计分析能力?如何评定数据的可信度、完整度和权威度?如何根据数据重要性对数据分类保存?何时将适合的数据提供给研究人员等?都将直接决定着一个机构开展数据管理与服务的质量,对数据管理人员展开专门的培训和辅导,提高科学素养水平。数据管理和服务的目标在于数据被合理使用,研究人员的数据再利用意识和获取数据、分析数据、评价数据的能力能助推数据管理和服务工作的开展,可总结各种常用数据分析软件和模型,针对具体的科研活动,开展培训工作。
3.2积极探讨科学数据管理与共享新技术
开展科学数据管理和服务,在数据采集、标引、提交、归档、发布与使用的各个环节都离不开相关的计算机软件和基础设施。随着计算机、网络和大数据技术快速发展,各种新技术、新工具更新速度加快。因此改善科学数据管理方式,重视计算机软件及工具的研发,对本体技术和元数据的创建进行探讨,为科学数据服务工作的开展提供技术支撑。
3.3积极组建并参与数据联盟
组建科学数据机构库联盟,有利于推进高校科研数据的管理与共享,图书馆在联合编目、联合采购和图书管理系统使用过程中非常注重与其他高校与机构的合作,使用同样的标准开展工作,可减少资源浪费,扩大知识使用范围,科学数据管理模式类似,开展校际合作,积极组建和参与数据联盟,对数据实现交换、购买和共享,可扩大科学数据使用范围,减少研究成本,提高科学数据再利用效率。
参考文献
[1] 肖潇,吕俊生.图书馆嵌入式学科化科学数据服务研究[J].图书馆学研究,2012(21):73+85-89.
[2] 徐坤,曹锦丹.高校图书馆参与科学数据管理研究[J].图书馆论坛,2014(05):92-98.
[3] 左志林,李瑞萍.国外高校图书馆数据馆员发展现状研究[J].农业图书情报学刊,2018(08):164-168+封3.
[4] 张连分.大学图书馆开展科学数据管理服务的实践和成效评析[J].图书馆建设,2018(10):45-51+58.
[5] 科学数据管理办法[EB/OL].http://www.gov.cn/zhengce/content/2018-04/02/content_5279272.htmcid=303,2018-04-02.
[6] Qin J.D Ignazio J. Lessons leamed from a two-year experience in science data literacy education[EB/OL].http://docs.lib.purdue.edu/cgi/eiewcontent.cgiarticle =1009&context=iatul2010,2012-10-07.