APP下载

澳大利亚国立大学图书馆数据管理服务及启示

2015-05-08王秀华

河南图书馆学刊 2015年4期
关键词:图书馆服务数据管理

关键词:数据管理;图书馆服务;研究数据

摘要:研究数据管理是图书馆服务的重要内容,但我国提供该服务的图书馆还不多。澳大利亚国立大学图书馆数据管理服务走在世界前列,了解其数据管理范围、方法和服务内容,对我国研究型图书馆数据管理服务提供理论支持和实践经验,具有重要指导意义。在此基础上,文章提出了我国图书馆数据管理服务应采取的措施。

中图分类号:G258.6文献标识码:A文章编号:1003-1588(2015)04-0095-04

收稿日期:2015-03-12

作者简介:王秀华(1977—),河南省人民医院馆员。

*本文系河南省软科学项目“大型医疗机构科研信息知识库服务功能构建研究”的阶段性研究成果之一,项目编号:132400410095;河南省医学科技攻关项目“大型医疗机构科研信息知识库服务功能构建研究”的阶段性研究成果之一,项目编号:201203117。科学研究是专业学科领域长期而复杂的创新过程[1],数据管理是现代化科学研究不可分割的一部分。研究者管理各种形式的数据,如测量数据、科学实验数据、多媒体、文献等。但很多研究者指出,他们并未成功保存和管理研究中产生的大量文献和数据,大量研究结果无序存放,在将来的研究中可能会丢失或不可获取[2]。研究数据管理是图书馆提供的重要服务内容。澳大利亚国立大学(Australia National University,ANU)图书馆数据管理服务走在世界前列,了解其管理范围、方法、服务内容,对我国研究型图书馆数据管理服务提供经验和启示,从而改进服务,更好地支持科学研究。

1ANU的数据管理范围

ANU的数据管理范围包括数据、数据管理和计划[3]。ANU的数据指数字化研究数据,即在研究过程中在计算机上存储的任何数据,包括工具测量数据、调查数据、出版物、实验方法、学科指南、分析方法、技术报告、数据集描述、照片、图表、表格、视频数据、访谈、野生记录、语言记录、模拟数据等,涵盖了大数据集、文献、视频、声频、认证数据等各种类型。ANU对这些数据进行组织、保护和传播。

数据管理计划是描述创建什么研究数据、使用数据的政策、谁有并能获取数据、使用数据管理实践(备份、获取控制、存储)、设备设施(硬盘空间、备份服务器、知识库)及负责计划各个方面责任人等文件。

2ANU的数据管理益处

2.1数据管理益处

研究数据是有价值的资产,数据管理是研究不可分割的一部分。数据管理益处有以下几个方面:①数据创建时,使用软件进行版本控制、合作及数据记录,这会节约时间并能利用数据更有效地工作。②保护数据,以防丢失、不可用或不正确发布。③使用软件或数据分析脚本确保数据质量。④为研究创建网站,把作品和研究数据存储到知识库中,可以大大增加研究影响力。研究表明开放获取出版物比仅是期刊订阅的文章被引率要高2~3倍,结果的重复性和独立是验证研究的重要标准[4]。

2.2数据存储和共享的益处

数据存储和共享有助于研究,因为它可以利用数据独立性验证结果和结论及进一步分析。开放的科学研究,鼓励分析和观点的多元性。获得同样数据的研究者可以挑战彼此的分析和结论,验证新方法,促进科学研究。通过研究资源培训,可以改进数据收集和测量方法,降低成本。

2.3资助和法律要求

与数据管理有关的重要资助和法律要求有许多。如 ANU的研究政策实践(总结)要求数据管理应该遵守隐私法,研究结果公布是经过审查的;与出版有关的非涉密数据可以获取。数据至少保存5年,保存应符合存储法(1983)。研究者负责数据安全性,导师必须确保学生收集数据的有效性。ANU反对剽窃、伪造、干涉数据等研究不当行为。

ARC发现项目资助协议要求社会科学中产生的研究数据应在两年内保存在澳大利亚数据知识库中,在项目结束后数据应递交给合适的学科或机构知识库。

3ANU的数据管理方法

3.1数据组织

3.1.1目录管理。研究者们在电脑上存储有数千学术论文,在写文献综述时找到一篇特定文章是困难的,如果手工创建目录则费时且易出错,而且期刊和会议通常使用专门的引文格式,因此自动生成参考文献目录将节约时间并避免错误。参考文献管理软件很多,它们把参考文献导入数据库,使它易于存储和检索。EndNote是一款流行的参考文献管理工具,ANU允许教职工和学生在办公室、家里电脑和笔记本上安装EndNote。JabRef是个免费程序,可以在所有系统上安装,Zotero是Firefox网络浏览器增值的免费开源书目管理软件。

3.1.2文件远程获取。项目合作的研究者通常需要共享原始数据和原始结果,因此,经常需要远程传递数据。传递数据常见的方法是邮件附件,但受传递文件大小限制。移动数据存储介质,如U盘和移动硬盘可以传递大量数据,但要求研究者随身携带。AARNET提供云存储专业服务,可以传递文件而不需要移动存储介质。为了帮助规范数据管理,ANU提供本地局域网和互联网获取Pebble服务器,在中心文件存储上为每个成员馆分配存储个人文件的文件空间,从任何共享计算机上可以到Pebble存取信息[5]。ANU提供网络应用,如联盟,允许获取数据并使用网络浏览器进行修正。

3.1.3文件同步。研究者通常在不同地点的计算机上工作,文件在电脑间来回备份,很容易不知道最新备份是哪个,因此可以考虑使用文件同步软件。文件同步软件可以自动检测修改的文件,并让用户选择保存哪一个。最常用的同步程序是WinSCP,主要用于SSH和FTP文件传递,也可以同步数据[6]。Rsync是另一个广泛使用的开源软件,可以增速文件传输和同步。它是跨平台的,可以生成“快照”和定期备份。商业化、界面友好的文件同步服务越来越受欢迎。

王秀华:澳大利亚国立大学图书馆数据管理服务及启示*王秀华:澳大利亚国立大学图书馆数据管理服务及启示*3.1.4合作。许多研究通过研究生和他们导师之间、部门研究组之间、跨学科研究和大学之间合作研究进行。这些合作研究可以考虑使用协作软件工具,比如ANU提供联盟和版本控制软件。联盟是一个基于网络的服务,可以让ANU的教职员工和学生轻松建立合作项目网站。联盟提供广泛的协作工具,如论坛、聊天室和日历,允许用户共享文件。

3.1.5版本控制。多个用户不断编辑数据时,应实现某种形式的版本控制来跟踪变化,在文件编辑结束后在每个主要编辑后面简单地添加数字实现。这种方式对简单工作是可行的,但当有多个作者或大量编辑时,使用版本控制软件是最佳方案。版本控制软件还提供访问控制、协同工作环境、不同电脑之间同步,实现一定程度的数据安全。

3.2数据管理

3.2.1备份。由于硬盘故障或意外删除会面临失去数据的危险,定期备份数据是最重要的,因此要制订维护数据备份政策和计划。当制订备份政策时,需要考虑备份数量、时间、存储空间、存储介质及备份数据的敏感性等问题。

3.2.2数据验证和认证。对研究数据得出的研究结果和结论,要确保其准确性。研究数据可能成为许多人使用的重要数据,如果研究数据有错误,这会阻碍研究的顺利进行。因此,建立确保数据准确性和真实性的政策和措施很重要,如通过使用校准仪器、电脑辅助采访、数据录入检查等避免意外或故意篡改。

3.2.3文献记录和获取控制。记录实验过程和数据收集方法是很重要的。自然科学已经有保持良好的实验室笔记传统,社会科学经常记录他们的调查方法,通常这是手工记录,应考虑将记录信息数字化。通过定义修改数据,维护数据真实性的权限,可以实现访问控制,保护隐私。访问控制可以在整个研究项目周期中变化。

3.2.4IT安全性。在遵守保密协议和隐私法前提下,避免违反知识产权或有价值数据被窃取,需考虑数据安全性问题。ANU制定有全面的信息安全政策,ANU的工作人员和学生可以在家里和办公室计算机上安装Sophos 杀毒软件[7]。如果有涉及隐私法或保密协议的敏感数据,最好是存储到未链接任何网络的计算机上或加密数据。

3.3数据存储与共享

3.3.1数据共享方法。数据共享可以通过电子邮件请求、网站、知识库等形式实现。知识库是首选,因为大多数知识库中的数据有保存与传播双重目的。知识库有搜索工具,从而增加其他研究人员使用数据和出版物的机会。存储数据集也意味着数据的所有者不需要维护网站,可以设置访问控制范围。如果数据是在线的,与出版物链接将会提高其使用和影响力。

3.3.2版权和许可。任何原始数据的所有者在创建数据时拥有版权。所有者通常是创造者,但一些资助和研究协议要求版权移交给另一方。许可证授予他人使用受版权保护的数据,开放内容许可证是研究人员许可他人使用其数据的简单方法。最著名的开放内容许可即创作共享许可。

3.3.3文件格式和标准。创建数据之前,应考虑采用的格式和标准,因为有时文件格式之间转换是很难的。从长远来看,最好使用开放格式,因为它们更可能在将来具有可读性和易于与他人分享。如果是广泛传播的,使用专有格式是安全的,因为有可能存在读取这些格式的免费程序。一些开放格式有PDF、ODF及PNG、TIFF图像格式。

3.3.4获取限制和存储。当数据在最后的状态并准备发布或存储时,应确定每个数据项的访问权限,如无限制的–任何人都可以下载,注册–用户必须提供他们的姓名和单位,数据所有者可以跟踪谁在使用他们的数据,请求–要求用户必须提交描述如何使用数据的请求,封闭–没有访问,即机密数据。鼓励存储最后研究数据,存储数据确保数据不会丢失、忘记,或由于存储在老文件格式,或存储媒体变得不可用。存储也需要考虑传播、访问控制和安全。存储的目的是保存数据,使数据可用于进一步的研究,数据所有者可以指定访问限制范围。

4ANU的数据管理服务

4.1本地IT支持员工

本地IT支持人员提供数据管理服务。他们提供服务内容通常由学院院长决定,所以服务因学院不同而不同。大多数大学提供文件服务器和网站托管,并雇佣员工[8]。文件服务器是存储数据的计算机,使您的计算机通过网络链接获取数据。大多数大学有Web服务器托管的教员和系网站,他们也允许学术人员使用网站服务器作为个人和研究组的网站。

4.2信息素养计划(ILP)

ILP为教职工提供了多种培训资源,包括在线培训课程。数据管理培训课程有联盟—ANU的在线合作环境、 LaTex和BibTex文献写作软件、办公软件、EndNote参考文献管理软件、SPSS统计分析软件,如何有效搜索网络和研究、搜索策略及如何有效使用数据库等课程。

4.3ANU数字资源和数据共享

ANU数字资源是大学指定的机构知识库,它提供ANU研究作品的长期存储和传播。数字知识库被Google这样的搜索引擎索引,增加了作品被再次使用的机会。数字资源包括ANU的数字学位论文、期刊文章、会议论文及其他。现在,越来越多的资助机构要求研究结果在机构知识库中可以获取。

4.4ANU超计算力(ANU Supercomputing Facility,ANUSF))

ANUSF是运行和支持国家计算基础设施的超级计算系统[9]。ANUSF提供广泛处理和分析的计算设施、大数据存储设施、复杂数据可视化,如3D模拟等,帮助人们解决复杂问题的咨询和培训,对ANU研究者可以申请免费帐号使用国家设施,帐号用户可以分配一定数量的服务单元和存储空间。

4.5澳大利亚数据知识库(Australian Data Archive,ADA)

ADA包括澳大利亚社会科学数据知识库,是由澳大利亚领先的大学构成,由ANU管理。ADA雇佣专业的数据存储员,由高级社会学家委员会建议,对澳大利亚学界提供领导、管理和拓展服务。ADA知识库是澳大利亚唯一综合社会学数据库,有2,000多个数据集目录,保存有澳大利亚调查数据、民意调查和户口普查数据,也包括亚太地区其他国家的数据。ADA提供专业学科化服务,包括Indigenous研究、选举行为、犯罪学及人类科学,通过管理和传播ARC资助数据集,在澳大利亚研究理事会发挥重要作用。

4.6澳大利亚国家数据服务(Australian National Data Service,ANDS)

ANU是ANDS计划成员,ANDS是研究机构合作,目的是管理本地数据,创建和出版结构化数据资源。这些联系的数据资源与共享的国家基础设施一起,形成了澳大利亚研究数据共享中心。使用研究数据服务可以搜索这些数据资源,ANU的教职工可以与ANDS联系把他们的数据存储到RDA。

4.7澳大利亚研究合作服务(Australian Research Collaboration Service,ARCS)

ANU的教职工可以获取和使用ARCS服务,包括框架数据和视频合作服务,这些服务是免费、灵活的,有助于促进合作,并形成下一代e研究。ARCS数据服务可以使研究者便利、有效地在线保存、获取和传播他们的数据。ARCS数据服务强调围绕数据的基本要求,即存储、共享和传递。

5ANU的数据管理服务对我国的启示

5.1制订数据管理战略规划

e研究和研究数据管理,是支持研究的重要内容[10],要做好这一点,图书馆首先应制订数据管理战略规划,发布数据管理政策,确定数据管理范围和权限、配套基础设施、涉及数据管理的法律法规、数据存储和共享、数据备份、数据安全性、技术人员、经费来源等,这些是确保数据管理服务顺利推进的重要前提。

5.2持续提供信息素养培训服务

提高研究者的信息素养是提高科研效率、加快科研创新的基础。我国研究型图书馆应采取多种形式开展信息素养教育,在线信息素养课程将帮助研究者学习高级信息素养技能[11]。图书馆应提供诸如数据管理、协同研究、文件转换、文件同步、参考文献管理、办公管理、数据统计分析等各种软件的使用方法培训,开展各类学科专题培训、引文搜索,提高研究者使用网络和数据库检索文献资源的搜索策略和技巧,提高信息搜索查全率和查准率。图书馆尤其要向研究者提供在研究过程中采用合适介质随时存储科研数据,并做好数据备份培训。

5.3建立机构知识库

机构知识库(Institutional Repository,IR)是机构管理科研成果、传播学术知识、支持全社会创新的重要机制,日益成为其知识基础设施的重要部分,成为支持数字科研和数字教育的重要工具[12]。机构知识库也是研究者存储和传播研究数据的重要工具,是提高其研究影响力的重要平台。目前,研究型图书馆机构知识库建设方兴未艾,在构建机构知识库常规服务功能的同时,应着重考虑研究者科研数据的存储、传播、共享、安全性和长期保存等方面的需求,提供数据管理服务。

5.4持续进行员工技术和管理培训

研究型图书馆应设置数据管理服务岗位,对研究者在研究过程中的数据获取、数据存储、数据管理、数据集成、数据挖掘、数据可视化及其他计算和信息处理需求提供服务。要给员工提供技术和管理培训机会,让他们获取给研究者提供服务的技能和知识,掌握资源以及它们的组织方式,熟悉发现工具[13],理解研究者需求,与研究人员协同工作,提供个性化数据管理服务。

参考文献:

[1]胡曙光.发挥高校图书馆在科学研究服务中的功能作用[J].产业与科技论坛,2014(8):129-131.

[2]Susan Kroll and Rick Forsman.Slice of Research Life:Information Support for Research in the United States[EB/OL]. [2014-10-29].http://www.oclc.org/research/publications/library/2010/2010-15.pdf.

[3]Information Literacy Program[EB/OL].[2014-11-18].http://anulib.anu.edu.au/_resources/training-and-resources/guides/DataManagement.pdf.

[4]Stevan Harnad,Tim Brody.Comparing the Impact of Open Access (OA) Vs.Non-OA Articles in the Same Journals[J].D-Lib Magazine,2004(6):4-7.

[5]Pebble.on-Campus Access information[EB/OL].[2014-11-29].http://anu.edu.au/computing_and_printing/computers_on_campus/personal_file_ space.php.

[6]rsync[EB/OL].[2014-11-29].http://wikipedia.org/wiki/Rsync.

[7]Sophos Anti-Virus Software[EB/OL].[2014-11-29]. http://www.sophosupdate.anu.edu.au.

[8]Find LITSS[EB/OL].[2014-11-29].http:// its.anu.edu.au/litss/contacts/.

[9]NCI National Facility[EB/OL].[2014-11-29].http:// nf.nci.org.au/.

[10]Joanna Richardson,Therese Nolan-Brown,etc.Library Research Support in Queensland: A Survey[EB/OL]. [2014-11-02].http://eprints.usq.edu.au/23002/2/Richardson_Nolan-Brown_Loria_Bradbury_PV.pdf.

[11]Imogen Garner.Library Support for Research in a University Context[EB/OL].[2014-11-02].http://docs.lib.purdue.edu/iatul/2006/papers/24/.

[12]张晓林.IR的发展趋势与挑战[J].现代图书情报技术,2014(2):1-7.

[13] Rachel Chan,John Cole (Chair),Anne Davis,etc. Taylor Family Digital Library Research Support Team:Final Report[EB/OL].[2014-11-02].http://www.ucalgary.ca/files/lcr/TFDL%20Research%20Support%20Team%20Final%20Report.doc.

(编校:崔萌)

猜你喜欢

图书馆服务数据管理
《大数据管理》课程思政教学质量评价体系研究
穿越数据的迷宫
金融行业数据管理将何去何从?
如何有效开展DCMM数据管理成熟度评估
数据挖掘在学生成绩数据管理中的应用研究
数据挖掘在学生成绩数据管理中的应用研究
基于数据挖掘的高校图书馆个性化服务研究
“国际视野中的大学图书馆发展研究高端论坛”综述
浅谈工匠精神在高校图书馆服务中的传承
浅谈阅读推广活动的探索与实践