APP下载

国外图书馆在数据共享时代的角色分析

2016-03-20庞淑杰

大学图书情报学刊 2016年5期
关键词:数据管理大学图书馆

庞淑杰

(吉林大学,长春 130012)



国外图书馆在数据共享时代的角色分析

庞淑杰

(吉林大学,长春 130012)

文章对科研数据共享的意义、发展趋势及其作用进行了剖析,认为科研数据通过共享公有、自由访问,可以被同行同步利用或跨领域使用,从而利用科学交叉地带出成果。因此,图书馆应承担起研究数据综合管理的历史责任,图书馆员在知识结构、专业能力方面应进行相应的提升。

数据共享;数据管理;新角色;科研数据;数据公开;数据保存;国外图书馆

1 前言

2013年5月,GRC(Global Research Council,全球科研委员会 )制定了一项“数据公开访问推进计划”,对相关政策的制定发挥了很大影响。2013年6月G8(八国首脑峰会)签署了“数据公开访问推进宪章”;同时,在G8的科技部长会议上达成了实施“公开、共享科技数据”的共识。2015年年末,OECD(经济合作与发展组织)对“数据公开访问事业”进行调查后发布了新版报告(2012年发布初版报告),在附录里按照国别对全球主要国家出台的“数据公开访问政策”作了总结归纳:截至2015年4月,已经有近60个国家颁布了推进数据公开访问的政策。 “道客巴巴(ROARMAP)”提供的资料——《OECD STI Outlook》(The OECD Science, Technology and Industry Outlook,经济合作与发展组织的科学、技术和产业展望 )显示,已经有20多个国家将“论文或者科研数据公开访问”上升为国家层次的科技战略。

早在2011年,欧洲就已经开始了被称为“EUDAT”的“共筑科研数据共享基础计划”。2015年,该计划以“FUAT2000”的名义,再次启动。2015年8月, PASTEUR4OA计划(Open Access Policy Alignment Strategies for European Union Research)为促进欧盟科研事业而实施“对数据公开政策”的战略调整发布了一份报告,名为《评估欧洲“实施数据公开存取政策”的准备情况》(Assessing Readiness for Open Access Policy Implementation across Europe),对各国的相关情况作了介绍与总结。一直以来,在天文学、地球科学、基因组计划、粒子物理学等领域收集获取各种研究数据的成本都非常高。所以,世界各国的科研工作者都致力于数据的共享(数据公开访问),努力解决科研领域所面临的问题,并且取得了显著成果。近年来,由于科研成果可信性的提高以及资源公开访问原则的确立,推动了数据共享事业的大规模拓展,而且,今后科研资助机构将数据公开变为被资助者应尽义务。在上述背景下,欧美学术型图书馆推进的科研数据共有共享进程也成绩斐然。[1]

2 科研数据共享的意义与趋势

2.1 提高科研的效率与可信度

数据共享(Data Sharing)的成功范例,应该是破解人类全部基因排序的人类基因组计划。根据百慕大原则,世界各国所有的科研人员应该在24小时之内将自己破解的基因序列向公众领域公开。这一目标在计划开始的第13年就已经实现,比最初的预定提前了2年。这以后,在生命科学领域,数据共享与二次利用方兴未艾,并且不断产生新的成果。[2]

篡改研究数据进行论文造假,是国际科研领域积习难改的老问题。业界普遍期待的是,公开研究数据,使实验可以重复,使成果能够重现,以提高科研项目的透明度。特别是医学临床试验数据,因涉及个人隐私与企业商业利益的保护问题,普遍被视为攻克数据公开的难关。不过,情况也在不断变化。2013年11月,日本东京大学医学部附属医院的医学信息网络研究中心,开通运行了可供所有科研人员利用的病历数据官方网站“LIMINI-ICDR”。

2.2 科研数据公开成为科研机构的义务

资源公开访问的大趋势,对数据共享事业的发展产生了影响。经济开发合作组织(IECD)、美国白宫科技政策局(OSTP)、欧洲议会等,都倡导将研究数据像科研论文等出版物那样向公众公开,以使政府资金资助的研究成果能为广大公众所利用。[3]之后,有越来越多的科研资助机构对自然人与科研单位提出要求,规定在申请资助资金时,相关人员、科研机构有义务提出“数据管理计划”,就“如何保存所获得的数据,如何共有共享”等做出承诺。这也为图书馆扶持数据共享事业提供了契机。比如,欧美一些大学图书馆负责健康科学领域的学科馆员被赋予了新的任务,即在科研资金的申领过程中提供专业支持,使申请者的申报符合资助机构在数据管理方面提出的条件;帮助制定数据管理计划,为计划的实施提供帮助。类似的事情还有不少。

在日本,尚没有将数据公开作为科研机构的义务来要求,但一部分研究项目是接受过文化科学部、福祉劳动部,科学技术振兴机构资助的。对这类研究,学术界以往也对其研究数据进行过公开征集,供给需要者免费使用。现在,社会各界正在大力呼吁科研机构提供合作,将工作向前推进一步,彻底实现数据共享。这样也有助于提高科研效率,节约资助金额。

2.3 跨学科领域对数据加以利用、引用,并评估影响力

跨学科领域推广利用研究数据以产生新的研究成果,这种旨在推动交叉学科研究的国际性浪潮正在蓬勃展开。已经有57个成员国的“研究数据同盟” (Research Data Alliance)正在倡导“无障碍数据共享”,并努力构建无障碍数据的技术标准(技术层面的基础条件)及通用共享的原则(社会意义层面的基础条件)。[4]大英图书馆“数据引用”(Data Cite)与“研究数据同盟”合作,为收集到的数据附上永久的DOI(数字对象标识符),以便于测定数据被发现、引用、追踪的频率及其影响力的强弱。

汤姆森路透社在2012年11月公开上线了“数据引用索引”(Data Citation Index),提供收录于Web of Science(当时公开的名称是Web of Knowledge)中的论文与各种数据的链接以及引用情况的统计。调查表明,研究数据的公开,使论文被引用的次数大为增加。2013年1月开始,美国科学财团(NSF)对援助资金的资助原则进行了修改,其中有关申请所要求的业绩条件要素,原来是“出版物”(publication),现在改称“产出成果”(products),研究性数据被提升至与论文同等的地位。2014年5月“自然出版集团”(Nature Publishing Group)出版发行可公开访问的电子杂志《科学数据》,该杂志收录有大量科研数据。

打破特定学科的局限而拓展到多个领域去利用研究数据,将数据本身视为科学研究成果而进行评价,这一整套制度正逐步建立与完善。这样也产生了某种强制性影响,激励科研人员走上资源共享的道路,相应地,各种类型图书馆必然会致力于科研数据的收集与整理。

3 科研数据管理的三项作用

3.1 数据管理的三要素

随着科研数据共有共享规模的不断扩大,图书馆被社会各界赋予了新的使命,希望其发挥以往不曾拥有的作用。一项对1329名美国科研人员的调查显示,能够做到让自身获取的数据被其他科研人员方便访问的,只占到被调查人员总数的36.2%。为什么大多数人做不到这点呢?理由有以下几点:没有充足的时间(53.6%),资金紧张(39.6%),找不到数据上传的登录地址(23.5%)。研究人员愿意公开自己的数据,或者有义务必须公布数据,却不能实现,在这种情况之下,图书馆就有责任为学者提供相应的支持。[5]

图书馆提供的研究数据共有共享服务,称之为 “研究数据管理”(Research Data Management,以下简称RDM )。根据DCC(Digital Curation Centre ,英国数据综合处理中心)所制定的《RDM构建指南》,RDM包括以下要素:(1)确立“公开所在科研机构上传全部科研数据的官方网站并提供服务”的实施计划;(2)为数据的长期保存于公开访问网站提供支持;(3)为科研人员提供辅导、培训、进修的机会。

3.2 制定数据对策与实施服务的计划

大学、科研机关的RDM服务,从诸如“制定对策与战略、核算实施成本、订立年度计划”等工作开始。根据2012年在英国进行的调查,制定了正式数据管理政策的大学占高校总数的30.9%,准备在2013年制定明确的相关政策的大学占43.2%。总的看来,英国有7成的高校正在致力于数据管理政策的制定与实施。各高校与科研机构的相关政策被综合归纳整理为DCC的“英国科研数据政策”( UK Institutional data policies),还有“数据研究”(Data Res,由诺斯德克萨斯大学图书馆及信息学院、图书馆信息资源整理财团联合组建运行的科技情报提供组织),出台了(美国)“大学数据管理政策”(University Data Management Policies)。

爱丁堡大学2011年5月在英国开始制定RDM政策,还制订了2012年8月至2014年的实施路线图,并予以公布。该对策包括诸如“新提出的科研项目申请,必须附有研究数据管理计划”等10项条款;路线图中规定了“数据管理计划、基础设施建设、数据管理责任、数据管理支持部门的目标”等,并将设想的成果按0、1、2等三个等级阶段加以记载。[6]

2013年8月,媒体对DCC、爱丁堡大学进行了采访。相关负责人表示,在制定机构整体的数据管理政策、战略、实施计划之际,图书馆发挥了主导作用。另外,来自学科领域以及专家学者寻求支持的需求日益多样化,图书馆与需要者的充分沟通就显得十分必要。

3.3 数据管理

图书馆的第二个全新角色,就是为了实现研究数据共享而对科研数据实施管理。数据管理的定义有多种,一般是指为了实现科研数据的公开访问、二次利用而对相关数据加以设计、选择、组织、长期保存等一系列工程的实施过程。首先是根据科研资助机构、学术期刊的相关政策规定,制定有关数据登陆地址、登陆方法、保存期限等管理计划。登陆地址有:基因数据库(GenBank )等领域的官网、学术期刊出版社的服务器网址、科研资助机构的官网,Figshare(一种分享开放科研数据的模式)平台等。

另外,作为制定“数据管理计划”的辅助工具,有一些公开发表的资料可供参考,包括加利福尼亚大学数字信息中心(UC3)的DNPTool、巴斯大学“全方位360度探索”(Research360)开发的模版、 DCA开发的检查列表、支助机构一览表等。

英国负责收集社会学、经济学领域数据的“全英数据档案”(UK Data Archive),对数据综合处理作了说明,将其分为9个步骤:(1)数据传输;(2)确定按不同标准处理的各类数据的数量;(3)数据的处理;(4)数据附属文件的处理;(5)元数据的制作;(6)追加用户信息(指形成阅读文件;)(7)公开数据目录;(8)以下载方式实行数据传递;(9)数据保存。

为了实现长期保存、广泛访问以及二次开发利用的目的,在进行上述第3个步骤的过程中,要将数据转变为某种适当的形式;对于第5点,需要尽量选择标准化的框架以备数据收割;对第7点数据公开,要着重实施标注“能够反映引用评价情况”的DOI(数字对象标识符),为论文建立原文链接,还要注重著作权所要求的许可、学术伦理所规定的禁忌等。

以上模式的服务需要以下人员的合作进行:主题库管理馆员、数据管理馆员、官网运行责任人、IT服务责任人、调查管理负责人。[7]

3.4 对研究人员的培训与支持服务

图书馆在RDM中的第三个使命,就是对科研人员、研究生提供培训服务与辅导咨询。国外各图书馆都积极开设相关的Web网站,组织研究进修,提供咨询服务。

在RDM网站,可以看到经过整理后发布的各种内容:数据管理机构对相关政策规定的阐述;有关元数据著作权的说明;有关数据引用方面的解释;有关科研支持机构的政策解释;关于制定“数据管理计划”的建议;相关研讨会的各种事宜;培训进修活动的指南等。

英国剑桥大学、美国麻省理工学院、美国加州大学洛杉矶分校都开设了RDM网页,就专门领域话题所做的探讨,对其他大学的研究人员也多有补益。

图书馆为科研人员、研究生等参加相关进修而编纂的教材也公开发行。“英国数据档案”项目就提供了教材,其中就“计划制定、数据形式、累积存储”等话题做了充分的论述,包括如何使用PowerPoint(演示文稿制作软件)制作幻灯片,解说者如何熟练地播映演示等,还收有练习题、测试题等。

在马萨诸塞大学的“新英格兰协作数据管理课程体系”(New England Collaborative Data Management Curriculum)中,提供了面向健康科技领域的学生、研究者等教授数据管理的7种模型和教材。

美国明尼苏达大学图书馆开展的数字管理服务也是成绩斐然。据统计,从2010—2013年秋,有47862名读者访问了该校RDM网站,先后有360名师生参加了专为教职员提供培训的“数据管理计划”的研究讨论。图书馆还开设了面向研究生的网络在线课程“数据管理”(不分单元),从2012年秋到2013年春,共进行了两轮课程,总共有58人修完整个过程。[8]

另外,根据一份发表于2013年以9国30所大学为对象的一份调查报告,可以了解到,各国配备有负责数据管理的专职馆员或招聘的专责人员的大学图书馆,占所有被调查对象的56%;为教职员提供相关培训的大学占46.7%; 向科研资助经费申请者提供有关数据管理计划的建议与意见的大学图书馆,占调查总数的63.3%。

4 图书馆的新角色对图书馆专业人才提出的新要求

经过对北美国家图书馆2011年10月到2012年4月发布的137条数据管理人才招聘启事所列条件进行分析,不难看出,图书馆所需新型人才要求具备以下一些主要素质或条件:(1)与著作版权拥有机构或自然法人进行交流沟通的能力;(2)对科研数据内容进行综合处理与保存的能力;(3)对数据进行管理(设计、甄选与重组)的能力;(4)制定数据公开项目相关计划的能力;(5)对数据进行价值评价的能力;(6)对数据公开利用系统(网络访问系统)进行管理维护的能力。为应对这种需求的新变化,国外各大学研究生院图书情报专业、各类信息情报学校纷纷开设了与科研数据管理相关的课程或培训项目。例如美国伊利诺伊大学的图书情报专业研究生课程,就设置了数据综合处理课程,其中除了元数据建立、数据保存这样的必修课外,还设立有如何构建数据图书馆这样的科目。

各国业界还普遍为现任在职图书馆员开设了相关的进修课程,组织召开专题研讨班。在CLIR提交的名为“论数据问题”( The Problem of Data)的报告中,列举了以下一些培训课程:北卡罗来纳大学所属教堂山分校的“数据综合管理课程系列II ——专题研究 ”( DigCCurr II Professional Institute);美国图书馆(LC)的“数据保存延展与教育“(Digital Preservation Outreach and Education),DCC的“数据综合处理”( Data Curation)等。不过,这些课程修完后不发结业证,一定程度上影响了在职人员的积极性。

对在职者来说,在线研讨会、网络课程更加方便利用。欧美各国教育机构、专业社团都开设网上公开课程,任何人都可以免费参加,资料与视频全部公开。[9]在DCC的“有关数据管理与综合处理的相关教育与进修”的网页上,可以检索到欧美大学或相关机构开设的课程与进修项目。伊利诺伊大学网页上“数据综合处理课程搜索”一栏中,可以查找到美国各高校开设的相关课程及辅导项目。

2013年9月UKSG(英国连续出版物集团)举行了题为“何为数据管理,图书馆在其中应发挥的作用”的网络研讨会,主要面向新近从事相关工作的人士。主讲人是谢菲尔德大学所属信息情报学院的安德鲁·考克斯(Andrew Cox),他提出“伯明翰大学的研究数据已积累到约10亿个文件夹”。结合具体例证,他阐释了在研究数据管理受到高度重视的大背景下,科研人员所面临的难点,图书馆所承担的新角色定位等问题。报告时间不长,只有45分钟,提问踊跃。考克斯教授最后将重要论点进行了精炼归纳,反复加以强调。讲演内容很充实,在海内外引起很大反响。

现在国际上较为著名的面向图书馆员自学之用的线上教材有:第一数据“(DataONE)”的“教育模型”( Education Modules)、谢菲尔德大学的“数据管理文化”( RDMRose)等。在著名的文献管理工具Mendeley(免费的跨平台文献管理软件及在线学术社交网络平台)中,有一款“馆员如何进行数据管理”( Data Management for Librarians )的文件库,附有不少相关主体的论文。

以上这些专为RDM服务而开发的情报信息、教程视频,都是十分适用的工具,与研究数据一道向业界公开,令各国科研人员、图书馆员不分国籍,皆可共有共享。在格拉斯哥大学,负责RDM的工作人员仅有几名,却实现了使公开的数据资料的利用最大化,为该校师生提供了极有效率的服务,在海内外大学馆中引起强烈反响。[10]

5 结语

数据共享工程是科研生命周期生态循环系统不可或缺的一环。其重要性已被业界充分认识,但要真正变成现实,还面临诸多的技术、制度、法律、伦理、财力方面的问题与壁垒。在这种环境中,图书馆为数据共享事业提供支持的诸多工作,也面临不少困难,在实践中也难免出现一些失误。为了提高图书馆在文化建设、科学发展中的现实与历史地位,惟一的途径就是使图书馆成为科学研究活动的忠实伙伴。从先行者的经验教训中吸收营养,承担起数据共享的历史责任与现实角色,才能实现图书馆人的理想。正如日本情报学专家在一篇文章中指出的那样:“关键的一点就是,图书馆必须与所属大学或者科研院所的管理经营层进行沟通,每个图书馆开展的业务,都要密切配合所服务的科研机构与教学组织所进行的以教育科研为中心的相关项目。”就是说,图书馆必须在科教机构所实行的教学科研工作战略中,构筑确定本身活动的目的与位置。图书馆需要将“知识构建与传播”的相关工作,从根本上采用全新的形式进行二次组织,从而塑造未来图书馆的的形象,在科研工作战略中将图书馆的服务变成不可或缺的要素。那么,围绕数据公开访问政策的落实,图书情报工作的切入点在哪里呢?那就是:未来图书馆与大学及科研机构进行的工作与活动,要参与教育、科学、文化的发展计划(这是有学术价值的知识生产活动),为振兴各类产业,活跃并推进创新发明活动,批量培养富于创造性的创新人才等发挥独特而重要的作用,并且使相关计划具有可持续性。 推进数据公开访问,同时保持该项事业的持续性,并且达成预期目标 ,图书馆被寄予很大的希望。

[1] Fienberg, S.E.et al [eds.].Sharing research data.National Academies Press.1983, 234p.Hey, Tony et al.The Fourth Paradigm: Data-Intensive Scientific Discovery.1st ed., Microsoft Research, 2009, 284 [EB/OL].[ 2014-06-30].http://research.microsoft.com/en-us/collaboration/fourthparadigm/.

[2] 高祖歩美.生命科学分野におけるデータの共有の現状と課題[J].情报管理,2013(5):294-301.

[3] Wadman, Meredith.NIH mulls rules for validating key results[J].Nature,2013(5):14-15.

[4] Swoger, Bonnie.Reference: ereviews: Thomson Reuters Data Citation Index.Library Journal.2012-12-27.[EB/OL].[ 2014-06-30].http:// reviews.libraryjournal.com/ 2012/12/ reference /ereviews /reference-ereviews-december-1-2012/.

[5] Jones, Sarah.et al.How to Develop Research Data Management Services - a guide for HEIs.DCC.2013, 22p.[EB/OL].[ 2015-03-30].http://www.dcc.ac.uk/sites/default/files/documents/publications/How-to-develop-RDM-services_finalMay2013rev.pdf.

[6] Research Data Management Policy.University of Edinburgh.[EBOL].[ 2014-12-10].http://www.ed.ac.uk/schools-departments/information-services/about/policies-and-regulations/research-data-policy.

[7] University of California Curation Center of the California Digital Library.DMPTool.[EB/OL].[ 2015-02-20].https://dmp.cdlib.org/.

[8] Support for Managing Research Data.University of Cambridge.[EB/OL].[ 2015-04-12].http://www.lib.cam.ac.uk/dataman/.

[9] Johnson, Lisa.“Academic Libraries Get Ready: Big data is here and it needs a (caring) home”.NISO Webinar: Research Data Curation Part 2: E-Science Librarianship.2013-09-18.[EB/OL].[ 2015-05-30].http://www.niso.org/news/events/2013/webinars/data_curation/ .

[10] 池内有为.研究データ共有時代における図書館の新たな役割:研究データマネジメントとデータキュレーション.カレントアウェアネス.2014, (319), CA1818, p.21-26.[EB/OL].[ 2015-04-30].http://current.ndl.go.jp/ca1818.

(责任编辑:朱爱瑜)

The Role of Foreign Libraries in the Era of Data Sharing

PANG Shu-jie

(Jilin University, Changchun 130012, China)

This paper analyzes the significance, the trend of the development and the functions of the scientific data sharing.It thinks that the scientific data can be used synchronous by counterparts or interdisciplinary, by sharing and free access.Then the achievement is produced by using the scientific crossing belt.Therefore, the libraries should undertake the historical responsibility of the integrated management of research data, and the librarians should be improved in the knowledge structure and the professional capacity.

data sharing; data management; new role; scientific research data; data disclosure; data storage; foreign libraries

G250.19

A

1006-1525(2016)05-0116-05

庞淑杰,女,副研究馆员。

2016-03-02

猜你喜欢

数据管理大学图书馆
“留白”是个大学问
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
《大学》
48岁的她,跨越千里再读大学
CTCS-2级报文数据管理需求分析和实现
大学求学的遗憾
图书馆
去图书馆