大英图书馆馆藏元数据战略解读及启示
2016-02-12东北农业大学图书馆
吕 游(东北农业大学图书馆)
大英图书馆馆藏元数据战略解读及启示
吕游(东北农业大学图书馆)
馆藏元数据对馆藏数据的管理、共享、复用有着战略意义。针对大英图书馆2015~2018年馆藏元数据战略,从战略愿景、战略挑战、战略协调、战略原则、战略重点和战略部署多方面加以诠释,强调馆藏元数据的开放共享,提出通过馆藏元数据资源与社会资源关联、实现其价值的全面释放。对国内图书馆参与国家大数据发展战略有着深入的启迪意义。
馆藏元数据;战略;馆藏资源生态系统
元数据是关于数据的数据,是数据管控的基本手段,元数据管理是大数据资产管理中的核心技术,任何科学合理的大数据治理模型中都必须囊括以一定元数据管理策略和管理体系为依托的全面化元数据管理。对图书馆而言,元数据是数字图书馆建设的基础和关键,是实现馆藏资源聚合的有效途径。正是基于对馆藏元数据战略重要性的认识,近年来国外图书馆纷纷围绕其展开研究。2011年,欧盟数字图书馆Europeana设计了开放、跨领域、基于语义框架的元数据方案《Europeana数据模型》 (Europeana Data Model,EDM);2012年,美国数字公共图书馆(DPLA)公开大规模征求元数据专家意见,在Europeana数据模型EDM基础上,结合自身元数据管理经验和特定需求,形成《元数据应用纲要》 (DPLA Metadata Application Profile,简称MAP)3.0版本,促进馆藏元数据的共享与获取,2015年3月,DPLA继2014年的3.1版本又发布了强化关联数据应用的MAP 4.0版本。[1]对元数据的展望及应用的规范不仅局限于数字图书馆,2015 年10月,大英图书馆发布2015~2018年馆藏元数据战略,强调馆藏元数据的开放共享,提出通过馆藏元数据资源与社会资源关联、实现其价值的全面释放。对国内图书馆而言,数据服务尚未全面展开,对元数据的规划应用仍处于初级阶段,制定馆藏元数据战略将不仅有利于馆藏利用率的提升,更关乎整体社会资源流通及国家大数据战略的推进。因此,对国外馆藏元数据战略报告的解读和研究有着较高现实意义。
1 大英图书馆馆藏元数据战略报告
大英图书馆馆藏元数据战略报告囊括战略愿景、战略挑战、战略协调性、战略性原则、战略部署等内容。(1)战略愿景。到2020年,建成全面、连贯、权威、可持续的馆藏元数据资产,通过强化内容管理、发展合作关系、深化馆藏利用,实现馆藏元数据价值的全面释放。(2)战略挑战。包括多种非兼容性元数据标准和系统的存在;大量不符合当前业务需求的元数据的迁移问题;大量印本元数据及非标准化元数据如何为更多的用户所发现和获取;元数据创建和管理的效率问题;如何为公众提供更多的元数据访问/获取机会;元数据对利益各方战略目标的广泛支持性问题;如何通过创新方式解决诸如动态化数字保存的资源识别等复杂性问题,以及为提供相应持续性服务而引发的人才技能培养及人才发展问题。(3)战略协调性。从托管角度分析,区域性、全国性馆藏的有效管理和保存必须依赖以馆藏元数据为基础的馆藏库存控制和获取;从研究角度分析,各类研究的支持和促进必须依托以馆藏元数据为基础的资源探索、文件传递和数据挖掘;从商业角度分析,元数据的开放存取有利于业务价值的进一步开发;从文化角度分析,馆藏元数据使用将促进更广泛的社区参与;从学习角度分析,学校及其他学术机构可利用发布的描述性元数据更有效地创建馆藏目录;从国际合作角度分析,与合作伙伴的元数据交换将促进相关国际化标准及标准化机构的发展。(4)战略原则。定义及实施馆藏元数据管理战略;馆藏元数据明细程度及可见程度需要专门规范及相应机构来监管;所有馆藏元数据需要统一存放;馆藏元数据管理与其他国际性、行业性标准的协同;满足用户及利益相关者的元数据使用预期。(5)战略重点。提升馆藏元数据创建、管理、开发效率,奠定战略项目实施基础;从长远价值着手提升馆藏元数据的投资回报率;开放尽可能多的馆藏元数据促进馆藏内容获取及扩大范围内的复用。(6)战略部署。2015~2016年,构建馆藏元数据管理、归档最佳实践模型,实施馆藏元数据审计,全面登记馆藏元数据资产,进一步开放馆藏元数据,评估馆藏元数据迁移标准,检验数字版权管理等;2016~2017年,实施创新的成本效益型馆藏元数据发展方案,制定参与计划鼓励更多合作伙伴参与构建元数据标准,识别可用于馆藏元数据持续保存、管理的各项技术;2017~2018年,简化现存馆藏元数据标准及基础设施系统,大幅降低现存的非可见、不可获取的馆藏元数据的数量。[2]
2 大英图书馆馆藏元数据战略报告分析
2.1战略愿景、挑战及协调性分析
大英图书馆馆藏元数据战略愿景突出了如下概念。(1)馆藏元数据资产的全面性、连贯性、权威性和可持续性。全面性包含两层含义,一层是指元数据对所有数字化馆藏资源的覆盖,即为不同类型、来自不同数据库的馆藏内容创建元数据,并将元数据统一聚合到元数据仓库中;另一层是指元数据种类及功能的全面性,通过描述型、技术型、管理型、复用型等多类型馆藏元数据库的构建,满足不同使用者及使用情境下的搜寻、定位、获取、管理、保存、评估等需求。连贯性是指馆藏元数据的创建、存取、管理应形成连贯一致、统一格式的系统和方法,从而保障整个馆藏系统的可靠、可用和一致。权威性是指馆藏元数据的高公众信赖度和社会认可度,权威性以元数据的开放、质量保障为前提,可以表现为利益相关者对馆藏元数据的积极使用,相关机构、行业对馆藏元数据标准化系统或流程的认可和推广等。可持续性是指馆藏元数据的未来适应性,包括与未来数据标准的一致性、能够满足未来科研、学术、商业等领域活动的各类需求,在不断地自我完善发展过程中同时推动社会的持续发展。(2)强化内容管理、发展合作关系是馆藏元数据战略的重点和路径。强化内容管理:分散、混乱的馆藏数据和信息无法形成强大的竞争性和利用价值,唯有通过标准化、智能化、平台化、异构化的内容管理,将其整合为具有逻辑组织性的数字化内容,才能发挥其最大价值,馆藏元数据正是适应数字图书馆发展引入,推动图书馆由形式管理转向、进而强化内容管理的有效工具。发展合作关系:馆藏元数据战略实施过程中,图书馆不仅需要发展国际合作关系确保所构建元数据标准的先进性及存续性,而且需要与国内其他共享服务计划、元数据项目相协调,确保最终系统和标准的普适性。此外,图书馆还需要通过与科研机构、商业机构的合作解决元数据战略中的业务价值深化、数字版权管理等问题。(3)深化馆藏利用、全面释放馆藏元数据价值是最终目标。馆藏利用率低下是长期困扰图书馆的问题之一。以元数据开放共享为途径,实现馆藏资源与社会信息资源的联通,形成社会广泛认可和反复利用的数据,不仅可以充分促进馆藏资源的流通,激活知识,提升馆藏资源投资回报率;还可以通过馆藏资源和社会资源的整合,提供公众联通的知识管道,发挥1+1>2的优势。
馆藏数据的高容量、多元化及迅速变化和元数据发展过程中的历史遗留问题是元数据发展战略所面临的主要挑战,突出表现为元数据的非规范、非标准化,阻碍了元数据的开放共享。首先,大量非兼容元数据管理系统的存在引发了元数据的流通障碍,元数据标准成为系统间元数据交换的唯一途径,而多种非兼容元数据标准的存在加剧了这种流通共享的障碍性;其次,为改变元数据非规范、非标准的现状,图书馆必须建立统一的元数据标准及系统,且不说统一标准、系统建立的难度及复杂性,单单是新标准、新系统下海量元数据的创建和迁移,都足以构成元数据战略发展中的挑战;最后,也是最关键的,统一标准及系统中的元数据资源如何向更多人开放,为更多人所见、所用,以及元数据发展战略中相关各方利益的协调。在深刻认识馆藏元数据战略的基础上,大英图书馆全方位分析了元数据战略环境中馆藏元数据的存在机会,以便整合相应的资源,充分利用这些机会实现战略延伸,这些机会集中表现为元数据战略实施所能为不同社会发展领域(如科学研究、公众参与、商业活动等)带来的长远收益。
2.2战略原则及重点分析
战略原则为战略行动提供了规范的方式方法,是战略行动的理论依据。从大英图书馆馆藏元数据战略原则中可以分析得出:(1)馆藏元数据管理是战略作战中的重中之重,图书馆在明确元数据管理策略和元数据集成体系结构基础上,应根据需要选择合适的元数据管理工具,并制定相应的元数据管理制度实施全面的元数据管理,[3]以资源有效的组织、管理为依托全面释放资源价值;(2)科学、高效的馆藏元数据管理必须建立起多方联动的管理机制,充分发挥专业机构的监管作用,如馆藏存储机构、审计机构及元数据标准制定委员会等类似机构对元数据管理的积极参与;(3)高效、规范的元数据管理必须以统一的元数据标准及元数据仓储为保障,其中元数据标准是元数据管理的核心与基石,目的在于通过公共的元数据信息来支持不同工具和系统之间数据的共享和复用,从某种程度而言,馆藏元数据标准是数据仓储元数据领域的事实标准,在元数据管理系统的构建过程中,唯有尽量参考元数据标准,才能实现系统可扩展性的强化;[4](4)以用户为中心对图书馆事业发展而言是一放之四海皆准的战略原则,馆藏元数据战略实施也不例外,因此,满足用户及利益相关者的需求及预期在战略作战过程中应当作为被充分考虑的关键因素。
战略重点是指具有决定意义的战略任务。如前文所述,元数据管理是大英图书馆馆藏元数据战略所要解决的突出性问题,由此展开,我们不难得出其战略重点。首先,以元数据管理为切入点,通过实施先进的管理标准、管理手段和管理工具,不断提升元数据的管理效率,将作为元数据战略初级阶段的核心任务;其次,随着元数据战略推进的不断深入,对其深远意义和长远价值的关注将会逐渐提上日程,而且就项目本身而言,对其投资回报率、可持续性的讨论将是无可避免的;最后,元数据战略的终极任务是推动元数据开放共享及馆藏资源的活化使用,实现馆藏价值的全面释放。因此,大英图书馆馆藏元数据战略重点以粗线条、阶段性的形式,由表及里、由浅入深地为我们勾勒了一幅战略任务规划图。
2.3战略规划及部署分析
如果说战略重点是粗线条形式的行动路线,那么战略部署则以年度为序,较为细致地描绘了战略任务的行动方案及实现路径。逐条分析下来,大英图书馆馆藏元数据战略部署与战略重点间的一一对应关系一览无余。(1)战略初期,2015~2016年,以元数据的高效管理为核心任务,为形成阶段目标的有力支持,核心任务被分解为:构建馆藏元数据管理最佳实践模型,实施法令送存电子书的元数据自动完善及强化程序,提升管理实践效率;全面登记馆藏元数据资产,实施馆藏元数据审计,评估馆藏元数据迁移标准,检验数字版权管理,通过元数据质量评估优化促进管理效率;进一步开放馆藏元数据,提升馆藏元数据使用效率;初步协调元数据战略与其他相关战略,建立环境扫描机制,正确识别外部相关因素,通过战略重组、资源整合提升元数据管理效率。(2)战略中期,2016~2017年,提升馆藏元数据投资回报率及元数据项目存续性的核心任务被分解为:规划实施成本效益型馆藏元数据发展方案,从经济决策的角度力求以最小的成本获得最大效益,挖掘元数据项目的内在发展动力及长期存续价值;鼓励更多合作伙伴参与构建元数据标准,一者可保障元数据标准的科学性,二者可形成较高的认可度,为标准在扩大区域内应用奠定基础,通过元数据标准的高投资回报率提升整个项目的投资回报率;识别可用于馆藏元数据持续保存、管理的各项技术,运用现代信息技术改善元数据管理方式、突破项目重点难点、从项目中获得更佳的投资回报和收益。(3)战略后期,2017~2018年,馆藏元数据开放共享、价值释放的核心任务被分解为:以标准化的形式降低现有馆藏元数据标准及基础设施系统的复杂性,减少元数据冗余,扫清元数据在不同工具和知识库间的流通、共享障碍,按照通用标准构建元数据存储库,方便元数据的开放存取;大幅降低现存的非可见、不可获取的馆藏元数据的数量,通过强化元数据管理和访问,变隐性资源为显性资源,全面释放馆藏元数据价值。
3 基于大英图书馆馆藏元数据发展战略的思考
3.1明确馆藏元数据战略意义,制定战略规划
大数据环境下,语义网建设已成为重要内容。在全球性数据库中,各类相关数据通过元数据相互联结,计算机根据元数据自动发现和集成网络信息,唯有通过计算机能够理解的语义标识——元数据,信息才能相互关联。[5]因此,无论是相对于数据使用者的数字内容查询、访问、检索、获取,还是相对于数据生产者的数据存储、处理、系统转换、质量优化,元数据均发挥着无可替代的作用。实际上,包括政府部门、学术机构、商业机构、非盈利组织及私人企业在内的众多机构早已认识到元数据的巨大潜在价值,并围绕元数据的内容标准及操作工具展开系列性研究。对图书馆而言,在数字化资源建设过程中,随着信息技术及开放理念的发展和深入,构建良好资源生态,挖掘资源潜在价值正成为业内关注和研究的焦点,应用元数据标记以实现馆藏资源的可见性,追求价值发现,实现“人找资源”向“资源随人”的转变,已经成为图书馆资源建设的新目标。[6]虽然Europeana数据模型、DPLA元数据应用纲要、ALA元数据实践、NISO数字馆藏指南框架等文件从实体及属性角度对馆藏元数据进行了规范,但从新形势下的图书馆数字文件元数据建设来说,必须将馆藏元数据发展提升到战略高度,从理论研究、标准制定、协调规划、资源分配和督导实施等各方面进行战略规划。[5]在馆藏元数据战略制定方面,图书馆应把握以下重点:(1)在原则上关注馆藏元数据的标准化、兼容性、灵活性、互操作化、可扩展性、普适性及存续性,通过元数据关联实现馆藏资源聚合,并与社会资源二次连接,形成更为广泛的可见、可用性资源;(2)在策略上强调战略协调、多方合作、资源整合;(3)在实践规划中强调统一馆藏元数据标准体系、建立馆藏核心元数据仓储,并通过组织保障、技术保障、人员培训推动元数据战略的贯彻落实。
3.2构建馆藏元数据统一标准,指导各项工作
虽然元数据的概念在图书馆的发展较早,但客观而言发展较为迟缓。馆藏元数据发展的真正障碍不在技术,而在于元数据的互操作性,实现互操作性的关键是标准化,唯有遵循统一化的标准,处于不同空间的元数据才能相互发现、连接和对话。从图书馆事业发展的角度而言,在馆藏资源生态系统构建过程中,各自为耕的时代早已过去,现在业界需要携起手来,通过馆藏元数据标准的统一化实现数据联通,建设资源生态系统,实现数字图书馆产业的发展愿景。与其他产业元数据标准相似,馆藏元数据标准必须具备科学性、实用性、开放性、互操作性的特质。[7]为满足以上要求,图书馆在构建中应开展如下部署:(1)积极加入国际标准化相关组织或行业组织,与组织成员合作共同打造标准化的共同语言;(2)以国际通用性元数据标准为指导,结合馆藏元数据管理经验和需求,构建元数据标准,并关注馆藏元数据标准与其他行业元数据标准的协同、交互;(3)以开放的心态聆听来自用户及其他利益相关者的需求,尽可能地将利益各方尤其是用户引入标准制定的决策过程中,双方展开建设性对话,使得元数据标准能够在最大程度上体现相关者的利益,实现利益均衡;(4)从理论研究和试点实践入手,形成馆藏元数据最佳实践模型,由此逐渐上升至标准高度;(5)开展馆藏元数据标准评估,从科学、实用、开放、互操作的多个角度检验元数据标准,通过开放实验采集用户、专业人士以及元数据设计人员对元数据标准的反馈意见及建议。经过检验、评估不断完善的馆藏元数据标准为以后元数据仓储及管理系统的设计、构建提供指导。
3.3提升馆藏元数据管理效率,优化数据质量
元数据的管理主要有两种方法,一是在相对简单的环境中,按照通用的元数据管理标准建立一个集中式的元数据知识库;二是在相对复杂的环境中,分别建立分布式元数据知识库,再通过建立标准的元数据交换格式,实现元数据的集成管理。[4]在馆藏元数据管理领域,选择何种管理模式,要求图书馆在统筹规划的基础上根据实际而定,管理效率、元数据质量优化及馆藏元数据项目的存续性将是最核心的评判标准。在评判元数据的管理成效方面,国际上已有较为完善的方法,即元数据管理成熟度模型,该模型将组织对元数据的管理划分为6个级别,分别是L0的初始状态、L1的从属于业务系统、L2的元数据统一存储、L3的元数据集中管理、L4的元模型驱动管理及L5的元数据管理自动化。[3]利用元数据管理成熟度模型,一方面,图书馆可以确立元数据管理的路径及目标,即通过部署元数据统一存储、实施元数据集中管理、建立元模型驱动管理,逐步实现元数据管理的自动化;另一方面,图书馆可以参照模型自我定位,评估当前元数据管理水平,根据业务需要制定相应的发展计划,充分保障馆藏元数据管理的效率和成效。馆藏元数据管理自动化模式中,馆藏元数据中的任何变化都将触发业务工作流,以便其他业务系统进行相应的修改,实现了馆藏元数据交互、数据格式映射的最高形式。但这种高效的管理模式不是一蹴而就的,需要大量的基础性支撑工作,如大英图书馆馆藏元数据战略部署中所提及的馆藏元数据资产的全面登记、迁移、审计、数字版权管理、自动化程序设计等,图书馆需要通过不断的实践探索,致力于馆藏元数据管理效率的提升及馆藏元数据质量的优化,建立科学全面的馆藏元数据管理体系。
3.4推动馆藏元数据开放共享,释放馆藏价值
无论是馆藏元数据管理效率的提升,还是馆藏元数据质量的优化,其目的均在于推动馆藏元数据的开放共享,全面释放馆藏元数据价值。近年来,馆藏元数据开放共享的发展趋势日趋显著,2011年,JISC邀请所有受公共资助的机构,包括大学、学院、图书馆、博物馆和档案馆签署开放元数据计划,从而为研究者、教师和学生构建获取资源的新途径;[8]2014年4月,EBSCO宣布为其开放元数据共享和技术协作政策增加50个数据库,从该政策可看出EBSCO致力于与合作供应商交换元数据、进行技术集成,为双方用户提供更好的发现服务体验。[9]开放知识环境提倡知识的充分流动与激活,一方面,知识存储模式发生了变化,以前相互割裂、相互独立的处于不同空间的信息开始被建立关联和集聚;另一方面,知识消费模式从强调拥有转变为强调使用,知识模式的变革要求信息价值的全面释放和呈现。[10]对图书馆而言,在探索数字化发展道路、建设数字化资源生态系统过程中,应将促进馆藏数字资源间的聚合度和共享度作为发展的首要目标,让各种资源在开放环境中根据一定形式实现共享,以此为基础,关联馆藏资源与社会信息资源,全面推动大数据资源的开发与利用。在推动馆藏数据的流通、共享、复用方面,馆藏元数据工具具备无可比拟的特质和优势,这也是众多机构强调以元数据的开放共享为依托,提高馆藏资源内容访问,促进更广泛再利用的重要原因。开放元数据在充分释放馆藏价值的同时,还能提高馆藏资源的社会影响力及公众认可度,展现图书馆对科研、教学、商业、创新等领域的资源保障和智力支持。
[1]胡小菁.美国数字公共图书馆《元数据应用纲要》为关联数据更新[EB/OL].[2015-10-06]. http://catwizard.net/posts/20150828111341.html.
[2]The British Library.Unlocking the Value,The British Library’s Collection Metadata Strategy[EB/OL].[2015 -10-08].http://www.bl.uk/bibliographic/pdfs/british -library-collection-metadata-strategy-2015-2018.pdf.
[3]大数据治理统一流程参考模型第三步:实施元数据管理[EB/OL].[2015-11-07].http://www.ibm. com/developerworks/cn/data/library/bd-1503bigdatagov ernance3/index.html.
[4]数据仓储与元数据管理[EB/OL].[2015-11-07].http://blog.csdn.net/zjw00417236/article/details/6 120936.
[5]王大青.大数据环境下数字文件元数据战略研究[R].南京:2013年第三届全国情报学博士生学术论坛,2013.
[6]许哲.面向价值发现的学习资源描述方案:以LRMI元数据为例 [J].中国电化教育,2014 (11):59-68.
[7]元数据研究笔记:写在将知天命的时节[EB/OL]. [2015-11-17].http://blog.sina.com.cn/s/blog_4da 824f40101rfqh.html.
[8]JISC.JISC倡导开放所有元数据[J].图书情报工作动态,2011(8):23-24.
[9]本刊讯.EBSCO为其开放元数据共享和技术协作政策增加50个数据库[J].现代图书情报技术,2014(7/8):47.
[10]吴建中.让知识流动起来——在上海宣传系统第二届职工读书节上的发言[EB/OL].[2015-11-06].http://blog.sina.com.cn/s/blog_53586b81010 2vzd4.html.
Interpretation and Enlightenment of Metadata Strategy of British Library's Collection
Lv You
Metadata of library collection has significant meaning to the management,sharing and reuse of library collection.The British Library's collection metadata strategy report contains strategic version,challenges,fit,principle,priorities,and implementation,which puts emphasis on the open and sharing of collection metadata,and comes up with the idea of connection collection resource with social resources to unlocking the full value of collection and collection metadata,The interpretation of metadata strategy of British Library is of great engagement for domestic libraries in big data strategy and collection resource ecosystem construction.
Collection Metadata;Strategy;Collection Resource Ecosystem
G259.561.25
B
1005-8214(2016)07-0056-05
吕游(1982-),女,东北农业大学图书馆馆员,研究方向:文献资源建设。
2015-12-01[责任编辑]徐娜