APP下载

Marc格式向Bibframe的转换研究

2016-05-25魏可

科技视界 2016年12期
关键词:书目

魏可

【摘 要】Marc格式在信息加工中的不足之处日益凸显,渐渐阻碍了现代图书馆的发展,引进美国国会图书馆新的书目记录格式——Bibframe能够解决这一不足。在阐释新记录格式的内涵和优势的基础上,列出其词汇与Marc字段之间的映射表,探索Marc记录向Bibframe的转换方式。

【关键词】Marc;Bibframe;书目;转换研究

【Abstract】The shortage of Marc format in information processing is becoming increasingly prominent, which has hindered the development of the modern library, the introduction of The Library of Congresss new bibliographic record format—Bibframe can solve these problems. Based on the explanation of the meaning and advantage of this new bibliography, list the mapping table between Bibframe vocabulary and Marc field, research the conversion way from Marc to Bibframe.

【Key words】Marc; Bibframe; Bibliography conversion research

0 前言

书目记录格式是构建图书馆知识网络平台的重要组成部分,在揭示馆藏、规范描述方面拥有不可撼动的地位。Marc作为机读编目记录格式的大统一,凭借其数据格式的标准化及细分化优势,广泛应用于各类图书馆的编目工作中。随着网络技术和新媒体技术的日益发展,信息源和信息接收者之间的角色不断转化,文献信息状态更加杂乱无章。在这种形势下,如何把现有封闭繁冗的书目信息转化为能够便捷共享、在万维网中畅通无阻的知识信息,成为编目人员面临的首要问题。促进编目工作顺应网络时代发展,这恰恰不是技术问题,而是数据格式的问题[1]。引进美国国会图书馆的新书目格式——Bibframe,有利于改善现状,推进编目工作的进展。

1 Marc与Bibframe概述

Marc格式源于20世纪70年代,后期根据各国编目界的实际情况改编为一系列UKMARC、USMARC、UNIMARC等标准。它以字段的形式通过详尽准确的著录,对图书馆资源的载体属性和内容属性进行描述,给现代图书馆的书目加工工作提供了极大的便利。

Bibframe(Bibliographic Framework Initiative)即书目框架计划,这个概念由美国国会图书馆经过数年的筹备后,在2012年底正式提出,并后续在官网上公布了其模型、词汇、规格等一系列要素。该网站设想的新书目计划引来了国内第一批学者的学习和研究,如2014年初,刘炜、夏翠娟在“书目数据格式Bibframe及其应用”一文中介绍了其框架模型、术语词表、用例和需求等内容,论述新书目格式的特点以及应用等方面的问题,为后续研究打开了思路。

1.1 Marc的发展现状

在网络超速发展、数据传输平台已经不再束缚数据以各种形式进行传播的今天,用户对数据描述的扩展性、共享性等需求日益增加,然而Marc自成一家的字段体系需要依赖特定的系统对资源执行著录和检索,不便于通过网上通用的搜索引擎如谷歌、百度进行检索。为了弥补这一缺陷,DC元数据应运而生,它开放性、扩展性好,能够很好的把馆藏书目信息组织为网络搜索引擎可以提取的信息,但由于两者元素内涵和属性结构的差异,至今难以实现统一。同一时期,信息资源描述与检索的标准(RDA)开始酝酿出现,它以英美编目条例第二版(AACR2)为基础,更新了信息资源的著录标准和著录内容,成为Bibframe内容框架的重要参考,为Marc升级为下一代书目格式奠定了基础。

1.2 Bibframe的内涵和优势

国会图书馆将Bibframe描述的对象和属性分为四类:创造性的作品(Creative Work)、实例(Instance)、规范(Authority)、注释(Annotation)。

1)作品是编目工作在概念上的统称,它作为抽象的概念不指向某个单一或者具体的实物,而是基于网络上的控制点来描述其与编目过程中的各种实例间的相互关系。

2)实例以物理的或者数字化的形式存在于作品的工作过程中,或者以网络控制点的形式存在,如一段程序代码,用来物化知识信息以及表达上下文关系,每个实例仅仅对应一个作品。

3)规范反映编目工作中编目人员与作品内部之间的关系,辅助构建导航和介绍作品相关背景信息。

4)注释允许图书馆对有关作品和实例进行更加透彻深入的本地化描述,这些被描述的作品和实例包括重组数据、本地化专业注释、使用中的数据、访问策略等。

在处理编目数据时,Bibframe的优势表现为以下几个方面:数据模型与配套的软硬件服务密切关联,允许编目间的共享程度上升到细粒度的级别;任何一个地方的编目员执行的任何更新编目数据的操作都能够自动触发和该条数据相关的更新[3];编目员可以随时随地的对第三方数据进行批注,把专家参与和自动生成的数据区分开,进而满足了用户对图书馆信息的潜在需求等等。Bibframe书目格式发扬了Marc的优点,融合了DC元数据的开放性,继承了RDA的内容形式,使之既能适应传统文献,又适应数字化资源以及万维网上的海量信息资源。

2 Bibframe词汇与Marc字段映射表

转换研究需要基于元素间的映射研究,依据新旧书目格式各自词汇和字段所指的具体内容,列出Bibframe词汇类、子类以及这些类和子类的属性,并将所指内容相同的Marc字段列于其后,构成新词汇与旧字段之间的映射表。

首先,在基本结构方面,Marc所有的机读目录几乎都是在ISO2709的基础上制定的,它们的基本结构大同小异,每条记录均由记录头标、地址目次区、数据字段区和一个记录分隔符组成,负责将复杂多样的数据以形式化的结构得以表现[4];Bibframe模型架构描述了包含作品、实例、规范、注释4个核心类及其它相关类,这些类目在一起构成了Bibframe的基本框架。其次,在字段词汇方面,Marc数据存在于若干个数据字段区中,在每个区域下列出字段及子字段;Bibframe框架中含有包括4个核心类在内的52个类,共247个属性。参照CNMARC机读目录的字段,与Bibframe词汇的部分映射关系如表1。

3 Marc向Bibframe转换方式

Bibframe的词汇公布以后,下一阶段便是如何通过技术手段加以实现。Marc风靡图书馆编目领域的几十年,应用于多种图书管理软件系统中,如汇文系统、妙思系统、ilas系统等。基于这种普及性现状,新的操作软件不仅仅要完整的展现新书目格式的所有要素,而且需承担起新旧记录间转换的使命,预留专用转换接口,扮演Marc数据向Bibframe数据转换的重要角色,相关的转换思路如下。

3.1 利用中间变量转换

设置好两者数据库的中间变量,Marc数据流通过一系列中间变量的算法,自动转化为目标数据流。这种方法思路简单,时间响应迅速,不足之处是一一对应关系性不强,两种格式对于同一种载体特征的描述,分别运用了多种词汇;此外,图书馆著录Marc数据鲜有针对所有字段加以描述,而只描述了一些重要的字段,使得Bibframe中与Marc对应的词汇无法从Marc中自动读取,反之,某些字段在Bibframe中找不到相对应的词汇。例如,在表1中,作品大类包含的14个属性,未必能从Marc字段中逐一读取;再如Marc中的092订购号、675国际十进制分类号、802ISBD等字段难以与相应的Bibframe词汇对应;两者针对同一内容的描述分别使用了多个词汇和字段等等。这些数据之间复杂的关联关系可以分为3种:一对一关联关系、一对多关联关系、多对多关联关系[5],理清这些关系有助于构建满足具体需求的转换方案。

3.2 利用组件转换

数据库组件是对数据、方法的简单封装包,在客户端应用程序中,一个转换组件封装了一个SQL语句,该语句负责转换指定数据库表中的数据并输出,因而只需要输入转换指令对数据库表进行访问即可。利用组件的转换方式需要双方的数据格式相同,若有不同,还需对数据格式实行预处理,如搭建一个标准格式平台,将两种不同的数据依照同一种格式录入后,再分别导出在原库中,并用字串做标记,待需要转换时通过访问相对应的字串即可实现转换。这种转换方式可以简单表述为两种不同格式的类借用同一种标准格式类,这种方法能够在一定程度上减免利用中间变量转换时处理多重关联关系的不便。

无论是利用中间变量还是组件皆有两种途径,即在旧的系统中增加新的书目格式转换接口进行转换,或者在新的系统中导入Marc数据进行转换,两者皆是通过对系统文件的写入、配置来实现的。Bibframe书目格式文件由一组“资源模块”定义,其中每一个“资源模块”再由属性模块进一步定义。网站在Bibframe的配置文件页面中,对简单编辑界面下的默认文件给出了一系列编码例句,国会图书馆也给出了Marc数据转化为Bibframe书目数据的编码文件实例[6]。

4 结语

选择一种编目系统投入使用后要在图书馆里发挥作用数年甚至几十年,其优劣点所产生的影响是深刻而久远的,因而模型设计和内容规划对新书目格式而言极为重要。Bibframe书目格式是Marc发展的趋势,它补充了Marc标引对象及属性的不足,尤其增强了与因特网的互联性,真正将图书馆的资源开放到馆外的无限空间中。实现新旧书目记录格式的转换,需要图书馆员和软件人员充分沟通,从信息的本质属性出发,巧妙的运用现代信息环境下的各种编程工具,不断的摸索和实践,逐渐形成传统的Marc记录与Bibframe的转换雏形。相信在不远的将来,Marc记录格式将会翻开崭新的一页。

【参考文献】

[1]刘炜,夏翠娟.书目数据新格式BIBFRAME及其应用[J].大学图书馆学报,2014(1):5-13.

[2]Library of congress. Bibliographic Framework as a Web of Data: Linked Data Model and Supporting Services. http://www.loc.gov/bibframe/pdf/marcld-report-11-21-2012.pdf.2013-09-13[OL].

[3]Overview of the BIBFRAME Model.http://www.loc.gov/bibframe/docs/model.html[OL].2012-11-21.

[4]孙更新.文献信息编目[M].武汉:武汉大学出版社,2006:290.

[5]覃嗣凤,顾平,张超.基于元模型的HBase数据模型转换方法[J].计算机与现代化,2015(08):32-37.

[6]Kevin Ford.LCS Bibliographic Framework Initiative:An Update[Z].

[责任编辑:王楠]

猜你喜欢

书目
竞赛书目推荐
竞赛书目推荐
竞赛书目推荐
推荐书目《初春之城》
竞赛书目推荐
竞赛书目推荐
竞赛书目推荐
竞赛书目推荐
本刊邮购书目
《全国新书目》2009年1月荐书榜