BIBFRAME2.0 的模型特点及其未来应用场景展望
2022-08-12蒋蓓蓓
杨 静 杨 峥 蒋蓓蓓
(金陵图书馆 江苏南京 210019)
BIBFRAME是由美国国会图书馆(Library of Congress,LC)联合Zepheira公司于2011年发起的“书目框架先导计划”,旨在开发一种替代MARC的书目数据格式[1]。BIBFRAME继承了FRBR的思想,通过描述实体、属性、实体间的层级关系来构建模型,用来增强书目信息在Web环境中的发现。
1 BIBFRAME2.0 模型的层级结构
2013年1月BIBFRAME1.0模型发布,提供了具体的元数据方案,并联合德国国家图书馆、大英图书馆及联机计算机图书馆中心(Online Computer Library Center,OCLC)等机构进行了大量的测试和开发,后于2016年1月发布了BIBRRAME2.0,版本发布后吸引了更多国家申请加入测试。目前其官网发布了BIBFRAME2.0与MARC21之间相互转换工具、转换规范、BIBFRAME编辑器、BIBFRAME2.0词表等。
BIBFRAME2.0书目框架模型(见图1)与之前的1.0版本最大的区别就是取消Authority(规范)和Annotation(注释)两个核心级别,新增Item(单件),即将所要描述的信息简化为三个核心级别:Work(作品)、Instance(实例)和Item(单件),三者共同构成了BIBFRAME2.0的三个层次,分别是Work(作品)代表的内容层次,Instance(实例)代表的载体层次,和Item(单件)代表的单件层次,再通过定义相关的类、属性、关系来对文献资源进行富含语义的关系揭示[2]。
图1 BIBFRAME2.0 书目框架模型
其中Work(作品)描述的是不同名称以及不同表达方式的同一作品,是一个抽象的集合,具有subject(主题)、agent(代理)、event(事件)等属性;Instance(实例)描述的是载体层次,是Work(作品)的具体化表现,因为一个作品很可能包括很多实例,可能是电子版,也可能是印刷本,所以具有format(格式)和publisher(出版者)等属性;Item(单件)通常理解为图书馆馆藏信息的描述,如借阅状态、副本信息等,该信息可以帮助用户直接获得所需资源,具有held by(持有者)和barcode(条形码)等属性。
BIBFRAME模型基于关联数据技术,注重描述实体之间、实体属性之间的关系。如模型中Work(作品)、Instance(实例)和Item(单件)三个核心级别之间存在“has(有)”的关系,Work(作品)“有”Instance(实例),Instance(实例)“有”Item(单件)。还利用统一资源标识符(Uniform Resource Identifier,URI)来标识“作品”“实例”“单件”及其属性,使书目数据实现在互联网上的发布和共享。
2 BIBFRAME2.0 的特点
2.1 继承MARC 的优点,且可以相互转化
虽然BIBFRAME诞生的目标就是为了取代MARC,但在目前还未开发完全的情况下,仍保持着与MARC的相互兼容,它继承了MARC的语义性和一致性。美国国会图书馆在BIBFRAME官网上发布了BIBFRAME到MARC21的双向转换工具,并规定了转换规范和转换程序[3]。
2.2 将书目数据分为抽象层次和具象层次
在BIBFRAME2.0模型中,Work(作品)层次集合的是抽象的内容,包含不同题名、不同语种或者不同表现形态的同一作品,具有subject(主题)、agent(代理)、event(事件)等属性。Instance(实例)层次则描述的Work(作品)的具象内容,具有fomart(格式)和publisher(出版者)等属性。Work(作品)和Instance(实例)之间是1对n的关系[4],因为同一件作品可能包含多个实例,举例来说,《不能说的秘密》这部作品在BIBFRAME2.0层级中属于一个抽象内容,因为它可以对应电影《不能说的秘密》、话剧《不能说的秘密》、电子书《不能说的秘密》、印刷本小说《不能说的秘密》等多个实例,于是每个实例又对应着不同的格式和出版者等属性。将抽象层次和具象层次分开描述,同时给抽象和具象的内容及其属性都赋予URI,可以更准确地展示它们之间的关系,从而提高检索的准确性和全面性。
2.3 资源描述范围和适用范围更加广泛
虽然BIBFRAME的名称叫书目框架模型,但其目标远不止对于书目数据的描述,还包括地图、数据集、静态图像、动态图像、音频、乐谱、舞谱、物体、多媒体、混合资料等多种形式的资源[5]。在各国的应用测试过程中,BIBFRAME官方也提供多种元数据映射方案,如MODS(元数据对象描述模型)、EAD(编码档案描述模型)、Pica+(荷兰图书馆自动化中心,一种元数据格式)、DCMI(都柏林核心集)等,因此,BIBFRAME的适用范围并不仅限于图书馆,还包括档案馆、博物馆等机构。
2.4 遵循关联数据四原则来描述书目信息
关联数据四原则是万维网的发明者蒂姆·伯纳斯·李(Tim Berners Lee)于2006年提出的关于建立数据之间链接的四个原则,即给所有事物赋予一个URI;用HTTP URI来标识资源,使数据资源能够在网络环境下通过HTTP协议访问获取;访问HTTP URI标识的资源时,可以根据标识的URI发现更有意义的相关资源;提供相关的URI链接,以便用户可以发现更多的关联对象[6]。在BIBFRAME2.0模型的设计中,也遵循了关联数据四原则的内涵,即不论在哪一个层级,不论是抽象还是具体的内容,或是其各种属性,都有一个HTTP URI来标识;BIBFRAME采用RDF(Resource Description Framework,资源描述框架)的编码方式,当有人查询一个URI时,使用标准的RDF提供与当前资源相关的其他有用信息;当发布书目数据时,与更多相关资源的HTTP URI建立语义链接,提高用户发现、获取和使用网络中潜在的相关信息资源的能力。
3 BIBFRAME 未来应用场景分析
2013年8月BIBFRAME官方发布了一份《BIBFRAME使用案例与需求》讨论稿,里面提出了BIBFRAME的15个应用场景[7],这些应用场景不仅面向图书馆工作人员,也面向读者,甚至是面向图书馆以外的机构使用。以下将整合选取其中8个方面的内容试做分析,展示基于关联技术的BIBFRAME是如何揭示书目信息,简化编目工作,并且使书目信息随着网络发挥前所未有的价值,使未来社会知识活动中的不同角色都能够从书目信息中获得支持和服务成为可能。
需要指出的是,BIBFRAME采用SPARQL语言作为查询语言,即SPARQL Protocol and RDF Query Language的缩写,专门用于访问和操作RDF数据。W3C的RDF数据存取小组(RDF Data Access Working Group, RDAWG)对其进行了标准化。在2008年,SPARQL1.0成为W3C官方所推荐的标准,2013年发布了SPARQL1.1[8]。
3.1 查找我附近的书
BIBFRAME可以根据客户端的地理信息方便地为用户提供SoLoMo(社交本地移动)服务。例如,当读者需要查找附近30英里以内的一本书,就可以用SPARQL语句实现:
SELECT ?work ?inst ?lib
WHERE {
?work bf:title "PhantomTollbooth"
?inst bf:instanceOf ?work
?holdings bf:holds ?inst
?holdings bf:heldBy ?lib
?lib gs:nearby(40.1583 83.0742 30) .
}
用户输入作品题名(bf:title "PhantomTollbooth"),查找条件为该作品的某些实例(bf:inst a nceO f?work),通过用户查询的设备定位坐标(40.1583 83.0742 30),查找出符合距离条件的图书馆馆藏(?holdings bf:heldBy ?lib)。其实这种SoLoMo服务早已根植于各类互联网应用中了,是一种基于本地的移动社交概念,如大众点评APP中,用户可以根据某一位置查找附近某一距离内的餐饮、景点、住宿、休闲等服务,并可以按照距离、评价等顺序排列。同样,BIBFRAME书目框架模型也可以根据客户端的地理信息方便地为用户提供SoLoMo服务,甚至设想可以加入距离内实体书店、档案馆、博物馆的关联数据搜索结果,只要他们同样采用BIBFRAME对书目、档案、藏品进行编目,由此可以增加用户发现资源、获取资源的途径。
3.2 资源自适应当前设备
用户在查找图书馆馆藏的某件作品时,BIBFRAME会优先显示适应当前设备的实例类型,如手机端、平板端就会推荐电子资源。用SPARQL语句实现如下:
SELECT ?work ?inst ?lib
WHERE {
?work bf:title "Fahrenheit451"
?work bf:hasInstanceOf ?inst
?inst rdf:type bf:Ebook
?inst bf:fomat
}
当读者需要找一本Fahrenheit451的书时,BIBFRAME根据当前设备的情况优先显示Ebook资源种类,于是显示了一本来源于idpf网站上epub格式的电子资源实例。
3.3 扩大作品检索范围
目前,国内外的图书馆几乎采用的都是MARC格式的编目格式,其检索方式一般为:用户查询某作品,须先进入图书馆OPAC检索平台,根据所选择的题名、责任者、主题词等检索点,才能检索出与MARC字段相对应的结果,在检索结果页面可以获得该作者在本OPAC系统上的其他作品链接,国内用户可获得豆瓣、当当、谷歌读书等网络社区关于本作品讨论、书评、购买的链接。而BIBFRAME以数据关联技术为基础,以URI来标识“作品”或者其“主题”“代理”“事件”等属性,采用RDF数据建模,能够使书目数据易于被万维网识别和处理,扩大检索范围,提高检索结果的质量。
3.4 检索结果更具开放性
BIBFRAME的设计比一般的书目格式更具开放性,不仅在图书馆领域,在档案馆、博物馆等机构同样适用,因为它可以描述文本、地图、数据集、静态图像、动态图像、音频、乐谱、舞谱、物体、多媒体、混合资料共11种资源类型,其对某一资源的检索结果可以是全方位、多元化的立体属性。同时为MARC、MODS、RDA、FRBR等多种元数据提供映射方案,为BIBFRAME连接世界打开了一扇窗户[9]。
可以设想当用户检索某一历史人物时,不仅可以检索到有关该历史人物在图书馆里的单一文本形式的文献资源,还可以获得图书馆外的资源,例如博物馆里与该人物关联的历史事件、考古挖掘、出土文物,档案馆里与该人物关联的手稿、作品、档案,甚至是视频网站上与该人物关联的影视作品等全方位的检索结果。这类似于维基百科的词条,可以通过链接自由跳转到我们感兴趣的对象或者内容上去。
3.5 简化编目工作
BIBFRAME另一方面也简化了编目人员的工作流程。如果编目人员获得一件作品,是The Shadow Club的电子资源,作者是Neal Shusterman,需要将其添加至本地图书馆,那么编目人员只要在图书馆联合编目系统中搜索到关于该作者的所有电子资源,将符合条件的实例拷贝到本地,赋予一个本地URI并添加它与本地作品的关系,同时为该实例添加item(单件),即馆藏信息URI。
3.6 让编目系统四通八达
当一件作品原作用A语种出版后,可能会被翻译成B语种、C语种、D语种……全球发行,那么在书目信息中就需要经常更新信息,在BIBFRAME中,作品Work是以HTTP URI来标识的,具有唯一性和共享性,全球各地的图书馆员都可以通过互联网,引用该作品的书目信息。当有新的语种信息产生时,只需要通过触发器(Trigger),向原作品拥有者发出通知[10],例如作者Kurt Vonnegut的作品Bluebread被翻译成了印地语,那么印度的图书馆员便会操作如下:
(1)在网络上的BIBFRAME规范控制服务中查询该作品的原作者。
…
bf:title”Bluebread”
(2)拷贝该作品书目信息到本地,赋予一个本地的URI,编辑添加本地语种信息。
a bf:Monograph;
bf:title”Barbablu”;
bf:author< http://bibframe.org/auth/people/kurt_vonnegut>;
bf:translator
3.7 “采”“编”协作
BIBFRAME中图书馆采访人员在文献采购阶段就可以率先开始部分编目工作了。由于采购人员在流程一开始就已经知道了采访对象的基本信息,所以可以先行在采购目录中添加“Work”(作品)、“Instance”(实例)、“Item”(单件)等部分信息,读者在查询时也可以看到某作品或实例处于“on order”(已订购)的状态。当编目人员正式开始编目时,会发现联合编目系统中已经有新采购资源的部分书目信息,这就是前期采访人员所添加的,此时,编目人员只需接受更新,便会大大减少后期编目工作量。
(1)采访人员在联机编目系统中查找采购订单上的作品和实例。
在编目人员拿到具体实例之后就可以继续添加馆藏地(bf:physicalLocation)、分类号(bf:shelfMarkCLC)等单件信息。
3.8 对同一作者的多个笔名,创建owl:sameAs 等同关系
在MARC编目中,编目信息之间缺乏关联,无法识别用户语义检索的需求。如在某图书馆的OPAC检索系统中,责任者输入“冰心”,可以检索到368条记录,而输入“谢婉莹”则仅搜到2条记录,且不是同一个人。而在BIBFRAME中,可以利用关联数据中owl:sameAs在不同规范实体间建立等同关系。
这样,当读者检索谢婉莹时,也能检索到冰心的作品。
4 结语
BIBFRAME的问世,表明了图书馆界也在积极顺应技术进步和社会需求,利用关联技术深度揭示书目信息所蕴含的知识,挖掘书目信息的价值,使其不再“藏于深闺”。这不仅是对图书馆内部的采访、编目、参考咨询等业务在工作流程上的全方位的革新,更是对图书馆人工作、服务理念的转变,图书馆人要着眼于服务知识生产、传播、消费等全生态链条,使知识生产、文化交流中的不同角色都能够在图书馆得到供需适配的支持和服务。
BIBFRAME在美国国会图书馆、Zepheira公司、联机计算机图书馆中心以及高校图书馆的共同合作下持续完善。在2021年冬季召开的年会上,美国国会图书馆宣布BIBFRAME 100计划的目标调整为“成功达成80%—90%的编目员使用BIBFRAME编目”。从新生事物的演化规律来看,一项事物一旦突破了关键技术的制约,就会迅速和蓬勃的发展,BIBFRAME具有远超MACR的诸多优势和广阔前景。目前我国仅有上海图书馆的家谱知识平台,以关联数据技术为基础,设计了BIBFRAME家谱本体,以及华东师范大学的数字方志集成平台基于BIBFRAME2.0等词表构建数字方志知识库本体模型,并正式上线服务。所以,我国图书情报界必须尽快达成共识,抢抓机遇、乘势而上,积极开展相关研究和国际交流,为我国“智慧图书馆”乃至“智慧社会”建设作出更大贡献。