对数字出版环境下图书馆拓展编目对象的探讨
2014-08-08苗青
作者简介:苗青(1980-),女,馆员,硕士,研究方向:文献资源建设,发表论文2篇。·业务研究·
〔摘要〕从传统的印刷品到电子图书以及随处可见的网络资源,各种信息正以排山倒海之势闯入我们的生活,本文通过对数字复合出版环境下自动编目情况的简要概述,试图分析这一新环境对图书馆编目工作的影响,进而提出对图书馆在新环境下扩展编目对象的思考。
〔关键词〕数字复合出版;自动编目;网络资源的组织;藏品揭示;编目
DOI:10.3969/j.issn.1008-0821.2014.03.029
〔中图分类号〕G25434〔文献标识码〕A〔文章编号〕1008-0821(2014)03-0135-04
Discussion on the Library Develops Cataloging
Objects in Digital Publishing EnvironmentMiao Qing
(Shanghai Library,Shanghai 200031,China)
〔Abstract〕From the traditional print to electronic books and ubiquitous network resources,all kinds of information with the avalanche of power into our life.In the article,through a brief overview of the automatic cataloging in digital composite publishing environment,trying to analyze the impaction on library cataloguing work,and then thinking of expanding cataloging objects in the new environment.
〔Keywords〕digital composite publishing;automatic cataloging;network resources organization;collection revealing;cataloging
2008年4月,国家数字复合出版系统工程在多方努力下正式启动。该工程的推出将在很大程度上增加数字文献的馆藏比例,减少了图书馆文献资源的电子化成本以及对版权问题的过分担心。但与此同时,我们也要看到,基于自动编目基础上的数字复合出版系统工程,在为图书馆界提供机遇的同时,也带来了一定的挑战。本文试图从编目对象的角度对这一问题进行分析和探讨。
1数字复合出版系统及其对图书馆编目工作的影响
11数字复合出版和自动编目的概况
数字复合出版系统工程是在对ECIP和自动编目的研究过程中扩展诞生的,是新闻出版总署在数字出版方面的第1号工程,以实现一种信息多种传播,信息处理、出版发行能够在一个系统里完成。如图1:
图1数字复合出版系统〖〗
自动编目从根本上改变了编目模式,变图书馆的“描述性编目”为出版社的“标识性编目”,即在图书印前电子文本上进行编目处理。具体操作是对其中的属性数据进行标识,而不是描述[1]。从源头规范了数据生产,改变了信息生产的无序状态,有利于文献信息资源的有序整合。文献编目工作也不再由图书馆的采编部门来完成,而是前移至上游出版社在文献产生的过程中自动生成。
12数字复合出版对图书馆编目工作的影响
网络化的今天,当人们的阅读方式正发生着悄然变化的时候,图书馆仍然在从事着以纸本文献为主的编目工作,而这一工作也即将面临数字出版的冲击:
(1)文献产生过程中的自动编目替代了文献产生后依据文献实体的客观性著录;
(2)针对“描述性编目”的理论不再适用,自动编目需要提出一套自己的编目理论,而这一理论是否适合图书馆对文献的组织要求我们尚不明确;
(3)图书馆的编目工作将逐渐淡出或消失,随之一同流失的是编目工作人员对文献的组织能力和经验。
此外,信息技术的发展、Web20技术的产生、读者阅读习惯的变化、各种手持阅读器、移动阅读的兴起,都让我们在面对信息资源如此庞大的社会有些不知所措。而数字复合出版系统作为出版系统而言处理的只是已经或即将正式出版的文献著作,面对各种复杂的信息还无法做到全面整合和揭示。因此,从图书馆界出发,在面临传统文献编目工作前移至出版社的情况下,我们是否可以考虑扩大编目对象,将随处可见的网络资源纳入我们编目(或者说组织)的范围内。这样不但能加强图书馆编目工作者对各种信息的组织能力,也可以满足用户对信息有效使用的需求。
2图书馆编目对象的拓展
随着社会进步和读者个性化的发展,传统图书馆已从对文献的加工发展为对信息的组织,进而争取达到知识管理的层次。从文献的分类编目到信息组织再到信息资源管理,就是一个对传统分类编目工作不断扩大、更新与升级的过程[2]。
21对网络信息资源的获取和组织
在今天科技水平日新月异、个性不断张扬的世界中,各种网络信息资源呈几何倍数增长,与此同时,伴随着网络信息资源动态变化性的特点,网络新闻、电子邮件、博客等各种类型的网络信息资源瞬间产生也瞬间消失,因此也提出了对网络信息资源选取、序化的问题。
211网络信息资源的获取
在解决网络资源选取问题上,各种搜索引擎应运而生,如传统的通用搜索引擎Yahoo!、Google、百度等。但基于传统搜索引擎无法搜索到深层网络(Deep Web)信息的原因,深层网络爬虫技术逐渐兴起并在实践中得到大量应用,取得一定成效[3]。所谓网络爬虫,又称网络机器人。英文名有Spider、Crawler、Bots、Robot、Wanderer等,是一个自动提取网页的程序,是搜索引擎的重要组成部分[4]。网络爬虫能够自动获取使用者所需资源,使用起来相对容易。相比之下,对网络信息资源的组织序化则是目前我们需要研究的重点问题。
212网络信息资源的组织序化
网络有着如此丰富的“馆藏”资源,因此必须建立一个通用的、合理的、规范的网络信息资源著录规则,这就要求在信息加工过程中引入编目理念,深化对网络信息资源的组织。对网络信息资源的组织是指采用一定的方法与模式,按照一定的原则将因特网上某一领域大量的、分散的、杂乱无章的、良莠不齐的信息通过搜索、评价、筛选、分析、标引、著录、排序等手段加工处理,使其形成一个有序的、便于用户获取与利用的信息系统的过程[5]。
在对网络资源组织方法的研究上,谷丽萍提出用传统文献组织方法组织网络资源,即使用元数据为网络信息资源著录提供最基本的著录项;将分类法思想引入网络信息服务系统中;将主题词引入搜索引擎中作为查找的关键词等[6]。目前,越来越多的学者将注意力转移到利用元数据对网络资源乃至其他不同载体形式的信息资源进行描述和组织方面。从20世纪90年代至今,世界各国就已先后制定出数十种具有一定影响的描述性元数据,根据其用途不同、对象不同、行业不同又可划分为不同的类型。万变不离其宗,王松林老师在其《信息组织与编目规则》中提到:“无论是今天的信息组织还是以往的文献编目,它们的信息组织在组织机制上是一致的”[7]。从另一角度来说,无论是利用传统的MARC格式还是现代不同种类的元数据,我们对各种载体的信息进行描述、揭示、组织的目的是相同的,即实现图书馆这一人类文化遗产保存机构的收集信息、组织信息和传递信息的职能。
endprint
虽然早在21世纪初一些专家学者就已经开始了对网络资源组织的研究,但笔者通过对维普中文期刊全文数据库1989-2009年的数据进行检索,检索格式采用布尔逻辑运算符“and”,关键词为“网络资源”和“组织”,检索到相关文献只有181篇。可见,图书馆界对网络资源组织的研究还处于初级阶段,实践应用不足,我们应将数字出版对图书馆编目工作的冲击和挑战转化为图书馆界扩大编目对象、深化信息组织的动力。
22对珍贵稀有藏品的揭示
2008年美国国会图书馆出具的《书目控制的未来报告》中曾建议“将稀有和仅有资料的发现工作作为优先考虑的工作。优化稀有和仅有资料的编目工作,重视更广的覆盖范围和更多资料的存取,而不是全面揭示一些资料而对其他资料不予揭示。建立可行的和灵活的编目实践,反映用户的需求和有限资源的现实。共享这部分资料的元数据。”[8]随后,世界各国对图书馆、博物馆和档案馆三馆合作方面的研究和实践逐渐兴起。2009年IFLA大会也将教育与培训专业组的征文主题定为“图书馆及文化机构专业人员在文化遗产领域发挥的作用:为图书馆、档案馆、博物馆(ALM)整合而教育”[9]。由此可见,图书馆、博物馆和档案馆的合作是近两年来图书馆界的一个热点问题。同时,也为我们扩展编目对象提供了一个新的可能性。
221博物馆和档案馆对数字化的需求
博物馆、图书馆和档案馆三馆作为国家的科学文化事业机构,担负着收藏、保管人类文化遗产、提供信息服务的重任,这一共同的使命也让三馆合作建设成为可能。
但相比图书馆文献的数字化比例及其开放程度,博物馆和档案馆由于其藏品和文献的珍贵性及保密性等一些其他原因,对数字信息资源的建设和开放存取的程度不能令用户满意。据国家档案局网站统计,我国2007年开放档案比2006年同比增长181%,到2008年1月1日,我国各级各类馆藏档案开放率已达1/3,虽已取得显著进步,但30%的开放率仍不能满足用户需求[10]。
而蓬勃发展的数字图书馆运动无疑反映了将图书馆、档案馆、博物馆馆藏资源联合起来互为补充的思想,举两个例子:美国加利福尼亚在线档案馆(OAC,Online Archive of California)[11]和欧洲数字图书馆、博物馆和档案馆[12]。这些项目的进行使得用户能够直接获取三馆的数字化资源,但是获取这些数字化资源的前提是对在线数字化资源进行组织描述。而对三馆馆藏描述的互操作性、检索点的一致性是目前三馆面临的主要挑战。
2223馆合作的出发点
目前,图书馆、博物馆和档案馆面临着同样的问题,即力求馆藏资源为用户所知、为用户获取,甚至是通过联合资源发现的方式来达到这个目的。与此同时,“纯粹的”馆藏——也就是,完全由图书构成的馆藏,或者全部是艺术品的馆藏——正变得越来越罕见。即使一所小型图书馆也能够采购一笔丰富的馆藏,包括替代图书的视频资料、艺术品、物质文化产品、或自然历史的遗迹样本。为了满足用户对于一站式信息检索的需求,文化机构必须做好准备,明智地采用各种类型的元数据标准,并且找到办法,将不同的数据元素、常规的描述方法融合为一个和谐的整体。因此,相对于著录标准的统一而言,三馆对检索点描述和规范记录方面的协调才是合作能够持续并推进的一个很重要的因素。
3在扩展编目对象时可能存在的问题
对图书馆而言,扩展编目对象并不简单意味着转变馆藏资源建设政策,只是在图书馆面临传统编目工作流失的背景下,为图书馆的编目工作寻找新的发展契机。因此,我们在对网络信息资源和档案馆、博物馆馆藏资源进行分析下,综合目前国内外的信息资源组织情况,对实际操作中将会存在的问题进行简单说明。
31网络资源内容的选取
虽然我们可以利用深层网络爬虫对所需资源进行搜寻,但具体在要获取哪些资源的问题上还需要结合本馆的特点和馆藏资源的建设方向进行综合分析,例如,对某一领域内专家博客的收藏、对涉及某一内容的相关新闻的选择等,这些都需要图书馆的采访人员能够在新环境下对读者的阅读习惯进行深层认知和分析:哪些信息读者喜欢从印刷型的文献上获取;哪些信息读者喜欢从网络上获取等。并据此来确定图书馆网络信息资源建设的方向和重点。
32统一标准的问题
单从图书馆领域来说,对文献著录标准的规范控制就是编目界一直在探讨的问题。在图书馆与博物馆、档案馆开展合作的过程中,该问题更是亟待解决和研究的重点。
(1)一些已开展的试验性合作项目表明,合作中首先要明确的是各馆在著录方面的分歧,例如,艺术名信息中采用的是词首字母大写方式,而英美编目条例规定句首字母大写。虽然,我们并不一定要求对这些著录规则进行统一,但作为编目工作者来说要对这些差异有所认识。
(2)上文强调过的对检索点的描述和规范记录的统一问题。三馆合作的目的之一便是能够通过一个平台将博物馆的珍贵藏品、档案馆的档案资料和图书馆有关的文献资源整合起来,方便用户对信息资源的检索和使用。因此,在数字图书馆发展迅速和三馆检索入口统一的背景下,通用标准的使用对各种文化遗产机构来说很有必要。
33深化对元数据的研究和应用问题
元数据在很多情况下被视为20世纪末、21世纪初编目的同义词。伴随着各种载体文献的出现,元数据在对资源描述和揭示方面的重要性日渐凸显。若按对象分类,描述性元数据具体可分为描述数字文献的元数据、描述数字图像的元数据、描述博物馆藏品的元数据和描述特殊资源的元数据等。 描述性元数据的特点是“跨行业”,这体现在所形成的记录上,每条记录都是在对采用的数据值和数据内容标准精心思考后得以完成的。
目前,元数据编制的一个新趋势是将描述(即“编目”)视为一个合作、扩充的过程,而不是一个仅仅独立在一家机构的单独一个部门开展的活动。在数字资源时代,元数据编制在很多情况下能够而且的确应该是一项合作开展的工作,也因此需要我们对其进行更加深入的研究和开发。
34加强编目员对相关知识的学习问题
近年来,编目员面临一种挑战,需要描述不断变化中的资源——像是一直变化中的网络资源,或是定期更新的在线出版物。针对这些类型资源的元数据记录会时常更新以反映其最新版本。与传统的对某一专著文献的描述反映一成不变的情况不同,21世纪的编目员不再是简单的信息著录员,他要有能力使元数据编制成为一种行之有效的工具,要对各种标准的精心研究、整合利用,将文献编目工作延伸到各行各业、各个领域和环节上。
4结束语
在网络化的今天,图书馆面临的编目对象已不再仅仅局限于印刷型文献和电子图书方面,图书馆、博物馆、档案馆的试验性合作已经开展,对信息资源的揭示已深入到实体藏品层面。而对网络资源和实体藏品的信息组织则是数字复合出版系统所不可及的。因此,如何保持图书馆编目工作不流失则成为今后我们需要关注的重点。
参考文献
[1]陈源蒸.论“标识性编目”[J].数字图书馆论坛,2007,(6):36-40.
[2]高红.抓住机遇迎接挑战把我国文献编目工作推向深入——第一届全国编目工作研讨会大会总结发言[C]∥21世纪的信息资源编目.北京:北京图书馆出版社,2006:8.
[3]曾伟辉,李淼.深层网络爬虫研究综述[J].计算机系统应用,2008,(5):122-125.
[4]刘金红,陆余良.主题网络爬虫研究综述[J].计算机应用研究,2007,24(10):26-29.
[5]谢晓专.网络信息资源组织模式研究[J].图书情报工作,2006,(1):64-67.
[6]谷丽萍.论用传统文献组织方法组织网络资源[J].文献信息论坛,2009,(1):42-43.
[7]王松林.文献编目与编目原则[C]∥21世纪的信息资源编目.北京:北京图书馆出版社,2006:1-7.
[8]美国国会图书馆书目控制的未来报告[EB/OL].http:∥www.1oc.gov/bibli0graphic-future/news/draf-report.html,2007-11-30.
[9]2009年国际图联大会将在意大利米兰召开[EB/OL].http:∥www.tedala.gov.cn/cmsfile/2009-3-5/1236217128951.htm,2014-01-15.
[10]陆懿琦.档案馆与图书馆信息资源服务比较研究[J].兰台世界,2009,(2):10-11.
[11]美国加利福尼亚在线档案馆[EB/OL].http:∥www.oac.cdlib.org/,2014-01-15.
[12]欧洲数字图书馆、博物馆和档案馆[EB/OL].http:∥www.europeana.eu/,2014-01-15.
(本文责任编辑:马卓)
endprint