数字时代联合目录的发展方向
2009-09-02李晨英韩明杰
李晨英 韩明杰
摘要对日本唯一的联合目录NACSIS-CAT的发展研究报告作了归纳和概述,从文献、系统与运行机制三个方面分析了面临的问题,认为重视电子资源编目、构建适应各种资源的数据结构和适应多种媒体与信息粒度的系统平台、追求高效共建共享是联合目录的发展方向。
关键词联合目录NACSIS-CAT/ILLCALIS电子资源数据结构共建共享
随着近年来计算机与网络技术发展的进一步加速,图书馆也被卷入急剧变化的服务环境。与联合目录相关的主要变化可以归纳为三个方面,首先是电子资源飞速增长带来的信息粒度变化。信息粒度已经由过去的一本书、一册期刊发展到一个章节、一篇论文。信息粒度的急速细化使描述对象的量急剧膨胀,也使与其构成单位相对应的元数据的编制及其相关信息的链接变得更为重要,致使书目控制更加困难。因此,如何高效地制作和提供高质量的元数据便成为重要课题。其次是搜索引擎功能的不断增强推动了用户获取信息方式的变化。同图书馆资源服务系统的日趋复杂化相比,单一平台、单一界面的搜索引擎实现了不同粒度电子资源之间的动态链接,成为查找和利用信息资源的一种快捷方法。越来越多的用户从“在图书馆查找”变成“从浏览器上获得全部信息”,并且认为在浏览器上“发现信息——确认信息——获得信息——利用信息”应该成为理所当然的信息获取方式。于是,如何使联合目录更加“精致”并贴近用户,与联合目录运营所要求的提高自动化处理程度之间的矛盾日趋尖锐。第三是联合目录成员馆在追求合理化经营的驱动下,对联合目录共建共享效率提出了更高的要求。电子资源的发展推动了图书馆业务的多样化进程,也使图书馆对自身合理化经营的需求变得更加强烈。于是,出现了编目员缩编、编目外包以及参与联合目录共建共享的积极性衰减等现象。因此,进一步促进文献资源共建共享,确保联合目录的可持续发展,仍然是联合目录运行机制的关注重点。
以OCLC为代表的一些联机合作编目中心从不同角度对联合目录发展方向开展了研究,在邻国日本,承担着NACSIS-CAT/ILL运营工作的国立情报学研究所,以研究下一代联合目录系统发展模式为目标,于2007年6月成立了由学科专家、教授和图书馆员组成的“下一代目录工作组”。该工作组于2008年3月发表了题为“关于下一代联合目录服务理想模式研究”的中期报告(以下简称中期报告),随后于同年6月举行了专题研讨会。本文在重点介绍该报告研究结果的同时,结合我国CA—LIS联合目录现状进行简单的比较分析。
1文献:重视电子资源编目,构建新型资源发现体系。
绝大多数联合目录都是以印刷型馆藏为前提构建的系统,不仅无法应对电子资源管理与服务中出现的访问权限控制需求,而且由于受书目数据编制规则及其方法的限制,难于适应越来越细微的电子资源信息粒度描述和服务的需求。这里需要特别关注的是电子期刊。
电子期刊是消耗研究型大学图书馆文献采购经费最多的资源,也是近年来数量增长最快的电子资源。无论是我国的CALIS联合目录还是日本的NACSIS-CAT对电子期刊的揭示与服务功能都相对薄弱。不仅揭示的电子期刊数量少,而且尚未实现与各种期刊目次库、全文库的统一检索和链接功能。此外,对1万多种无偿使用的开放存取期刊也尚待揭示。
电子期刊的购入多以数据包为单位,其目录处理方式与工作流程都不同于印刷型资料;包罗万象的电子资源携带的书目数据也难以利用。尤其是,电子期刊引进后需要立即投入使用,于是图书馆都直接将电子资源链接在图书馆的Web页上向读者提供服务。致使馆藏目录和联合目录都无法实现印刷型资料与电子资源的统一检索。再加上电子资源使用权限的认证等问题,造成了即使是允许馆际互借的电子期刊也难以顺利进行。因此,构建适应多种媒体和信息粒度的文献信息资源发现系统已经成为联合目录发展亟待解决的问题。
目前,无论是中国还是日本,多数图书馆尚未实现对电子资源的统一管理。欧美一些国家的图书馆主要通过电子资源管理系统(ERM:Electronic Re—source Management)对获得许可的第三方的电子资源(数据库、电子期刊、电子书等)进行控制,具有认证管理、更新、合法利用、访问管理以及馆藏建设等功能。据估计,世界上正在使用的ERMS系统有400种以上,ERMS无论作为独立系统,还是图书馆系统的一部分,其本身都不具备制作电子资源书目数据的功能。电子资源的书目数据编制仍然要依靠与联合目录联动的图书馆系统。电子资源的元数据是管理和利用电子资源的基础。商家与图书馆之间的数据交换尚未形成通用标准:商家提供的电子期刊元数据内容与书目数据较之极其简单,并且格式各异。
针对以上现状,“中期报告”指出:下一代系统必须构建既可管理印刷型资料“馆藏”又可控制电子资源“访问权”的“新的资源发现系统(resource discovery system)”。随着开放存取期刊的不断增加,资源价值与是否有偿使用已无关系,系统必须对无偿资源提供与有偿资源同等级的服务。
该报告还提出了构建适应多种媒体和信息粒度的信息资源发现系统模式概念图(图1),希望通过构建电子资源数据银行对各馆本地系统的书目、馆藏、访问控制等信息进行收集(上载或远程收割),实现电子资源与联合目录的一元化检索。
CALIS目前情况与NACSIS-CAT极其相似,除揭示印刷型馆藏的联合目录之外,也有一个电子资源管理系统——西文期刊目次数据库CCC,集目次揭示、全文链接、馆藏揭示比对、原文请求及馆际互借链接功能为一体。但是两个系统互相独立,尚未实现一元化检索。因此,今后CALIS项目建设中有必要对联合目录服务与电子资源服务进行一体化方案设计。
2系统:适应各种资源的数据结构,公开API。
重新审视国际目录标准的动向出现在上世纪六、七十年代,但是到九十年代后期才进入了热烈讨论阶段。其中抢先的是1997年公布的FRBR,给随后其他标准的修订带来了很大影响。IFLA的“国际目录原则”预计2008年完成,ISBD也开始修订。此外,“英美目录规则”的修订工作起始于2002年,目前正在策划制定“Resource Description and Access(RDA)”新名称的规则,预计2009年完成。与此同时,对MARC21格式所进行的新的讨论也开始了。此外,构建“虚拟国际规范文件(VIAF)”、出现MODS等新的元数据Schema,信息组织领域正处于剧烈的变动期。
OPAC功能自从问世以来一直没有取得本质性进步,Google等搜索引擎功能的快速拓展加速了OPAC功能的危机意识,以美国为中心的图书馆开始进行着各种各样的尝试。例如:以整理不同版本
检索/显示的“FRBR化”、以实现显示主题信息列表的多种分面检索结果集合的二次检索的“分面聚类”、真正改善检索结果集排序功能的检索方法等,正处于任何一种功能都有可能成为新一代目录“标准”的阶段。其中,既包含在检索系统中就可以直接解决的问题,也包含需要通过重新考虑数据结构或目录规则才能解决的问题。例如,按照FRBR模式实现的检索和显示的FRBR化,已经对目录规则修订带来了很大的影响,对目前数据结构的重新审视将有可能带来新的大幅度改造。
网络时代要求数据具有充分支持用户发现信息的品质,同时要有高效的业务工作效率。因此,需要系统与外部数据库具有更强的密切衔接性能,以支持同步、高效地进行数据交换。此外,还要强化与图书馆联合体以外数据的交换性能,例如:提高文献生产源书目数据及其相关信息利用效率,补充图书馆书目数据中所缺乏的信息揭示;提高与机构知识库等网络资源管理系统的互操作性;关注与博物馆、档案馆等近缘机构系统的合作等等。
API(Application programming Interface)是Web上程序之间数据或程序的对话技术/规则的集合,也称为Web服务。通过公开Web API,既可以获取其他网站的数据或程序,扩展自身网站的服务范围,也可以使联合目录数据与其他服务进行组合。例如:当前各国都在研究检索结果关联度排序和聚类、用户参与型社会书签、注释与推荐的组合以及类似于Google Book Search与Amazon.com那样与外部系统的链接等。如果联合目录通过公开API,能够提高成员馆书目的附加值,提高用户使用的便利性,那么公开本身就具有很大意义。在此基础上,就会有更多的人认识到联合目录书目数据的价值,从而进一步促进联合目录共建共享积极性和书目数据品质的提高。
综上所述,联合目录系统平台功能拓展应着重考虑以下三点:(1)卡片目录时代确立的书目数据结构基本框架在今天以计算机目录为前提的环境下,今后的功能创新更需关注;(2)由于管理的资源对象已经由以图书为中心扩展到多种媒体,因此数据结构需要适应从打包的数据库到网络信息资源等各种媒体资料;(3)数据结构不能仅仅局限于图书馆联合体内部,还应充分考虑与其他联合体的互操作性。
3运行机制:重构书目编制工作流程,追求共建共享最适化。
2008年1月,LC的工作组在书目控制未来报告“On the Record”中提到:由于机读目录制作的普及,书目记录编制在出版社和图书馆之间出现了重复劳动。随着大学图书馆的经营合理化以及其由应对新的信息资源而出现的业务多样化需求,如何降低书目记录编制的业务负担,提高书目数据库构建中的业务效率已经成为一个重要课题。然而,减轻编目业务工作量不能以牺牲目录质量为代价,于是,充分发挥外部高品质书目记录的作用就被看作是保持联合目录书目品质的有效措施。为此,联合目录有必要针对国家书目制作机构的发展动向,充分研究双方合作的可行性。
NACSIS-CAT以探讨文献出版经销商编制书目数据在联合目录建设中的利用情况为目的,对日本出版商协会书目数据TRCMARC在实际编目中的利用率进行了调查。结果显示,只要文献生产源能够保证提供一定品质的书目数据,就能够大幅度减轻成员馆的原始编目工作量,同时还能够防止因原始编目造成的书目记录重复。
“中期报告”提出:面对NACSIS-CAT数据库品质整体下降的问题(主要原因:1000多家成员馆编制的书目记录质量参差不齐,并且由于成员馆利用联合目录数据库的方法不同,形成大量的重复数据),需要从根本上进行改革,即重新构建以充分利用好外部书目数据、最大限度地降低重复劳动为目标的书目编制工作流程。
为实现在继续维持书目数据品质的基础上进一步提高书目利用效率的目标,“中期报告”提出了NACSIS-CAT今后发展的三个具体设想。(1)指定“书目中心”馆:如果实现“文献生产源编目”可以设想原始编目工作量将会大幅度减少,由承担书目中心功能的几个大学图书馆集中承担书目质量维护工作,并作为图书馆员元数据应用业务能力培养的基地,构建大学图书馆界整体元数据应用技能的培养维持机制。(2)导入激励机制:对于为联合目录共建提供新的书目记录,做出突出贡献的成员馆,要以某种经济方式给予奖励;与此同时,对于仅仅是共享联合目录数据成果的成员馆,则要求以某种等价方式参与共建,形成促进原始编目的新机制。(3)成员馆分级:不要求所有成员馆发挥同样的作用,而是根据规模将成员馆进行分级,以追求更高的运营效率。
日本NACSIS—CAT所提出的上述三个设想,在我国CALIS联合目录中早有类似的具体措施。CA-LIS将成员馆分为8个级别,不同级别成员馆承担的责任与义务有所不同,其中最高级别成员馆承担着上述“书目中心馆”的任务。不过,今后需要探讨进一步调动“书目中心馆”的积极性和挖掘这些成员馆潜力的措施。CALIS联合目录对原始编目数据的奖励机制一直是促进核心成员馆积极参与共建共享的有效措施。此外,CALIS联合目录的编目员认证工作对提高非核心成员馆编目员的编目水平以及促进参与共建共享的积极性发挥了重要作用。今后有必要建立一整套编目员认证的长效机制,构建编目员、图书馆与联合目录三方共同受益的良性运营机制,为联合目录的可持续发展提供基本保障。
他山之石可以攻玉。本文归纳介绍的内容仅仅是NACSIS-CAT长期以来率领学科专家、图书馆员以及相关机构人员一起开展的众多联合目录业务发展研究项目中的一个。日本国立情报学研究所(NACSIS-CAT运营机构)与OCLC、CALLS等联合目录运营机构一样,不仅向社会提供全体成员馆精心挑选管理的文献资源查询和利用服务,而且承担着引领成员馆业务发展方向的旗帜作用。在当今电子资源飞速增长、书目服务受到Google强烈冲击的时代,希望CALIS联合目录继续率领成员馆共同构建数字环境下无处不在的图书馆书目服务体系。