APP下载

图书馆电子资源编目研究进展分析

2016-11-19汪初芸苏建华

现代情报 2016年4期
关键词:电子资源编目研究进展

汪初芸 苏建华

〔摘 要〕相较纸质资源电子资源具有数量大、更新快、载体形式多样等特点,且大部分数据库商能够提供原始数据。这些特点决定了对电子资源编目需采取不同的策略:确定编目对象和级别、选择编目方式、数据审查检验及批量导入。因此图书馆必须在统一标准的指引下采取科学的办法,注重数据质量控制、评估资源发现系统的影响、开展联合编目才能保证电子资源编目数据的质量。

〔关键词〕图书馆;电子资源;编目;研究进展;书目数据;质量控制

DOI:10.3969/j.issn.1008-0821.2016.04.025

〔中图分类号〕G254.36 〔文献标识码〕A 〔文章编号〕1008-0821(2016)04-0134-03

〔Abstract〕Compared with traditional paper resources,electronic resources have such characteristics as huge quantity,rapid update,a variety of manifestations,and most database suppliers can provide the original data.The electronic resource cataloging need to adopt different cataloging strategies:determining the object and the level of the catalogs,selecting a way of cataloging,checking the data and processing them batch by batch.The academic libraries should adopt scientific approach under a unified standard,pay attention to data quality control,evaluating the influence of resource discovery system,carrying out cooperative cataloging to ensure the quality of electronic resources cataloging data.

〔Key words〕library;electronic resources;cataloging;research process;bibliographic data;quality control

随着现代网络和通信技术的发展,电子媒体和资源已经成为人们获取资讯的重要渠道,成为图书馆购买资源的重要来源,大有取代纸质资源的势头。以笔者所在西南政法大学图书馆为例,年订购的中外文印刷型期刊仅为1 600余种,而电子期刊有2万多种,电子资源尤其是期刊已占据了图书馆资源的大半壁江山,这种变化促使图书馆必须将电子资源的编目提上日程。怎样快速对大量电子资源进行编目以及如何有效维护MARC记录中电子资源856字段URL的有效性,一直是困扰图书馆界的现实问题。本文考察了国内外进行电子资源编目图书馆的最新实践,试图归纳总结探讨电子资源编目的有效方法。

1 国内外文献研究综述

国内对电子资源编目的研究较少,只有少数几个实力较强的图书馆做了实践和理论探索:这几个图书馆中清华大学图书馆的实践和研究起步较早:先后有多篇文章介绍电子资源编目实践中的一些具体方法,贾延霞等分好几篇文章详细介绍了中文电子图书和电子期刊批量编目的具体实践;北京大学图书馆的王亚林介绍了该馆电子资源编目策略:即对有物理实体和无物理实体的电子资源分别做完全级和非完全级编目[1],上海交通大学图书馆采用图书馆管理系统自带的批量处理功能实现了对各类电子资源的编目。

从国外的研究文献看,电子资源编目主要工具为MarcEdit、图书馆管理系统自带的批量处理功能以及Excel等,这三者结合就能实现对电子资源的批量导入、更新和维护。如芝加哥伊利诺伊大学使用Voyager集成管理系统,批处理时需要先导出记录,在系统外应用MarcEdit进行批量修改,然后再重新导入系统。休斯敦大学图书馆使用Millennium管理系统、MarcEdit和Excel等对MARC记录进行批量修改,然后再导入OPAC系统,并利用系统自带功能对系统记录进行批量删除[2]。Auraria图书馆和Wichita州立大学图书馆利用MarcEdit将开放获取的电子书元数据及特藏资源元数据批量转换为MARC。有调查显示英国各图书馆大都将提供商的MARC记录批量上载到书目管理系统中,但具体操作中做法不一。此外还有文献表明国外图书馆电子资源的编目已涉及数据质量审核、提高质量的措施、流程管理、政策、经验和教训等内容,比如肯特州立大学图书馆、宾夕法尼亚州立大学图书馆、伊利诺伊州立大学芝加哥分校图书馆[3]。总之,国内外关于电子资源编目的实践主要集中在利用第三方软件批量处理MARC数据层面,对导入系统后的数据更新维护较少关注。

2 国内高校电子资源编目实践现状

从上面的文献调研可看出,国内从事电子资源编目的图书馆并不多,清华、北大和上海交大图书馆的实践比较典型,大部分图书馆由于技术所限对电子资源根本不做任何编目。进行编目的图书馆都是一些资金和技术力量比较雄厚的图书馆,而且都是通过批量操作:如上海交通大学图书馆采用Excel及MarcEdit对导入系统的数据进行校验;清华大学图书馆采用编目员抽检、Excel和MarcEdit软件三者相结合的方式来校验外部数据源。武汉大学、西安交通大学图书馆采取编目人员修改和工具批量修改相结合的方式处理数据[3],处理后再批量导入图书馆OPAC系统,这样检索OPAC时可同时检索到同一本书的印刷型和电子版书目(限于电子图书),但查看时需要点击电子资源进入单独的书目,然后通过超星电子图书链接获取电子版全文(清华大学图书馆OPAC)。由于电子资源的编目数据均来源于数据库商,标准的缺乏导致数据来源多样化,格式多样、质量高低不一,这就需要人工抽检和工具校验同时进行,但MarcEdit等工具是基于MARC21为西文编目数据开发的,在检验数据有效性、字段统计等方面比较方便,在识别中文数据方面存在着欠缺,因此可以说国内高校图书馆电子资源编目一开始便存在着不少问题。

2.1 数据来源多样,数据质量参差不齐

信息技术的发展使得电子资源的类型越来越多,电子期刊、电子图书、视频、音频以及复合资源不断产生,不断加大着收集和组织的难度。同时数字出版的规模呈几何级增长,数据库规模越来越大,收录百万种电子图书和万种电子期刊的数据库屡见不鲜,如中文电子图书和期刊的业界翘楚读秀和CNKI。面对如此众多的电子资源,数据库商收录出版时也不能完全按照标准统一处理,因此提供给图书馆的数据质量也良莠不齐,数据不完整、链接错误、前后不一致都需要工作人员校对、核实甚至补充。根据清华大学多年的实践发现:订购资源量与数据不匹配,数据著录格式不规范、字段信息不准确或不全面,URL链接不正确等问题比比皆是[3],有些规模小的出版商甚至连MARC数据都不提供。另外电子资源更新较快,数据库商会根据商机不断调整数据库内容,如增刊、减刊、改变全文覆盖范围及地址等,这些都需要图书馆管理系统及时发现和编目人员及时维护更新,如果不及时维护便会出现数据不一致和死链等情况。调研中有图书馆就表示图书馆管理系统功能欠缺和维护技术的不完备也是影响电子资源编目数据质量的重要因素。

2.2 缺乏标准,编目方法灵活多样

目前电子资源编目通常有两种方法,一种是单独编目,北京大学、清华大学以及香港大学均采用这种方法;另一种是将电子资源与纸质结合,将电子资源的URL地址增加到同一纸质资源MARC记录的856字段中,中国人民大学就是采取这种办法进行电子资源编目。对电子期刊则采取导航和编目两种方式处理,前者比较简单通用,大多数图书馆均采用前者揭示电子期刊,后者比较麻烦,主要是由于同一种电子期刊会隶属于不同的数据库,其URL会指向几个数据库,加大了编目人员维护更新856链接字段的难度,清华大学图书馆为了解决这一问题已经探索出了新的办法:首选将已有编目数据的电子期刊的856字段u子宇段中的URL全部转换为指向电子期刊导航系统中该刊的地址,然后对未编目的电子期刊则用SFX知识库的数据进行简单编目并导入书目系统,在不影响读者使用的情况下再对这些数据完善补充[4]。总之,目前各馆的电子资源编目各自为政,缺乏统一的操作指南,这常常使得编目员处理不同电子资源数据库时采取灵活变化的方式,客观上导致了数据的多样性。

3 改进国内电子资源编目的建议

近年来,不少图书馆都引进了资源发现系统,实现了对馆藏资源的部分甚至全部覆盖。这样有些图书馆便不对电子资源进行编目,而是通过资源发现系统提供统一检索服务,比如北京师范大学、浙江大学等图书馆;但OPAC作为读者查询图书馆各类资源的重要途径和常用方式,一直以来是不可或缺的,因此在OPAC中整合电子资源书目信息能极大地方便读者使用和提高馆藏资源利用率。因此怎样将图书馆的电子资源尽可能地整合在OPAC系统的检索功能里,以便更加简便、直观地利用是图书馆亟须解决的问题。

3.1 统一标准,选择合适的编目策略

目前国内图书馆纸质资源编目有国图和CALIS两个标准,公共图书馆多用前者,高校图书馆则采用后者,但由于各馆选取字段和编目员水平的差异造成各馆的书目数据不完全一致。电子资源由于没有成型的标准可遵循,各馆都是按自己的需求和理解来执行,又加之电子资源更新较快,使得电子资源书目数据更加杂乱无章,为此就需要业界共同努力实践,制定出统一的编目指南,在统一指南的指引下开展电子资源编目。其次开展电子资源编目时必须采用合适的策略,当前国外电子资源编目主要依据《英美编目条例》的第9章、美国《国会图书馆条例解释》及全美期刊合作编目计划的规定,基于上述条例国外对资源编目主要采取两种办法:单一记录和分散记录编目法,前者将不同载体记录集中著录于一条记录中,便于读者理解和挑选,保证了数据的一致性,但需要大量的人工来维护记录;后者利用数据源进行数据批量导入,编目效率较高,但会产生大量重复相似数据,加大编目人员校验的强度和读者选择的困扰。这两种方式前者适合大型联合编目中心使用,后者比较符合单馆使用[1]。比如北京大学图书馆据此制定适合本馆的电子资源编目策略:首先确定学术性电子图书和期刊为编目对象,接着确定编目级别,对有馆藏实体资源的电子资源做完全级编目(赋予分类号、索书号和主题词),没有的则根据需要灵活处理,然后则采用分散记录编目法对引进电子资源进行批量导入,当数据库内856字段发生变化时可以批量删改和更新。

3.2 注重数据后期维护,加强数据质量控制

目前大部分数据库商都能给图书馆提供MARC数据,这极大减轻了编目员的工作量,但由于专业知识所限,数据商提供的数据并不能完全满足图书馆的需要,实践证明,国外数据商提供的数据比国内的要规范的多,国内数据库提供的数据普遍存在着著录资源不齐全、不规范、同一资源在多个数据库出现等问题,尤其是链接数字资源地址856的z字段的形式和内容多样,造成读者在OPAC中看到的信息也是多种多样。为了保证电子资源在馆藏OPAC中正确显示,编目人员得到数据商提供的数据后必须认真分析,标记不规范或缺失的字段或子字段,制定科学合理的修改方案,尤其需要关注检索点字段,如CNMARC的2字段、7字段、MARC21的5字段、856字段z的公共附注等[5]。同时编目人员也可同数据库商沟通,提出图书馆所需MARC数据的格式标准,尽量从源头上保证数据的质量和减轻编目人员的工作量。

3.3 开发选择适合工具,进行批量操作

电子资源种类繁多,数量巨大,对其进行逐条编目工程浩大,这就需要编目工作人员想办法批量处理,目前数据库商大多都给图书馆提供电子资源的Excel文件列表,这为批量编目提供了可能,但需要工具转化软件来执行,北大图书馆自主开发了自动转换程序,实现了Excel数据到MARC文件的转化,批量处理时能按照MARC对各字段、子字段的要求将数据库商提供的Excel文件的字段值标准化。清华图书馆引进了冠景公司开发的Marcpro具有数据库文件转换MARC文件、MARC文件转换数据库文件以及MARC记录编辑修改的功能;武汉大学、东南大学、北京工业大学图书馆利用书目管理系统自身功能进行批量处理,这些工具的使用在减轻编目人员的工作量同时也提高了电子资源编目的速度和准确率。为保证电子资源批量编目的顺利开展,笔者建议可以综合使用多种工具检验:国外图书馆常用的检验西文书目数据的MarcEdit、MARCReport、Perl、OCLC宏命令,再加上国内常用的Excel、商用软件、自开发的软件以及管理系统的自带功能,上海交通大学图书馆综合运用上述工具和Aleph系统实现了对购买的各种类型电子资源编目数据的批量导入和后期的数据更新维护。

3.4 正视资源发现系统的影响

近年来资源发现系统由于实现了对馆藏资源的全覆盖似乎有取代图书馆OPAC系统的势头,于是部分图书馆认为没有必要再对电子资源进行编目,但笔者认为,作为图书馆查询馆藏的OPAC系统不应退居幕后,虽然一些发现系统可以提供电子资源元数据,但由于数据覆盖面和数据质量不高,在全面揭示本馆馆藏资源方面显得有点差强人意,因此对电子资源批量编目仍是有价值和意义的。有调查发现:部分图书馆认为资源发现系统能够更快和大批量地实现电子资源规范化数据的上载,在导入数据时会优先考虑资源发现系统,编目导入OPAC系统则作为备选方案。笔者认为,虽然导入OPAC系统的数据需要编目人员花费一定的时间和精力审核和规范化处理,数据更新速度肯定不及资源发现系统迅速,但数据质量是有保障的;资源发现系统虽然揭示资源较快,但隐含的数据质量问题无法及时发现,日积月累会影响图书馆编目数据的质量。

3.5 开展联合编目,实现资源共享

目前国内的联合编目仅限于实体资源,鲜见电子资源联合编目的案例,而国外已有电子资源联合编目的实践,伊利诺伊大学芝加哥分校与伊利诺伊州学术和研究图书馆协会合作开展电子图书编目,休斯敦大学图书馆与其他几家图书馆共享其电子图书,降低了各图书馆间的重复劳动[3]。国内CALIS 在高校电子资源集团采购方面起到积极作用,但迟迟没有开展电子资源的联合编目。为此笔者认为,CALIS和国图应借鉴国外的实践,组织同行开展电子资源编目理论和实践讨论,对具体案例尤其是国外的先进案例进行剖析,讨论联合编目的可行性,尽快制定出电子资源编目指南和联合编目规程,并鼓励成员馆依据规则提交数据,尽早实现电子资源书目的资源共享。

参考文献

[1]王亚林.电子资源的编目策略[J].图书馆建设,2012,(2):47-49,53.

[2]张轶华,曲建峰,李芳.Aleph系统批量编目功能的研究与实践[J].图书馆杂志,2015,(1):66-72.

[3]贾延霞,杨慧.电子资源批量编目的实践及研究[J].图书情报工作,2014,(18):117-121.

[4]贾延霞,吕肖华,杨慧,等.电子期刊编目方法新尝试——以清华大学图书馆的实践为例[J].图书馆建设,2011,(4):43-46,50.

[5].贾延霞,杨慧.利用数据库商提供的电子资源MARC数据的策略[J].图书馆建设,2012,(8):25-27.

(本文责任编辑:郭沫含)

猜你喜欢

电子资源编目研究进展
MiRNA-145在消化系统恶性肿瘤中的研究进展
国家图书馆藏四种古籍编目志疑
离子束抛光研究进展
粤剧编目整理之回顾与展望
独脚金的研究进展
关于少数民族师生数据库利用情况调查研究
图书馆数字资源评价指标权重赋值方法概述
图书馆纸质资源与电子资源最优配置研究
高校图书馆电子资源的宣传与推广
CALIS联机合作编目中的授权影印书规范著录