APP下载

电子连续性资源元数据标准建设研究*

2013-07-24吴丽杰

图书馆学刊 2013年3期
关键词:连续性出版物标准

吴丽杰

(辽宁省图书馆,辽宁 沈阳 110015)

吴丽杰 女,1973年生。硕士,副研究馆员。

电子连续性资源是以电子形式持续出版的连续性资源,是网络环境、数字环境下连续性资源与电子资源融合发展形成的一类资源。与其他文献资源相比,这类资源不仅积累了庞大的数量,在资源揭示上也更为复杂,各个图书馆在描述此类资源时,处理方式各异,使得大量的资源难以共享,影响了资源的利用,解决问题的关键在于电子连续性资源元数据的标准化。目前,国际上专门针对连续性资源的元数据标准并不多见,国内对于连续性资源的元数据研究尚处于发展中,全国图书馆标准化技术委员会于2011年确立了电子连续性资源的文化行业标准研制修订项目,由国家图书馆牵头,联合中国科学院文献情报中心、辽宁省图书馆共同研制。该标准研制的目的是通过制定统一的电子连续性资源元数据规范,实现行业内对电子连续性资源的统一揭示、深层挖掘。笔者从分析电子连续性资源概念的范围界定及其特性出发,提出了元数据标准的基本结构和元数集,旨在为标准的确定提供可资借鉴的参考。

1 电子连续性资源的定义及范围界定

《国际标准书目著录》(ISBD)2002年修订版中用ISBD(CR)连续性资源(Continuing Resource)取代了 ISBD(S)连续出版物(Serials),最先提出了“连续性资源”这一概念,涵盖的范围除了连续出版物外,还将不断更新的集成性资源纳入其中。《英美编目条例(第二版)》(AACR2)2002年修订版中保持了与ISBD的一致性,将书目资源(Bibliographic Resource)分为有限性资源(Finite Resource)和连续性资源(Continuing Resource)两类。扩大了原第十二章“连续出版物”的内容范围,改章名为“连续性资源”,包括连续出版物(Serials)和连续集成性资源(Ongoing Integrating Resources)。两个相继修订的规则都顺应了网络型资源的快速增长,扩展了连续性资源的外延,定义了新的资源类型——连续集成性资源。

1.1 定义

在2010年实施的我国国家标准(GB/T 3792.3-2009)《文献著录 第3部分:连续性资源》以及《文献著录 第9部分:电子资源》中分别针对连续性资源、集成性资源、电子资源作了如下定义:①连续性资源:一种在发行时间上没有明确终止日期的资源。连续性资源包括连续出版物和不断更新的集成性资源。②集成性资源:通过更新进行增补或修改的一种书目资源,其更新部分并不离散于原资源,而是与原资源整合为一体。集成性资源既可以是有限性资源,也可以是连续性资源[1]。③电子资源:由计算机控制(包括需要使用计算机外部设备,如CD-ROM播放器)的资料。这种资料的使用可以是交互式或非交互式[2]。

电子连续性资源是网络环境、数字环境下连续性资源和电子资源融合、交叉形成的文献类型,同时具备连续性资源和电子资源的属性,综合上述3个定义,笔者对电子连续性资源给出了参考概念:一种在发行时间上没有明确终止日期的电子资源。电子连续性资源包括电子连续出版物和不断更新的集成性电子资源。

1.2 范围

1.2.1 电子连续出版物:以电子形式存储于光盘、磁盘、磁带、硬盘等存储装置中的连续出版物,包括期刊、报纸、年鉴、系列会议录、系列报告、光盘数据库等。特点是具有接续关系、以独立的卷期或部分以定期或不定期的方式发行,通常带有编号,但无明确的终止日期。电子连续出版物主要有两种出版形式:一是原始出版形式即电子形式,保留独立的卷期定期出版;二是以印刷形式出版,保留卷期的完整独立性的数字化版本,如“龙源期刊网”所收录的电子期刊,可按卷期检索全文。

1.2.2 不断更新的集成性电子资源:通过持续更新进行增补或修改的电子资源,其更新部分并不离散于原资源,而是与原资源整合为一体,包括持续更新的网页、更新型数据库等。这类资源具备以下特点:①更新频率通常不固定,如网站的更新通常没有时间、形式上的约束;②出版形式上往往不再保持印刷形式的卷期独立性,而形成以单篇独立文章为存取单元的电子资源[3],如一些电子报纸的网站,只能检索单篇文章,不能按卷期检索;③更新部分不能单独使用,必须综合并入整体资源中。

2 国内外相关元数据标准研究现状

2.1 国外研究状况

国外描述元数据的发展比较成熟,但是完全针对于连续性资源的还很少见。对连续性资源进行揭示主要使用的有几种元数据标准:MARC、DC、MODS、ONIX for Serials等。

2.1.1 MARC

图书馆机读目录格式(MARC)是全世界图书馆普遍用于描述馆藏文献资源和联机检索的一种较为复杂的元数据标准。MARC中设立了很多连续出版物专用的字段,如出版周期附注(连续出版物)、曾用题名(连续出版物)、识别题名(连续出版物)、缩略题名(连续出版物)、展开题名(连续出版物)等,以更好地揭示连续出版物的特点、变化、沿革。为了适应网络信息资源编目需要,增加了编码数据字段:电子资源、文献检索或获取时间,电子资源的书目记录、资料特殊细节项:电子资源特征、检索计算机文件的系统细节、电子资源定位与检索等字段。

2.3.3 不使用空气清新剂和汽车香水,空气清新剂和汽车香水既不能达到消除污染物的目的,而且其自身所含有的VOCS等有害物质,还会对人体造成伤害。

2.1.2 MODS

MODS是Metadata Object Description Schema(元数据对象描述模式)的缩写,MODS是在MARC的基础上发展起来的,是MARC的标准子集,由元素、子元素、属性3层结构组成。MODS共有20个主元素和两个根元素,每个主元素下都有若干子元素,元素具有属性[4]。所有元素都可以重复使用,但属性不可重复使用。MODS既能描述结构复杂的传统文献信息,又能描述灵活多变的网络数字信息,能够满足各种行业信息交换的需要,显示出良好的扩展性。

2.1.3 DC

DC是都柏林核心元素集(Dublin Core Metadata Set)的简称,DC最早由美国OCLC公司于1995年发起研究,是“用该元素集描述任何网络信息资源,并足够简单以至任何作者无需专门培训即可创建自己文件”的元数据。经过10余年的发展,DC因其简单性、模块化、可扩展性及与其他元数据兼容等特性,使其成为国际通用的适用于描述电子资源的元数据标准,也成为各个领域各种类型资源元数据制作的基础。

DC元素集包括15个核心元素,被分为3组:①描述资源内容相关的元素:包括题名(Title)、主题(Subject)、描述(Description)、来源(Source)、语种(Language)、关联(Relation)、覆盖范围(Coverage);②描述知识产权的元素:包括创作者(Creator)、出版者(Publisher)、其他责任者(Contributor)、权限(Rights);③资源外部属性相关的元素:包括日期(Date)、资源类型(Type)、格式(Format)、标识符(Identifier)[5]。这些元素既可以选择使用也可以重复使用,元素顺序可以任意排列,每个元素可以进一步扩展。

2.1.4 ONIX for Serials

ONIX是Online Information Exchange(在线信息交换)的缩写,是以电子形式获取、传输图书工业产品信息的国际标准,是一种描述、传递和交换出版物元数据的国际性标准。ONIX for Serials是EDItEUR及NISO合作发展的一种结构化、全面性及可扩展性诠释数据的期刊在线信息交换标准,出现于图书在线信息交换标准(ONIX for Books)之后。ONIX for Serials包括3种格式:①期刊在线馆藏格式SOH(Online Holdings):出版物存取管理服务商(PAM))图书馆之间交换电子期刊馆藏细节的格式;②期刊产品及订购格式SPS(Products and Subscriptions):订购期刊产品所需的一种交换信息格式,包括价格信息、目录信息,以及订购双方所拥有的特定订购细节;③期刊发行通知格式SRN(Release Notification):有关期刊发行、出版信息的格式[6]。

2.2 国内研究状况

国内元数据受国外元数据理论和应用的影响较大。目前,对于连续性资源的元数据研究还处在发展中。主要有以下几种。

2.2.1 CNMARC

CNMARC是在《国际机读目录格式》UNIMARC基础上结合我国实际情况制定的,CNMARC可以描述专著、连续出版物等多类文献,数据元素分为头标区、目次区、字段区3个部分,与国际标准保持了较好的一致性。

2.2.2 “中国数字图书馆标准与规范建设”项目(简称CDLS)

CDLS中“专门元数据”子项目制订了11种专门元数据规范及其著录规则,其中《期刊论文描述元数据规范》适用于连续性资源的析出层文献。《期刊论文描述元数据规范》中规定了12个核心元素和1个个别元素,核心元素全部复用了DC元数据标准。

3 电子连续性资源元数据基本结构和元素集

在对电子连续性资源对象的特性分析以及参考国内外相关元数据标准的基础上,项目组初步设计了电子连续性资源元数据基本结构和元素集。电子连续性资源的元数据规范遵循了描述元数据的两层基本结构:核心元素和资源类型核心元素,其中包括13个核心元素(修饰词24个)和6个资源类型核心元素[7],核心元素复用了DC元数据标准,资源类型核心元素则复用了MODS元数据标准,大部分核心元素以DC为基础扩展了元素修饰词和编码体系修饰词。囿于篇幅,表1仅列出核心元素。

表1

4 元数据方案设计的思考与建议

制定元数据方案是个复杂的系统性工程,除了要分析电子连续性资源的范围和特性,调研国内外相关研究标准之外,还应考虑以下因素。

4.1 兼顾元数据创建者、管理者、使用者的需求,做好平衡和组配

本标准研制的目的在于满足数字图书馆建设中对电子连续性资源的描述、定位、管理、检索、评估和选择、交互和长期保存。在设计时要充分考虑元数据创建者、管理者、使用者的需求,在其间做最佳平衡和组配,使标准可以满足使用者各方、各层次的需要,具备较广泛的适用性和可操作性。

4.2 以国际通用元数据标准为基础,进行本地化改造

国际上元数据标准发展比较成熟,形成了DC、MARC、MODS等一系列国际通用的元数据标准,在设计元数据标准时可以充分利用这些已有国际通用标准,在元素设置上尽可能复用国际通用标准的元素、修饰词及编码体系,在此基础上,结合我国电子连续性资源建设的实际情况形成新的元素集。通过复用一个或多个元数据格式的部分元素或属性,形成新的描述更为专指数字对象的元数据格式,可以更好地实现与国际标准接轨,提高标准的兼容性和互换性。

4.3 通用性与专用性结合,满足资源描述个性化需求

电子连续性资源类型繁杂,制定标准时一方面尽可能考虑标准在一定范围内的通用性,覆盖所有类型的电子连续性资源。另一方面,每种类型又有各自的特性,例如电子期刊和更新型网站同属连续性资源,但又具有各自的特性,因此标准的设计要在满足通用性的前提下,具备一定的灵活性和专指度,满足不同类型资源个性化的需求。

4.4 具备前瞻性和可扩展性,以适应资源不断发展的需求

易变性是电子连续性资源最大的特点,更新频率、载体形式、内容等任何方面发生变化都会导致描述项目的变化,因此,标准的设计要具备一定的前瞻性和可扩展性,为资源可能发生的变化预留发展空间,允许使用者在遵循已有内容的前提下,自行扩充一些元素或属性值,以适应资源不断发展变化的需求。

5 结语

电子连续性资源元数据标准是有效描述资源,实现资源发现、交流、共享以及全行业协调协作的基本保障。元数据标准的设计要综合平衡开放性、灵活性、互操作性、可扩展性等因素,达到整体方案设计的合理性。此外,与其他文献资源相比,电子连续性资源的情况更为复杂,只有联合多个国家、多种类型机构共同合作建设、维护,才能更好地提供知识的发现、挖掘服务。

[1]全国信息与文献标准化技术委员会.GB/T3792.3-2009,文献著录 第3部分:连续性资源[S].北京:中国标准出版社,2010.

[2]全国信息与文献标准化技术委员会.GB/T3792.3-2009,文献著录 第9部分:电子资源[S].北京:中国标准出版社,2010.

[3]宋登汉,周迪.中文连续性电子资源的出版变化对记录编制的影响[J].图书情报知识,2006(3):49-52.

[4]刘孝文.从MARC到MODS:编目元数据MODS分析与研究[J].图书馆杂志,2007(7):14-17,30.

[5]肖希明,等.数字信息资源建设与服务研究[M].武汉:武汉大学出版社,2008:146-147.

[6]叶莉.基于ONIX的电子期刊信息交换标准探析[J].内蒙古科技与经济,2010(7):130-131.

[7]文化部文化科技司.文化行业标准项目合同:专门元数据元素集及著录规则——电子连续性资源[Z].WH2011-020,2011.

猜你喜欢

连续性出版物标准
2022 年3 月实施的工程建设标准
非连续性实用类文本阅读解题技巧例谈
小学中段非连续性文本阅读教学初探
忠诚的标准
美还是丑?
2017年出版物
连续性
一家之言:新标准将解决快递业“成长中的烦恼”
Global analyses of sea surface temperature, sea ice, and night marine air temperature since the latenineteenth century
Arctic sea ice decline: Faster than forecast