APP下载

图书馆特色数字资源建设中的标准制定与实施
——以三峡大学图书馆为例

2014-08-17潘彤声望艳春

关键词:数据项标引著录

潘彤声, 望艳春

(三峡大学 图书馆, 湖北 宜昌 443002)

一、图书馆特色数字资源建设的背景

1.国内高校图书馆特色数字资源建设现状

高校图书馆在支撑学校教学科研、服务地方经济的过程中,不断调整自身的发展方向,积累了一定数量的特色资源,这些特色资源主要包括:与学校重点学科相关的图书、期刊、会议论文、标准专利、图纸图像、音视频;地方经济重点发展方向的新技术、新进展;反映区域特有的人文、历史、地理的古籍、地方志、手稿;反映学校及地方学者的学术水平的文集等。

特色资源的收藏范围、数量和质量,反映了高校图书馆的历史底蕴,反映了图书馆服务高校教研的水平,将这些珍稀的特色资源利用现代化技术实现数字化建库,具有极为重要的作用,一是有利于资源的保存,二是提高了资源的利用效率,三是方便了用户的检索与获取。很多985、211的高校很早开始尝试进行特色资源的数字化,而中国高等教育文献保障系统(CALIS)从1999年起就组织高校图书馆进行了共3期近200个特色数据库的建设,表1列举了其中几个较具影响的特色库。

表1 CALIS较具代表性的特色库

2.三峡大学图书馆特色数字资源建设

(1)建库情况

三峡大学依托三峡工程与周边的众多水电工程,因此办学的重点方向就是突出水电特色和三峡文化,这也一直是我们建设特色资源的重点,关于这些水电工程的建设历史、现状和发展,三峡地区的人文、历史地理、动植物、地质地貌的图书、期刊、报纸、会议、音视频、图像、图纸、古籍、地方志甚至手稿一直是我们的收藏方向,以此为基础,近10年来,三峡大学图书馆进行了一系列的特色资源数字化建库尝试,较具代表性的如表2所示。

表2 三峡大学图书馆建设的特色数据库

(2)存在的问题——标准缺失

数字资源在建库过程中,需要遵循并建立一定的标准,以控制并保证数据质量。这些标准包括元数据和数字对象两个方面。元数据指题名、分类等揭示信息,数字对象则是纸质、音视频等资源本身,前者需要制定著录标引标准,后者需要加工标准。数字资源由于其特殊性、新颖性和发展性,在其发展过程中没有形成完善系统的标准,很多元数据的建库标准都大量参照一些成熟标准,如GB2659-81世界各国和地区名称代码、GB3469-83文献类型与文献载体代码等。1995年OCLC与国家超级计算应用中心(NCSA)联合发起建立了一套描述网络电子文献的方法,以便网上信息检索,后来此方法形成都柏林核心元数据(DC)标准,其基本方案是包括15个“核心元素”的集合,用来供数字化建库遵循与参照,表3列举了都柏林核心元数据(DC)标准部分元数据。

表3 都柏林核心元数据(DC)标准部分元数据

很多机构以DC标准为基础,对自身的数字化建库标准进行了补充与完善,形成了较为系统的标准体系。在国内,CALIS专门为其三期特色库建立一套包含17种数字资源类型的Schema规范;国家图书馆建立关于十几种数字对象的《数字资源加工标准》;CNKI建立《清华同方特色库建库相关标准》。

我馆在进行建库之时,缺乏统一规划,元数据字段不齐全,著录与加工标准缺失,数据质量良莠不齐,以CALIS三期的几个子项目为例,表4、表5分别反映了初次提交验收时元数据字段与记录质量不达标的情况。

表4 三峡大学图书馆CALIS子项目元数据字段缺失情况

表5 三峡大学图书馆CALIS子项目元数据字段缺失情况

其他的特色库也存在类似的元数据或数字对象的标准缺失,归纳起来有如下几点:(1)元数据字段缺失,导致揭示资源不全面客观;(2)元数据著录标引标准缺失,导致揭示资源不准确;(3)数字对象加工标准缺失,导致资源本身的可利用性降低;(4)审核标准缺失,导致资源的综合质量下降。

二、图书馆特色数字资源建设的解决措施

综上所述,特色资源数字化过程中,如标准缺失,将会严重影响资源质量,导致资源的利用率和图书馆的服务水平下降。因此,建立一套完善的特色数字资源的标准,并以之为基础,规范数据质量,提高服务水平,是势在必行的。三峡大学图书馆需要一套适合自身特色资源发展的标准,包括各类型特色库的通用模板,即元数据字段标准、元数据著录规则和数字对象加工标准。经过反复的对比、借鉴、论证和修改,制定了这么一套体系,下文简述相关标准及实施办法。

1.元数据标准制定

(1)元数据字段标准制定

这一部分内容包含了图书、期刊、会议论文、标准专利、音频、视频、教参、图像等通用的特色库以及我馆在建特色库的元数据字段定义,包括每一个元素的定义、描述、类型、DC映射、必备性、唯一性内容,表6为工程移民数据库的部分元数据定义。

表6 工程移民数据库部分元数据定义

(2)元数据著录标引标准制定

很多元数据的录入都需要遵循一定的固有标准,如ISSN号遵循ISO3297,地区名称代码遵循GB2659-81;某些特色库因为具备一定的地域文化特性,无法用现有的标准来约束,我们必须自定标准,如武陵民族资源库中的所属武陵地区、所属武陵文化内容等项目。

元数据录入根据元素本身的性质分为著录和标引两类,直接录入原始信息是著录,如题名、著者等,需要进行提炼的是标引,如主题词、分类号等,录入方式不同,采用的质量标准也不同,对于著录我们采用著录项错误率和著录文字错误率两个指标来衡量,对于标引,我们采用标引正确率和标引一致度来衡量,具体定义如下:

一是著录项错误率:(元数据项著录错误的数据项数量/数据项数量)×100%,著录错误的数量与总数量的比率。著录项错误是按元数据项计算,凡未能对元数据项进行客观著录的均计为著录项错误,适用于文字错误对元数据项内容影响大的元数据项。元数据项内容为单值的,计为一项;元数据项内容为多值的,则按值的数量计算项数。

二是著录文字错误率:(元数据项内容文字错误的数量/元数据项文字数量)×100%,表示内容文字错误的数量与总数量的比率。著录文字错误按文字计算,适用于文字错误对元数据内容影响较小的元数据。元数据中文字与原文不符的计为著录文字错误,但不包括对原文的文字错误进行纠正的情况。

三是标引正确率:(元数据标引正确的数据项数量/数据项数量)×100%,标引正确的数据项数量和总数量的比率。标引项目基本反映文献主题,无原则性错误,则计为标引正确。

四是标引一致度:(元数据标引一致的数据项数量/数据项数量)×100%,表示元数据标引一致的数据项数量与总数量的比率。标引一致度反映同主题文献标引一致的程度。

据上述原则,对在建库进行了著录标准的制定,表7以武陵地区资源库部分字段为例。

表7 武陵地区资源库部分元数据著录标引标准

(3)数字对象加工标准制定

不同的数字对象,需要进行的加工方式不同,因此,也就有不同的加工规范,例如普通纸质需要进行扫描和OCR识别,古籍需要拍照,网络资源需要采集,音频需要进行无损失压缩,视频需要采集和转换格式,图像需要扫描和图像处理等,归纳起来,我们能用到的最主要的数字对象就是普通纸质(图书期刊)、网络资源、音视频和图像等,表8简述各种处理方式的统一规范。

表8 常见数字对象处理统一规范

其中,对于纸质文献,在扫描过程中,需要遵守一定的版面错误率和页面错误率:

1)版面错误率:(错误版面数/版面总数)×100%,错误版面数与版面总数的比率。它是衡量文本型全文数据制作质量的指标。其质量要求包括:a)文字内容应与原版印刷本一致,版式应与原版印刷本基本一致;b)文献不应出现缺页、多页、错页、重页现象;c)文献不应出现版面重叠的现象;

2)页面错误率:(错误页数/页面总数)×100%,错误页面数与页面总数的比率,它是衡量图像型全文数据制作质量的指标。同一页面内出现一个或一个以上错误,均计为一个错误。其质量要求包括:a)文献不应出现缺页、多页、错页、重页等现象;b)页面应保持完整;c)页面无污损;d)页面清晰。

表9是纸质资源中的普通印刷型加工技术规范。

表9 普通印刷型文本的加工技术规范

据此,我们确定水利水电资源库数字对象部分加工标准如表10。对其他资源,我们也参照制定相关标准,表11为课件视频数字对象部分加工标准。

表10 水利水电资源库数字对象部分加工标准

表11 专业课件视频库数字对象部分加工标准

2.标准的实施

在完善的标准制定后,我们需要从以下几点来严格实施,才能真正提高质量:一是工作流程细致化:资源的采访由数字采访研究员完成,结构建库由系统管理员完成,数字对象加工由数字对象加工员完成,元数据编目由编目员完成,工作流程细致规范,消除工序交叉带来的影响;二是标准执行常态化:对照图书馆的纸质资源编目工作,人手一份编目与加工标准,将其作为工作手册,将标准化工作常态化;三是建立互审制度:除了常规的审核机制,还要完成相似工作互审,表12是数字对象的互审记录和整改情况。

表12 数字对象加工互审表

三、结语

特色资源数字化过程中,标准缺失对于特色库的品质影响巨大。因此,建立一套完善的编目标准和加工规范,能够提高资源的利用效率,提升特色库的品质,更好地为高等院校的教学科研服务。

参考文献:

[1] 刘 莹.高校图书馆特色数据库的建库研究[J].现代情报,2004(9):177-179.

[2] 夏 红.对高校特色数据库建设的探讨[J].情报杂志,2005(9):75-77.

[3] 石含芳.西北地方文献资源数据库建设述要[J].图书与情报,2007(5):120-122.

[4] 同方光盘股份有限公司.水利文献信息系统建设标准[S].2012:1-37.

[5] 孙一钢,龙 伟.数字资源加工标准[S].我国数字图书馆标准规范建设.2006:1-35.

[6] 张新玲,郑宗荣.应对期刊数字化的编辑策略[J].重庆三峡学院学报,2012(4).

猜你喜欢

数据项标引著录
常用参考文献著录要求
常用参考文献著录要求
常用参考文献著录要求
一种多功能抽签选择器软件系统设计与实现
非完整数据库Skyline-join查询*
基于Python的Asterix Cat 021数据格式解析分析与实现
档案主题标引与分类标引的比较分析
本刊对来稿中关键词标引的要求
本刊对来稿中关键词标引的要求
本刊参考文献著录要求