ECIP的实现及其意义
2001-12-31陈源蒸
陈源蒸
社会发展的需要
ECIP(Electroniccataloginginpublication),即实现图书在版编目的电子化(也就是网络化、数字化),美国国会图书馆在1995年就着手实施ECIP计划,出版商通过互联网将经过结构化处理的出版物的电子文本传送至国会图书馆,该馆以软件方法从中提取CIP数据,获得很好效果。实现了自动编目和书目记录的数字化,这是美国国会图书馆启动数字图书馆项目之前的基础准备工作之一。基于目前我国图书出版已全部采用计算机激光照排技术,在生产印刷版图书的同时,就有了计算机可读的电子文本。只是由于现有的录入排版软件所产生的是文本型文件,而不是结构型文件,因而不能进行属性检索,也就不能产生计算机可读的书目记录,并影响电子文本的广泛应用。随着图书在版编目工作的深层发展,网络技术的不断完善,推进ECIP计划,实现图书在版编目的电子化已经提到议事日程。
国家标准《图书书名页》(GB/T12450-2001)和《图书在版编目数据》(GB/T12451-2001)修订稿即将发布,CIP中心可以实施修订后的标准为契机,要求各出版单位用结构化方式录入图书书名页、版权页、附书名页等图书在版编目所必需的内容,以及与图书编目有关的多作者专页、目次页、内容简介/出版说明、前言、后记、封面封底(文字部分)等相关内容。从而在完成图书的录入排版后,即可同时自动生成CIP数据及相关书目信息;图书正式出版后,又可自动获得图书馆界所需要的完整书目记录,产生数字图书馆要求的元数据。其处理软件可开发一独立运行的程度,能将结构化数据转换为排版文件,技术上很容易实现,笔者多年前即已做过类似的工作。
ECIP的实现方法
一、数据定义
实现ECIP的主要技术是对主书名页等有关数据进行结构化处理。可采用文化部发布的行业标准《中国机读目录格式》(WH/T0503-96)对下列内容进行定义(具体字段与子字段标识符从略)。
1.主书名页
书名,包括正书名、并列书名、副书名及说明书名文字、分册号及分册书名、正书名汉语拼音
作者,包括主要、次要作者及其并列名称
版本说明
出版者及出版地,包括其并列名称
合订书名
丛书名/多卷书名,包括其并列名称
(注:如丛书名/多卷书名及各项目的并列名称在附书名页排印,书名页即不录入这些数据)
2.版权页
ISBN编号、定价
CIP中心审定号(由CIP中心填写,不印出)
版权说明
预定出版日期(不印出)
出版地、出版者、出版者地址、出版日期、印刷者、印刷者地址、发行者
载体形态,包括尺寸、印张、附件、字数等
印刷及发行记录,包括版次、印次、印数
分类号、主题词(不印出)
有关责任者,包括出版人、责任编辑、封面设计、美术编辑、策划等
3.附书名页
①丛书/多卷书
丛书名/多卷书名,包括其并列名称
丛书/多卷书责任者,包括其并列名称
出版者,包括其并列名称
总集、分册及单册名称
②译著/重版古籍原版说明
原著书名、作者、出版者、出版日期、版权说明
③会议录
会议名称、届次、日期、会议地点、会议组织者
④多语种图书
第二种语言的书名、作者、出版者
4.多作者专页
作者及其责任方式与身份说明
5.内容简介/出版说明
6.目次页
章节或单篇论文名称及作者
7.前言、后记
8.作者简介
9.封面、封底(文字部分)
二、转换方法
按照ECIP功能要求设计的软件,可以做到一次录入,分别转换为结构型书目数据和文本排版文件两种产品。
1.CIP数据
只生成本书的CIP数据。
2.正式书目记录
①本书书目记录
②合订图书的各个书目记录
③丛书/多卷书的书目记录
3.机读目录生成方法
处理软件依次读入上列9个文件,数据内容相同者去除。对合订图书的内容,CIP数据只产生4、2、3字段,正式书目记录则分别生成每种图书的书目记录。对3/①的内容,CIP数据只产生4、6、1字段,正式书目记录还要分别产生丛书综合记录和多卷书综合记录。
4.排版文件生成方法
根据排版要求,对每个文件分别设置转换参数,转换过程中自动插入排版语句,形成供印刷用的排版文件。
实施ECIP计划的重要意义
一、全面提高书目数据质量
首先从CIP数据本身来说,目前只是根据出版单位报来的数据进行核定,出版单位未报的缺项,则无法判断。如现有的CIP数据,基本没有并列书名,原因是出版单位未报,CIP中心无法增补。分类、主题标引,也因可资参考的材料很少,不能保证标引质量。实现ECIP以后,除必要的书目数据外,尚有目次页、内容简介/出版说明、前言/后记、作者简介等内容,对提高标引质量将起到很大作用。
对于正式书目记录而言,原先关于全面反映责任者、进行内容分析著录、介绍图书内容等要求,均因工作量太大而难以做到。现在由图书的电子文本自动生成,问题迎刃而解,书目质量将大大提高。
二、从根本上杜绝重复编目
目前,全社会重复进行大量图书编目的机构(不包括为本单位编目者),少说也有一二百家。不仅浪费人力、物力,而且影响标准化的推行,书目质量得不到保证。由图书的电子文本自动产生新书预报或正式书目数据以后,全社会都可以享用这一成果,发行界和图书馆界都不用另行编目,其经济效益极其可观,每年最少可减少上千万元的费用。
三、为数字图书馆的实现创造条件
ECIP的实现,涉及一系列标准与规范的执行,将有力地推进出版行业标准化的进程。目前出版界执行《图书书名页》国家标准很不规范,CIP数据与版本记录常常印在书后,项目也不一致,有的把翻译书的原著书名印在主书名页上。这种情况不仅给编目工作带来困难,对图书电子文本的利用也很不方便。《图书书名页》标准的认真执行,可为制定EBOOK的标准奠定基础。同时,不仅对于统一机读目录格式也有极大的影响,对于元数据的研究工作也将产生积极作用。从而为大量开发与利用数字化中文信息资源创造了条件。
四、可加强出版事业的科学管理
在我国的具体条件下,ECIP的全面实现,也就是图书出版的全过程,从选题、审稿、录入排版、印刷、发行,都将在网上有所反映,也就是产生了一个非常完善的书目信息数据库。从而可用以加强对出版行业的科学管理。即可在每一环节上实施底账核查的办法,以打击造假制假、盗版侵权的非法行为。
五、提高CIP数据的商业价值
覆盖面全,内容又非常丰富的CIP数据,将成为最好的新书预报,必将受到发行界、图书馆界和读者的欢迎,也会为各种网站积极采用,并列数据的完善,也为我国图书走向世界提供了更好的条件。对于图书发行将产生不可估算的影响,因而会得到出版界的大力支持。CIP数据的商业价值将得到充分的发挥。