对数字复合出版环境下图书馆发展方向的思考
2010-03-22上海图书馆上海200031
●傅 俊(上海图书馆,上海 200031)
1 数字复合出版系统工程介绍
数字传媒时代在提供给人们新的生活方式的同时,也悄悄改变着人们传统的阅读习惯。针对这种变化,出版业界的数字复合出版应运而生。数字复合出版指的是对文献内容的多媒体出版,其中包括对文献同一内容“用多种符号复合表达、用多种媒体复合表达、用多种传播载体复合表达、用多种传媒形态复合表达、用多种显示终端和制作技术复合表达等多个方面。”[1]
2008年4月,“国家数字复合出版系统工程”在多方努力下正式启动,该工程作为数字出版的重点工程,已被明确列入《国家“十一五”时期文化发展规划纲要》和《新闻出版业“十一五”发展规划》。作为21世纪数字环境下新闻出版业的“748工程”,数字复合出版系统工程意义重大,不仅在出版内容上,而且在阅读方式、内容传播方面都将会促进数字产业的发展,并带动产业链上相关产业的发展。
数字复合出版系统工程内容可简单概括为:“一系列标准规范、两部分研究内容、五类应用示范、六大技术平台、九项关键技术、十六个子项目。”[2]
(1)在数字复合出版系统工程研发中,标准化建设工作处于该工程的重要位置,是该工程的基础性工作。标准体系由标识类标准、复合文档结构化类标准、元数据类标准等十大类标准组成。
(2)数字复合出版系统研究内容分为核心研究内容和关联研究内容两部分。核心研究内容包括六大技术平台的建设,即:数字复合出版采编管理平台、全媒体资源服务平台、内容制作平台、多渠道出版发布平台、政府监督平台和出版物DOI/CDOI管理与服务平台。关联研究内容包括:生产过程全流程数字版权保护解决方案,补字、超大字符集的应用,全媒体经营管理技术支撑平台,全媒体应用整合平台和数字复合出版可扩展体系五部分。
(3)数字复合出版系统共性技术的研发涉及九项关键技术:元数据、结构化信息、知识点标注技术,面向生产过程的数字版权保护体系,痕迹保留以及版本管理技术,科技内容排版技术,并行组版技术,自动化排版技术,版式和流式相统一的多元发布技术,DOI,暗纹和二维码编码、嵌入、解析技术,出版选题的辅助决策分析。
(4)在数字复合出版系统工程建设全过程中,进行系统分类集成与应用示范。对开发完成的各项共性软件工具进行集成与二次开发,并在科技图书、百科全书/辞书工具书(包括年鉴等)、教育图书、各类期刊、报纸等五类不同类型的出版领域,遴选符合本系统实施条件的出版单位进行典型示范。
2 数字复合出版系统工程对图书馆的影响
数字复合出版系统工程以出版业为立足点,以打造出版新业态为目的,因此在工程实施过程中或多或少会对产业链上相关领域产生一定的影响。处于产业链下游的图书馆是受惠其中还是直面冲击,是值得图书馆人深思的问题。
2.1 加快书目数据编制速度,统一书目数据源,促进统一规范研究
长期以来,图书馆一直被认为是信息资源收集、加工、保存并提供利用的最佳机构。然而,随着互联网的发展和技术环境的变化,网络信息资源的动态性、分布性、多元性和无序性等特点,使信息的查找和检索变得越来越困难。如何对多元化的信息进行合理的描述、组织、序化,如何使信息资源在全社会范围内达成统一则是近十年来图书馆界研究的重要课题。
图书馆对文献的揭示是依据文献已有信息进行客观性描述,且各个图书馆会根据需要对文献进行深浅不同程度的揭示,由此导致针对同一文献会产生不同的书目数据状况。虽然国内已经形成几大联机联合编目中心,成员馆可以在所属中心内进行数据的共建共享,使数据的揭示标准在一定程度上有所规范,但目前几大中心之间还未能就数据的著录规范达成统一标准,距离文献信息资源的全国统一还有很大一段差距。
数字复合出版系统工程的实施无疑将对数据著录规范的统一产生重要的影响。文献在生产之时就自动提取书目记录所需的元数据,按标准化格式供全社会使用,即对文献实行自动编目,从源头对数据的生产进行有序化。图书馆在获得文献的同时,也获得了最基础的编目信息,这将大大提高编目的速度,使文献能够尽快地被读者使用。
同时,对元数据的处理也不再局限于文献生成以后,而是从文献生成之时开始。这样各个图书馆便可以在拿到文献的同时得到同样标准的元数据,很大程度上缓解了由于数据著录标准不统一而产生的问题,使今后对规范的研究有了统一的起点,也使全社会的信息标准化进程迈向一个新的高度。
2.2 编目工作前移至出版社,对编目人员和理论发展的影响
自动编目从根本上改变了编目模式,变图书馆的“描述性编目”为出版社的“标识性编目”,即在图书印前电子文本上进行编目处理。具体操作是对其中的属性数据进行标识,而不是描述。[3]文献编目工作也不再由图书馆的采编部门来完成,而是前移至上游出版社在文献产生的过程中自动生成。这虽然从源头规范了数据生产,改变了信息生产的无序状态,有利于文献信息资源的有序整合。但这一看似新技术环境下产业环节优化整合的方法却给图书馆带来了巨大的冲击:
(1)编目人员角色的重新定位。当我们从全国范围内的数据规范化中看到希望而倍受鼓舞的同时,也应对占据采编部门大半壁江山的编目工作及其从业人员进行重新定位。在信息量激增的时代,信息爆炸使得文献信息资源的检索越来越复杂,在美国,许多专家呼吁,应当以“图书馆员的思维方式”对信息资源进行管理。可见,编目工作者的丰富经验及其所从事的工作对信息资源的组织的重要作用。自动编目的数据虽然可以使读者在最短时间内获取目标文献,但却无法在文献检索过程中提供完整而全面的数据。优秀的图书馆员应当在自动编目的基础上,对数据进行进一步的结构性编目,以满足读者知识搜索的要求。
(2)现有理论发展方向的转变。伴随着编目的对象从纸质文献向电子文献、网络资源乃至实体藏品的拓展,图书馆对编目规则的研究从AACR2(英美编目规则第二版)、FRBR(书目记录的功能需求)、RDA(资源描述和检索)发展到FRAD(规范数据的功能需求)、FRSAR(主题规范记录的功能需求)。虽然在数据规范方面的研究已经取得了很大的成绩,但所有这些规则都是在客观性描述的前提下产生的,从本质上看还是将文献实体作为著录的客观依据的规范。面对自动编目的产生,这些规范都将无法发挥原先应有的作用。因为,自动编目是在文献生产过程中对其中的属性数据进行标识,对待出版的图书必须具有哪些属性、输出哪些属性、输出的格式等进行规定,这对现有编目理论提出了挑战。在这种情况下图书馆需要针对标识性编目制定新的编目原则,这将是未来编目理论的一大发展方向。
2.3 促进编目工作朝知识组织方面发展
总体上看,自动编目系统的设计思想可简单概括为对图书的印前电子文本用XML语言描述的DC元数据加注结构标签,使线性文件转换为数据库文件,从而达到一次录入生成两种产品(图书馆机读目录、图书)的目的。这一转换过程是通过简化CNMARC字段,限制字段指示符的选择性定义以达到MARC与DC元数据的匹配来实现的。
但正如CIP数据一样,该系统虽然能够产生基本的书目数据,满足图书馆能够把书借出去的初级要求,但该系统的设计思想忽略了其产品的使用者对知识组织的需要,而这恰是图书馆对数据的深层次的揭示的优势,即为读者提供更全面、更准确的文献检索。[4]要完成图书馆深层揭示文献外部与内容特征的要求,还需依赖于基于形式化表达的本体论的知识组织模式。以本体作为知识组织的技术和方法,将实现基于语义的知识检索,使读者在搜索目标文献时准确而全面地获得数据,这也将是未来编目工作的努力方向。
3 图书馆在数字传媒时代的发展方向
站在图书馆的立场上看待数字复合出版系统工程,一方面要认真分析工程中与改善图书馆服务质量、提升图书馆核心竞争力紧密相关的技术要点;另一方面也要在错综复杂的技术环境中保持清醒的头脑,存有忧患意识,面对挑战,寻求出路。
3.1 寻求契机,深化与出版社的合作
图书馆与出版社的合作早已如火如荼地展开。以中版通与国家图书馆在“网上样书库”的合作为例,该项目旨在数据共建共享方面缩短书目数据面世的时间,使图书馆可以与出版社同时拿到编制完整的MARC数据,从而节省数据编制加工时间,及时地为读者提供新书借阅服务。在编目工作前移至出版社以后,图书馆与出版社将在此基础上进行更广范围和更深层次的合作。
(1)在标准制订上的合作。商务印书馆信息中心主任刘成勇在接受采访时指出,从产业链来看,数字出版与数字图书馆是源和流的关系,是内容生产和使用的关系。作为出版业下游的图书馆来说,它是数字出版产品的直接使用者,但显然在我国,数字出版要落后于数字图书馆的发展。我国数字图书馆的发展已有10多年历程,但数字复合出版才刚刚起步。因此,数字复合出版在标准制定上可以借鉴或参考数字图书馆的一些现有标准,以避免上游数字出版与下游数字图书馆形成的标准体系不相容的情况发生。[5]在制订标准的过程中上下游应相互借鉴,相互合作,共同推进信息标准化的进程。
(2)数字版权方面的合作。从数字图书馆目前的发展现状来看,图书馆也存在着与数字出版合作的必要性,这主要体现在电子资源的版权问题上。2006年7月1日起施行的《信息网络传播权保护条例》第七条规定:“图书馆、档案馆、纪念馆、博物馆、美术馆等可以不经著作权人许可,通过信息网络向本馆馆舍内服务对象提供本馆收藏的合法出版的数字作品和依法为陈列或者保存版本的需要以数字化形式复制的作品,不向其支付报酬,但不得直接或者间接获得经济利益。当事人另有约定的除外。”该条例排除了数字图书馆的合理使用权,完全确立了权利人的网络传播权,使得数字图书馆的上传、下载、设置链接、馆藏文献开发、自身数据库建设均受到不同程度的影响。而走出这一困境的最佳路径就是要加强与出版社的合作,一方面在技术层面上加强电子资源的知识产权保护力度,另一方面在与出版社的合作中,将电子资源纳入出版物版权交易的谈判中,以内容的方式获得出版物的版权,从根本上解决数字复合出版在图书馆层面发生的瓶颈问题。针对前者,国家数字复合出版系统工程中关于“生产过程的数字版权保护体系,痕迹保留以及版本管理技术”将是在电子出版物知识产权保护方面迈出的重要一步。
3.2 转换角色,加强信息资源的组织能力
当编目工作前移至出版社以后,编目人员何去何从不得不成为图书馆要思考的问题之一。早在2008年1月美国国会图书馆便在其发布的《书目控制的未来报告》中建议利用供应链中前端可以获得的书目数据,减少重复工作,提高书目生产的效率。但该报告对编目人员今后的发展方向并没有给出具体定位和建议。
将图书馆的工作简单概括为收集信息、整理信息和传递信息并不为过。图书馆曾经在对以纸质印刷文献为主的文献编目中取得丰硕的成果。近年来,图书馆界对元数据、知识组织、本体、语义万维网、机器可理解等方面的研究扮演着领军人物的角色,并在关于分类法和情报检索系统的研究中也已经取得了丰硕的成果,这为编目人员从对文献信息的揭示到对知识信息的组织的角色转换奠定了基础。数字复合出版系统工程中的结构化信息和知识点标注技术将给予我们新的启发。数字复合出版系统中的结构化信息和知识点标注技术允许读者深入到文献内部就知识块进行检索。针对不同的读者,可以设立不同的知识元体系,建立不同的知识元数据库,这能够大大降低检索结果的信息冗余度,减少时间耗费,推进知识普及,加快知识创新。如果对专业作品在编辑加工过程中加上对知识的结构化加工,则在出版传统作品的同时还可出版带知识标引的作品,后者则可进入相应的知识数据库,提供按需知识服务。[1]这将从根本上提高知识搜索效率,满足不同读者对于不同知识块中的搜索,使图书馆成为用户获得有效、全面资源的知识库。
3.3 面向稀有特色资源的数字化发展
数字复合出版系统工程的推出将在很大程度上增加数字文献的馆藏比例,解决文献资源的电子化成本和版权的问题。
网络化的今天,图书馆面临的编目对象已不再局限于印刷型文献和电子图书,图书馆、博物馆、档案馆之间的试验性合作已经开展,对信息资源的揭示已深入到实体藏品层面。而对网络资源和实体藏品的数字化则是数字复合出版系统尚未涉及的,图书馆应抓住这方面的发展契机,加强在稀有资源和特色资源上的数字化进程,将稀有和仅有资料 的发现作为优先考虑的工作,优化稀有和仅有资料的编目工作,建立可行的和灵活的编目操作规范,共享这部分资料的元数据。[6]在基于三馆合作的实体资源组织方面,图书馆应继续扮演领军人的角色,进一步促进理论和规范的发展。
4 结语
数字复合出版是我国出版业的一次印刷技术革命,其不仅是出版业的飞跃发展,更关系到整个产业链的升级和变革。图书馆在面对这种机遇与挑战时,应尽快地适应新的规则所带来的变化,对于编目人员自身来讲,要充分做好这方面的知识准备,加深、加强数字复合出版、知识组织等技术、理论的理解和研究;对整个图书馆来说,则要加强与上下游产业链之间的合作,在变化中找准图书馆独特的发展方向,在网络传媒飞速发展的今天,寻求图书馆基业长青的生命要诀。
[1]田胜立.数字复合出版催生出版新业态[J].出版科学,2008(2):5-8.
[2]《国家数字复合出版系统工程》标准研制工作方案(征求意见稿)[EB/OL].[2009-12-01].http://www.epublab.com.
[3]陈源蒸.论“标识性编目”[J].数字图书馆论坛,2007(6):36-40.
[4]蒋小耘.ECIP自动编目软件系统设计思想的探讨——兼与张丽娟等同志商榷[J].图书馆杂志,2005(11):18-20.
[5]洪黎明.数字出版与数字图书馆的互动——访商务印书馆信息中心主任刘成勇[N].人民邮电报, 2008-12-10 (6).
[6]美国国会图书馆.书目控制的未来报告[EB/OL].(2007-11-30).http://www.loc.gov/bibliographic_future/news/draft_report.html.