20世纪末中国数字图书馆实践探索
——先行者李东来馆长访谈
2023-01-10宫平
宫 平
李东来先生是我国著名图书馆专家,1984年自北京大学图书馆学系毕业,1984-2002年在辽宁省图书馆(以下简称“辽宁馆”)工作,2002年被东莞市委人才引进担任东莞图书馆馆长至今。李东来馆长在公共图书馆领域工作30余年,主要研究领域为图书馆管理、阅读推广、信息技术应用等,担任中国图书馆学会阅读推广委员会主任、全国图书馆标准化技术委员会委员兼副秘书长,曾获全国优秀科技工作者、国务院特殊津贴专家、文化部优秀专家、广东省宣传思想文化领军人才等荣誉。他在数字图书馆领域的探索极大地促进了我国图书馆现代化。以辽宁馆为例,在其推动下,20世纪90年代末数字图书馆建设踔厉前行,实践内容详见表1。
表1 李东来馆长早期在数字图书馆领域的探索
20世纪末数字化浪潮奔腾而来,李东来馆长提出图书馆的主要职能是保存和传播人类文明,在全新的数字时空中,图书馆必须迎接生存形态的转型与蜕变;数字图书馆是人类文明的新家园,信息技术是关键和保障,信息内容是主体与核心,社会环境是生存基础和发展动力,三者共同作用推进数字图书馆良性可持续发展[2]。回首20年数字图书馆的发展过程,它是一个不断演化、迭代进化的过程。信息技术的迭代及应用使得图书馆事业不断变化与进步,数字图书馆的研究与实践可以给如今的智慧图书馆很多借鉴与启示。对照20多年前数字图书馆概念刚刚被引进,在理论上的研究与探讨,在实践中的探索与建设,诸如数字图书馆建设初期的组织与规划,应用技术与标准规范,信息内容的组织与描述,积极适应社会发展环境和读者需求,思考如何协同技术、内容、环境等要素,如何发挥图书馆专业知识贡献等问题依然具有参考价值。站在智慧新时代,图书馆需要在新挑战中把握新机遇,打造智慧图书馆如同建设数字图书馆一样,是以新的形态储藏和展现人类文明,是图书馆人的职责和使命。
1 背景回顾
20世纪90年代以来,信息技术飞速发展,互联网普及化,人们的生活、工作与学习方式随之发生了深刻变化,互联网成为人们获取信息的重要渠道。电子图书馆、网络图书馆、虚拟图书馆和数字化图书馆等概念应运而生,随着研究与实践深入发展,逐渐规范统一为“数字图书馆”①。数字图书馆是基于网络环境的信息资源组织与服务方式,是图书馆人适应时代发展和社会需求的专业体现。
辽宁馆以南湖新馆建设为契机,为其自动化建设制定实现“三种形态”、承担“两个职能”的发展目标,实现三种形态即建成辽宁省数字图书馆、辽宁文化信息中心、辽宁文化信息社会服务网;承担两个枢纽职能即承担横向的省内文化信息网络枢纽和纵向的国家数字图书馆网络的东北地区枢纽。其中,数字化图书馆项是自动化建设的重要组成部分,也是重点工作。1997年9月辽宁馆与东大阿尔派公司合作,选用当时比较有影响的IBM公司数字图书馆系统,进行数字图书馆整体解决方案探索。辽宁省数字图书馆项目一期的目标是搭建数字图书馆技术平台,在IBM数字图书馆系统的基础上,由东大阿尔派公司做系统集成和二次开发。首先对辽宁馆馆藏的60万册古籍进行筛选,从中选择富有特色的部分资源进行数字化转换,并探索通过互联网向全球用户提供使用。辽宁馆的数字化图书馆项目在系统上实现古籍图书的数字处理、因特网信息发布、多媒体阅览室和VOD点播,充分发挥数字化图书馆系统的多媒体平台特性,为辽宁馆搭建了一个集成的、多媒体信息工作环境[2]。这一项目是我国数字图书馆整体解决方案的先行探索,在图书馆界产生了较大影响。在没有很多参考与借鉴状况下,李东来馆长所带领的辽宁馆研发团队积极学习,认真探索,充分发挥专业智慧,为数字图书馆建设提供了可行方案与实践经验。回顾数字图书馆实践探索历史,能够为当下的智慧图书馆建设提供借鉴。为此,笔者就20世纪末中国数字图书馆的实践探索访谈李东来馆长。
2 访谈内容
◆宫 平
□李东来
◆2002年吴慰慈老师出版的《图书馆学概论》中有一章是《信息高速公路与数字图书馆建设》。数字图书馆这个词给刚刚迈入大学校门的我带来了无限遐想,对图书馆的未来形态充满了期待。
□的确如此,数字图书馆对图书馆行业来说,名字是金光闪闪的,在当时为行业带来了希望之光,让图书馆人看到了美好前景。如今回顾数字图书馆的发展历程,确实绕不开信息高速公路。1992年美国参议员阿尔·戈尔提出“美国信息高速公路”法案,信息高速公路是国家信息基础结构的形象化名称。1993年9月,美国政府制定《国家信息基础设施:行动计划》,引起广泛的关注,引发全球信息化建设热潮。图书馆所处的外部信息环境发生了变化,信息基础设施建设成为数字图书馆产生和发展的重要推动因素。在信息基础设施建设中所应用的现代信息技术为数字图书馆的开发和试验奠定了技术基础。
1996年,第62届国际图联大会在北京召开,这是国际图书馆界的一次盛会。实际上,信息技术和高新技术在图书信息界的推广应用也逐渐形成了热潮,当时图书馆人深刻认识到广泛采用信息技术已成为全球图书馆发展的趋势。那届大会展览会的展品与以往大不相同,可以说是更新换代的转变,让我感触最深就是电子出版物,展览会上大多数出版社和发行商带来了电子出版物展品。这其中包括采用先进技术制作的缩微、防盗、集装书架等一系列图书馆设备的新产品。另外就是设有一个电子图书馆展厅,这里集中展示了信息数据化、计算机信息检索和查询及综合管理、网络信息服务这些新型图书馆设备与系统,当时IBM公司就提供了一个数字图书馆的演示空间[3]。在信息化浪潮背景下,国际图联大会在中国召开,给中国图书馆界带来的是欣喜和兴奋。因为全球都在提数字化生存、网络化发展,在图书馆界很多新观念随着数字图书馆应运而生,图书馆行业发展的目光都聚焦于数字图书馆,无限美好!但数字图书馆到底是什么?它是什么样子?好像还有一段距离,很遥远,图书馆界也开始进行实践探索。
◆IBM数字图书馆系统作为第一个商用数字化图书馆解决方案,给当时的国内图书馆界带来怎样的影响和冲击?
□IBM公司当时是最有影响的IT公司,为顺应全球信息化数字化建设的发展与需求,专门成立数字图书馆的部门来进行数字处理平台的研发和建设。1996年5月,IFLA大会开幕之前,北京国际图联大会秘书处与IBM中国公司联合举办了“北京96图书馆自动化发展研讨会”,参加会议的有原文化部、原电子工业部、原国家科委等部门领导,还有IBM中国公司和来自美国、日本及全国各大图书馆的专家,IBM公司演示了数字图书馆技术、最新产品,包括当时较为成功的用户实例,为数字图书馆进行了预热。1996年8月,在IFIA大会上,IBM公司展出了一个旨在实现全球信息共享的最新解决方案,这个方案就是IBM数字图书馆系统。
IBM数字图书馆系统实质上是一种技术平台,可以广泛应用于各种解决方案。7月31日,IBM宣布数字图书馆软件包将交付给用户全面使用,当时产品所包含的技术已经支持了诸如梵蒂冈图书馆、EMI音乐出版社、DreamWorks SKG数字动画工作室等多个著名学院和商业机构所开发的数字化项目。这项技术提供了一个较为全面的方案,或者说是数字图书馆的底层平台,帮助信息拥有者实现信息资源的数字转化和发布利用。IBM数字图书馆系统将多媒体信息以数字方式创建或将其转化为数字形式,通过网络发布给全世界的用户。数字图书馆一直在行业内发酵,这个名字就足够吸引图书馆人去关注,所以图书馆人所投入的热情比中国IT界还要大,虽然当时国内的网络基础设施还不够完善,但依然阻挡不了图书馆人的那种热情与兴奋[4]。
◆查阅2000年左右的相关文献,对于数字图书馆这个舶来品,在国内并无统一的认知,图书馆界如何去实现数字图书馆呢?
□信息高速公路建设热潮把我们带入了信息社会。生活方式改变了,数字化信息时刻环绕着我们,由此引发的是人们对信息、知识、文献需求的变化。图书馆作为社会的文献信息中心,是信息加工整理机构,在这种深刻的变革中,我们需要提供相应的新型服务来适应信息社会。那个时候迫切需要一种新型的图书馆,这种新型的图书馆至少要满足几个要求:第一,图书馆要依赖现代通信技术和网络基础设施进行管理与工作;第二,图书馆加工、处理并用于服务的文献信息应该是以数字化形态存储和传递;第三,图书馆所利用的文献信息不应局限于单一馆所有,应该构建总体拥有量大、个体专题能力强的格局,突出单馆的专题文献信息整理能力,突出工作特色;第四,图书馆需要信息图书馆员,既了解并熟悉信息内容,又拥有现代信息技术技能的新一代图书馆员。我始终认为图书馆员是图书馆运作的关键与核心。把这些问题梳理清楚,要做的事情也就清晰了,就是将图书馆原本以纸质文献为工作内容的加工、排序、重组并形成以书目索引为工作结果的一系列工作,转换在各种载体文献和宽广的电子时空中进行信息的筛选、整理、排序、重组,形成专题信息,甚至可以进行内容的再创造,形成新知识,最后的成果形态就是数字图书馆,当时我是这样理解和认为的。
回归到现实,数字图书馆引导图书馆人去关注,具有很大的吸引力。当时美国国会图书馆、大英图书馆都有相应的项目,国内都有跟踪研究。1996年7月由原文化部组织申报“中国试验型数字式图书馆”项目,1997年1月经国家计委批准被列为国家重点科技项目。项目由国家图书馆作为组长单位,联合上海图书馆、深圳图书馆、原广东省中山图书馆、辽宁省图书馆、南京图书馆和广西桂林图书馆几家具有一定技术基础的图书馆共同承担[5]。数字图书馆建设初始更多的是技术平台、技术方案、技术系统的配置,包括硬件和软件,底层是网络基础设施,后面要靠软件系统进行整合实现相关功能。那么试验型数字图书馆,不是简单地搞出来一个系统,而是重新拟定系统架构和功能需求,进行二次开发,以真正适用于图书馆行业并具有推广价值。
◆辽宁馆是国内较早进行数字化图书馆开发研究的单位。项目初期,图书馆做了哪些准备工作?
□1990年辽宁馆启动新馆建设,分两期进行,一期工程结束后,随即启动二期建设。这个时候辽宁省政府拨自动化专款500万,用于图书馆自动化设施建设。在专项经费确定后,首先开展考察与调研,随后开始论证与选择,之后又积极推进配置、开发、加工以及调试和集成等一系列繁杂而紧张的工作。前后大概有两年时间,最后选择由办公自动化、图书馆业务管理系统、数字化图书馆3部分组成辽宁省新馆的信息系统建设,其中重点部分就是数字化图书馆[6]。
为充分使用好新馆自动化专款,做了大量工作。首先调查了解图书馆行业发展趋势,立足于辽宁馆现状,起草《辽宁省图书馆自动化信息系统需求方案》。为保证系统选择的科学合理,在广泛调研、征求意见基础上,组织召开两次全国性的专家论证会和一次跨国性的专家咨询会。这些工作都做得扎实有效,成果是形成了一个较合理的经费使用方案。图书馆新馆的网络化和数字化有3个层次:一是基础设施建设,就是智能楼宇综合布线,包括网络管理,各楼层的配电、弱电配置,路由集线器,网络管理设备等,这些都需要全新配置来适应新馆各项工作;二是硬件设施,主要是服务器、磁盘阵列和计算机,实现电子阅览室和自动化业务管理;三是系统软件和应用功能,软件层面一般是图书馆自动化系统部分,当时系统有国外的也有国内的,国内国外(价格)差别很大。当时500万专项经费不多,仅仅智能楼宇部分,全馆3万多平方米(馆舍)的智能布线、网络路由就占较大比重,还有必须实现的展现新馆形象的目录检索大厅、电子阅览室、员工办公自动化等电脑和服务器配置。如果再加上新应用功能,实现的难度都大,所以比较分析后做了较为理智的选择,在业务管理系统上选用深圳ILAS系统,节省的经费用于开发数字化图书馆系统。
之前IBM国内的宣传推广让我们有了直观认识。IBM数字化图书馆是基础技术平台,属中间件产品,需要开发客户应用程序。经过广泛调研,结合多次专家论证和咨询,最后选择与东大阿尔派公司合作,对IBM数字化图书馆解决方案做系统集成和二次开发。IBM数字化图书馆是全球首家数字化图书馆商用系统,我们期待通过其先进的技术平台加速推进辽宁馆信息化建设的数字化转换加工和数据库建设。通过多方论证,按照现有条件对东大阿尔派公司提供的数字图书馆集成方案进行了有侧重的取舍,突出图书馆资源特点并适用于网络发展趋势(见图1)。在当时的经费条件下,这是一种综合效益最佳的方案,既满足了面向未来、适度超前的需要,又充分利用好了现有资源,具有可行性。由于是国内首个商用数字图书馆系统,IBM公司和东大阿尔派公司给了我们很大的优惠和赞助,如IBM捐赠辽宁馆的一套高端扫描系统,价格不菲[7]。
图1 辽宁省数字图书馆方案简图[7]
◆在与东大阿尔派公司合作研发的过程中,图书馆的专业化组织工作体现在哪些方面?
□作为一个平台产品,数字图书馆的很多功能是需要再开发的。选择确定系统方案,完成设备配置安装仅仅是前期基础,之后的功能分析和数据加工才是关键工作,而这些需要作为用户的图书馆去承担,并且是大量的工作。在开发过程中,确定数据要求、提供功能需求这些要由图书馆方来承担,图书馆工作人员还需要承担辅助页面制作、参与功能测试与修改的任务。在系统实施过程中,我们感到重点和难点就是信息内容选择和数据分析。IBM数字化图书馆实质是由客户、图书馆服务器和对象服务器构成信息传递的三角形架构,类似于传统图书馆的读者-目录-书库的三点结构,这是具有重要意义的。数字化图书馆需要向客户提供信息内容,那么哪些信息内容要存储到数字图书馆中,这些信息内容又该如何组织呢?我觉得这些问题必须仔细地分析、认真地研究,而且要以规范性的文字明确规定出来。当时我们确定信息分析组织的一个基本程序是:首先进行信息内容选择,其次是确定信息的类型,之后建立数据模型,然后规范数据格式,接着明确信息间相互关系,最后进行统一的加工与处理。其实也就是将以往图书馆经验型的管理与需求在深刻认识的基础上,进行系统化提炼与总结,形成能够由计算机处理的相关模型,并且符合数字图书馆的信息构成要求[8]。
在信息内容选择上,既要考虑现实意义,又要兼顾社会价值。只有选择社会需要的信息内容,方便更多人去获取和使用,才能让信息流动起来,数字图书馆的功能和价值才可以发挥出来。当时辽宁馆数字图书馆内容建设是从主题角度来切入的,首期的专题包括古籍精选、历史存照、名人留鸿、医疗信息、文化信息、影视剪辑等。比如古籍精选,当时就是考虑到将部分古籍进行数字化,不仅能够保护国家珍贵的文化遗产,最重要的是能够让更多用户访问和使用,并且不损害古籍。在内容选择上有目的和重点地选择多种载体形态;文化信息是全文类型;名人留鸿是全文和图像两种类型。古籍精选和历史存照是图像类型,但两者是有差别的,古籍是连续的图像,历史存照则是单幅图像;影视剪辑就是视频和音频;医疗信息这个专题是结构性数据。这些专题几乎涵盖了常用的载体类型,都转换为数字形态。
◆建设数字图书馆要解决的关键问题是信息描述与组织,辽宁馆是如何应对和解决的呢?
□当时组建了很多工作小组,从馆里抽调一批年轻业务人员,比如资料翻译与规范整理组、图像扫描处理组、全文录入与转换组、数据库加工组、音视频编辑加工组、数据集成与网页设计组。面对多种载体形态的信息,如何进行有效组织,是要解决的关键问题,也是图书馆专业性的重要表现。在没有很多可参考借鉴经验的情况下,我们还是下了很多功夫的。当时纯网络环境的元数据DC出台不久,比较简单,应用也不完善,不能适应我们的需求,只能结合实际和系统需要做转换。比如图片加工处理,是在遵循CNMARC格式的基础上,针对图片的特点采用22个字段,65个子字段,全面揭示图片本身和所反映的内涵。在不断实践探索中,制定《图录数据库图片命名规则》,建立和完善《辽宁省图书馆图片数据库著录规则》。文化信息、古籍精选和历史存照这3个是可以实现全文数据检索的数据库。古籍精选和历史存照实际上是有两个文献数据库,一个是一次文献数据库,就是将书籍和图片直接扫描而成的图片数据;另一个是二次文献数据库,就是经过加工处理的,可以称之为书目数据。通过提取书目数据中的属性值形成检索点来实现全文检索。这些数据描述都是以MARC为基础,结合具体资源特点进行修改与完善,最终实现了结构化数据、图像、全文、音频、视频等不同类型信息的组织(见图2)。这种数字化的信息组织模式,可以实现信息抽取,根据需要从不同专题中抽取出相关信息组成新的专题,辽宁馆就在上面介绍的这些专题中抽取了张学良和辽宁名胜两个动态专题。在数字图书馆建设过程中,我们探索并建立多媒体信息结构和规则,这既是应对的方法和途径,也是专业的思考和贡献[9]。
图2 信息内容构成及其关系[7]
◆在数字图书馆项目研发过程中,您觉得最大的收获是什么?
□经过数字化图书馆项目探索,最大的收获是培养和锻炼了一批年轻的业务和技术骨干。首先,有专门团队跟踪学习数字图书馆的发展与变化,包括理论学习和实践跟踪。1999年研究团队从收集查阅的大量资料中选取具有代表性的论著和文章,出版《数字化图书馆文集》,比较全面地展示当时我国数字图书馆的研究和工作状况。同年在《图书馆学刊》开辟“数字化图书馆”专栏,当时很多参与项目研发的馆员都根据自己的工作实践和思考撰写文章,将我们的经验分享出去,也期待更多的图书馆人参与进来,共同推动数字图书馆研究,促进理论与实践的密切结合[10]。其次,在信息内容组织方面有一些探索。在建设数字图书馆过程中,要对多种类型的信息进行数字化转换和标识加工。针对连续图片、离散图片、全文数据、事实型数据、MARC数据、音频、视频等7种信息进行元数据描述,并制定了相应的规则和标准。最后,在此基础上形成各类专题数据库,包括古籍精选、东北图录、影视剪辑等,既体现了辽宁的地域文化特点,又汇集各种类型,为数字图书馆提供了类型多样的丰富信息内容,也是我们所取得的成效。总的来说,既有实践探索,也有理论呈现。在跟踪学习数字图书馆的过程中,专业能力和业务水平不断得到提升;在建设数字图书馆的探索中,创新思考和专业贡献得到体现。
图3 国内第一本数字化图书馆文集
◆数字图书馆经过20年发展,已经进入到一个全新的时代。回顾当初数字图书馆的实践探索,您有什么感想?
□建设数字图书馆是以一种新的形态存储并展现人类文明,使其在新的环境中赢得全新的发展,发挥更大的效用,而这正是图书馆人的职责与使命所在。在这个大背景与大趋势下,图书馆从传统转向现代化,这个进程可以分为3个阶段:一是自动化管理阶段,主要是将图书馆原有业务流程中由人工来操作的工作采用计算机进行替代,提高工作效率,实现科学管理。这个阶段主要是对书目信息和业务信息进行处理,实现业务自动化和管理自动化。二是单体数字图书馆阶段,只是一个图书馆实现所有的文献信息的集成化管理,并且深入到文献内容。这个阶段图书馆不仅处理书目信息和业务信息,还能够处理图片、视频、音频等多媒体信息。这些经过数字化转换和处理的形式多样的信息,能够让读者通过网络和计算机在图书馆或者家里就完成读书看报,还可以浏览照片、欣赏音乐、观看视频。那时候的辽宁馆就是在自动化管理的基础上,不断完善系统规模和功能,适时开展数字图书馆研究与建设,从而实现了图书馆的跨越式发展。三是联合数字化图书馆阶段。所谓联合就是将单体数字图书馆通过网络连接起来,突破地域限制,提供规范有序的信息查阅服务。前面我们谈到的“中国试验型数字式图书馆”就是要实现数字图书馆的共建共享,规划建设框架,制定标准规范,协同资源建设,进行应用系统开发,从而实现跨库检索。最直观的体现,就是一个读者不需要知道某个文献资料具体在哪些图书馆,或是哪个图书馆有哪些文献资源,他们只要提出信息需求就可以,然后通过联合数字化图书馆系统完成文献资料的查找和调阅,最后将检索结果直接反馈给读者。当然,这种期待已经成为现实,而成为现实的动力离不开当时图书馆人的迫切期待和无限憧憬。
数字图书馆是图书馆,但不局限于图书馆,更多是拓展了图书馆。网络信息技术的发展和信息基础设施的完善,打破了原有图书馆的外延,赋予图书馆更为丰富的内涵,在更大范围内连接了图书馆和社会。当时中国数字图书馆的建设目标是建立起一个跨地区、跨行业的文化信息资源网,对文化信息资源进行数字化和深加工,是在整个文化领域的促进与推进。数字图书馆赋予人类文明新的发展,给予中华文化新的契机,预示着图书馆新的发展前景。图书馆在迈向数字化的进程中要完成内部模式的转换,在内容组织上从单一的书报刊发展到多媒体和音视频,这必然会给文化生产、文化传播、文化消费带来一系列的连锁反应,因此,我当时认为数字图书馆将会引发新的文化发展模式,形成网络化密切联系的新趋势。后来在新世纪进行的服务体系建设,是网络联系趋势的自然发展,我们以集群技术支持体系建设,思路是相通的,作用领域和处理对象有所调整而已。
3 结语
20世纪90年代,数字图书馆如同一道光照进图书馆界,让图书馆人感觉到如此美妙!信息化、网络化、数字化为人类搭建起一个全新的数字时空,也为图书馆开辟了一条宽广的道路。图书馆积累的大量文献资源如何在全新的数字时空发挥出更大的效用,前辈们孜孜不倦、勇于探索,实现了图书馆现代化的完美转型。数字图书馆的实践探索积累了丰富的数字化资源和宝贵的建设经验,为开启智慧图书馆新时代提供了参考与借鉴。
2021年9月16日,笔者收到李东来馆长邮寄来的《数字化图书馆文集》,这是一本1999年由东北大学出版社出版的图书。翻看这本书,第一感觉是很有年代感,因为书有些陈旧。仔细翻阅内容,慢慢体味出一种新鲜感。文集作者中有很多熟悉的名字,也有很多不熟悉的名字,但他们的共同点是在朴实的文字中流露出对数字图书馆的无限憧憬和美好期待,让人感受到了那时图书馆人强烈的创新精神和务实的工作态度。在进行数字图书馆访谈过程中,李馆长总是充满激情,展现出强烈的专业热情。他清晰而专业的讲述,就算是语音通话,也依然让人感受到他的眼睛是发光的。是的,图书馆人的专业和智慧就是发光的。
注释
①由于数字图书馆概念的发展变化,本文在引述历史文献资料部分仍沿用“数字化图书馆”,在其余表述中统一使用“数字图书馆”。