美国大学图书馆馆藏资源组织进展
2020-01-08蔡迎春
蔡 颖,蔡迎春
0 引言
馆藏文献组织是图书馆信息资源建设的重要环节,是将馆藏文献由分散变整体、由孤立变系统的过程,能使图书馆资源不断增值,提高其社会价值[1]。迈入21世纪以后,新技术的快速发展改变了全球的信息环境,图书馆的资源建设开始进入一个全面数字化的转型时期,很多图书馆逐步从以纸质资源为主转向以数字资源为主,同时开始注重馆藏纸质资源的数字化建设。虽然收藏规模还是一个重要指标,但图书馆的工作重点已经不再以资源收藏为核心,反而更重视如何利用已有资源为读者提供教学、学习和研究中所需要的知识和服务。
美国作为全球信息技术发展大国,在新技术的应用方面一直走在世界前列,引领着世界高等教育与图书馆行业的发展与转型。2017-2019年间,笔者有机会走进耶鲁大学、哈佛大学、斯坦福大学、麻省理工学院、哥伦比亚大学、芝加哥大学、普林斯顿大学、加州大学伯克利分校、伊利诺伊大学、纽约州立大学石溪分校、乔治·华盛顿大学等多所美国顶尖大学图书馆,与这些图书馆相关人员在文献资源体系建设方面进行了深入学习和交流。它们在大数据环境下构建起的文献资源体系,在数据管理、数据处理、网络平台搭建、学术研究、数字人文等方面所做的工作,都有许多值得我国图书馆学习和借鉴之处。
国内学界一向很重视借鉴国际一流大学图书馆的发展经验,它们在发展规划、联盟合作、开放获取、用户研究、知识服务方面的做法先后成为国内图书馆界关注的话题[2],基于出国考察访问的研究成果也逐渐增多。但从已发表的论文看,大多集中在空间改造、学科服务等领域和层面的经验借鉴和介绍,从信息资源组织与利用的角度对馆藏文献进行深层次分析的研究成果并不多。通过梳理国内外最新研究进展发现,国外同行在RDA编制推广以后,解决了纸质资源与数字资源的统一著录问题,在研究如何优化资源整合方式,提高资源利用效率方面,以关联数据、数字人文技术、下一代图书馆服务平台、科学数据管理等为突破口,取得了不少进展;而国内同行们还停留在MARC时代,围绕模块化的工作流程开展工作,虽然也有一些研究成果发表,如上海图书馆夏翠娟等提供了关联数据在上图家谱数据库中的完整应用案例[3],南京大学图书馆在按需定制模式下构建起了一体化电子资源服务体系[4],国家数字图书馆工程建设了多个数字人文数据库并向公众开放[5],重庆大学图书馆打破数据库壁垒进行更为专业的资源类聚和推送等[6],但对前沿问题大多以理论研究为主,自主实践较少。面对“双一流”高等教育重点建设需求,有必要通过典型案例,介绍国外图书馆在信息资源组织与利用方面的最新实践,探索其创新之处,以期为我国大学图书馆今后的发展提供参考借鉴。
本研究以上述11所美国大学图书馆的信息资源组织与利用情况为研究对象,重点介绍他们在馆藏特色文献数据化、资源多样化收集与元数据整合、数字资源全生命周期管理方面的特色和进展情况。本案例中的数据来源于现场调研与文献调查,主要包括上述图书馆官网中的栏目介绍、相关会议报道、期刊论文、统计数据等。
1 美国大学图书馆资源组织与利用的最新进展
1.1 挖掘纸质特藏文献价值,开展关联数据及数字人文研究
当前国外大学图书馆以建设国际一流的特色馆藏资源为目标。哥伦比亚大学东亚图书馆馆长程健在介绍哥伦比亚大学图书馆馆藏发展政策以及信息资源共享体系的过程中,提到未来高校图书馆最大的差异在于特色资源。几乎所有参访的图书馆都把特色资源建设列为战略优先项,尤其重视纸质文献的特色化收藏,一般资源则以数据库的形式提供给本地用户使用。
过去几十年中,知识的传播形式发生了深刻的变化,教师和学生在教学和科研过程中使用和创造的资源越来越多地采用了数字化的形式。为了增加特色馆藏的可见度和影响力,美国高校馆纷纷实施了特色馆藏数字化工程,建设本地数据处理中心,将部分有代表性的资源进行数字化开发,使用户能更方便地利用特色馆藏。例如,哥伦比亚大学东亚图书馆收藏了中国民国时期制作的231幅门神纸马,为其馆藏特色资源之一,并于2005 年对这些门神纸马进行了数字化加工,利用自建网络平台以MARC数据的形式对全世界提供开放资源服务。此后,浙江大学图书馆利用哥伦比亚大学提供的高清数字化档案,于2006年制作出仿真品,并成功举办两地“馆藏民国门神画像联展”,为文献的进一步研究利用创造了条件[7]。
在图书馆的数字化业务走向深入以后,将馆藏数字资源进行深度整合和排列,挖掘出数据之间隐含的关系和内容,就成了下一步资源服务的重点。乔治·华盛顿大学图书馆资源编目中心负责人Jackie Shieh在《关联数据技术在图书馆编目系统中的应用》授课中介绍,美国很多高校图书馆正在研究关联数据技术,通过在图书馆编目数据中加入URL统一资源标识符,让读者可以通过一个数据查到其他相关数据,从而追踪到图书馆所有相关的书目信息。同时,关联数据技术可将图书馆的书目信息与开放获取网络资源相连接,提高资源的可揭示性和可获取性。目前,该校图书馆在数据服务上的优势已成为地区特色之一,为学生和教职员工提供贯穿整个研究过程的统计咨询、地理信息系统(GIS)咨询、查找与特定主题相关的数据、制定数据管理计划等服务[8]。
数字人文也是近些年来图书馆为数字学术开展服务的一个重点领域,其基本特征是利用计算机及其复杂的算法实现一些单用人脑很难或不可能实现的研究分析,包括社会人文信息的空间和时间分布分析、对大规模全文数据库和语料库的分析、社会网络分析等。数字人文学研究需要运用大量的数学知识和专门技能,而图书馆往往拥有远超个人收藏的海量数据以及专业技术团队,因此,很多数字人文项目的背后都有图书馆的支持和参与。在今年的参访中,各大学图书馆都重点介绍了各自最新的数字人文实验项目。斯坦福大学图书馆是全美第一个成立数字人文研究部门的图书馆,他们的CIDR(跨学科数字研究中心)拥有7名专职员工,都兼具计算机背景和文科博士学位,不仅自身进行数字人文研究实践,也负责培训分散在学校各个文科院系的学术技术专家,并通过他们向全校师生提供数据可视化分析、文本与定量分析、GIS 分析等多项服务,至今已取得相当多的成果。他们今年发表的成果中有一项《中国的死亡之域——现代中国的墓 葬 改 革》(Chinese Deathscape: Grave Reform in Modern China),由斯坦福大学历史系的墨磊宁(Thomas S.Mullaney)教授主导,以空间和时间轴线来表现当代中国的墓葬改革过程以及其中的各种社会和文化现象。虽然数字人文学目前仍然只能解决传统人文学和社会科学研究中的一小部分问题,但近年来在美国发展迅速,继斯坦福大学之后,哈佛、耶鲁、伯克利、康奈尔等著名院校也开始支持数字人文项目,纷纷建立数字人文实验室,加强了对馆藏特色资源的数字化融合和揭示,其研究成果不仅提供给本校人文学者,而且向全世界学者提供开放获取。
1.2 重视资源多样化收集与元数据深度整合
除常规的图书、报纸、档案、捐赠资料外,美国的大学图书馆几乎都拥有独特的实体馆藏,包括地图、手稿、信函、票据、账簿、广告、简报、决议等。经过多年的积累,不仅馆藏十分丰富,而且形成了十分鲜明的特色。比如,伊利诺伊大学图书馆从2006年就开始收集、整理电子游戏,经过编目的电子游戏可以通过网络进行查询,并且可以在网上演示游戏方式,方便读者研究。哥伦比亚大学于1948 年成立口述史研究室,是公认的现代口述史的发起者,在哥伦比亚大学善本与手稿图书馆内至今已收藏有8,000多份录音、录像、纸质文献和100多万页誊抄稿[9]。
同国内一样,越来越多的读者更喜欢利用图书馆的数字资源和学习阅读空间,美国大学图书馆在如何处理数字文献和纸质文献的关系方面也存在着困惑。很多图书馆减少纸本资源的采购,尤其是理工科文献,转而购买更多的数据库产品。数据库资源形式多样,包括电子书刊、数据集、参考工具书、图片、音频视频、开放资源等;内容丰富,覆盖了不同学科、不同领域、不同语言的信息资源,既有学术信息、时事信息,也有商业信息和广告信息。
各馆对资源编目十分重视,不管是纸质资源、视听资源还是数据库资源,全部进行MARC编目,整合进OPAC系统,实现馆藏可利用资源的统一检索。对纸本资源和视听资源,美国大部分图书馆已全面推行RDA编目。在描述一般印刷型文本资料和某些特殊类型资源(如音乐、录音、动态图像、测绘制图资源)时,RDA可以提供更为详细的描述元素。在选取口述历史作为编目对象时,字段的选择根据项目的需要和访谈内容有所不同。编目人员会先与口述历史学家达成一个编目协议,确定数据字段中应该记录哪些信息。如果缺乏抄本或者访谈员提交的元数据,编目人员就需要花时间听取采访,再综合采用书籍、手稿和视听资源中的元数据来实现编目。在对数据库资源进行编目时,电子图书一般先由数据库商提供编目数据,再由本馆编目人员对这些数据进行审校和添加链接字段;电子期刊则主要由统一检索平台的提供商通过技术手段抓取期刊的篇名、作者、关键词等信息,再对每种电子期刊的刊名、收录时间等信息加以核实;对于网络上有用的网页信息,则主要由参考咨询馆员对网页进行选择,将对教学科研有用的网页提供给编目部门,然后由编目部门进行编目和维护。
与国内图书馆普遍编目外包的情况不同,美国的图书馆只有在内部编目力量不足的情况下才会适度外包,大多数馆的编目工作仍由本馆编目人员自行承担。编目部作为元数据管理支持部门,是图书馆必不可少的组成部分,还承担给其他部门同事进行简单编目培训的任务。乔治·华盛顿大学图书馆的馆员被要求熟悉整个数字资源收集和管理的过程,而不能只考虑馆员自己所负责的那部分内容。为此,馆员们需要掌握更多关于编目、检索、信息存储等软件工具的知识,如口述历史同步元数据处理机(Oral History Metadata Synchronizer)可以用作转录抄本,电子版权办公室(Electronic Copyright Office)可以处理数字资源版权问题,内容传输服务(Content TransferServices)用来收集和储存电子文档,等等。
在美 国,Facebook、Twitter、LinkedIn、Google+、YouTube、Flickr 和Instagram 作为主要的社交媒体渠道,目前正在被图书馆利用,在编目形式上也出现了互动式编目。以前读者只能被动地接受图书馆的书目数据,图书馆给出什么(信息),读者就看到什么。现在只要把一条在线编目记录放在网页上,就可以做成标签(tag),可以单独拉出来分享到Facebook、Twitter等社交软件上,也可以通过打印、电子邮件等方式保存到手机和其他储存空间。同时,在每条编目记录下面还设置了互动对话框,读者可以在此发表阅读心得,也可以与图书馆员对话,如有什么疑问,希望推荐哪些新书等。目前,纽约州立大学石溪分校图书馆已采用了这种新颖的互动式编目。
1.3 实现数字资源全生命周期管理
随着数字资源在图书馆文献购置经费和馆藏中所占比例的持续增长,馆藏结构发生了明显变化。加州大学伯克利分校图书馆和耶鲁大学图书馆去年在资源建设方面用于数字资源的比例约为60%,其他大学图书馆投入到数字资源上的比例也大致在40%~60%(以上数据都来自现场调研)。在参访图书馆中,占比最高的纽约州立大学石溪分校图书馆,从2008年开始迅速增加电子馆藏,最近几年电子图书和电子期刊的订阅数量都占到总数的90%以上,到2020 年将接近100%。无论是从经费投入比例还是从数字资源发挥的作用来看,图书馆对于数字资源的依赖程度都不容忽视。
然而,与纸质资源在图书馆格局中占主导地位的工作流程相比,数字资源的管理流程更加复杂。对于馆藏建设领域专门负责数字资源管理的馆员而言,需要反复循环、更迭的流程很多。商业化的数字资源在图书馆的生命周期一般包括资源发现、资源获取、资源试用、资源评估、资源使用监护、资源统计、资源续订或停订这几个阶段[10]。在传统图书馆集成管理系统(Integrated Library System)的工作模块下,大量信息被分散到图书馆各个职能部门中:采访部掌握订购信息,参考咨询部掌握使用统计信息,技术部掌握资源的监护状况信息,决策团队掌握评估信息。由于信息之间缺乏有效的沟通渠道,数据的收集变得非常困难。如何实现数字资源的全生命周期管理,使图书馆员能在同一平台上完成各自的工作已经成为当前图书馆界急需解决的问题。
电子资源管理系统(ERMS)应运而生,最初由美国的大学图书馆自主研发,主要用于管理电子期刊、电子图书、书目数据库、全文数据库等传统图书馆自动化系统无法管理的资源。随着图书馆系统平台的不断发展,ERMS与自动化管理系统的功能逐渐走向融合,有的ERMS开始作为集成管理系统中的一个内置系统出现,业界称其为“下(新)一代图书馆服务平台”(LPS),能够把所有资源都集中在一个统一的平台里,对数字资源进行全生命周期管理以及为用户提供相应的发现服务[11]。2012 年,ExLibris 公司发布了Alma系统,引发了一波从图书馆集成系统向新一代系统迁移的浪潮。目前,许多供应商已将成熟的新一代ILS产品投入图书馆市场,截至2018年底,市场销售表现最好的ProQuest 旗下ExLibris 公司的Alma 在全球有1,543 个用户,OCLC 的WorldShare Management Services 在全球有565 个用户[12]。此外,开源软件开发者也在开发新一代ILS,最具代表性的有Koha、TIND、FOLIO等。
在学术图书馆和研究型图书馆领域,几乎所有大型图书馆、多校区图书馆和图书馆联盟都选择使用Alma 系统[13]。耶鲁大学、哈佛大学、麻省理工学院、哥伦比亚大学、普林斯顿大学、芝加哥大学、伊利诺伊大学香槟分校、伊利诺伊大学芝加哥分校、纽约州立大学系统中的64所学校、乔治·华盛顿大学的图书馆都纷纷从原有的图书馆集成系统迁移到Alma系统,加州大学伯克利分校法学图书馆也迁移到TIND图书馆集成系统。Alma的资源管理模块涵盖了各类资源数据,现有的各个层次的服务被整合在一个框架内,工作人员能在同一环境下完成所有工作。在资源获取环节,支持各种模式的资源选择与采购,特别是支持数字资源的用户驱动采购(Patron-Driven Acquisition,PDA);在资源描述环节,支持多种元数据标准,如RDA、CNMARC、MARC21、DC 等;在资源试用环节,能通过前端直接提供全文链接、查看排架状态等;在资源统计环节,馆藏分析与评估的各项功能将更加完善,可以从资源导航与远程访问系统中收集本地使用的统计数据,自动统计分析数据库中出版物或文献被列入本校发文的参考文献数据等,也可以从共享平台及其知识库中获取更广泛的数据来对本馆馆藏进行分析和预测[14-15]。
2 对美国大学图书馆资源组织的思考
美国之行中,笔者体会最深的是数字环境下信息资源与技术创新深度融合,给图书馆的资源服务工作带来了极具冲击力的变革。对图书馆来说,信息资源是其赖以提供服务的物质基础。随着数字信息所占馆藏份额的快速增长,如何有效管理庞大的馆藏数字资源,并在此基础上为用户提供独特的资源服务,已成为当前图书馆资源建设的主要驱动力。
2.1 资源服务角色不断演变
图书馆是一个不断生长的有机体。很长一段时间内,图书馆只是一个提供“藏书建设”的场所,资源管理的对象是文献载体,而非文献内容。随着新科技的发展和读者需求的变化,图书馆工作内容随之改变。2013年Janice等在美国图书馆协会的报告中指出,多样化的数字信息、教学形态的演化、科学研究范式的变化、学术交流与传播途径的变革等迫使图书馆的工作重点不再以资源为核心,而是利用图书馆资源为读者提供教学和研究中所需的知识和服务[16]。伊利诺伊大学图书馆馆长在介绍该馆2019-2023年的战略规划中也提到,未来将以“整合和管理知识以及为学生和学术团队提供支持”作为图书馆发展目标,以增强大学知识发现和知识创新的能力[17]。
知识的发展不只是量的积累。科学领域不断扩大,产生出许多分支学科和专业,同时各门学科之间又互相交叉、互相渗透,产生出许多边缘的研究方法和综合学科。学科分得越细,各学科就越需要运用其他学科的研究方法和研究成果。当代科学发展的这个特点,对图书馆的资源建设工作和用户文献信息利用行为的研究,都产生了深刻的影响。现在大量研究资料都以数字形式保存,很多还以开放获取的形式储存在出版社的服务器、社交媒体平台或学科机构存储库中,很适合图书馆基于馆藏书目数据加强与外部数据之间的关联,开展文本挖掘、数字可视化、数字人文等研究。过去20年间,数字人文学的发展非常迅速,图书馆也在数字人文领域为人文学者的学术研究提供了更加直观和便捷的研究视角与工具。尽管需要很大的资金投入,但随着具备现代信息技术知识的年轻一代人文社科学者的人数日益增长,对这个领域的兴趣在可预见的将来还会高速增长。数字人文使图书馆找到了新的服务方向和发展机会,但同时也对图书馆形成了新的挑战。馆员有必要密切跟踪相关领域的研究动向,增强自身数字信息技术业务能力,以应对这些挑战。
2.2 信息资源共建共知共享成为共识
金融危机以后,美国高校普遍面临经费相对短缺以及数字信息依旧快速增长的现实,于是合作协调、资源共享成为了图书馆的一种现实选择。借助先进的信息生产、储存和传递技术,最大限度地实现信息资源共建、共知和共享已经成为国外高校图书馆发展的共识。
首先,图书馆间各种形式的合作越来越多。在美国,以往图书馆间的合作大多局限在同一个州的范围内,现在跨州的合作逐渐增多,顶尖大学图书馆间往往还有跨国的合作。合作内容也从馆际互借、联合编目、联合采购逐渐深化到共建共享文献资源、共聘共用人力资源的程度。以参访的纽约州立大学石溪分校为例,该校与纽约州立大学系统中的另外63所学校共同组成了紧密的区域性数字图书馆联盟SUNY Connect,共用一个图书馆管理集成系统。所有教职员工和学生均可在任何时间地点,访问全体成员馆的图书馆目录,共享所有在线的参考工具和全文数据库,接受所有图书馆员的参考咨询服务和文献传递服务[18],使图书馆的信息资源在更深层次上实现了整合与利用。
其次,基于云端服务平台的数据实现了共享。在美国政府于2013年发布公开获取备忘录以后,各大高校逐步扩大了机构知识库的开放权限,让社会公众也可以下载查看以开放获取形式发表的研究成果,这在很大程度上促进了学术信息的共知与共享。很多机构库本身由大学图书馆负责管理,也在事实上拓展了图书馆信息资源共享的范围。高校图书馆将本校教职人员的论文、演示文稿、课程讲义、课题报告、实验数据等学术信息集中起来提供开放获取,对内可长期保存本校的知识产品,对外统一揭示本单位的研究成果,扩大了学校和本校教师的影响力。在应用软件方面,使用较多的是开源软件DSpace。这软件在2002年由麻省理工学院图书馆和惠普公司联合开发,任何机构都可以基于非营利目的来使用和共享网络资源,长期以来都是全球用户使用最多的机构库开源软件。读者无论在哪里,不需要登录VPN就可以获取其中的开放资源,还可以查看附近其他机构的机构库资源。从这一点看美国的大学机构库建设已经突破了区域内部的共享,达到与外部资源共同发展的程度。
3 启示与建议
3.1 关注数字人文技术,加大特藏资源开发
在科技飞速发展的当代,特色资源已成为图书馆的核心竞争力。相比美国的图书馆,我国图书馆对于特色资源的开发和利用还远远不够。在加快“双一流”高校建设背景下,图书馆需要加强本地特色馆藏开发,关注与未来图书馆发展紧密相关的数字人文、科学数据管理等新兴技术,将其作为特色馆藏建设的重要手段,增加本地特色资源的可见度和影响力。当然,这并不意味着所有图书馆都必须立刻投入实践,毕竟数字化加工的投入较大,数字资源的组织和规范标准也和纸质资源不同。比如,在处理纸质资源的时候要用到MARC格式、主题词表、分类法,而处理数字资源时还需要加上作者ID,否则很难区分。国内一些大馆也只是刚刚投入实践,虽已取得一定的成绩,但研究焦点大多还是基于理论探讨,从技术层面和应用层面进行研究的相关案例较少,且主要集中在上海图书馆和复旦大学、武汉大学、上海交通大学等几所国内知名大学的研究机构[19],需要更多的人来关注。
3.2 管护数字资源,促进纸质数字资源融合
是否对网络信息资源进行编目,把数据库资源和网页资源整合进OPAC系统的检索功能里,是中美图书馆工作中差异较大的部分。在各种资源类型越来越多样的情况下,美国的图书馆强化了数字资源和其他类型资源的编目工作,而国内目前还有很多图书馆并没对数字资源进行编目,读者无法在OPAC上检索到数字资源信息。资源发现系统可以实现对部分资源的跨库检索,但无法实现对所有馆藏资源的统一检索,部分数据库资源由于受到平台功能的限制而无法被检索到。从馆藏资源整合的角度来说,纸质资源与数字资源无法完全融合,会对学科服务的深入开展形成阻碍。在不具备对馆藏数字资源大规模编目的条件下,图书馆要加强对用户需求的整理,并深入思考如何让资源容易被发现、如何利用技术手段让资源容易被利用、如何通过宣传让资源容易被知晓,这些方面都显得尤为重要。
3.3 优化数字资源完整生命周期的流程管理
目前基于纸本资源而构建的传统ILS系统仍是国内图书馆存放数据和管理业务的主要系统,大多数图书馆对数字资源采用的是半手工化和半自动化的管理模式。虽然实体的音视频文件可以像纸质资源一样进行编目著录,但以数据库形式存在的电子图书、电子期刊、论文、书目等数字资源,从试用阶段起,管理过程就变得复杂:每个数据库在正式购买以前都有3~6 个月的试用期,每个合同都有合同期,到期后能不能自动提醒以进行下一步谈判战略梳理?经费应该怎样按照学校的学科重点进行合理分配?在统计时应该以篇来计算,还是以书名或刊名来计算,有无统一标准?图书有没有达到数据库商承诺的品种?期刊是不是与发布的目录一致?使用数据能不能自动生成分析统计表格?近年来数字资源愈加快速增长,我们理应重视馆藏数字资源完整生命周期的业务管理,规范其整体的业务流程,对目录管理、试用管理、合同管理、经费管理、资产管理、数据统计分析等各环节进行系统控制[20]。
4 结语
在图书馆开始进入全面数字化的转型阶段,美国的大学图书馆以整合知识和提供服务作为目标,正朝着信息资源共建、共知和共享的目标迈进。它们在信息资源组织方面,利用新兴的关联数据及数字人文技术来进一步挖掘纸质文献价值,加强了对馆藏全部可利用资源的编目工作,并且利用下一代图书馆服务平台的功能对数字资源实行全流程管理,从而构建起了一个完整的文献资源体系。目前国内在数字馆藏的管理和开发利用方面经验尚少,而经验只有在实践中才能不断获取与积累,因此,我国图书馆员有必要密切跟踪相关领域的最新动态,对自身的用户需求进行分析整理,不断尝试以最优模式来建设馆藏,推动图书馆向智慧图书馆前行。