APP下载

馆藏数字化的另一种方式
——纸电融合*

2022-09-15周秀梅

图书馆学刊 2022年8期
关键词:电子图书馆藏纸质

周秀梅

(浙江机电职业技术学院,浙江 杭州 310053)

1 引言

馆藏数字化是指将图书馆的印刷型、缩微型等载体形式资源用数字化的方式保存和使用,并实现资源全生命周期的标准规范管理[1]。馆藏数字化是构建数字图书馆的核心,建设智慧图书馆的基石,也是数字人文领域的重要基础设施[2]。随着移动网络技术和信息化社会的发展,馆藏文献的需求方、服务方、供应方均对文献的载体需求发生了巨大变化,馆藏文献由纸质型向数字化转化趋势明显[3],数字化资源是馆藏文献的重要组成部分。

2 高校图书馆馆藏数字化建设现状调研

面对馆藏文献数字化发展趋势,为了满足用户日益增长的数字化文献需求,国内外机构与组织做出了大量努力和尝试,如国内的大学数字图书馆国际合作计划项目CADAL(China Academic Digital Associative Library)和国外的HathiTrust数字仓库项目都以联盟形式对所收藏的纸质文献进行数字化加工与存储,为联盟成员提供长期的文献保存和获取服务。

笔者选取国内高水平研究型高校图书馆作为样本,通过检索39所“985工程”高校图书馆网站、CADAL网站以及教育部高校图书馆事实数据库系统等,分别对各高校图书馆的电子图书馆藏情况、馆藏数字化建设平台、纸电一站式资源发现系统、CADAL建设情况等进行调研,了解到“985”高校馆藏数字化建设基本情况如下(见表1)。

表1 “985”高校图书馆数字资源系统调研情况

2.1 高校图书馆参与CADAL项目建设情况

国内已经运行20年的CADAL项目是以高校图书馆为主要成员开展的馆藏数字化项目,是最早的大规模数字化资源工程和知识整合平台,目前资源量已达到268万种,是全球最大的公益性数字图书馆,已有881家国内外机构加入CADAL联盟[4],“985”高校中有35家图书馆为CADAL项目共建共享单位。数字化的文献有古籍、民国文献、现代图书等特藏资源132万册,期刊报纸35万册,学位论文13万册,各类文献资源累计约181万种,“985”高校馆藏数字化的文献约占CADAL资源总量的68%,这说明大部分高校图书馆已在一定程度上开展了纸质资源的数字化加工工作,并在CADAL项目中发挥主要作用。

在35家“985”高校图书馆CADAL共建共享单位中,25家高校图书馆的馆藏数字化资源可在CADAL网站上检索、查询到数字化图书的简要书目,共建共享单位用户在身份验证登录后,还可查阅数字化全文。鉴于版权保护等因素,馆藏数字化文献基本为2000年以前的图书。除了加入CADAL联盟共建共享数字馆藏以外,部分图书馆也对本馆的特色馆藏文献进行独立的复制扫描或委托专业公司进行馆藏数字化,以实现重点文献的永久保藏,但这种方式受技术、设备、经费和人员等因素影响,较难实现系统化建设和可持续发展,且因各馆扫描格式、技术规范不一等原因,给资源的共建共享带来一定困难[5]。为避免重复建设,并集成共享数字化资源,图书馆在进行馆藏数字化之前,可先加入CADAL等联盟平台。

2.2 高校图书馆文献管理系统与资源发现系统使用情况

通过检索图书馆网站,了解到“985”高校图书馆使用的文献管理系统主要有Alma、Sierra、Symphony和汇文等,清华大学[6]、华中科技大学、北京师范大学、南京大学[7]等已采用下一代图书馆服务平台LSP(Library Service Platforms),实现了纸电资源的一体化管理,读者通过图书馆主页的一站式检索框,即可查询纸质图书与电子图书的相关信息。

“985”高校图书馆均在图书馆网站明显位置使用了中外文资源发现系统,其中浙江大学、同济大学等12家图书馆使用ProQuest旗下Serials Solutions开发的Summon系统;清华大学、北京师范大学等9家图书馆使用ExLibris公司的Primo系统;中山大学、厦门大学等10家图书馆使用EBSCO的Discovery Service(EDS)系统[8]。由于外文发现系统对中文数据库的元数据覆盖率较低[9],一些图书馆将中外文发现系统分开检索,调研发现有31家“985”高校图书馆同时使用外文资源发现系统和超星的中文发现系统,通过资源发现系统实现中外文纸质馆藏和电子馆藏的融合。

2.3 馆藏数字化图书信息融入OPAC系统情况

通过访问39所“985”高校图书馆网站,发现19所图书馆OPAC系统不能在校外访问,20所可在网上公开访问的图书馆中,仅11所图书馆实现了CADAL馆藏数字化图书在OPAC系统中的检索与揭示。如浙江大学、武汉大学、同济大学、南开大学图书馆显示CADAL相关电子书,在书目信息界面提供“类似题名CADAL电子书”的链接,点击题名信息,可直接链接到CADAL网站电子图书目录页,方便读者在检索馆藏纸质图书时,也可查阅与纸质图书相关的电子书版本;华东师范大学、重庆大学、复旦大学、武汉大学图书馆等将CADAL电子书与OPAC系统挂接,实现了纸电资源的精确匹配和相对融合,促进了资源的利用与保存,为读者提供了更多资源类型选择。北京师范大学图书馆可显示数字化版本可获取状态,通过点击“馆藏高校人文社会科学研究课题成果全文库”获取馆藏数字化全文信息。

无论是使用新一代纸电一体化管理系统还是汇文等文献管理系统,在技术上都可以实现CADAL电子书与OPAC系统的精准挂接,但仅有少数图书馆将馆藏数字化图书信息融入OPAC系统,说明图书馆纸电融合度不高。

2.4 电子图书信息融入资源发现系统情况

电子图书是图书馆文献馆藏的重要组成部分,许多图书馆每年投入大量的经费用于采购电子图书,电子图书一般以数据库的形式打包采购,读者需进入相应的电子图书数据库网站,才可检索相应的电子图书资源。随着电子图书数据库品种日益增多,读者需要切换不同的中外文平台查找某一本电子图书,如超星汇雅、方正阿帕比、畅想之星、书香中国、京东电子书等,每个电子图书平台都拥有不同的系统和阅读器,这就给读者高效地获取信息带来不便。而整合图书馆绝大部分数据库的资源发现系统,可有效解决这一难题,用

户通过一个检索框即可实现一站式检索,通过检索结果提供的链接,发现图书馆的纸质图书、电子图书等各类文献信息资源,实现图书馆资源的纸电融合。

通过检索各大图书馆网站,发现使用Summon、Primo、EDS等发现系统的图书馆,如北京师范大学[10]、复旦大学等图书馆已在一定程度上实现了纸质图书和电子图书的融合显示,当一本书的纸质版本和电子版本均有时,馆藏信息显示纸质图书在架情况,电子图书提供获取全文的链接,链接文字显示为数据库名称,点击网址即可切换到对应的电子图书。例如,清华大学图书馆资源发现系统显示包库电子图书在线访问链接,点击链接获取全文,链接页面显示的是如“书香清华电子书”,而不是网址,包库电子图书图书附授权结束日期:2022—04—14;如果是镜像电子图书则不写授权日期,读者通过输入相应的身份认证后,登录即可阅读全文。

3 馆藏数字化建设过程中存在的问题

采用新一代图书馆服务平台和中外文资源发现系统的图书馆,拥有较高的纸电融合度,但在馆藏数字化建设过程中,仍普遍存在以下问题。

3.1 馆藏数字化图书的知识产权问题

知识产权问题是制约馆藏数字化大规模发展的根本问题,馆藏数字化建设存在知识产权侵权风险,部分图书馆为了实现馆藏资源的全部数字化,对馆藏纸质图书不加区分地进行扫描、加工,并在网上传播共享,有可能侵犯作者的复制权和信息网络传播权。馆藏数字化是一种典型的复制行为[11],《中华人民共和国著作权法(2020年修订)》第十条规定,以数字化等方式将作品制作一份或多份的复制权归著作权人所有。著作权人可以许可他人行使复制权,转让全部或者部分权利,并依照约定或法律规定获得报酬。《信息网络传播权保护条例(2013年修订)》第七条规定,图书馆可以不经著作权人许可,通过信息网络向本馆馆舍内服务对象提供数字化形式复制的作品,但不得直接或者间接地获得经济利益。

“网络服务提供者提供著作权人的作品后,著作权人不同意提供的,网络服务提供者应当立即删除著作权人的作品,并按照公告的标准向著作权人支付提供作品期间的报酬。”2021年12月,赵德馨教授告赢中国知网案,对图书馆和内容提供商都应有所启示[12-13]。随着信息技术的飞速发展和公众维权意识的提升,图书馆在进行馆藏数字化之前应先规范操作流程,在知识产权管理方面进行深入思考。HathiTrust项目实行严格的版权管理制度,采取与作者签署版权许可协议,通过技术控制提供有限访问权限,建立版权回顾管理信息系统等方式有效避免知识产权纠纷。CADAL采取在网站上公告“版权声明”的方式来规避侵权,在网站的醒目位置做出标识,声明尊重知识产权法以及所有著作人的权益,无意侵犯他人权利也尽量避免侵犯他人权利。并通过技术手段,对用户设置了分级查阅、限制浏览、不得复制和下载等限制,避免用户超出法律规定的范围,侵害著作权人的利益。

3.2 馆藏数字化图书的合理利用问题

根据法律规定,图书馆可进行馆藏数字化的范围应为进入公共领域的无版权纠纷的纸质图书,若确实为陈列或者保存版本需要而进行馆藏数字化,应在法律允许范围内,进行有限、合理地使用。部分图书馆为了防止侵权,将数字化的馆藏图书数据完全封闭保存,馆藏数字化平台与OPAC管理系统或资源发现系统相对独立,读者不能在图书馆主页明显位置检索与利用馆藏数字化图书,过多的限制措施使得馆藏数字化图书未能得到有效利用。

馆藏数字化图书与纸质图书检索平台资源可否融为一体?2014年6月,美国作家协会等诉HathiTrust案,法院将馆藏数字化的转化格式定位为合理使用[14],其法律依据是HathiTrust数字图书馆的数字化储存与定位提高了信息搜索与使用的效率,用户只在有限范围内合理使用资源,因此为提供搜索定位功能而进行的全文扫描行为与大规模数字储存行为具有合法性。这一裁定不仅认可了馆藏数字化行为的合法性,同时也表明建立联接提高检索与利用的效率是馆藏数字化的价值所在。

3.3 馆藏数字化图书与电子图书的重复建设问题

馆藏数字化图书与电子图书的采购存在重复建设问题,在一定程度上造成了资源浪费。

3.3.1 电子图书的重复采购问题

随着办学监测指标[15]等政策导向对电子图书文献的认可,电子图书的采购将成为图书馆文献资源采购类型中较重要的载体。图书馆一般会以包库或镜像等方式采购电子图书,用作馆藏文献资源的扩充方式。包库方式为包年购买数据库的全部资源;镜像方式一般也是按资源包来购买电子图书镜像数据,由于不能做到像纸质图书一样精挑细选,没有完整的馆藏体系,因此数据重复现象严重,同时,资源包不能与学科、专业精确匹配等问题凸显。

3.3.2 电子图书的资产管理问题

图书馆每年花费大量的经费用于电子图书的采购,无论是包库购买的电子图书使用权,还是以镜像方式购买的永久保存在图书馆本地服务器上的电子图书镜像数据,都应作为图书馆资产的一部分,进行规范的数字资产管理。馆藏数字化图书经过加工,以另一种载体形式存储在图书馆服务器上,可否作为图书馆资产的一部分?图书馆仅拥有包库电子图书的使用权,合同期限结束链接可能会失效,包库电子图书可否作为图书馆当年的数字资产?图书馆拥有镜像电子图书的长期使用权,电子图书镜像数据永久保存在图书馆服务器上,是图书馆的常见数字资产,但目前对电子图书镜像数据进行查重采购、资产保存的研究和实践尚欠缺。

3.3.3 纸电图书的精确匹配问题

目前图书馆采用的购买电子图书方式,与图书馆纸质文献馆藏管理脱节,使得电子图书的利用和检索存在问题。尽管部分“985”高校图书馆通过资源发现系统实现了纸电资源的统一揭示与融合,但纸质图书与电子图书并未达到精确匹配,只是相关字段的关联,是发现和获取平台,不是一对一的镜像匹配平台,由于部分数据库商不提供元数据,资源发现系统并不能整合全部的资源。在一站式检索框内检索纸质图书和电子图书时,一般情况下,电子图书、纸质图书都会显示在结果界面,检索结果有可能不在同一条记录上,有可能分开几条纸质图书、电子图书的结果显示,并不是所有已购电子图书的链接都会被显示在纸质图书的检索结果界面,这就给纸电融合的充分利用带来不便。

4 纸电融合的馆藏数字化方式探索

针对目前馆藏数字化建设过程中存在的知识产权纠纷、纸电图书融合度欠佳、电子图书的资产管理等问题,笔者提出以纸电融合的馆藏资源建设方式,购买最新纸质图书的同步电子版本产权或历年回溯纸质图书的馆藏电子图书镜像数据,使馆藏纸质图书的电子版本镜像数据不断增加,以逐步实现图书馆纸质资源的数字化进程。纸电融合的方式与传统的以复制、扫描为主的馆藏数字化方式最为明显的区别是不对纸质图书进行数字化加工,而是采用尊重知识产权的方式,由供应商取得作者和出版社的授权,由图书馆等使用者采购资源的知识产权,从根本上避免了知识产权纠纷,实现纸质图书与电子图书的有效融合,方便读者通过OPAC系统实现纸电资源的一站式检索并选择合适的载体形式进行阅读。以下是以纸电融合方式进行馆藏数字化的业务流程,主要参考汇文文献信息服务系统Libsys5.6设计。

4.1 采访流程

纸电融合的应用方式有多种,笔者仅从馆藏数字化角度,采购图书馆已有馆藏纸质图书的电子版本方式。此种方式亦有两种,一种是购买最新纸质图书的同步电子版本产权,即纸电同步采购;一种是历年回溯纸质图书的馆藏电子图书镜像数据,即通常采用的馆藏电子书的采购。这两种采购方式,与传统的电子图书包库、包学科等采购方式有着明显的不同,即不是以包库方式打包采购,而是仅采购与馆藏纸质图书相匹配的电子图书,最终目的是要逐步实现馆藏资源的数字化,这就需要图书馆在招标文件中对采购范围、采购数据和版权要求等都进行明确,以便使采购到的电子图书内容符合图书馆馆藏数字化的建设需求。

4.1.1 版权要求

供应商需承诺提供的电子图书已获得出版社和作者的授权,即电子图书为合法的正式出版物,图书馆用户在PC端、移动端等平台阅读多种格式的电子图书,其知识产权均受到法律保护,从采购源头上解决数字化图书的版权问题。

4.1.2 采购范围

图书馆提供馆藏纸质图书的书目信息,选购的电子图书镜像数据必须与图书馆的纸质图书信息匹配,作为纸质图书的电子版本镜像数据入藏。这就需要在采访电子图书数据时进行查重,只有ISBN、书名、作者等信息与纸质图书书目完全对应的电子图书才符合采购范围,通过限定书目信息,解决纸电图书的精确匹配问题。

4.1.3 数据查重

采购的电子图书镜像数据,不仅应与纸质图书书目数据相匹配,同时还应与图书馆已有的电子图书镜像数据进行查重,若图书馆已购买,则不再重复采购。图书馆对查重、预处理过的电子图书采访数据进行审核后,再将电子图书采访征订数据导入文献管理系统。两种电子图书数据查重方式,可有效解决馆藏数字化图书的重复建设问题,节省资源购置经费。

4.2 编目流程

将电子图书书目数据融入OPAC系统是实现纸电图书充分融合的技术手段,对电子图书进行MARC编目,并通过OPAC提供检索服务是提高纸电资源利用率、满足读者需求的有效途径。为保持纸电图书数据的相对独立性,目前国际上通常采用纸电图书分别建立MARC数据的方式[16],因为各自独立的书目记录能更为充分地揭示不同类型文献的特征信息。电子图书的编目数据来源有两种,一是与纸质图书一样,由供应商提供每本电子图书的规范编目数据,由于电子图书编目标准尚未推广普及,只有较少供应商能提供规范的电子图书编目数据;一是在原有纸质图书编目数据基础上,单独增加一条电子图书MARC数据,并额外增加电子图书的财产号、价格、书刊状态等馆藏信息及856字段网络地址。为了提高读者的检索与阅读体验,图书馆可对856字段进行更多的个性化设置,如856$uURL子字段,将在OPAC界面直接显示电子图书的链接地址;856$z字段,标注“点击查看电子图书全文(如超星电子图书)”,方便读者直接点击查看全文,并了解电子图书的来源库。

图书馆对供应商提供的电子图书MARC数据进行核对确认后,再批量导入馆藏书目系统,实现电子图书与纸质图书编目数据的融合,通过纸电图书编目数据建立的关联字段,解决纸电图书一站式检索问题。

4.3 典藏流程

通过包库方式购买的电子图书,图书馆可以通过链接解析服务自动匹配纸质图书数据,将电子图书的链接嵌入到书目数据中,或通过新一代图书馆服务平台对电子图书包库数据进行实时管理、更新和揭示。电子图书链接随包库信息的变化而自动变化,不需做典藏入库操作。

通过购买产权的方式获得的电子图书镜像数据,图书馆可进行典藏入库、验收清点和财产登记等规范的资产管理:首先,将电子图书镜像数据安装到本地服务器上进行长期保存;其次,根据安装的电子图书信息,进行数据清点和批量验收,将与清点数据一致的编目数据典藏入库;最后,从文献管理系统打印电子图书财产登记账,作为图书馆的数字资产进行规范管理。规范的典藏流程可解决电子图书的资产管理问题,电子图书镜像数据可作为纸质图书的永久保藏版本,在纸质图书因年代久远、破损严重、盘点丢失等问题出现剔旧、报废时,作为纸质图书长期保存的一种补充方式。

4.4 阅览流程

电子图书的阅览途径主要通过OPAC系统的书目数据展示信息,读者通过书目数据一站式检索,即可选择查阅纸质图书或电子图书。读者可通过电子图书书目数据提供的856字段链接,进入到相应的电子图书数据库,直接链接到当前电子图书的全文信息;或通过书目数据中提供的二维码,手机扫描电子图书,用移动端阅读电子图书全文。为有效保护电子图书知识产权,在阅览电子图书全文之前,读者需通过VPN进行统一身份认证,或输入相应的账号密码获取本地图书馆的全文阅览权限。

5 结语

采购纸质图书电子版本,实现馆藏纸本资源逐步数字化的纸电融合方式,有效解决了数字化图书的版权、统一检索、电子图书资产管理等问题,是馆藏数字化的另一种积极的补充方式。由于受知识产权授权时间及电子图书建设标准不一等因素的影响,图书馆也许在短时期内不能实现馆藏纸质图书的大规模数字化,某些图书因为版权问题可能长期买不到电子版本,但图书馆作为知识产权的保护与宣传部门,应该合理合法利用版权,做知识产权合法使用的示范,教育和引导读者合理利用文献。

纸电融合的馆藏数字化是一个长期、持续地建设过程,图书资源总量可包括纸质图书和数字资源,“电子图书可作为图书资源量”的政策出台以后,电子图书的采购、编目、典藏、阅览、存储等必然走向规范化管理,图书馆在馆藏建设实践中应顺势求变,合理布局,谋求更好的发展。

猜你喜欢

电子图书馆藏纸质
馆藏几件残损《佚目》书画琐记
四川省图书馆发布2019年阅读报告
博物馆的生存之道:馆藏能否变卖?
布达拉宫纸质文物修复——以佛经公文为例
知还印馆藏印选——古印篇
图书馆电子图书需求与馆配商联盟服务转型探讨
独立书店浪漫的纸质生活
介绍两件馆藏青铜器
电子书是否会取代传统图书?
北大方正提供373种电子图书信息