美国高校数字图书馆建设项目分析及启示
2016-02-13吴晓静
吴晓静
(福建省永安市水利电力职业技术学院图书馆,福建 永安 366000)
美国高校数字图书馆建设项目分析及启示
吴晓静
(福建省永安市水利电力职业技术学院图书馆,福建 永安 366000)
[摘要]HathiTrust项目是美国高校图书馆建立的一个旨在将其成员馆所收藏的纸质文献进行数字化存储,为用户提供数字服务的数字图书馆项目。分析了HathiTrust项目的资源建设、用户服务以及管理模式,以期为我国数字图书馆项目建设提供参考。
[关键词]HathiTrust数字图书馆数字仓储
1 HathiTrust项目简介
数字技术的发展和互联网技术的成熟不仅为信息传播提供了更加便捷的途径,而且也为信息组织和信息保存提供了更多的可能。为了更好地促进信息传播,最大程度地提高文献信息的利用率,促进文献信息教育与科研功能的发挥,各国图书馆都在积极推进大型文献信息资源数字化项目,加强本国的数字化建设。其中,建设数字资源,提供数字化服务是其重要内容之一。2008年10月,包括密歇根大学和印第安纳大学在内的中西部大学联盟的13所大学与加利福尼亚大学、弗吉尼亚大学等共同发起了HathiTrust数字图书馆项目,旨在将其成员馆所收藏的纸质文献进行数字化存储,为用户提供数字服务[1]。截至目前,HathiTrust项目共有110个机构成员,既包括高校图书馆也包括研究型图书馆。此外,HathiTrust项目还与Google、InternetArchive和微软合作,拓宽其数字资源存储范围[2]。与一些商业性质的数字图书馆项目不同的是,HathiTrust项目是以图书馆用户平等使用和获取为价值导向的,其馆际平等互利互惠的核心价值满足了各成员馆的价值需求,它是图书馆与商业机构合作的有效探索。因此,对HathiTrust项目进行分析,不仅为我国高校数字图书馆建设提供经验,而且也有利于我国数字图书馆合作项目建设实践。
2 HathiTrust资源建设
纸本文献数字化是HathiTrust项目的主要目标和任务,为了满足成员馆用户日益增长的电子文献需求,HathiTrust项目每年都要更新自身的数据库资源并且逐渐增加开放获取的数字资源。
2.1资源整合范围
信息资源的整合范围决定了信息资源的整合方式以及整合技术,一般而言,整合范围越大,对整合技术和整合方式的要求就越高[3]。HathiTrust项目利用元数据采集、跨平台传输协议以及网络检索协议等标准和技术实现了各平台的信息资源整合。HathiTrust项目建立的初衷是建立一个数字仓储,为所收藏的公共领域和受版权保护的文献资源提供长期的保存和获取服务[4]。因此,HathiTrust项目整合资源来自4个渠道,分别是成员馆、Google图书、微软和Internet Archive,资源类型包括数字化扫描图书、电子照片、特色馆藏以及一些原生数字资源等,涵盖了100多种语言。截至2015年,HathiTrust项目已经数字化文献1388万册,包括约70万册的图书和30万册的连续出版物。在这1300万册的数字化文献中,处于公共流通的文献占39%左右,并且呈逐年增加的趋势[5]。
2.2数据存储形式
数据存储是HathiTrust项目核心工作之一,包括了书目数据存储和全文数据存储两部分。与传统数字图书馆项目不同的是,HathiTrust项目并没有采用MARC格式存储机读目录,而是在开放获取系统OAIS构建的存储框架体系下,根据自身的元数据保存实施策略PREMIS,利用自建的HathiTrust元数据(HathiTrust Megadata)存储书目数据。HathiTrust元数据共包括13个数据元素,分别是卷册标识(Volume Identifier)、获取(Access)、版权(Rights)、标题(Title)、来源(Source)、版本说明(Imprint)、年表(Chronology)、密歇根大学记录号(University of Michigan record number)、来源机构记录号(Source Institution record number)、OCLC号、ISBN号、ISSN号和LCCN号等[6]。成员机构在上传数字资源时要先按照HathiTrust元数据格式上传书目元数据信息,然后再上传全文信息。此外,在统一的HathiTrust元数据格式下,成员机构之间可以通过Z39.50协议下载和传输书目数据,方便成员间的书目交流与共享。2013年,HathiTrust推出新的书目元数据管理系统ZephIR,用于管理其1300多万卷信息资源。对于同一标题的记录,ZephIR会对成员馆提交的所有书目元数据版本进行筛选,选择最佳的记录存储在元数据库中为用户所用[7]。
2.3版权管理规定
为了避免知识产权纠纷,HathiTrust项目实行严格的版权管理制度。HathiTrust项目的版权管理主要体现在以下几个方面:首先,在作品、作者明确的情形下与作者签署版权许可协议,征得作者同意之后进入公共领域。目前,在HathiTrust数字图书馆中可以免费获取的全文资源主要是1923年以前在美国境内和1870年以前在美国境外出版的作品、无版权保护的作品以及取得使用许可协议的作品。其次,对于受版权保护且未取得公开许可协议的作品,HathiTrust数据库提供有限的访问权限,用户可以检索到作品的书目数据信息和摘要信息,但无法查看全文。第三,采用IP限制和用户授权许可等手段合理分配用户权限,最大限度降低版权风险。HathiTrust数字图书馆中的文献信息大多只能在成员机构的校园网中访问,在公众网中一般只能获得资源片段和书目信息。但是,成员机构用户可以利用身份认证的方式,通过远程访问使用数字资源。最后,建立单独的版权回顾管理信息系统,保存和跟踪每个数字化文档的版权信息[8]。
3 HathiTrust用户服务
3.1检索服务
HathiTrust数字图书馆在建立之初并没有设置统一的检索平台,成员用户必须在自己图书馆的主页上检索然后链接到HathiTrust资源库中,对于用户而言非常不便。2011年,HathiTrust与OCLC进行合作,创立了WorldCat Local Prototype的用户界面,建立了统一检索平台,用户在统一检索平台中可以跨库检索,还可以访问其他成员馆的信息资源[9]。目前,HathiTrust提供了两种检索方式,分别是简单检索和高级检索。在高级检索中,用户可以通过布尔逻辑运算以及限定词对检索词进行限定,还可以对检索结果的语种、年份、馆藏所在地和文件格式进行选择。此外,在简单检索和高级检索中,用户还可以选择是全文检索还是目录信息检索。如果选择全文检索,只要用户输入的检索词出现在全文中的任何一个地方都能够被检索到。如果是选择目录信息检索,只有当检索词出现在书目数据上才可以被检索到。HathiTrust一站式的检索平台让用户可以在统一的界面对多个数据库进行检索,避免多个检索界面的相互转换,提高了用户的检索效率。
3.2个性服务
提供检索结果的保存和分享是HathiTrust个性化服务的集中体现。用户登录HathiTrust数字图书馆之后可以建立自己的档案,在档案中填写研究方向和研究兴趣。用户在HathiTrust资源库检索后,可以根据自己的需要建立个人收藏库,保存检索结果,对检索结果进行分类、列表、添加说明和评价等操作。此外,用户还可以将个人收藏库选择私密或者公开,让其他具有相同兴趣爱好和研究方向的用户对收藏库的书目信息进行标签的添加和评论,实现用户的聚合和个人观点的分享,从而让用户从信息的利用者变成信息的创造者,促进用户隐形知识转变为显性知识。
3.3移动服务
随着移动设备的普及和移动阅读的兴起,用户的阅读方式和阅读习惯发生了很大变化。Mobile-Research的概念在近几年被学者提出并且越来越得到认可。为了适应移动阅读和移动研究的趋势,HathiTrust推出了移动平台,让用户通过移动终端访问HathiTrust数字图书馆资源。目前的HathiTrust移动平台只有WAP版本,没有移动应用客户端,在功能上也精简了很多。整个页面只提供一站式检索平台,并且只支持目录信息检索。但用户可以标题、作者、出版社、年份和ISBN等限定词对检索词进行限定,提高用户的检准率。
4 HathiTrust管理模式
在2012年以前,根据分工的不同,HathiTrust的管理机构主要由执行委员会、运作委员会以及战略咨询委员会3部分组成[10]。执行委员会是HathiTrust项目的主导管理机构,主要负责项目的综合事务,每个月集中开会一次,讨论项目的发展方针、财政支出等问题。运作委员会负责项目事务的正常运转和经费的募集。战略咨询委员会负责审查和监督项目的日常工作并且提供项目发展战略方案[4]。2011年10月,在华盛顿举办的一次HathiTrust成员会议上选举产生了HathiTrust董事会,负责项目的日常运作、财政支持、成员审核以及项目评估等事务。董事会由12名成员组成,其中有6名是项目创立成员,包括1名首席执行官和5名来自执行委员会的成员。此外,HathiTrust项目还设立了一个代表团,由参加项目的各个高校老师和学生组成,负责对项目提出意见和建议。
在经费管理上,HathiTrust项目经费由执行委员会管理,实行单独的财政体系。经费主要来源于密歇根大学图书馆财政预算[11]。此外,HathiTrust项目的其他经费还来源于成员机构的资金分摊。在2011年的HathiTrust工作会议上,HathiTrust规定成员机构在存储和利用数据时需要分摊项目的存储费用、备份费用、人力资源费用、服务费用以及技术创新等费用。但成员机构的分摊资金需要经由密歇根大学审计后才能纳入项目经费[12]。
5 项目启示
HathiTrust项目自2008年建设以来,在短短的8年时间内其成员馆增加到100多个,收藏的数字资源达到1300万卷,在数字图书馆建设领域产生了相当大的影响。其开放共享的发展目标以及合作共赢的发展方式值得我国高校图书馆借鉴。
首先,明确发展目标,体现人文关怀。HathiTrust项目的宗旨就是建立一个数字仓储,保存成员馆的数字资源,避免资源的重复建设,为文献资源的长期保存和获取提供服务。正如其名字“HathiTrust”所示,“Hathi”在印度语中是大象的意思,象征着智慧和力量。而“Trust”则代表信任,既包括成员之间相互信任,也包括用户对项目建设的数字图书馆服务的信任。HathiTrust项目体现了图书馆开放获取、共建共享以及平等服务的核心价值,其公益性的属性和建设数字仓储的使命成为整个项目运作的指导方向。因此,我国高校在建立数字图书馆时应该明确其发展目标和宗旨,坚持贯彻“以人为本”的发展理念,关注知识弱势群体,体现图书馆的人文关怀。其次,拓展合作范围,促进资源共享。参与HathiTrust数字图书馆资源建设的机构除了一些高校图书馆外还有Google、Internet Archive和微软等一些商业公司。与OCLC的合作让HathiTrust数字图书馆拥有了统一的检索平台,拓宽了HathiTrust馆藏检索的途径,也使HathiTrust数字馆藏整合到OCLC馆藏之中,更容易被用户发现。HathiTrust项目的成功与其广泛建立合作、资源共建共享是分不开的。我国在建设数字图书馆项目时应该加强图书馆与图书馆之间以及图书馆与其他机构之间的合作,让资源的利用在时间与空间上得到最大的延伸。作为我国高等文献保障系统,CALIS在今后的工作中应该发挥其独有的高校联盟优势,积极与其他机构合作,加强传统文献数字化以及数字化文档的永久保存和利用工作,促进数字资源的共建共享。
6 结语
数字图书馆建设是一项长期而系统的工程,合作与共享是数字图书馆建设的必然途径。HathiTrust项目的成功与其在资源建设、用户服务以及管理模式上灵活有效的机制是分不开的。我国高校在建设数字图书馆项目时可以借鉴HathiTrust项目的优秀经验,不断地实践和探索,寻找最适合我国高校数字图书馆的建设之路。
参考文献:
[1]建中读书.HathiTrust[EB/OL].[2016-03-01].http://blog.sina.com.cn/s/blog_53586b810100ys1h.html.
[2]Our Partnership[EB/OL].[2016-03-01].https://www.hathitr ust.org/partnership.
[3]宋琳琳,李海涛.大型文献数字化项目的信息资源整合研究[J].图书情报知识,2014(4):94-105.
[4]李咏梅,袁学良,唐李杏.美国HathiTrust项目及其对我国高校图书馆数字化的启示[J].四川图书馆学报,2011 (3):35-37.
[5] Deposited Volumes by Original Source of Content-Daily Statistics[EB/OL].[2016-03-02].https://www.hathitrust.org/ visualizations_deposited_volumes_current.
[6]苏海明.HathiTrust数字仓库项目概述[J].数字图书馆论坛,2009(7):60-65.
[7]现代图书情报技术讯.HathiTrust推出新的书目元数据管理系统ZephIR[J].现代图书情报技术,2013(11):29.
[8]Copyright[EB/OL].[2016-02-28].https://www.hathitrust.org/ copyright.
[9]单蓉蓉,陆铭,魏可.云环境下HathiTrust的用户服务研究[J].图书馆论坛,2012(6):69-73.
[10]Governance[EB/OL].[2016-02-28].https://www.hathitrust. org/governance.
[11]Finances[EB/OL].[2016-02-28].https://www.hathitrust.org /governance.
[12]Cost[EB/OL].[2016-02-29].https://www.hathitrust.org/cost.
吴晓静女,1986年生,助理馆员。研究方向:用户信息服务。
[分类号]G253.1
收稿日期:(2016-03-18;责编:王天泥。)