开放存取环境下图书馆古籍数字资源的开放性工作探究
2011-08-31张华艳曲阜师范大学图书馆山东曲阜273165
●张华艳(曲阜师范大学 图书馆,山东 曲阜 273165)
1 引言
开放存取信息服务是当今社会信息量剧增、信息流通迅速催生出的一种新型服务方式,它迎合了网络时代信息交流的特点,开创了一种新的、高效的交流模式。[1]开放存取的服务模式,促进了信息的传递与共享,同时也使各种资源的利用率得到了极大地提升。古籍文献是一种不可再生的有限资源,由于它的这种特性及数量的有限性,使得古籍整理工作受到了很大的限制,也使得古籍利用与保护的矛盾日渐突出。在这种情况下,我们需要借助于一些外在的力量,寻找馆藏实体资源之外的数字古籍资源和已有的古籍研究成果来开展工作。开放存取信息服务理念的提出为古籍整理保护工作开创了新的契机。当前国内一些高校已经将开放存取服务模式引入古籍资源的共享上,但无论在服务体系的完善还是在平台的建设上还存在诸多问题,因此有必要对古籍资源的开放存取作更深入的探讨,以期更好地服务于古籍整理与保护工作。
2 古籍的数字化为古籍资源的开放存取奠定了坚实的基础
“古籍数字化就是从利用和保护古籍的目的出发,采用计算机技术,将常见的语言文字或图形符号转化为能被计算机识别的数字符号,从而制成古籍文献书目数据库和古籍全文数据库,用以揭示古籍文献信息资源的一项系统工作”。[2]近年来,随着计算机网络技术的不断发展,图书馆、学术机构以及数字企业等机构都相继开发了适应学术研究与交流需求的古籍数字化产品,使得古籍数字化资源从最初的书目数据库,发展到了全图像型数据库,再到后来的古籍全文数据库,直至如今的网络综合检索系统。越来越多的古籍资源拥有了可供快速查检的电子版本。
笔者通过网络调查与文献调查发现,目前古籍数字资源种类繁多。这些数字资源类型不一,既有纯书目的数据库,也有能提供全文与影像信息的数据检索系统,如“中国古籍善本导航系统”“数字方志”等。一些图书馆根据自己馆藏特色,进行了古籍数字化开发工作,如国家图书馆的“碑帖菁华(中文拓片资源库)”“敦煌在线资源库”;南京图书馆的“中国传统体育图片数据库”;上海图书馆的“名人家谱库”“宋元善本全文数据库”等。除此之外,一些致力于古籍数字化的学术机构及其数字企业也相继开发了150多种古籍数字资源。如香港中文大学中国文化研究所中国古籍研究中心的“甲骨文全文数据库”“金文全文数据库”“竹简帛书出土文献数据库”“中国传统类书数据库”等;北京国学时代文化传播股份有限公司的“国学宝典”“宋词备览”;北京爱如生数字化技术研究中心的“中国基本古籍库”“中国史学库”“永乐大典”等。这些数字资源多集中于各类图书馆及其科研机构的主页上,也有的以光盘的形式集中于各使用单位。研究者可以利用各种检索系统,对其所需的资源进行检索、复制、阅读、下载、传播、打印等,也可以通过链接的方式了解相关的学术前沿与发展方向,极大地节省了古籍整理工作的时间与精力。这不仅为古籍的整理与研究开启了一扇便捷之门,同时也为古籍资源的开放存取奠定了坚实的基础。
3 古籍资源开放存取的现状及其存在的问题
开放存取的内涵包括两层含义:一是指学术信息免费向公众开放,它打破了价格障碍;二是指学术信息的可获得性,它打破了使用权限障碍。笔者根据开放存取的这一概念内涵对10家“全国古籍重点保护单位”在古籍数字资源的开放性问题上进行了网络调查。调查结果如表1所示。表1所选取的图书馆有公共图书馆、高校图书馆以及科研机构图书馆,这些图书馆在各自的类型中有着较高的档次,能够代表同类别图书馆的水平。经分析总结,发现问题如下:
(1)各类图书馆古籍数字资源的开发利用不平衡、不开放。由于各类图书馆服务的读者群体不同,服务的内容和层次也不一样,它们在古籍数字资源的开发利用程度上表现也不同。科研类图书馆、高校图书馆的古籍资源的读者由于科研和教学的任务较重,他们对有关的信息资源需求比较强烈,这就使得这类图书馆对古籍学术信息资源的建设和开发比较有力。而公共图书馆是面向社会服务的,其读者类型多种多样,信息需求不一,对于古籍资源需求的读者占比重很少,所以在古籍数字资源的开发利用上表现出了明显的差异性。另外,由于受经费的限制,大部分图书馆对古籍资源以及相关信息共享意识淡薄。多数图书馆对自己开发及其所购买的资源“保护意识”特别强烈,对于本单位服务对象之外的读者则设置重重“关卡”,致使馆外读者所需资源无从检索、下载、复制等。即使有的能复制、下载,但却不能生成可编辑文件。这与开放存取所倡导的“学术信息免费向公众开放”相去甚远。
(2)古籍数字资源的组织利用方式不规范,缺乏统一的平台。数字资源格式不一。从文件格式上来看,数字化古籍除了目前常见的tet、doc、html格式外,还有 exe、pdf、wdl、pdg、ebk、edb等。各古籍数字资源信息存储形式差异性大,各格式之间互不兼容。因此,目前许多图书馆古籍数字资源虽然比较丰富,但却因每一个检索系统都有着不同的检索界面、不同的使用方式、不同的身份认证、不同的资料属性,而且呈现的格式不一,使得用户无法一次获取各数据库的信息,这为开放资源与馆内资源的整合带来了困难。目前在国外,开放存取主要有3种基本的形式:机构资源库、学科资源库和开放获取期刊。[3]这3种类型都有自己的发行软件,但遵从统一的存储标准,各系统间具有良好的兼容性,具有统一的检索平台。国内也有一些图书馆建立了统一的平台,如清华大学图书馆的“中国知识资源总库”传播共享平台、清华同方电子资源统一检索平台和南京大学图书馆的一站式检索,利用这些统一检索平台可以将搜集到的古籍数字资源与本馆的数字资源进行整合,实现多数据库同时检索、分数据库展示检索结果,检索系统算是走出了成功的一步。但是,离建立一种兼容的信息存储模式,进行信息资源的整合,真正实现全国范围内的信息流通还存在很大的差距。
表 不同图书馆对古籍数字资源的组织利用情况
4 古籍数字资源开放存取的探索性措施
4.1 提高认识,实现开放共享
古籍数字资源已经硕果累累,这些成果借助于计算机与网络平台为读者教学与科研提供了前所未有的便利,促进了学术的交流与发展。但由于各图书馆对于这些资源开放共享的重要性认识不足,导致图书馆各自为政,在很大程度上又限制了这些资源的开放与共享。要彻底实现古籍数字资源的开放存取目标,大力宣传其开放共享的意义,提高其社会认知度是非常关键的一步。在图书馆之间实行古籍数字资源的开放共享对于各个图书馆来说是一种互赢互利的双赢活动。目前,古籍数字资源数量繁多,况且都价格昂贵,在图书馆之间实行资源共享可以保证各图书馆在存储大量信息的前提下节省大量经费。因此各图书馆之间应该改变观念,打破封闭与半封闭状态,加强交流与协作,实现不同图书馆间的信息融合,使得各个高校图书馆间的信息资源互补原则通过电子交流的方式得以实现。
4.2 构建统一检索平台,逐步向开放存取过渡
如上所述,目前古籍数字化产品种类繁多,但却因每一个检索系统都有着不同的检索界面、不同的使用方式、不同的身份认证、不同的资料属性,而且呈现的格式不一,使得用户无法一次获取各数据库的信息,各信息资源的使用权限遇到了障碍,违背了开放存取“信息可获得性”的宗旨。为了打破这种权限障碍,各图书馆应遵从统一的存储标准,取消查检信息资料时的“身份认证”限制,搭建统一的检索平台,使用户不仅可以在集成检索界面上同时检索各种网络数字资源,也可以实现不同类型、不同层次资源之间的动态链接,还可以与原文传递、馆际互借等服务进行整合。因此只有构建统一的平台,使读者能够轻松快捷地检索到自己所需资源,了解相关的学术信息,才能对古籍数字资源的开放存取有新的认识以及新的渴求,也才能更好地加快其开放存取的进度。
4.3 深度开发古籍数字资源,促使其深层次开放使用
目前,一方面由于古籍数字资源的开发者与组织者素质高低各不相同,资源的水平与质量也是参差不齐,加之古籍数字资源缺乏像开放存取期刊一样的同行评审制度,使得网络上资源的权威性与可靠性受到质疑。另一方面,多数古籍数字资源仅限于提供古籍资料的目录检索及全文检索和简单的复制、下载、统计等功能,离古籍整理平台差距甚远。因此有必要研究行之有效的古籍整理与开发模式和方法,深度开发古籍数字资源,使得古籍数字化不仅能全文检索,还要深入文献内部的知识单元,通过古籍文本内容的深入揭示和关联重组,达到知识发现的目的。将古籍的文本内容与相关知识的辅助工具相配备,如联机古汉语字典、年号与公元纪年对照表、室名别号、官职制度等,力求从任何角度都能检索到读者所需要的信息。同时让计算机模拟人脑从大量古籍文本及其相关辅助工具中作出判断选择,从而达到能自动编纂、自动标点、自动断句、自动注释、自动校勘等。[4]将全文检索的古文信息化建设转向古籍资料的数据分析和处理,满足实际古籍整理工作需要。古籍数字资源的智能化可以为古籍研究者提供全面的多维度的帮助,能大大提高古籍整理及研究的效率,会受越来越多的使用者欢迎与倡导,从这一点来说,古籍数字资源的智能化会极大地推动其开放存取的步伐。
[1]王大伟.高校图书馆开放存取信息服务的若干问题 [J].图书馆,2010(1):110.
[2]毛建军.古籍数字化的概念与内涵[J].图书馆理论与实践,2007(4):82-84.
[3]喻文.开放存取对高校图书馆的影响及对策思考[J].图书馆,2008(6):50-52.
[4]常娥,等.古籍智能整理与开发系统构建研究[J].情报资料工作,2009(4):45.