图书馆古籍数字化交流模式的构建
2011-03-18许琼
许 琼
(昆明冶金高等专科学校图书馆,云南 昆明 650033)
在现代社会中,人类已经进入了数字化时代,计算机数字技术对社会生活的各个领域都产生了革命性的影响。为此,同属图书馆领域的古籍也不可避免地受到影响[1]。在数字社会里,古籍整理已经不能再拘泥于传统的方式与方法,必须有所创新。这是数字化社会赋予图书馆工作者、古籍整理工作者的历史使命,也是为古籍整理工作和历史学研究注入新生机和新活力的必然[2]。
1 图书馆古籍数字化交流的意义
中国古籍是我国历代保存下来的历史文化瑰宝。它既反映了我国在人类社会发展进程中的历史地位和作用,同时所蕴含的中华民族特有的精神价值、思维方式和想像力、创造力,也是中华文明绵延数千年,一脉相承的历史见证[3]。古籍数字化是指利用现代信息技术对古籍文献进行加工处理,使其转化为电子数据形式,通过光盘、网络等介质保存和传播[4]。我国古籍数字化经历了数据库版、光盘版、网络版3个建设阶段。数据库版古籍包括书目数据库和全文数据库两种形式;光盘版古籍一般有图像版、全文版和图文版3种类型;网络版古籍主要是将数字化的古籍资源在网络上有偿或无偿发布,供互联网用户使用,这是目前古籍数字化的主要目标[5]。
1.1 有利于古籍资源的保护
古籍是我国科技文化与历史文化的宝贵资源。因此,图书馆保护好有限且珍贵的古籍是我们的重要职责。尽管我国在古籍保护方面投入了巨大的人力和物力,但是古籍保护的任务仍然十分艰巨。我们知道,古籍属于非再生性的文化遗产,随着时间的推移,在数量上将会不断减少,而开展数字环境下的古籍数字服务是解决这一问题的有效途径。
1.2 有利于古籍数字化开发
在数字环境下开展古籍数字化服务必须依托古籍数据库。就古籍书目数据库而言,传统的古籍目录只能按照书名、责任者、分类等途径进行检索。数字化的古籍书目数据库著录的书目则甚为广泛,还可提供多种途径检索和资源链接,可以实现多种条件的组配检索。同时古籍书目数据库为开发利用古籍提供了快捷准确的途径[6]。
1.3 有利于提高科学研究水平
由于数字化资源都具有快捷检索和交互流通的特点,古籍数字化资源的出现将彻底改变以前查找资料需要逐本翻阅大量书刊的状态。当前科学研究和弘扬中华文化对数字化古籍的需求非常大,开展数字环境下的古籍服务将极大地改善广大科学研究人员的科研环境,有利于提高科学研究水平。
2 图书馆古籍数字化交流存在的问题
2.1 古籍数字化打破了以往在古籍整理中给古籍圈定的范围,原来不属于古籍范畴的甲骨文、金文、辽文等都成为古籍数字化的对象,这是对古籍整理传统观念的突破,更符合现代社会科学研究的需要。不过目前就连纸质古典文献的大规模录入问题也只能说是有所突破,并没有完全解决。多种古典文献的数字提取和录入尚处于起步阶段[7]。
2.2 大多数古籍数字化产品都实现了任意字、词和字符串的检索,一些较好的则实现了按条件检索。有的检索系统实现了在检索时简繁互换等关联,但同古籍数字化实际要求达到的检索性能相比,还有相当大的差距。使用这样的检索系统检索出的结果中夹杂着大量不符合要求的数据,而一些不是检索词但是符合要求的数据却没有检索出来[8]。
2.3 目前的古籍数字化产品仅仅是基本实现了古籍载体的转换和全文检索功能等,这只是所有数字化文献具有的普遍特点,并不是古籍数字化产品的特色。在解决使用计算机数字技术表现古籍特征这一问题上,把古籍的特点与数字技术结合起来,是古籍数字化下一步工作的重点和难点,是一项极为复杂和困难的工作。
2.4 古籍整理软件的数量和种类都很少,缺乏通用性,更没有形成一个集成的古籍整理平台。目前的古籍整理软件基本上都是首先将扫描图像与原稿进行校对的校对系统,及对古籍文本图像进行文字切分的数字化处理系统。它们还不是通用软件,仅适用于当前的古籍数字化项目。
3 图书馆古籍数字化交流模式的构建
3.1 基于网络平台的古籍信息服务
构建内部局域网自动化管理系统,实现文献的数字化制作、编辑、流通与利用自动化,是网络信息服务的平台。当前我国基于网络平台的古籍信息服务比较多,我们综合考虑到现有自动化系统水平、数据标准化和运行稳定性,认为清华同方的TPI数字图书馆系统功能较强。使用其中的数字加工子系统和内部管理发布系统,可以集多种功能于一体,完成古籍数字化的建库、扫描、图像处理、生成电子书、建立导航系统、古籍网上发布与浏览等功能。同时对于存储容量500页以上的古籍,如果全文放在网上,下载速度非常慢,而系统提供了在线浏览功能,读者可以进行在线浏览,传输速度非常理想。
3.2 馆藏实体资源的数字化
针对馆藏资源数字化问题,可以综合比较多个公司的数字化解决方案,其中,北京万方公司的数字化系统由于采用了国际标准的数字格式和无损压缩格式,同时支持GIF、JPG、PNG、MP3等图形格式,描述数字资源的元数据采用了国际通用标准,为将来数据开放、交换和系统升级提供了广阔的环境;数字化加工的差错率低于万分之五,且加工成本较低,因此,可以采用北京万方公司的系统实现馆藏资源的数字化。
3.3 全文检索系统的数字化
由于数字化馆藏资源的存储、组织以及全文检索等问题是相互联系的,因此,在确定古籍资源数字化整合建设方案时,应该进行统一考虑。国内目前适合中文数字全文检索的软件系统也有多个,其中,易宝公司的TRS系统功能强大,可实现多库并行检索,内置1万多条智能检索规则,输出格式灵活,能够把PS数据转换成HTML、XML、PDF以及用户自定义模式,完全满足了用户Web下载的要求。为此考虑到二次开发的易用性和通用性,我们建议可以考虑采用易宝的TRS系统作为数字馆藏文献的存储、组织和全文检索的基础数字平台。
3.4 数字化古籍的共享与发布
当前我国很多大学的图书馆数字中心在互联网上建成了初具规模的网站系统,数字用户以高速宽带接入方式建立二级网站,因此,具备了数字化共享与发布的基础平台。在内部数字管理系统的划分与衔接上,设计了先进的数字结构并引入了相关的数字设施,成功实现了二者的有效安全连接。
3.5 数字化古籍的知识产权管理
按照我国颁布的著作权与知识产权法的要求,对数字化古籍应区别情况分类管理。首先对于无知识产权作品和已进入公有领域的作品,数字化加工后可以自由使用。其次对于他人拥有知识产权的来源作品经数字化加工后,可利用合理使用制度,在公益条件下,读者可以为教学和科研的需要自由阅读,不过要防止非法复制。第三,对于当前普遍具备原创性的数据库作为版权法的编辑作品加以保护,信息资源数字化整合建设中形成的二次和三次文献数据库,具备自主知识产权。第四,对于购买的各类电子文献数据库,作者和出版社享有知识产权,可使用数字版权保护技术。当前北大方正的Apabi数据图书馆支持软件Apabi-library,该软件使用数字版权保护技术,实现了网上管理、读者注册、检索与阅读,妥善地解决了数字版权的保护问题。
4 图书馆古籍数字化交流模式发展趋势
我们认为,图书馆古籍数字化交流模式的发展趋势有以下几个方面:按数字图书馆模式对古籍数字化进行组织,建立古籍整理的自动完成集成系统,检索系统和支持系统研究将成为重点,国家对数字化古籍资源进行整体规划,加大资金投入力度,人才培养势在必行,古籍数字化项目的国际性合作将是未来发展的目标。
总之,图书馆古籍的数字化交流模式构建是一项系统工程,笔者还没有涉及到具体的设施、硬件设备和技术问题。但是随着计算机技术与数字技术的发展,图书馆古籍的数字化交流模式将被越来越多的人接受,对于图书馆古籍的数字化需求也将越来越深化,数字化服务的系统化、规模化必将成为图书馆古籍数字化服务发展的趋向。
[1] 李玉梅,迟伟凡.略论我国大学与科研单位馆藏建设的基本特点及成因[J].图书馆论坛,2006(2):147-149.
[2] 李勇,闵维方.论大学与科研单位的特征[J].教育研究,2004(1):61-64.
[3] 汪肇兵.个性化智能数字检索的设计与实现[J].计算机工程与应用,2009(11):62-64.
[4] 孔燕.数字时代高校图书馆用户需求及服务研究[J].大学图书情报学刊,2010(1):39-42.
[5] 吴叶葵.数字图书馆中面向用户数字服务的组织[J].情报理论与实践,2008(4):21-28.
[6] 金更达.数字图书馆模式探讨[J].图书馆建设,2008(2):54-56.
[7] 杜文峦.数字图书馆数字个性化定制服务现状分析[J].情报资料工作,2010(1):112-114.
[8] 陈晶.从用户的可用性角度看数字环境下图书馆数字资源建设[J].情报资料工作,2002(1):56-58.