基于IBASE语言的数字化图书馆及其处理方案研究
2009-10-13黄素君
黄素君
〔摘 要〕基于IBAS E数据库的数字图书馆系统有独特的结构及特点。为数字化信息的来源与提取技术和海量数 字信息的存贮和管理提供了可能。IBASE非结构化数据库系统对数字图书馆信息资源建设提 供了有效解决方案。
〔关键词〕IBASE;数字图书馆; 处理方案
〔中图分类号〕G250.76 〔文献标识码〕A 〔文章编 号〕1008-0821(2009)08-0081-03
Study on the Digital Library and
Handling Scheme Based on IBASE LanguageHuang Sujun
(Library,Guangdong Sheng CPC Committee Party School,Guangzhou 510053,China)
〔Abstract〕The digital library system based on IBASE database has its unique struct ure and characteristics.It makes the source and extraction technology,storage an d management of digital information possible.IBASE has provided the efficient ha ndling scheme for information resource construction of digital library.
〔Key words〕IBASE;digital li brary;handling scheme
随着网络信息技术的飞速发展,传统的图书馆管理方式正面临着深刻的变化,用户对信 息的需求也提高到一个全新的水平。如何利用先进的网络信息技术实现图书馆的数字化、网 络化建设,增强自己在网络社会的竞争力,以更好地为社会和读者服务,成为未来社会的公共信息中心和枢纽,正成为各类型、各专业图书馆共同寻求的现代运作模式。非结构化数据 库是针对关系数据库模型过于简单、不便表达复杂的嵌套需要以及支持数据类型有限等局限 ,从数据模型入手而提出的全面基于因特网应用的新型数据库理论。
1 基于IBASE数据库的数 字图书馆系统结构及特点
1.1 系统结构概述
IBASE数据库是一种崭新的非结构化数据库,在处理非结构化信息和全文检索方面获得了突 破。它能够处理包括结构化和非结构化数据在内的复杂的Web数据,能通过独特的子字段、 变长字段和重复字段的数据模型结构,来处理复杂的嵌套和变长数据,支持全文检索,支持图像、声音等多媒体数据的新型数据库。IBASE数据库最核心的技术,实际上就是对数据的 变长存储和智能检索技术。在数据存储上,IBASE数据库在数据模型上主要采用了面向对象 技术,以XML技术为其核心,能根据数据对象自动分配存储空间,实现数据自适应存储和管 理,大大节省存储空间;同时,IBASE数据库的数据表突破关系数据库严格的二维表结构, 数据库记录内的每一个字段都是可以重复的,而每一个字段可以有一个或者多个子字段,甚 至可以嵌套一个二维表,从而解决原来关系数据库需要多个表来表示的复杂关系。
1.2 系统结构特点
IBASE数据库针对关系数据库在存储机制和索引机制局限,使得它在技术、性能等多方面满 足了图书馆实际业务及数字化建设的要求。IBASE数字图书馆为“信息源——图书馆——读 者”三角架构,利用IBASE数据库强大的数据管理和全文查询能力,以统一的标准和规范为 基础,以数字化的各种信息资源为底层,以分布式海量资源库群为支撑,以智能检索技术为 手段,以电子商务为管理方式,为公共图书馆、高校图书馆和各类专业图书馆用户提供完善 的数字化图书馆解决方案。其实质是基于IBASE数据库的一个企业级数据库应用系统,它通 过数字信息的制作与获取、存储与管理、权限管理、内容管理和信息检索与服务等五项综合 功能,涉及图书馆数字信息资源的生产、加工、存储、管理、检索、传递、利用、归档、出 版的全过程,为数字化图书馆的建设提供了一个多媒体信息资源管理系统平台和一整套符合 标准规范的数字图书馆赖以运作的软件系统。
基于IBASE非结构化数据库,为数字化信息的来源与提取技术和海量数字信息的存贮和管理 提供了可能。
2 非结构化数据及数据库
2.1 非结构化数据
非结构化数据是没有经过人为处理的不规整的信息,如文件、声音、图像等。非结构化数据 必须借助对应的解释软件才能打开并直观浏览。因此,无法从数据本身直接获取其表达的物 理属性,亦即不易于理解。非结构化数据不具备严格的结构,较之结构化信息更难以标准化 ,管理起来较为困难。在对非结构化数据的存储上,可以采用传统的关系型数据库或多媒体 数据库。但这两种数据库都不是针对非结构化数据创建的数据库管理系统,因此,在对非结 构化数据的处理过程中存在不足之处。
2.2 非结构化数据库
所谓非结构化数据库是指能够对非结构化数据进行处理的数据库。在非结构化数据库中,字 段长度可变,并且每个字段的记录又可以由可重复或不可重复的子字段构成,允许创建许多 不同类型的非结构化或任意格式的字段,从而突破了关系数据库严格的表格结构限定,解决 了关系数据库模型过于简单、不便表达复杂嵌套的问题。对于多媒体信息的存储和管理,非 结构化数据库系统采用外部文件方式,摒弃了传统关系型数据库采用二进制字段存储的方式 ,实现了对于图像、声音等多媒体信息的高效管理。正是由于非结构化数据库支持子字段、 重复字段和变长字段,具有高效处理图书馆领域内数据的能力,加之内嵌全文检索引擎,支 持对声音、图像等多媒体数据存储处理,使非结构化数据库成为众多图书馆进行数字化建设 的首选系统。非结构化数据库内嵌全文检索引擎,避免了图书馆使用关系数据库进行资源建 设后,在提供全文检索服务时需要再选购一套全文检索系统的双重投资问题。因此,越来越 多的图书馆在信息资源建设上开始使用非结构化数据库。非结构化数据库在对数据处理上, 采用了面向对象技术,不仅可以处理不同类型的文本文件,而且可对图像、音频、视频、计 算机程序以及网址资源进行编目和数字化处理,覆盖了图书馆领域内几乎所有的文献数据类 。同时,非结构化数据库支持外挂文件的全文检索,其独特的外部文件支持能力使图书馆能 轻松实现二次文献挂接全文的功能。
3 数字图书馆发展方向及特点
3.1 数字图书馆发展方向
数字图书馆是用数字技术处理和存储各种图文并茂文献的图书馆,实质上是一种多媒体制作 的分布式信息系统。它把各种不同载体、不同地理位置的信息资源用数字技术存贮,以便于 跨区域、面向对象的网络查询和传播。它涉及信息资源加工、存储、检索、传输和利用的全 过程。
高校图书馆在经历了传统图书馆、现代图书馆之后,正在向数字图书馆发展。数字图书馆是 高校图书馆建设与发展的方向和必然趋势。高校数字图书馆建设与发展是高等教育事业发展 的需要,更是高校自身建设与发展的需要。
3.2 数字图书馆特点
高校数字图书馆是一个宽带多媒体网络和海量信息管理系统,它所面对的存储对象和技术领 域远远超出了目前传统图书馆的范围。存储对象包括数字化的图书、音像、软件、电子出版 物、互联网内容等各种各样的人文与科学数据,因而涉及到大量的管理问题。数字图书馆涉 及的技术领域很宽广,需要大量的技术突破作为支撑,例如基于内容的多媒体检索技术和智 能化、个性化和自动化服务技术,这样数字图书馆的真正潜力才能发挥出来。高校图书馆资 源载体类型较多,有纸制的载体,也有磁、光、电介质的载体。馆藏电子信息资源不仅包括 TXT、DOC、EXCEL、PPT、PDF、S2、PS2等流行的数据文件类型,而且还存有大量的图像、音 频、视频等数据信息。图书馆信息资源建设的过程,实际上就是将资源电子化、数字化后建 成各种类型数据库的过程。图书馆资源即包括本地资源,又存在异地资源,即有国内资源, 又存在国外资源,不同国别,不同地域的文献资料在数据著录格式上存在着差别。高校数字图书馆应具有:充实的在线资源;发现和使用信息资源的必备工具;用于采选、描述、保存 、管理和分发数字资产的商业构架;能够在数字信息前景下操作的信息专家等特性。
4 IBASE数字图书馆处理方案
4.1 基于IBASE的数字图书馆
目前国内的非结构化数据库最有代表性的是国信贝斯(IBASE)。IBASE数据库是一种面向最终 用户的非结构化数据库,在处理非结构化信息、全文信息、多媒体信息和海量信息等领域以 及Internet/Intranet应用上处于国际先进水平,在非结构化数据的管理和全文检索方面获 得突破。IBASE非结构化数据库系统不仅能够支持IBASE非结构化数据库的直接上网发布和全 文检索,对于传统关系型数据库,如Oracle、Sybase、Sql Server、DB2、Informix等,也 提供了导入和链接的支持,用户可以采用导入方式,将传统关系数据库转换为IBASE非结构 化数据库,再进行网上发布和开发全文检索应用。用户也可采用链接方式,对传统关系数据 库构建本地化索引,从而通过本地化索引实现对关系数据库的全文检索支持,IBASE非结构 化数据库系统充当关系数据库应用服务器,系统的检索效率也将受关系数据库自身检索效率 和应用服务器交互效率的影响。针对Internet应用的特殊性,IBASE非结构化数据库系统主 要解决了文档型和多媒体数据类型的支持问题、数据库的全文检索问题和Internet数据库应 用中的查询和检索效率问题。
4.2 IBASE软件数据库建设
IBASE系列软件主要包括IBASE DMC数据管理中心和IBASE IPAC图书馆文献信息资源发布与检 索系统。IBASE DMC(数据管理中心)可以完成特色数据库的建设。利用IBASE DMC数据管理中 心提供的方便快捷的建库功能,可以将馆藏资源建成满足用户的个性化、专业化需求、突出 馆藏特色和科研方向、为教学科研提供高层次、高效率特色数据库。利用IBASE IPAC图书馆 文献信息资源发布与检索系统,图书馆可以建立起图书馆信息服务网站,将各种资源动态发 布上网实现资源的共享是图书馆数字化建设的最终目的。利用IBASE IPAC图书馆文献信息资 源发布与检索系统强大的发布功能图书馆无须任何编程,就能将特色数据库发布上网。
4.3 IBASE数字图书馆处理方案
IBASE数字图书馆处理方案是基于“信息源——图书馆——读者”三角架构,利用IBASE数据 库强大的数据管理和全文查询能力,以统一的标准和规范为基础,以数字化的各种信息资源 为底层,以分布式海量资源库群为支撑,以智能检索技术为手段,以电子商务为管理方式, 为高校图书馆提供完善的数字化图书馆解决方案。使用IBASE数据库可以实现:数字化信息 的制作与获取;海量数字信息的存贮和管理;用户权限认证及计费管理;网站内容管理;信 息检索和个性化服务。除此之外,IBASE数据库还可以实现图书馆新闻/公告、用户意见箱 、BBS、FAG、网上用户教育等辅助功能。
5 结束语
目前,国内很多高校的图书馆都选购了以IBASE IPAC图书馆文献信息资源发布与检索系统为 核心的IBASE系列软件,应用于其特色数据库建设、信息资源管理以及图书馆WEB站点和信息 服务的建设中,使IBASE数据库成为图书馆数字化建设的核心平台,极大地推动了图书馆特 色库、论文库、导航库及图书馆网站的建设,取得了良好的反响。除此之外,在电子商务等 领域也可以应用IBASE系列软件。
参考文献
[1]雷菊霞,孙魁明,贾西兰.数字图书馆建设的实践与思考[J].大学图 书馆学报,2007,(3):39-42.
[2]瞿晓静.非结构化数据库技术综述[J].农业图书情报学刊,2004,(7):8-10.
[3]张德政,张萍萍.非结构化信息管理[J].微计算机信息,2006,22(3):218-219,2 39.
[4]钱智勇.基于非结构化馆藏电子文献数据库的开发研究[J].情报技术,2003,(5): 46-47.
[5]夏萍.基于知识管理的高校数字图书馆建设[J].现代情报,2007,(2):99-100.
[6]李德玲.辽宁高校数字图书馆建设与发展研究[J].沈阳大学学报,2005,17(3):12 7-130.
[7]张绍武,吴建西.非结构化数据库在数字化图书馆发展中的应用[J].图书馆理论与 实践,2003,(4):75-76,88.
[8]兰丽辉.基于IBASE的高校数字图书馆解决方案[J].现代情报,2008,(7):88-92.