区域数字图书馆框架搭建与平台建设
2012-04-29刘卫利易峰
刘卫利 易峰
〔摘 要〕将网络环境、软硬件设备建设集成于区域数字图书馆框架搭建中,以资源建设、资源管理、资源服务为主线来调理数字图书馆平台建设的思路,对区域数字图书馆门户建设中的若干问题作了探讨。
〔关键词〕区域数字图书馆;框架搭建;平台建设
DOI:10.3969/j.issn.1008-0821.2012.06.014
〔中图分类号〕G250保罚 〔文献标识码〕B 〔文章编号〕1008-0821(2012)06-0055-03
区域数字图书馆是数字图书馆联盟的高级形式,是由一大批共同遵循某种协议的计算机网络互联而成的庞大网络。它的基本目标是提供一个良好的基于数字化的信息环境,提供对分布式存储的信息的知识化组织、智能化服务。其体系结构包括基础设施建设、平台门户建设(含文献资源建设)两大部分。其中基础设施建设包括网络环境、各类硬软件系统建设,是区域数字图书馆建设的基础;平台门户是图书馆资源与服务的集成,是区域数字图书馆全部资源和服务的访问接入点,它使得用户通过一个接口友好地访问图书馆所有的资源和服务[1],是快速构建各种信息服务的核心工具。此外,建设区域数字图书馆还需要通过信息安全体系和标准规范体系来协调维护区域数字图书馆各分中心与中心的互操作等。
1 系统架构与基础设施
1.1 系统硬件架构
系统硬件架构主要包括集群服务器架构和海量存储器架构。集群服务器架构考虑采用两台多层交换机作为主干交换机,它们之间采用Fast EtherChannel或Gigabit EtherChannel连接,保证负载均衡及线路备份,当两个交换机之间的一条线路出现故障,传输的数据会快速自动切换到另外一条线路上进行传输,不影响网络系统的正常工作,无需人工干预。主机及备机分别接到两个主干交换机上,当主机出现故障、主机的两块网卡出现故障或主机所连接的交换机两个端口甚至交换机整个出现故障,系统会快速自动切换到备机及另一个交换机进行工作,从而保证整个系统安全有效的运行。
海量存储器架构考虑采用以存储区域网络SAN构架为基础,通过核心的光通道交换机作为SAN的连接核心设备,将多个主机和多个存储设备连接起来的方案。SAN架构可以实现系统中的任何服务器、阵列子系统、磁带系统之间的互连。SAN建造存储池,使多个服务器共享一个阵列子系统、共享一个自动带库,实现数据的共享和集中的管理。它有效地改善了存储资源的共享特性,非常适合管理动态数据。它独立于应用服务器网络系统之外,拥有几乎无限的可扩展性。开放性和可扩展性是系统硬件架构的设计原则。
1.2 系统软件架构
平台软件系统应通过国际工业标准JSR168来实现应用集成,门户支持XML/XSL、ODL、HTML、JSP、WEBSERVICES等整合模式[2]。整个系统可考虑采用业界领先的TRS数字图书馆解决方案,包含表现层、逻辑处理层和数据层等3个层次。
表现层是整个资源平台与用户的接口,负责用户界面以及用户的接入。表现层的最终表现形式是整个数字图书馆的门户。该层采用TRS内容管理协作平台(TRS WCM),它是一套完全基于Java技术和浏览器技术的网络内容管理软件,集浏览器内容创建和写作、内容交付、基于模板的内容发布、强大的站点管理于一身,并提供企业级的团队协作能力,使信息发布简单化、自动化、智能化;逻辑处理层是整个资源平台的应用服务逻辑事务层,负责完成应用系统所要完成的功能。它提供对资源发现的通用检索、对象代理发布以及其它用户服务(如个性化定制)等,同时负责在应用层上对资源进行存取。该层使用TRS内容分发平台(TRS CDS),该平台是TRS内容管理平台中的一个重要组成部分,其主要功能就是实现内容的分发及后续阶段的评估反馈,以实现整合多种数据源,为表现层提供多种异构数据源的内容,即实现灵活、无缝、透明的数据整合;数据层负责存储与管理各种信息数据资源,通过相应的存取协议来进行访问。由于数字图书馆的数据库需求和其它系统的差异性,需要提供在海量非结构化信息中快速、准确获得用户所需信息的全文检索功能。
1.3 网络传输环境
网络出口带宽主要依据在线用户数来配置,可建立Chinanet和Cernet双通道出口。为使公网用户访问更为顺畅,前者带宽应大于后者。
横向上IP网可分为核心层、边缘层、接入层。核心层是由核心路由器或异步转移模式骨干交换机以及承载这些设备的光纤传输网组成;边缘层由边缘路由器或ATM交换机组成,边缘层设备可以通过光纤直接与核心设备连接;接入层包括局域网、公众电信网、综合业务数字网、移动网直接面向用户连接或访问的部分,由无线网卡、AP和L2Switch组成,主要功能是完成用户流量的接入和隔离。
湖北高校数字图书馆建立了一个公共网数据中心和一个教育科研网数据中心,采用分布式架构在数据中心建立数据资源存储与服务系统,并以专线方式在两个中心之间实现光纤直联,实现了两个中心的硬件及数据互为冗余备份,解决了异构设备及网络互联、城域光缆连接、负载均衡与切换数据同步等技术难点[3],这种双数据中心架构的方式,为区域数字图书馆网络建设提供了有益的思考。
2 平台建设的逻辑结构
2.1 信息资源建设层(数据层)
资源建设包括各类电子图书库、期刊库、报纸库、文献库、光盘库、素材库、课件库、试题库、案例库、答疑库及图书馆内部管理信息系统、馆藏资源的数字制作、格式转换等等,是数字图书馆的核心;从来源上可分为商业数据库、免费数据库、自建数据库等类型,它处于整个平台架构的底层,包括了信息资源交换的体系和规则,是区域资源共享的基础。在实践中,应考虑以下几个方面:①为体现资源的学科特性,应加强各学科文献资源中心建设;②各分中心根据本馆特点进行分工协调,购买安装相关数据库并负责买断该数据库的区域内使用权,实体文献建设保持现有机制,以馆际互借和文献传递方式来解决共享问题[4];③要坚持引进和自建相结合的原则。
2.2 信息资源管理层(应用层及应用支撑层)
应用层包括为了实现共享平台的诸多功能而开发的应用程序模块,如统一认证、统一检索、文献传递、推送服务、资源导航、个人图书馆、专题图书馆、信息交流、创作出版、区域流通、联合咨询、产业资讯等应用功能[5]。数字图书馆的最终服务主要体现在资源的整合和重组上,整合的概念体现在两个方面,即数据与应用。数据级的整合需要将可抽取的元数据按照一定的标准和规范集中存放以实现统一检索和全文检索;应用层的整合主要涉及读者的认证、系统检索出口数据的分析与整理,然后再统一数据显示格式。整合层是数字图书馆实施中的重点和难点,需要针对不同的数据资源进行定制[6]。
联合目录检索与基于元数据的统一检索是针对各种异构数字资源进行应用检索整合。强调基于元数据的统一检索,可通过先进的组织体系和语义检索获取信息,为用户提供统一的检索界面和检索语言,实现对汇总资源元数据联合仓库的跨库检索,同时提供异构数据库统一检索功能,使发布分散的数字图书馆资源充分发挥整体效益,进一步用于增值性的应用。资源调度模块能够自动更新知识库,允许自定义本地调度规则并定制个性化调度服务,向第三方提供资源注册标准和接口,方便数据商批量更新资源注册信息。
参考咨询与文献传递模块集成了OPAC系统、中外文期刊、中外文数据库及电子书系统,用户在网上提交馆际互借申请,通过所在馆获取文献传递网成员馆的文献资源。如何使整合后的各种数据资源发挥作用并进行高效的知识管理以及增值性服务,是信息服务的主要目的。数据资源服务系统将各种数据资源通过多种数据服务方式提供给服务团体或个人用户,包括:虚拟参考咨询服务,馆际互借服务,个性化服务等。
应用支撑层指工作流、内容管理、通用表单、知识管理、统一交换平台、统一消息平台认证和权限管理。支撑层是基于灵活的目录服务体系和标准规范的信息交换格式构建应用集成、信息管理和共性服务系统,包括工作流引擎和中间件。中间件支持跨平台的分布式异构数据的访问,从而向应用业务层提供统一的数据服务。工作流系统通过工作流引擎驱动数据在应用业务层的各种应用之间流转,以便根据分工合理高效和完整的分配信息。应用支撑层采用面向对象、组件式设计等多项技术,提供的构建系统是跨领域、与具体业务无关、通用的基础服务,能随着电子政务系统的发展而扩展伸缩,应用系统一般通过应用开发接口或声明性的描述来使用这些构件服务[7]。
2.3 信息资源服务层
现代技术条件下图书馆工作效果的一个衡量标准可能是:大部分的服务是否都可以通过门户网站来完成?我们可以大胆推测:假如某实体馆一天不开放,会有N位读者感觉不适的话,那么其平台门户瘫痪一天,应该有2N位读者抱怨。公共服务平台就是要搭建一个面向全区域用户的网络服务系统,拥有装载各类型文献数据库的服务器群,连接各个图书馆的自动化管理系统。构建统一的网络检索及异构数据库检索共享网络平台是现代图书馆联盟的必要技术支持。数字图书馆联盟服务平台建立的目的是要打破馆际界限和信息分割,集成各类数字信息资源,协同各成员馆间的业务处理,为用户提供一站式的信息服务。其工作重点是面向分布式和异构化的数字信息资源,通过服务集成构造统一的信息服务平台,实现信息服务的集成与数字信息资源的共建共享[8]。
门户的核心要素包括认证、检索、导航、链接、咨询、个性服务等等,其建设应处处以用户使用为主导,强调资源和服务的集成,突出资源的学科性,同时还要注意系统架构的开放性和与传统服务的平滑过渡问题[9]。应从两个方面来评价门户建设的满意度,即用户界面和服务功能。用户界面包括屏幕布局、帮助和容错能力、可学习和可记忆能力等指标,服务功能则包括资源检索、资源导航、个性化服务、用户认证等指标[10]。门户建设的最终目标是要把图书馆的资源和服务做到无缝连接,使读者通过门户可以享受几乎所有的服务项目。
3 问题与思考
文化部打造的数字图书馆推广工程,是区域数字图书馆建设的重要实践。它将构建以国家数字图书馆为中心、以各级数字图书馆为节点、覆盖全国的数字图书馆虚拟网,借助网络及各式新兴媒体,向公众提供数字图书馆服务,在全国范围内形成有效的数字资源保障体系。全国省级数字图书馆平台搭建工作预计2012年完成,届时全国所有省级数字图书馆和部分市级数字图书馆的硬件平台搭建工作将完成,2013-2015年则进入全面推广阶段[11]。如此众多的分中心的加盟,在扩大资源共享范围的同时,必然带来一些问题引发一些思考,这些问题和思考对区域数字图书馆建设有着积极的意义。
3.1 IP地址限制的弊端
以高校系统建设的数字图书馆为例,几乎都是受IP地址限制的围墙式封闭馆模式,它并非为技术所限制,而是数据供应商保护自身经济利益的一种不成文的行规。而读者访问数字资源恰恰有随时随地的需求,无疑这种限制是致命的。打破这种禁锢,开放资源,是建设者必须面对的现实。现时通常采取两种方式实现IP地址限制的突破:对自身用户采用免费注册授权,实行系统统一身份认证;对公众用户,另作用户编码,通过售卡与供应商共享利益。但是,长久看这并不符合资源共享的本意,这种状况降低了数字资源的传播扩散优势。在更大范围内解除IP限制才可以使区域数字图书馆使用走上正途。
3.2 数据存储方式的弱点
无论是中心还是分中心,都存在存储方式的选择问题。资源的本地镜像存在知识产权问题,也会带来存储设备的持久压力;而远程访问又面临受制于人的尴尬。所以,在区域内对各种资源的存储使用方式的协调统筹,应该多体现“计划”的色彩,确定好各种资源的保存级别,分清轻重缓急,做到“有取有舍”。
3.3 技术条件复杂引发的被动
计算机技术、网络技术牵引着数字图书馆建设的方向,它们走到哪一步,数字图书馆跟进到哪一步,“技术推进”原理体现得非常充分。但技术环境复杂也导致资源组织、资源管理、资源发布工作运行成本高企,也引发人文与技术的对抗。商业数据库由于开发商不同,往往使用不同的硬件系统和软件平台,技术规范、数据标准不一。而自建数据库的质量差异较大,除少数建设质量较高外,大多存在功能单一或不够完善,资源收录不全,后续管理难以到位等问题。由于商业数据库的技术异构和自建数据库的质量差异,致使图书馆联盟电子资源的共享环境复杂,资源整合、多馆协作和服务共享等方面存在一定困难,自建特色数据库整合、资源开发利用、服务评估困难。
3.4 门户建设的随意性
门户建设规范性不够,指标分散杂乱,对图书馆工作内容体现的充分程度差异很大,折射出图书馆建设者、管理者对图书馆工作认识上的较大差别。这种认识上的差别对区域数字图书馆建设起到了反作用。门户为用户提供的服务种类呈现出五花八门、繁简无序、参差不齐、良莠不分的状态。所以,有必要对图书馆工作的服务项目制定一个规范性的指标,以此引领门户建设,从而规范并提升图书馆服务水平。
参考文献
[1]林芳.数字图书馆门户可用性评估指标体系[J].图书情报工作,2008,(4):25-28.
[2]颜务林 李亚芬.宁波数字图书馆建设模式与运行机制研究[J].图书馆,2009,(3):84-85.
[3]燕今伟.湖北省高等学校数字图书馆建设方案及其实施.陕西:PPT,2009-05-21.
[4]徐力文.湖北数字图书馆区域合作发展模式探讨[J].图书馆论坛,2003,(5):57-59.
[5]何继红.区域数字图书馆平台建设的研究[J].苏州大学学报,2011,(4):23-27.
[6]白广思.数字图书馆平台建设研究[J].情报理论与实践,2010,(4):102-105.
[7]电子政务PPT教案[EB].http:∥www.doc88.com/p-968199123979.html
[8]易菲,龙朝阳.基于SOA的数字图书馆联盟信息服务平台构建[J].图书馆工作与研究,2011,(6):4-7.
[9]肖珑,等.数字图书馆门户的构建与服务[J].大学图书馆学报,2007,(4):41-48.
[10]林芳.数字图书馆门户可用性评估指标体系[J].图书情报工作,2008,(4):25-28.
[11]游雪晴.科技日报[N].2011-09-13.
(本文责任编辑:张丽娟)