高校图书馆数字资源整合方式研究
2009-07-14王利蕊
王利蕊
〔摘 要〕介绍高校图书馆数字资源整合的信息源、整合方式及其概念,在数字资源整合过程中数字资源选择、描述、加工、整理、维护、更新等方面作了分析和比较,并提出作者的观点和看法。
〔关键词〕信息集成;资源建设;数字资源整合
〔中图分类号〕G250.76 〔文献标识码〕A 〔文章编号〕1008-0821(2009)02-0075-03
Research on Integration Mode of Digital Resource of University LibraryWang Lirui
(Library,Nanjing Institute of Technology,Nanjing 211167,China)
〔Abstract〕This paper introduced the information source,the resources integration way and the concept of digital resource of university library.In the digital resources integration process,choice,description,processing,reorganization,maintenance,renewal of digital resources have made the analysis and the comparison,and proposed one餾 own viewpoint.
〔Key words〕information integration;resources construction;digital resource integration
随着信息全球化程度不断深化,数字信息社会化已是必然。伴随网络信息化程度深层次发展,成本降低,高校图书馆的数字化资源成异构性、动态性和多样性巨量增加,信息服务方式也趋向于数字化、网络化、区域性联机合作方式。各种联机数据库、书目系统、检索系统、文件系统、自建数据库等各种数字资源,信息源之间的信息组织体系、文件格式、采用的检索技术等各不相同,形成一个又一个的“信息孤岛”,为读者目标信息的获取带来了极大的难度,图书馆数字资源整合已经成为亟待解决的问题。
1 数字资源整合的主要阶段
1.1 数据整合
所谓数据整合,是对异构资源系统中的异质、异类的数据在逻辑上或物理上有机的集中,提供统一的表示和查询,以解决多种异构数据资源的互联与共享。这种整合方式整合的对象是资源实体本身,不对资源实体进行处理,通过一定的技术手段,把不同来源、不同格式、不同特点、不同性质的异构数据,在逻辑上或物理上进行有机集中,屏蔽各种数据源的差异,让这些异构系统“互联互通”,并以统一的视图形式表现出来,达到异构数据的共知和共享。
1.2 信息整合
所谓信息整合,主要指通过某种机制或标准,对不同性质、不同来源和不同格式的数字资源进行描述与链接,使相对独立的资源实体产生联系,实现数字资源的全方位整合和一步到位的获取。它的实质是将信息实体间及信息实体基本属性间的多种复杂的关系进行衔接、整合,使分散的、异构的数字源形成一个有机关联的整体,是基于数据整合,建立在搜索引擎基础之上的整合方式。信息整合的主要对象是信息实体之间的关系,是数字资源巨量增长,相互关联后的实际需求。
1.3 知识整合
所谓知识整合,是以知识组织方法为指导,以数据整合、信息整合为基础,以知识组织体系为支撑,组织资源知识结构中概念及概念关系的一种整合方式。知识整合的主要对象是内在于知识体系中的知识结构的概念及关系,建立在数据整合和信息整合基础之上,侧重于概念和关系的重组,跟踪用户需求,提供多种智能化的知识服务,处于数字资源整合体系的最高层,是资源整合的最终目标。ゾ菅д咄跛闪帧按油际楣莸慕嵌瓤葱畔⒆橹和知识组织”一文中论述,知识管理中知识组织包括显性知识(含事实知识和原理知识)管理和隐性知识(含技能知识和人力知识)管理,图书馆的知识组织不是知识组织的全部,而图书馆的知识管理侧重于对显性知识的组织和管理。目前,高校图书馆的数字资源整合涉及多种数字信息源及服务,本文就高校图书馆数字资源整合策略进行了研究和探讨。
2 数字信息资源整合的信息源
数字资源整合是将零散的信息源整理、序化,通过某种机制或标准,对不同性质、不同来源
和不同格式的数字资源进行描述与链接,使相对独立的资源实体产生联系,实现数字资源的全方位整合和一步到位的获取。数字信息源是资源整合的物质基础,基于数字环境下的高校图书馆数字信息种类,主要包括各种类型的联机数据库:题录、文摘和全文库,如EI、中国期刊网、万方数据等;自建数据库:中外文书目数据库、中外文期刊目次库、学位论文库、科技信息数据库等;光盘数据库:包括网络光盘数据库和单机光盘数据库等;专业特色数据库:专利数据库、标准数据库、学术导航数据库等;电子期刊、图书、多媒体资源、各类网络行业信息等。
3 数字资源整合方式
纵观数字资源整合方式,图书馆的数字资源整合主要侧重于对显性知识的组织、开发、利用。主要有以下几个整合方式。
3.1 基于数据仓库系统的整合
数据仓库整合方式起源于20世纪80年代,是一种比较成熟的信息集成技术。是将异地、异构数据库系统中的信息提取出来,通过分析、综合、转换、过滤和整合,使分散的、不一致的数据转换成集成的、同构的数据,建立一个消除了差异性的、稳定的数据仓储集合,以提供集中的、统一的检索服务。在图书馆数字化整合过程中,应用于异构数字化整合系统平台比较成熟的系统有:Eprints、OAICat、ARC、OAIster、NSDL、NDLTD、my.OAI等[3]。①ARC—A Cross Archive Search Service ARC是美国弗吉尼亚州立大学数字图书馆研究组开发的一个数字化整合系统。它收割元数据,进行规格化处理后存储到基于关系数据库的检索系统中,提供统一界面检索服务。②OAIster是密歇根大学数字图书馆服务的一个项目,目的是创建一个易于获取信息的学术性数字资源集合。OAIster采用OAI协议收割不同机构的元数据记录构建自己的服务,用户通过检索OAIster获取的元数据记录,可以直接链接到相应的数字资源,为用户提供“一站式”检索服务。③NSDL—National Science Digital Library NSDL是美国国家科学基金资助的项目,它的核心就是收割的多样化元数据仓储,为用户提供检索服务。④CALIS高校学位论文数据库是一个集中检索、分布式全文获取服务的高校博硕士学位论文文摘与全文数据库。采用各成员单位在本地建立自己学位论文提交和发布系统,通过OAI协议收割原数据,建立集中的元数据库提供检索查询的分布建库模式。清华大学图书馆作为服务提供方,向分布在各成员单位的数据库发出请求,抓取元数据。用户通过集中的元数据库检索到论文信息后,通过OPENURL链接到存储在各校的论文全文[4]。
3.2 基于中介模式的整合
基于中介模式的整合方式,也称为数据的逻辑集成(虚拟数据库整合、系统平台整合、数据聚合、数据互操作)。这种方式是通过包装器(Wrapper)/协调器(Mediator)中介结构模式满足系统集成应用的需求[5]。这种整合模式是通过中间媒介结构把在不同的时间、用不同技术开发的、具有不同内容和不同形式的数字资源系统集成起来,呈现给用户的是一个统一的检索界面,用户不必关心每个数据源的查询特征,便可一次集成检索多个数字资源系统。这种数字资源整合模式通过中介屏蔽掉分布式系统的异构性,保持异构资源系统的组织模式不变,通过资源与利用之间的中介结构完成异构数据的集成,适宜于数据源数量较大、数据变化频繁、集成系统对数据源没有控制的集成系统。适合高校图书馆数字资源整合的基于中介模式整合的方式主要有:
3.2.1 基于CORBA的数据整合
是一个为异构平台提供基础对象接口的开放式的标准规范。目的是为了支持异构分布式计算环境下的互操作性,以有利于解决与日俱增的异构数据源集成,具有与平台、操作系统、网络和开发语言无关的特点,有效地解决了平台异构性,并可以实现资源的实时更新。例如:斯坦福大学的数字图书馆项目Infobus(Information Bus)系统。
3.2.2 基于Z39.50协议的数据整合
Z39.50协议是信息检索应用服务定义和协议规范,它的核心是指定了客户端和服务器之间的信息交换的格式和过程,使用户可以透明地检索远程数据库信息,是一种开放的网络应用协议,支持MARC语法、元数据检索。既可以屏蔽掉不同的检索语法和策略、文件格式和操作平台的异构性,又规定了异构系统之间传递检索命令和数据的标准方法。Z39.50协议实际上就是一个中间协议层,通过他的转换,可以实现异构操作平台之间的交互式通信和分布式异构数据源之间的无缝链接。基于Z39.50协议集成整合书目资源成为图书馆异构数字资源整合的一个重要应用。例如:OCLC WorldCat、加拿大的虚拟联合目录计划vCuc(Virtual Canadian Union Catalogue)、台湾的“Z39.50跨系统查询系统”、国内的OPAC等。
3.2.3 基于中介模式的异构数据库整合系统
基于中介模式的异构数据库整合系统是采用多种集成技术和协议标准构造一个中介结构模式,实现实体资源分散下的虚拟的逻辑的数据整合,用户只需要提交一次检索请求,就可以对多个资源数据库进行检索,而不需要逐个进入不同的数据库检索服务界面。国内具有影响的基于中介模式的异构数据库集成检索系统是CALIS“数字图书馆资源统一检索系统”、CSDL“国家科学数字图书馆”、以及台湾“华文知识入口网”等。
3.3 基于信息链接整合
基于信息链接整合通过超文本链接机制,将存在于异构数据源的信息是投机信息实体基本属性间的内在关系整合起来,使得不同类型、不同级次、不同载体的信息有机地连接起来,组成一个有机的信息网络,用户不仅可以一次性获得多个资源系统的数据或信息的集合,实现“一站式”检索,而且可以根据信息点链接的指引,实现关联资源“一步到位”的获取。国外主要的应用有:ISI的Web of Science、NASA的Astrophysical Data Stem、NLM的PubMed、基于OpenURL的SFX等,国内著名的CNKI中国知网、基于OPAC书目资源系统的纵向整合等。
3.4 基于学科信息门户的整合
学科信息门户的整合是根据学科研究与教学的需要,集成整合学科领域的核心和相关学术资源,为专业用户提供一个有效利用领域学术资源与服务的整合方式。它以信息组织体系(分类/主题词表)为资源组织的基础,以元数据为资源描述基准,全面整合学科领域内重要资源,针对用户的特点和需求,以统一的界面为用户提供浏览、检索和获取以及个性化服务等。比如:英国的Intute:Social Science、INFOMINE、WWW Virtual Library、中国国家科学数字图书馆(CSDL)学科信息门户系列、中国人民大学“经济学学科知识门户”等。
4 对数字信息资源整合的思考
4.1 数字化资源整合平台的设计
数字化资源整合平台的设计要有利于数字资源采集、序化、组织、整合、显示。通过系统平台、技术手段和图书馆工作人员对数字信息资源的采集、序化、重组,使各类数字资源的信息实体及其关系形成一个关联的整体,实现资源一步到位的获取。界面要有利于数字资源发布、管理、交流和用户认证,要有良好的可视性、便捷性。
4.2 图书馆数字资源管理系统的选择
现有ERMS软件,除少数几个图书馆自主开发一些试验型的或具有部分ERM功能的系统(如波士顿大学图书馆的ERMdb及MIT的VERA)外,商业性系统占主流。商业性系统来源有4个:ILS厂商、期刊代理商、非盈利组织以及出版获取管理服务公司(PAMS)[6]。由于计算机技术、搜索引擎技术及网络技术发展迅速,使得数字资源管理系统升级换代频繁。因此,图书馆在选择管理系统时要分析本馆整合的实际需求,更要了解各种ERMS的优点和限制,了解系统的操作性、兼容性、功能性以及采用的标准和系统升级换代的费用等实际情况。
4.3 建立数字资源整合质量控制标准
数字资源整合是否成功,必须在数字资源选择、描述、加工、整理、维护、更新等各个过程,都要有一整套规范化的质量控制标准。规范的质量控制标准有利于数字资源的选择、资源发现、采集策略以及信息源描述、加工、标引、重组等。有利于与机构资源的对接、升级,有利于动态数据更新等好处。
5 结 论
在信息技术日新月异的时代,使分散的数字资源有序地整合链接,必将是网络环境下数字资源管理、服务的趋势,也是最大限度地体现“以人为本”的服务理念。在对数字资源的异构性、动态性和多样性进行整合利用过程中,首先要建立一套科学规范的资源选择、加工、维护的控制体系,根据自身图书馆数字资源的具体情况,选择合适的数字资源管理系统,建立可视化、易于交流、检索的数字资源门户,才能做好数字资源整合工作。
参考文献
[1]马文峰,杜小勇.数字资源整合:理论、方法与应用[M].北京:北京图书馆出版社,2007,(12).
[2]黄如花.网络信息组织:模式与评价[M].北京:北京图书馆出版社,2003,(11).
[3]齐华伟,王军.OAI-PMH与数字图书馆的互操作[J].图书馆论坛,2005,(4):19-22.
[4]赵阳,姜爱蓉.学位论文网上提交系统和发布系统比较研究[J].大学图书馆学报,2004,(3):36-40.
[5]孟小峰.Web信息集成技术研究[J].计算机应用与软件,2003,(11):32-36,63.
[6]Maria Collins.ERM:Understanding the Players and Right Choice[J].Serials Review,2005,(2):125-140.