区域高校图书馆联盟信息服务云平台体系研究★
2017-04-11蔡炜
蔡 炜
(青岛大学图书馆 山东 青岛 266061)
区域高校图书馆联盟信息服务云平台体系研究★
蔡 炜
(青岛大学图书馆 山东 青岛 266061)
为了实现高校图书馆联盟内文献的共享和共用,利用云计算技术,构建了包括角色层、服务层、工具层和基础层的面向区域高校图书馆联盟的区域云服务平台体系架构,并对资源发现进行了探讨,提出了一种层次递进的检索模型,在资源语义建模基础上,给出了基于用户需求的语义匹配策略。
语义建模;云计算;资源发现;图书馆联盟
1 引言
图书馆联盟是以实现资源共享、互惠互利为目的而组织起来的图书馆联合体,是数字图书馆的一种发展趋势[1]。区域性图书馆联盟是图书馆联盟中比较普遍的一种,这种联盟利用地域上的便利,充分发挥联盟的优势,在联合编目、馆际互借、公共检索、集团采购、电子信息资源的建设等活动中相互协作[2],建立起区域性的文献信息服务体系。国内比较典型的如江苏省高等教育文献保障系统、天津高等教育文献信息中心、河南省高等教育文献保障系统、山东省网上图书馆共享服务平台等都是区域性信息资源共建共享机构。
云计算是一种新兴的计算模型, 具有可靠性高、数据处理量大、扩展灵活以及设备利用率高等优势, 正成为信息领域研究的热点, 包括Google、IBM、Amazon、Microsoft在内的几乎所有的IT巨头都将云计算作为未来发展的主要战略之一[3,4]。云计算旨在由专业计算机和网络公司建立计算机存储和计算服务中心,把资源虚拟化成“云”后集中存储起来,为用户需求提供服务。对于图书馆应用,云计算作为一种信息共享技术的架构模式,可以将海量的数字信息资源集中在一起,实现数字图书馆的云平台和云联盟,为数字资源的真正共享提供了新的途径。
本文针对区域内高校图书馆联盟模式,探讨云计算模式下信息资源共享服务平台架构,对云模式下的资源检索提出了本体建模方法和检索策略。
2 云计算应用于区域图书馆联盟的优势
随着图书馆事业的不断发展,图书馆的各类资源已经覆盖社会生活每个领域,并不断地细分、深化和专业化,各高校图书馆根据自身的条件分别拥有其中的部分或全部资源。但由于高校类型不同,图书馆提供的馆藏电子资源服务的综合性和专业性不同,因而形成了电子资源的千种百态。用户如果要从图书馆中获取最有价值、最全面的资料,就要面对不同的图书馆、不同的资源检索系统,无疑增加了用户的困难。图书馆联盟的形成实际就是电子资源整合的一种服务方式。云计算在图书馆的应用很适合共享与合作的范式。这种区域图书馆联盟构成云计算模式,或称为区域云,具有如下优势:
(1)区域内各高校通过联合建立一个共享“云端”,以资源高度共享为基础,改进现有的用户服务模式,逐步形成“统一检索——集成咨询——实时获取——知识服务”的服务模式,有效提高高校图书馆的资源利用率及用户满意度。
(2)众多的服务器、存储器等设备集成在“云端”,其存储能力和计算能力理论上可以无限增大。在区域云中,各高校图书馆实现了共享资源,避免了电子数据库资源的重复购买,也不必再考虑硬件费用问题。同时,更方便的终端设备(如4G手机、IPDA等)接入方式提供用户去访问区域云内的资源信息。
(3)以区域云平台为基础,高校联盟图书馆可以利用云平台实现数字资源的整合、组织、导航以及可视化服务,不同类型和规模的高校图书馆可以按需索取相应的服务,满足用户的需求。
3 基于云计算技术的区域图书馆联盟信息服务云平台架构
3.1 云服务平台架构
云计算的出现对于建立一个统一、开放、灵活的数字图书馆信息服务平台有着重要作用。本文构建了包括角色层、服务层、工具层和基础层的四层结构的面向区域高校图书馆联盟的区域云服务平台体系架构,可以为用户提供基于网络的快捷、安全、价廉的信息服务,并实现地区性图书馆集群的多方协同与共赢,构建一个科学、稳定的平台体系(如图1)所示。
图1 图书馆联盟区域云信息服务平台架构
(1) 角色层是资源需求方、资源提供方和方案服务方等各用户与图书馆联盟信息服务平台进行交互的接口。
(2) 服务层是服务平台的核心功能层。通过人机交互界面用户对各类信息资源需求、信息资源进行注册发布,形成云需求和云资源。在工具层各类型工具的驱动下,服务化的信息资源将按用户需求动态组合为粒度不同的服务模块,形成相应的区域云服务。
(3) 工具层是服务支持层,主要由资源管理工具集、运行服务工具集和平台综合管理工具集等组成。资源管理工具集用于用户及图书馆需求和资源的注释、注册、发布以及分类,主要包括注解工具、注册工具、分类管理工具和发布工具;运行服务工具集可支持信息区域云服务的网络化运行,包括智能匹配工具、本体构建工具、运行优化工具、服务评价工具、租赁管理工具、实时监控工具等;综合管理工具集则为用户提供安全、可靠和稳定的服务环境支持,主要包括了信息平台运行管理工具、用户信息管理工具、安全运行管理工具等。
(4) 基础层将区域内分布在各高校图书馆的数据库、存储类设备、服务器和网络安全类设备接入区域云服务平台中,形成云数据库、云服务器、云存储和云安全等信息服务平台运行支撑环境。
3.2 平台运行模式
云服务平台既要支持区域内各信息服务角色所拥有的广域、异构信息资源虚拟集成,又要实现信息资源共享和优化利用、图书系统网络化集成运行、信息获取过程优化,以及远程维护等基于网络的信息服务。本文初步建立了图书信息云服务平台的运行模式,如图2所示。
图2 云平台服务模式
资源需求方、资源提供方和整体解决方案服务方通过云服务平台的注册发布工具,对各自的服务需求信息、信息资源进行虚拟化描述与服务化封装,并注册发布到云服务平台上,形成相应的云需求和云资源;资源需求方调用服务平台工具集中的智能搜索匹配工具,对其相应的云需求与云资源库中的信息资源进行智能搜索匹配,形成供需匹配文档,并反馈至信息供需双方;待服务确认后,供需双方则可利用平台提供的组合调配工具、优化运行工具、交易协同工具、综合评价工具等服务运行工具对服务进行组合、调配、优化、交易和评价,并将其反馈给服务供需双方,以便对所提供服务进行实时跟踪和完善;同时,平台服务在线监控工具、服务容错管理工具等对其服务进行运维管控,以不断优化平台服务能力。
云服务平台的构建及运行实现,涉及信息资源的云端接入、信息本体建模、云资源搜索与智能匹配、云服务运行及监控等关键技术,就云资源检索本文提出了一种层次递进的检索模型。
4 区域图书馆联盟云平台下信息资源检索
云计算模式下的图书馆联盟涉及到多方面的技术和内容,包括:
(1)图书馆信息资源存储:通过联盟应用、网格技术以及分布式文件系统等功能,将网络中大量各类存储设备通过应用软件虚拟地集合起来协同工作,共同对外提供数据存储和业务访问功能,即“云存储”。在云计算模式下,图书馆藏书目数据库和特色文献数据库等资源都可以选择存储在区域云中。
(2)图书馆信息资源检索:云计算具有强大的计算能力,这为图书馆完成大规模用户同时在线检索服务提供了可能。用户通过Google、百度等检索界面将检索请求提交给云计算服务器,服务器进行本体演算、机器智能推理匹配等复杂计算,将存储在云存储服务器的资源提供给用户。
(3)图书馆信息资源获取:基于云计算本身的分布式架构和强大计算能力,用户从云中获取数字资源的速度将如同在本地一样快捷。用户可以随时的向云服务器提交获取资源请求,云计算服务器将通过统一平台,自动挖掘分布在区域云中各处的数据提供给用户。为了完成信息资源检索,系统需具有强大的资源发现功能。本文在信息资源语义建模基础上,提出了基于用户需求的资源发现服务和语义匹配策略。
4.1 区域图书馆用户模型的建立及其语义描述
用户建模的目的是帮助信息服务系统推测用户提出的需求,智能、主动地发现用户所需的资源内容。因此,资源发现服务需要自动地或人工获取用户需求信息,用户需求表达的准确性和合理性直接影响到发现服务的质量。用户模型所涉及到的用户知识包括采用检索关键词表示的用户需求、隐含的问题空间、用户的兴趣模型及领域知识。用户模型的主要元素包括用户的研究方向及领域、爱好、工作部门、职务等基本背景信息。模型采用类来定义层次不同类型的用户,类属性用来描述相应类用户的特征知识,每一个具体用户对应类的一个实例,可以通过类的继承和关联关系来表达模型的层次。
图3是一用户模型实例,其中用户类描述了所有用户的抽象特征,用户类又分为图书馆类、部门类以及个人用户类。
4.2 基于语义的图书馆联盟文献资源建模
云模式下的资源模型描述需要从语义层次上来加以研究。语义是建立在一定语法上,反映一定认知结果的数据对象的含义以及关联关系,是对数据的一种抽象或者更高层次的逻辑描述[5]。文献信息资源的语义模型可以用于资源的主题搜索、元数据提取和资源语义注释等资源发现过程。同时,也可用于资源的分类聚类,语义导航、检索匹配及智能推理等信息资源语义的应用服务。本体是一种可以在语义和知识层次上描述资源的概念建模工具。对于云模式下资源发现服务,可以通过对信息资源的概念抽象,把信息资源组织为一个公共的资源模型,使其成为基于本体的资源语义模型。
图3 基于类表示的用户模型图
图4 图书类资源本体实例
构建资源领域本体常采用自顶向下(Top—down)的方法,构建的主要步骤包括:(1)确定领域资源的本体范围;(2)定义资源概念的语义层次体系框架;(3)建立资源的领域本体;(4)细化、扩展应用本体。图4是采用有向图定义的图书类资源的局部本体。
4.3 基于概念本体的资源语义检索
高校数字文献资源分布广泛,内容和形式复杂,有效的资源发现和服务机制是资源共享服务的基础。资源检索是信息服务的一项主要内容,本文采用一种层次递进的检索模型(如图5所示),可以实现精确检索、基于语义检索、模糊检索以及智能推理等功能。首先对用户需求进行模糊扩展来完成对模糊查询量的精确化,其次根据资源本体的语义模型实现语义扩展(如:同义扩展、语义蕴涵、语义联想等),末层采用精确匹配和智能推理技术完成资源的检索服务。
图5 层次递进检索模型
基于本体的资源语义检索是一种基于语义匹配过程的资源服务,其检索步骤为:
Step1:将用户需求信息和文献资源信息所包含的概念分别映射到各自对应的本体概念语义模型上,形成用户需求本体O1和文献资源本体O2;
Step2:采用后序遍历分别生成O1和O2各自所包含的概念序列;
Step3:对序列中的每一对概念节点(ci,cj)进行概念本体的语义相似度计算;
Step4:以语义相似度作为量度,从区域云存储数据库中找出符合条件的信息资源集合。
语义相似度采用如下计算公式:
Sim=(ci,cj)=
其中,Sim(ci,cj)代表两个概念ci和cj之间的语义相似程度,li、lj分别是概念ci和cj在概念本体树中所在的层次,α是调节系数(0<α<1),Dis(ci,cj)是概念ci和cj在概念本体树中路径距离长度。
5 结束语
以用户需求为基本是数字图书馆发展的根本和宗旨。随着云计算技术的逐渐完善,将云计算技术与方法运用到区域图书馆联盟信息服务平台建设中,本文在平台的结构及相关技术方面做了有益的探讨,可以有效提高区域联盟内软硬件资源的利用率,构建数字图书馆资源共享体系,提升图书馆的服务质量。
[1]叶素萍.云计算环境下的区域图书馆联盟建设模式研究[J].河北科技图苑,2012,25(4):84-86.
[2]张甫.国内区域图书馆联盟建设与发展研究[J].情报杂志,2011,30(8):138-143.
[3]王德文.基于云计算的智能电网信息平台[J].电力系统自动化,2010,34(22):7-11.
[4]VAQUERO L M,RODERO-MERINO L,CACERES J,etal.A break in the clouds:towards a cloud definition.ACM SIGCOMM Computer Communication Review,2009,39(1):50-55.
[5]张维明.语义信息模型及应用[M].北京:电子工业出版社,2002.
[6]陈康,郑纬.云计算:系统实例与研究现状[J].软件学报, 2009,20(5):1337-1348.
Research of Cloud Information Service Platformfor Regional University Library Alliance
Cai Wei
To achieve the sharing and reuse of Library alliance literature resources, the paper uses cloud computing technology, and structures regional cloud service platform for regional university library alliance that includes multilevel, such as user layer, service layer, tool layer and support layer. The resource discovery is discussed. A retrieval model of hiberarchy is presented. The semantic matching strategy is given based on resource semantic modeling.
Semantic Modeling; Cloud Computing; Resource Discovery; Library Alliance
本文系山东省艺术科学重点课题“基于SOA架构和多Agent技术的区域高校图书馆联盟信息服务体系研究”(2013438)的研究成果。
G250.7
A
10.13897/j.cnki.hbkjty.2017.0014
蔡炜(1970-),女,硕士,青岛大学图书馆副研究馆员,研究方向:图书馆学、文献学。
2016-12-03 责任编辑:张晓霞)