APP下载

基于语义网和SOA的医学图书馆信息服务模型设计

2015-03-22

中华医学图书情报杂志 2015年9期
关键词:本体馆员语义

大数据时代,文献信息资源呈现出来源多样化、数据增长快速化、数据资源海量化等特点,给用户快速发现和有效利用信息提出了挑战。对此,图书馆应积极整合信息资源和创新服务模式,为用户提供专业、高效的个性化信息服务。

本文运用语义网技术针对用户的检索方式和学科馆员的服务方式提出了新的思路和模型,即基于语义网关联数据和本体技术的用户检索方式的转变及基于本体的学科馆员信息服务模式。在基于语义网技术的个性化信息服务新模式下,学科馆员通过领域本体和构建应用本体向用户“推信息”,用户端通过“所得即所需”的方式“拉信息”的模式获取准确度、相关度高的信息。

1 语义网和SOA

1.1 语义网及相关技术

语义网的出现改变了图书馆的信息组织和检索方式,将以前没有关联的数据通过语义关系相联系起来,在逻辑层面上实现了数据整合[1-2];摆脱传统关系数据模型下机械式检索的约束,实现基于语义关系的智能化数据检索。

关联数据技术是语义网实现的基础。关联数据技术通过网络把相关数据通过语义连接起来,目的是构建一个计算机能够理解的具有结构化的和富含语义的数据网络,以便在此基础上构建更智能的应用[3]。关联数据技术采用资源描述框架(Resource Description Framework,RDF)数据模型,利用URI命名数据实体,并在网络上发布,从而可以通过HTTP 协议揭示并获取这些数据,同时强调数据的相互联系以及有助于人和计算机理解数据的语境信息[4-5]。关联数据技术引领用户检索方式由传统的字面意义的匹配查询转化为围绕着主题的基于语义的查询,为将检索词背后隐藏的、相关联的信息充分揭示给用户提供了技术基础。

本体用来描述或表达由RDF所描述的某领域内知识的一组概念或术语[6],使这些概念和关系在共享范围内具有大家共同认可的、明确的、唯一的定义,在此基础上便于人机以及机器之间可以进行交流[7]。

本体的目标是获取、描述和表示相关领域的知识,提供对该领域知识的共同理解,确定该领域共同认可的词汇,并从不同层次的形式化模式上给出这些词汇和词汇间相互关系的明确定义[6]。本体按层次划分为顶层本体、领域本体、任务本体和应用本体4个层次[8]。本体能够在不同层次范围内构建出具有多种属性的概念关系网,为基于领域内的语义查询实现更具指向性、精确性、专业化的检索能力提供了可能[9]。

1.2 SOA技术

SOA(service-oriented architecture,面向服务的体系结构)是一个组件模型,它将应用程序的不同功能单元(称为“服务”)之间定义良好的接口和契约联系起来。其中,接口是采用中立的方式进行定义,独立于实现服务的硬件平台、操作系统和编程语言,使构建在这样的系统中的各种服务可以以一种统一和通用的方式进行交互[10];服务是一种部署在网络上的实现了一定功能的应用逻辑单元,它包含一组操作集(一个或多个操作)并向外界提供访问操作的接口,服务请求者通过服务提供的接口来调用服务实现应用需求。

2 基于语义网和SOA的医学图书馆信息服务模型

2.1 模型架构

模型的核心设计思想是建立一个开放的基于语义网的信息服务平台,在该平台上建立起学科馆员、医学领域专家和学科专业用户之间以信息为纽带的新型个性化服务关系。基于语义网和SOA的图书信息服务模型架构见图1。在该模型中,基于SOA的RDF服务、RDFS服务、本体服务及传统业务服务是核心服务组件。在核心服务组件的支撑下,形成信息的“聚合”和“流动”,即以学科馆员为代表的服务人员针对学科专业用户的需求构建适当层次的领域本体或应用本体模型,专业用户基于本体模型驱动的服务获取高质量的信息。

2.1.1 核心服务组件

核心服务组件主要包括RDF服务接口、RDFS服务接口、本体服务接口及传统服务业务接口。核心服务组件架构主要层次大致分为4层(图2)。

底层为数据层,包括关联数据知识库/本体模型库/用户数据库、元数据库系统及传统数据库系统等。其中元数据库系统是另外两个数据库的基础,包括了元数据标准库、元数据库和元数据映射库,元数据库为知识发现提供了规范和基于规范的数据基础。元数据标准库包括不同元数据标准,模型通过本体的映射屏蔽数据的异构性并提供统一的逻辑视图。关联数据知识库提供了元数据的关联模型和类型定义信息,本体模型库则提供了知识概念之间的联系信息,用户数据库为不同用户提供个性化的信息记录服务。

RDF服务引擎和RDFS服务引擎共同组成了关联数据服务引擎,在关联数据知识库、本体模型库、元数据库系统的支撑下为关联数据的生成、入库和基于关联数据库的语义查询提供服务。

本体服务引擎完成各种本体的辅助构建和在RDF服务引擎和RDFS服务引擎的帮助下完成基于本体模型的语义查询。

传统数据库和传统服务业务层承担整合已有数据库和保留传统业务软件资产的任务,使旧业务和旧数据无缝地融入新平台和新应用。

图2 核心服务组件架构主要层次

2.1.2 服务总线及接口

服务总线是负责管理和协调学科馆员平台、医学领域专家平台、学科专业用户平台与核心服务组件接口关系的组件,服务总线可以应用企业服务总线(Enterprise Service Bus,ESB)平台。

2.1.3 学科馆员工作平台

学科馆员工作平台为学科馆员在基于语义网的医学信息服务系统中发挥驱动和提炼医学文献信息知识的能力提供了重要的支撑,为学科馆员与学科专业用户的沟通提供了便捷的、专业的、实时的联系工具。学科专业用户的需求可以通过提交到用户数据库等多样的方式传递给学科馆员,使学科馆员能捕获最准确的需求信息。 学科馆员根据获得的需求信息为用户构建、选择适当的领域本体或应用本体,通过扩展或裁减的迭代,为用户提供最准确、相关度最大的本体模型,并持续跟踪用户的研究动向,不断完善更新本体模型,以提高用户获取信息的效率和质量。

核心服务组件为学科馆员提供私有的用户数据库,用来保存学科馆员的各种经验、规则、模型及由其他各类数据挖掘等方法获取的医学及相关知识,为知识、方法的复用提供了技术基础。

2.1.4 医学领域专家工作平台

医学领域专家既可以是学科馆员的协作者,也可以是高层次的学科专业用户。领域本体及应用本体的构建是专业性很强的工作,本体构建的科学与否,与检索结果的准确度密切相关,但学科馆员往往难以完全胜任本体的构建工作。作为学科馆员的协作者,医学领域专家可以指导其构建医学领域本体或应用本体模型。作为学科专业用户,医学领域专家可以通过用户数据库和积累的相关经验及知识与学科馆员沟通交流。

2.1.5 专业用户终端

本文所指的学科专业用户是一个广义的用户群,没有特定的指向,既可能是独立的医学学者,也可是与医学学科相关的群体。专业用户可通过终端与学科馆员交换信息,也可以用来记录自己的相关需求和经验。

2.2 模型的工作方式

模型的工作方式有本体模型的建立/选择过程、基于关联数据和本体模型的检索过程两部分。

2.2.1 本体模型的建立/选择过程工作流程

学科专业用户将服务需求以学科馆员规范的形式提交给学科馆员,必要时可提交附件,辅助学科馆员充分理解、分析用户需求。学科馆员与医学领域专家进行充分的沟通,对用户的意图和需求的目标进行确认,初步构建起或选择所需的本体模型,对本体模型进行验证评估,必要时进行修改和完善,并重复本步骤,对优选出来的模型提交给核心组件的相关数据库,需要时可以同步提交到学科馆员用户数据库,用于知识的积累。

2.2.2 基于关联数据和本体模型的检索过程工作流程

医学专业用户提交检索需求给核心服务组件,核心服务组件对检索命令按照关联数据或本体服务引擎的需要进行格式化,然后转交给关联数据引擎或本体服务引擎。当转交给关联数据引擎时,由RDF引擎和RDFS引擎根据命令参数及算法查找出相关信息;当转交给本体服务引擎时,本体服务引擎在RDF引擎和RDFS引擎的支持下,查找与本体相匹配的信息,将信息按照用户的需求做进一步的处理后返回到接口。

3 模型的优势及特点

3.1 应用开放的架构体系建立起开放的基于语义网的信息服务模型

不同的医学专业用户均可访问模型所支持的文献信息资源,不同的图书馆文献信息资源也可以通过关联数据技术相关联,以关联数据为形式的医学信息资源从多个维度进行扩张。

3.2 紧密联系学科馆员的服务与学科专业用户的需求

对学科馆员来说需求指向更加明确,信息推送更加精确;对医学用户来说检索过程达到“一键拉取”,检索结果达到“所得即所需”,形成基于信息“推拉”模式的个性化服务新模式。

3.3 结合医学图书馆信息资源的语义化检索与资源的整合

既可实现数字资源的整合又能实现基于语义网的检索能力,同时还可有效保护已有的软件资产。

3.4 为学科馆员的个性化服务提供了新的思路

对学科馆员的学科专业性和语义网应用建模能力提出了新的挑战。

3.5 凸显医学领域专家在学科馆员服务中的重要性

强调了医学领域专家在基于本体的智能检索服务中不可或缺的角色。

4 结语

本文论述了基于SOA架构方法将关联数据和本体技术应用于医学图书馆信息资源服务的模型架构,模型借助SOA方法屏蔽了传统业务和数据层的异构性,并为医学信息资源整合提供了可行性,针对各种异构资源,能够提供基于语义网技术的开放的应用接口,使资源之间具有了语义上的可扩展的关联关系。两种技术方法的结合提供了一个较为通用的整合资源和基于语义的信息组织、检索服务系统建设新思路。模型通过应用本体模型的技术为学科馆员和学科专业用户之间架起了一座桥梁。学科馆员在医学领域专家的协助下,应用本体模型为医学专业用户提供语义层面的智能化检索服务,并不断追踪医学专业用户的需求变化,同步更新本体模型,逼近用户的真实需求。

猜你喜欢

本体馆员语义
Abstracts and Key Words
对姜夔自度曲音乐本体的现代解读
语言与语义
青海省人民政府关于转聘谢承华、斗尕馆员为荣誉馆员的决定
青海省人民政府关于转聘谢佐等3位馆员为荣誉馆员的决定 青政〔2017〕32号
“上”与“下”语义的不对称性及其认知阐释
《我应该感到自豪才对》的本体性教学内容及启示
认知范畴模糊与语义模糊
浅谈图书馆青年馆员职业生涯规划
Care about the virtue moral education