APP下载

数据仓库在数字化图书馆中的应用

2017-09-07胡金艳

数字技术与应用 2017年5期
关键词:应用设计数据仓库图书馆

胡金艳

摘要:随着数字化图书馆建设规模的不断扩大,数字化图书馆在为读者提供广泛的数字信息资源的同时,也由于信息资源的无序性、开放性等特点增加读者的搜索难度,因此基于数据仓库技术的应用对提高数字图书馆资源整合、提高决策科学化具有重要的意义。本文以数据仓库技术在数字化图书馆中应用的必要性作为切入点,阐述数据仓库技术在图书馆应用设计的具体对策,以此提高数字化图书馆的资源价值。

关键词:数据仓库;图书馆;应用设计

中图分类号:TP311.13 文献标识码:A 文章编号:1007-9416(2017)05-0134-02

基于互联网技术的不断发展,高校数字化图书馆建设规模不断提升,数字化图书馆为师生提供了广泛的数字化信息资源,提高了信息资源的利用率,然而数字化图书馆信息资源庞大,而学生对于信息资源需求不同,因此容易形成异构数据,不利于资源的最大利用,因此本文基于数据仓库技术,提出构建数据仓库图书馆工作模式,以此提高数字资源的利用价值。

1 数据仓库的概述

数据仓库就是面向主题的、集成的,随时间变化的,非易失性的数据集合,用于支持管理层的决策过程。数据仓库技术的产生可以将分析决策所需要的大量数据从传统的操作型环境分离出来,从而将分散的、难以访问的数据转化为统一、随时可用的数据存储环境。因此数据仓库呈现以下特点:面向主题性,数据仓库主要是从人们所关注的主题入手,将数据按照主题进行分类;集成性,数据进入数据仓库之前需要对数据的一致性进行分析与判断,保证数据仓库内的信息完整一致;相对稳定性,一般数据仓库的数据不会被修改,并且能够得到长时间的保存。

由于数据仓库的数据主要来源于多个数据库平台,因此需要根据用户的需求对数据进行选择处理,以此将处理好的数据存储在已经建好的数据仓库中,一般数据仓库系统主要包括:数据来源、数据存储与管理、数据分析工具以及用户四个部分。

2 数据仓库技术应用在数字化图书馆中的可行性

数字化图书馆信息服务具有高度集成特点,信息资源丰富,读者需求差异明显,因此如何将丰富的数字化资源准确的提供给读者,满足数字资源的高效利用是图书馆建设的重要技术问题,而数据仓库拥有的信息处理能力和内在稳定性为数字化图书馆建设提供了技术支撑,因此将数字仓库技术要应用到数字化图书馆建设中具有切实意义:

(1)数据仓库技术具有面向主题的信息组织,能够根据数字化图书馆将多样的数据转化为容易被读者所理解的语义,以便更好地为读者的检索能够便利。例如通过数据仓库技术的处理,可以将不符合学生检索需求的信息排除出去,提高学生检索信息的效率,从而提高图书馆数据资源的最大利用,实现查询结果的准确性。

(2)数字化图书馆建设的目的就是为读者提供信息资源服务,而数据仓库技术为数字化图书馆在提供信息服务时提供稳定的系统支撑。以数据仓库技术的稳定性为例,由于数字化图书系统需要涵盖大量的信息资源,同时还需要不断引入新的信息资源等,基于不同读者的需求,要求系统要具有稳定的操作性,尤其是对于数据信息不能随意的修改,而数据仓库技术则有效的保护了数据资源的不被修改,从而为读者提供了准确的数据信息。

(3)数据仓库技术有助于提高数字化图书馆的战略决策的科学性。信息化背景下,数字化图书馆不仅要注重数据信息资源,还必须要注重服务质量以及科研工作等,尤其是在信息资源传播途径不断丰富的环境下,高校数字图书馆必须要在决策上、管理上创新,要利用完善的数据信息,对决策进行优化,提高服务质量。

将数据仓库技术应用到数字化图书馆中需要解决好以下关键技术:联机分析处理技术,元数据,数据挖掘技术。

3 数字化图书馆数据仓库技术设计的策略

数据仓库技术在数字化图书馆中的应用对提高数字图书馆资源利用率,实现图书馆服务具有重要的作用,因此基于数据仓库技术的数字化图书馆设计主要包括以下方面:

3.1 数字化图书馆数据仓库概念模型设计

图书馆书数据仓库是按照主题進行数据组织的,因此在具体的设计中需要明确以下两个方面:一是界定系统的边界。系统边界的界定主要是明确读者的阅读规律、文献信息的阅读状况以及读者信息资源阅读的倾向,因此数据仓库的构建需要以下数据:读者的基本信息、数据信息的基本信息以及信息资源的浏览数据。数据仓库具有主题性,因此数据仓库的主题包括,读者、文献信息以及读者借阅;二是明确系统的主题。根据上述说明,信息文献是数字图书馆建设的基本要素,也是图书馆的基础。读者是数字图书馆参与的重要主体,尤其是在网络环境下数字图书馆服务模式由以“文献”为中心转化为以“读者”为中心。基于数据仓库系统边界及主题的确定,数字图书馆数据仓库概念模型见图1所示。

3.2 逻辑模型设计

逻辑模型是整个系统设计的基础,在该模型的设计中需要对数据仓库实体进行定义,这主要基于在设计的过程中每个维度实体之间存在一定的交错现象,因此为了降低因为维度不同而造成的空间浪费现象,需要对实体进行统一的定义,以此达到系统的最优化设计。

3.3 物理模型设计

物理模型是数据仓库最底层的数据模型,可以直接生成物理数据库。它是逻辑模型在数据仓库中的实现,包括数据的物理存储方式、存储结构、存储位置和存储分配等。

3.4 数据仓库的实现

实现数据仓库需要解决好以下流程:首先是解决数据仓库与业务处理系统接口集成问题,实现数据仓库系统的多元化问题;其次构建完善的数据仓库体系结构,实现逻辑模型和物理模型的优化,保证构建的数据仓库与设计方案相一致;三是对数据仓库数据进行加载处理,实现了系统的最优化运行。

4 实现数字图书馆数据仓库设计的注意事项

首先数字图书馆数据仓库设计必须要获得高校管理的支持,其次加强与读者的沟通交流。数字图书馆的功能就是为读者提供个性化的信息服务,如果图书馆所提供的信息资源不能满足读者的信息需求,数字图书馆就失去了存在的意义,因此在数据仓库设计前必须要对读者的信息需求以及服务模式等进行调查,加强与读者的沟通。

总之,基于互联网技术的发展,数字化图书馆在高校教学中的应用越来越重要,与此同时,数字资源的广泛性也增加了图书馆服务功能的完善程度,尤其是对于数字图书馆数字资源的优化配置的影响,而数据仓库技术则为数字化图书馆提供了基础技术支撑,有效的对数字资源进行合理配置。

参考文献

[1]张宏武.数据仓库技术在高校图书馆中的应用研究[J].渭南师范学院学报,2011(12):80-84.

[2]李康.图书馆网络综合布线的理念与设计实施[J].新疆师范大学学报(自然科学版),2011,03:91-93.endprint

猜你喜欢

应用设计数据仓库图书馆
基于数据仓库的住房城乡建设信息系统整合研究
图书馆
分布式存储系统在液晶面板制造数据仓库中的设计
探析电力系统调度中数据仓库技术的应用
项目教学法在《基础会计》教学中的应用
分层教学模式在初中信息技术中的应用设计
基于数据仓库的数据分析探索与实践
居住空间绿饰陈设原则与应用