APP下载

浅谈数据仓库在图书馆信息资源中的关键技术

2018-09-10李玉珑

企业科技与发展 2018年7期
关键词:信息资源数据仓库图书馆

李玉珑

【摘 要】在互联网时代,图书馆信息资源快速增长,图书馆实现信息化管理成为必然趋势。数据仓库是一种能够优化图书馆信息资源的技术,能够为读者提供更加个性化的服务。数据仓库在图书馆信息资源中的关键技术包括联机分析处理技术与大数据挖掘技术,能够从不同角度、不同层面。不同纬度来实现对图书馆信息资源的高效管理,为读者提供更加理想的服务。

【关键词】数据仓库;图书馆;信息资源

【中图分类号】G250.73 【文献标识码】A 【文章编号】1674-0688(2018)07-0154-02

图书馆要为读者提供更加完善的服务,就需要实现信息资源整合。图书馆信息资源整合是针对分散异构信息资源体系,在新信息交换与共享平台上开发新的应用,从而实现信息资源利用的最大化。图书馆信息资源整合是将分散异构的非结构化数据、异构的结构化数据进行管理利用,将其集成为不同应用系统,为所有者提供更加高效的资源管理。而数据仓库技术则可以为图书馆信息资源整合提供坚实的技术支持,为优化图书馆服务质量、提升图书馆资源利用率提供帮助。

1 数据仓库与图书馆信息资源

1.1 数据仓库

1991年,W.H.Inmon编著的《Building the Data Warehouse》中将数据仓库进行了以下定义:一个用于更好支持组织决策分析的,面对需求的、综合的、稳定的,伴随时间不断变化更新的数据集合,主要用于支持管理决策。数据仓库的特点主要表现在以下几个方面:第一,数据仓库中的数据是有主题的,其是将数据在高层次上进行归类后进行分析利用。数据被储存在数据仓库前需要进行一定的加工处理,将原始数据根据主题来进行转变,以贴切主题需求。第二,集成性。数据仓库中的数据将分散的不同系统中的数据进行选择、转换后进入数据仓库,数据仓库中的数据是源数据的综合与统一。第三,更新性。数据仓库会伴随着时间段变化不断更新数据和内容,长时间不用数据也会被删除。第四,相对稳定性。数据仓库虽然会伴随着时间的推移更新数据,但是其却具有相对稳定性。相对稳定性主要是供数据仓库决策人做出决策所使用。相关决策人员可以利用数据仓库进行数据查询,通常不会对数据进行修改。当某类数据进入数据仓库后会被长时间保留,在一段时间后该数据会被相关规则转变为历史数据,从数据仓库转移到存储设备中。

1.2 图书馆信息资源

图书馆信息资源整合主要作用体现在以下几个方面:第一,提供决策支持。在经过一系列的信息资源整合后,各类数据信息再也不是无逻辑的分散信息,而是通过系统的提取、归类、转化形成了网络型关系信息。例如,通过综合报表、定制信息等方式,为图书馆决策提供了全面而精准的决策依据。第二,改善当前信息系统效能。在经过系统的信息资源整合后能够实现工作人员与应用系统之间的协同工作,利用当前信息资源,改善数据的利用率,为图书馆管理员个性化管理提供充足信息,从而提升了信息系统效能。

2 数据仓库在图书馆信息资源中的运用

2.1 图书馆信息资源整合与数据仓库应用的必要性

随着互联网时代的来临及信息技术的广泛应用,图书馆中的各类信息资源类别在持续增加。不仅纸质文件得到了快速的增加,磁带、光盘、电子期刊、电子图书、互联网资源、网络数据等各类媒介的图书资源也在持续增加。同时,图书馆收藏的一些传统文献也添加了不同辅助信息为读者提供该服务。例如,出版商在提供一般文献的过程中还会适当提供相关题库信息,为读者提供更加丰富的服务。在信息资源建设方面为了获得更加显著的竞争优势,有的图书出版商推出了各类图书资源特色服务项目,如新书推荐系统、教师选书系统等。这些图书资源特色服务项目不仅大大提升了图书馆馆藏建设,还使得图书馆的电子资源更加丰富。但是在图书馆电子资源的实际应用过程中,通常电子信息资源都处于相互独立的状态,检索系统也相对独立,这给读者检索带来了一定的困难。读者对图书馆中的数据资源分类不熟悉,为了找到既定文献,读者必须进行多次重复搜索,大大降低了图书馆信息资源使用效率。

基于这一现象,为了使得图书馆更好地服务读者,可以将异构数据库中的数据进行整合,对海量信息进行深层次开发,将信息资源进行整合,进一步强化信息资源组织处理能力。首先,可以利用数据仓库技术,通过多层次、多渠道来进行数据的收集,将采购历史数据、信息资源流通数据等进行整理收集,通过计算机互联网分析处理及数据挖掘等数据仓库技术,为图书馆信息资源的采购和整理提供更加高效的决策。其次,在数据仓库技术的基础上为读者提供更加便捷、更加快速的检索服务。对于读者来说,图书馆所馆藏的资源信息内容繁杂、类型众多,不仅涵盖了大量的纸质书籍,还涵盖了互联网中的海量信息。而数据仓库运用联机分析处理技术,直接面向主题,利用图书馆信息检索服务,根据用户的需求直接提供与主题相关数据,从而提高信息检索服务效率。同时,利用数据仓库技术还能够为读者提供个性化的服务,可以针对读者的浏览历史记录进行分析,对读者进行类别甄别,为读者推送感兴趣的、潜在的数据资源,为读者提供个性化的服务。

2.2 数据仓库在图书馆信息资源中的关键技术

数据仓库在图书馆信息资源中的运用涉及多种类型的关键技术,不同技术可以为图书馆信息资源整合提供不同的幫助。

2.2.1 联机分析处理技术

联机分析处理技术是一种软件技术,能够使图书馆工作人员快速、多方面地获取信息,从而达到深入理解数据的目的。获得的信息数据都是从原始数据中处理得来的,以用户最容易理解的形式来体现图书馆经营的真实情况。联机分析处理技术中的绝大多数策略就是将数据进行多维存储,以便进行联机分析处理。这类多维数据库主要是沿着不同维度方向来进行数据产出,能够让用户按照事物发展的轴线有逻辑地对数据进行分析。联机分析处理技术是数据分析技术的一种,其功能特点主要表现在以下几个方面:第一,快速。用户对联机分析处理技术的反应速度有较高的需求,通常需要在很短时间内做出反应,满足用户需求。第二,可分析性。联机分析处理技术能够快速处理与逻辑分析、统计分析相关的事物。在联机分析处理分析中,用户不需要进行编程就可以重新计算,将其称为分析的一部分,并以用户的需求为准给出相关报告。第三,多维性。联机分析处理技术中的多维性十分关键,能够提供数据分析后的多维视图及相关分析,是图书馆利用联机分析处理技术的核心。第四,信息性。不论数据量多么庞大,也不论数据存储在什么地方,联机分析处理技术都可以快速获取信息进行管理。在图书馆信息资源中,联机分析处理技术的运用方式主要包括3种,分别为切片、钻取及旋转。其中,切片即在多维数据结构中根据用户的需求进行二维切片或三维切块,以获得相关数据;钻取即转变数据报告方向,例如进行行列交换来获取数据;旋转就是转变维度层次,通过上钻取或下钻取的方式来获取数据。在图书馆信息资源应用中可以从时间维度及读者类型维度2个方向对借阅量进行切片;也可以从时间维度、读者类型维度、借出数据维度来对借阅量进行切块。整体来说,联机分析处理技术是数据仓库应用在图书馆信息资源中的关键技术之一,能够实现多维度访问数据,多角度分析数据,往往在图书馆信息资源中与数据挖掘技术一同运用。

2.2.2 数据挖掘技术

数据挖掘技术即从海量数据中挖掘获取有价值的信息,数据挖掘技术能够对海量数据进行分析,从而获取数据之间存在的隐藏联系,为用户决策提供依据。数据挖掘技术综合运用了统计学、计算机学、数学等技术,可以通过一系列方法来实现。例如,传统统计法运用数据挖掘技术进行抽样分析,在用户需求指导下进行合理抽样,在获得抽样数据后进行多元统计分析或统计预测,利用因子分析、回归分析、时间序列分析等方法进行。对于图书馆来说,数据挖掘技术能够提高图书利用率的相关问题。在读者所处环境及图书价值始终保持不变的情况下,对读者以往的借阅历史进行挖掘,以判断读者未来可能出现的借阅率,挖掘出各类读者对不同类型图书的需求,进而利用最终挖掘得出的数据结果来引导读者选择合适的图书资料。

3 结语

图书馆信息资源整合中的数据仓库技术能够充分实现信息的挖掘与利用,还能够与其他应用系统一同融合,实现图书馆数据库的拓展。在未来的发展中,图书馆数据仓库技术将会成为图书馆信息资源整合、自动信息化发展的必然趋势。

参 考 文 献

[1]韩璐.基于数据仓库的数据挖掘技术在高校图书馆管理中的应用[J].科学家,2016(15):77-78.

[2]公立.数据仓库和数据联邦技术在信用信息资源存储和共享上的比较[J].科技创新与应用,2017(5):97.

[3]吕欣.数据仓库与数据挖掘在图书馆决策管理中的应用[J].数字技术与应用,2017(6):89.

[责任编辑:陈泽琦]

猜你喜欢

信息资源数据仓库图书馆
基于数据仓库的住房城乡建设信息系统整合研究
图书馆
分布式存储系统在液晶面板制造数据仓库中的设计
探析电力系统调度中数据仓库技术的应用
飞跃图书馆
关于构建党校图书馆中信息资源的共建与共享方案
谈云计算与信息资源共享管理
基于网络的信息资源组织与评价现状及发展趋势研究
网络信息资源检索工具和技巧
基于数据仓库的数据分析探索与实践