APP下载

基于数据挖掘技术的图书馆个性化服务应用研究

2019-04-20康洁

卷宗 2019年12期
关键词:数据挖掘技术个性化服务图书馆

摘 要:图书馆管理者需要从庞大的数据中筛选出可读性高的知识信息任务量很大,且效率比较低。本文分析了图书馆应用数据挖掘的必要性,阐述了图书馆个性化服务的内涵,提出了基于数据挖掘技术的图书馆个性化服务应用流程,有效的提高了图书馆管理的效率。

关键词:图书馆;个性化服务;数据挖掘技术;应用

1 图书馆应用数据挖掘技术的必要性

1.1 信息化需求

图书馆数据库之中包含用户使用记录,如借阅记录、检索记录、网页浏览记录等。由于图书馆用户需求不同,在使用过程中就会产生种类繁多、信息量大的数据。图书馆管理者需要从庞大的数据中筛选出可读性高的知识信息任务量很大,且效率比较低。而通过数据挖掘技术,就能够快速地将大量的数据转换为游泳的知识信息,为图书馆管理决策提供参考。

1.2 管理需求

传统图书馆系统一般只具备简单的检索、访问等功能,而这已经不能满足现代用户对图书馆管理功能的需求,亟需对系统功能进行升级改造。数据挖掘就能够满足为用户提供个性化服务的技术要求,通过分析用户使用数据,挖掘隐含的关联性信息,并发现相关的知识信息。

2 高校图书馆个性化服务的表现形式

所谓图书馆个性化服务,就是能够为不同类型的用户提供有针对性信息服务,满足其知识查阅需求。而就个性化服务具体内容而言,其表现形式主要有以下四个方面:

1)用户能够根据自身不同的需求定制有关的信息,并可从图书馆获取有效的信息资源;图书馆一方可通过数据挖掘方式掌握用户兴趣,并可针对性地提供访问空间,满足用户需求。图书馆在获取用户兴趣爱好数据时,主要是通过用户浏览路径信息时间来分析的,一般情况下用户对感兴趣的内容会花较多的时间来阅读。分析用户在页面的停留时间长短,即可掌握用户对信息资源的感兴趣程度,这可为图书馆管理提供很好的参考。

2)进一步提高馆藏信息资源的利用率。图书馆资源得到利用才能保证知识的广泛传播,图书馆可利用数据挖掘技术掌握用户访问图书馆网站的信息,包括浏览路径、经常访问页面,通过在路径上增加针对性的信息资源的推送,引导用户对信息资源进行访问,进而提高图书资源的利用率。

3)为用户提供快速便捷的访问条件。挖掘用户网络日志数据,分析其访问页面之间的共同点,图书馆可加强那些关联性比较强的网页之间的联系,便于用户对相关内容的获取。通过数据挖掘了解图书馆用户的期望位置,并分析用户在期望位置与实际位置二者访问频率的差异,如若前者频率高于后者,则可以在两者之间创建一个导航链接,便于用户获得更全面的信息。

4)查新、定题服务。传统纸质版、光盘类数据库已经跟不上新时期信息资源的查新服务,并且随着网络技术不断进步与普及,图书馆内容网络在信息发布、更新方面具有明显的滞后性,其服务内容的真实性与可靠性亦值得商榷。因此,强化网络平台建设已成为图书馆发展的必由之路。数字图书馆已经较为普及,但其自身的查新与定题服务仍有很大的差距,而可视化技术将成为即时信息分析的重要选择之一。

3 基于数据挖掘技术的图书馆个性化服务的应用实现

3.1 读者数据仓库的建立

数据准备过程中的关键步骤是选择一个样板数据子集,该子集内容需与挖掘目标有较强的关联性。由于所挖掘数据信息量较大,需要通过一个数据仓库将所挖掘的目标数据进行保存,这是保证数据挖掘成功实现的重要内容。所建立数据库的类型主要有两类:其一,用户的兴趣库,可结合以往用户在借閱图书过程中的信息记录、网站访问记录,并通过调查问卷的方式对用户借阅兴趣爱好进行了解;其二,有自身特点的特色资源数据库,对馆藏资源进行有效汇总分类,筛选出有特色的数据资源。

3.2 数据收集

数据库建立之后,还需要对其中数据进行处理,包括分析、调整等,通过这种方式来提高数据库原始数据的质量,保障数据挖掘过程的顺利实现。数据的分析、调整过程主要是对原始数据进行抽取、清洗和转换等。所谓数据抽取,就是通过对原有数据库信息进行筛选,选择与挖掘目标相关的数据信息;在数据抽取基础上,数据清洗再对所选择的数据信息进行噪声、重复记录的消除工作,并结合挖掘目标计算得出相应的缺值数据。由于图书馆自身数据量庞大,且每天都有大量新的用户信息数据产生,而如果对所有的数据都进行挖掘,则势必影响挖掘效率与质量,甚至可能出现负面影响,因此,清除与挖掘目标不相关的数据就显得十分重要。数据转换的目的是对数据进行进一步提炼,精简数据的维数,缩减挖掘变量数,从而从众多数据的原始特征中选择出所需的特征。

3.3 挖掘算法选择与模型建立

针对同一个系统任务,通过不同的运算方法可能得到相同的数据挖掘结果,但其运算过程有很大的相似之处。因此,为提高运算效率与质量,数据挖掘算法的选择应结合数据特点、系统运行要求,选择最简便、最快捷的挖掘算法。由于图书馆用户群体较大,对知识获取的需求差异性大,需要根据用户的不同选择适宜的挖掘算法,并据此建立有效的数据挖掘模型。通过一定的方法将用户进行分类,分析不同类型用户的普遍性需求与个性化需求,并从中抽象出来,以此建立相对应的关联规则模型。但需要注意的一点,是模型的建立并不一定能够解决实际问题,其还需要通过验证不断地进行完善。

3.4 数据挖掘结果的验证、应用与评价

数据结果的验证涉及到应用过程中许多关键的环节,且各个环节之间有很强的逻辑关系,上一步结果解释实践情况可对最终结果的实用性造成影响,可通过这种关系来对结果实用性进行进一步验证。但在应用过程中需要注意挖掘模型与数据之间的匹配问题,不可能使一个模型与数据在所有情况下都能够完全相符。因此,需要通过对数据挖掘结果进行评价,在结合用户反馈信息基础上,挖掘结果能够解决问题,达到开始的挖掘目标,满足用户需求,这也就意味着该挖掘模型是可行的、合理的。同时,用户需求得到满足之后会做出满意的反馈,决策者根据用户所反馈的信息会对下一步做出合理的规划,通过这一过程不断对服务进行完善,这也就实现了以用户需求为前提的图书馆个性化服务数据挖掘过程。但是,还需要考虑到评价结果与用户需求之间的较大差距情况,这一情形需要系统重新进行数据处理,由系统决定选择其他的处理方式,如改变转换方法、设定新参数、选择其他挖掘算法等,循环多次地对数据进行处理,直至满足用户需求。

4 结语

新时期图书馆用户数量倍增,信息服务需求也出现了多样化、复杂化的特点。在如此庞大的信息资源中,数据挖掘技术能够高效、快捷地发掘有用的知识信息,有针对性地提供个性化的服务内容。当然,图书馆个性化服务中数据挖掘技术的应用尚属于初级阶段,需要在挖掘方法、数据可视化、挖掘语言标准化等多个方面进行完善,相信其会在数字图书馆建设中发挥不可替代的作用。

参考文献

[1]李艳,吕鹏,李珑.基于大数据挖掘与决策分析体系的高校图书馆个性化服务研究[J].图书情报知识,2016,02:60-68.

[2]侯振兴,崔虹燕.数字图书馆个性化主动信息服务模型研究[J].情报科学,2013,03:35-39.

[3]王立伟.基于图书馆流通日志信息的维度建模[J].图书馆论坛,2008,03:58-60+120.

[4]周军.基于数据挖掘的数字图书馆个性化服务系统的构建[J].图书馆学研究,2007,03:15-17.

作者简介

康洁(1987-),女,陕西人,本科,研究方向:图书馆学。

猜你喜欢

数据挖掘技术个性化服务图书馆
图书馆
互联网思维下数字图书馆个性化服务建设研究
需求理论在高校图书馆就业服务中的应用研究