关联规则在图书管理中的应用
2011-08-15贵州人民医院图书馆牛青伟王学进
贵州人民医院 图书馆 牛青伟 王学进
关联规则在图书管理中的应用
贵州人民医院 图书馆 牛青伟 王学进
图书馆每日会产生许多图书流通数据,通常来说这类数据信息不仅仅是记录读者的信息,也进行一些日常的数据收集和统计。然而,从当前情况来看,这些数据的真正价值并没有充分地被挖掘,更没有得到充分的运用。通过持续的观察,笔者从读者借阅的历史数据中发现,读者借阅图书也存在着一定的关联性,并且学科与学科之间也存在着这样或者那样的关联,不同类型的读者也在借阅图书的习惯上有一定的关联性,这种关联性已经在潜移默化中形成了一种规律与模式。因此,笔者将这些关联性适时地总结归纳,挖掘数据之间的潜在关联,对于提高资源利用率以及合理配置资源有着很大帮助,并且能够在很大程度上提高图书馆的整体服务水准。可以说,将关联规则挖掘方法真正地作用到图书流通数据的研究和分析过程中,通过读者图书借阅的记录,发现和挖掘读者借阅行为习惯中暗含的基本规律,考察读者与图书之间的频繁项集,能更快捷地满足不同读者的借阅需求,更好地指导馆员提高工作质量和效率。
一、关联规则数据挖掘模式
全面到来的信息时代促使着社会的发展日益提速,各个学科之间的关联也日益紧密,快速的知识更新促使越来越多的人走进图书馆汲取更全面、更专业的知识。医院图书馆是医生与患者联系生命科学世界的桥梁,因此,服务的质量十分重要。它不仅要保障人们借阅与查询文献的基本权利,更要为大家提供一个方便、快捷的学习场所。从当前情况来看,越来越多的医院图书馆纷纷采用了数据库技术进行图书馆的管理。其研究和发展的目标是为了方便图书馆对图书的编目、采购和流通加以高效快速的管理。在图书的频繁流通中,会产生大量的数据信息,而读者的借阅信息是最为重要的数据之一。因此,图书馆数据库的关联规则数据挖掘的目标就是要从大量的借阅信息中,挖掘出学科之间、读者与书籍之间的关联程度与联系,从而促进图书馆服务水平的提高。
1.分类模式。在数据挖掘中,通过对已知类别的个体进行归纳,找出各类的特征属性,即分类模式。在有些情况下,先由领域专家对个体进行分类,再通过分类模型提取分类模式。读者分类研究包括读者的分类、读者的属性和特征分析、读者满意度分析、学科交叉分析及学科发展方向预测等内容。高校图书馆可以对读者群体按照年龄、学历、职业、地域等因素进行分类,把读者进行群体细分。通过这种手段,可以更清楚地了解用户,了解他们的特点,分析不同群体的借阅量,从而有针对性地提供不同的服务,以提高图书馆的服务质量。
2.聚类模式。聚类模式是把数据划分到不同的组中,使得组之间的差别尽可能大,组内的差别尽可能小。与分类模型不同的是,聚类模型从未知开始,既不知道具体的分类标准,又不知道会有些什么类,只是按照给定的聚类参数(如距离等)进行分解、合并。得到的结果由领域专家进行甄别,如果不满足目标,需要改动聚类参数,重新聚类;一旦达到目标,分类规则也就通过聚类参数得到。
3.时间序列模式。时间序列模式是根据数据随时间变化的趋势预测将来的值,所采用的方法一般是在连续的时间流中截取一个时间窗口,把窗口内的数据作为一个数据单元,然后让这个时间窗口在时间流上滑动,以获得建立模型所需要的集合。时间序列的数据库内某个字段的值是时变的,例如股票价格每天的涨跌、浏览网页的次序等。运用时间序列挖掘方法,可以从流通数据库中挖掘出流通量的周期性规律,分析读者借出图书流通的高峰期和低谷期,借此可以科学安排流通部门的全年和每天的工作,在人力资源、图书资源有限的情况下,为读者提供更多更优质的服务,为流通部门日常工作的安排提供科学的参考数据。
二、关联规则在图书管理中的应用
1. 图书借阅数据库中的关联规则。在书籍借阅数据库中,书籍之间也存在着某种关联,举例来说,A读者在借《中药学》的同时又会再借《针灸学》一书,这表明A读者对这这两类书籍都有兴趣,通过这一例子,可以判定这两种不同类别的书籍之间存在一定的关联关系,而笔者在使用类同的方法去挖掘不同类别图书资料之间的关联规则时,必须要有一定程度的支持度,然而在图书借阅记录数据库中却并不需要,这是因为图书馆中和每一类书只有少量的数十本,并且借阅时间也较长,那么就自然不可能有很高的支持度。
2. 关联规则在图书管理服务中的应用。尝试发现和摸清读者借阅图书的潜在的规律是关联性挖掘的最终目的,举例来说,读者借阅《肠道病毒71型手足口病》一书时,通常都会同时再借阅《手足口病防治手册》等书籍,这是普通人很容易联想到的必然联系,但是在实际的图书馆借阅过程中,仍然有图书管理人员所尚未了解的规律,而运用关联规则就能更好地发现某些不容易发现或者被大家忽略的潜在规律。书籍间的关联性可以协助管理人员更真实地了解读者的兴趣方向,与此同时还可以在个性化服务上现实地应用。书籍间具有一定程度的关联性,不单单要探索借阅频率高图书间的关联性,也务必要对书籍进行分类的关联规则挖掘,寻找同类书籍之间的关联性。从医院的医生角度来说,医生的借阅方向通常都与其专业内容相关,所以说,探索和发现图书间的类型关联关系,极有可能比不进行分类的关联性更为有意义,并且更具价值。因此,笔者认为,在应用和研究的过程中,图书的关联性挖掘要从两方面入手,首先是不进行分类的挖掘,其次是要根据中国图书分类法,对书籍进行分门别类的挖掘。
三、结论
综上,数据挖掘关联技术是医院图书馆管理发展的大势所趋,时至今日,已经被广泛地应用于图书馆的服务与管理中,为更多的读者带来了实在的方便。而这一技术也被应用到了社会的其他领域,包括商业机构、银行等经营性场所,由此可见,数据挖掘关联技术是顺应时代发展,满足社会运转需要的一项重要技术,从医院图书管理的特殊服务角度来说,则更需要图书管理者们进一步研究和探讨,并最终促进其更好地在医院图书管理的过程中发挥出更大的作用。