个性化推荐技术在图书馆服务中的应用
2013-04-29聂珍王华秋周建
聂珍 王华秋 周建
〔摘要〕本文分析了图书馆服务中个性化推荐提出的背景、研究意义和图书馆发展的状况,阐述了图书馆个性化系统设计思想、框架结构和各功能模块的任务。详细介绍了系统的实现,以某图书馆数据为例,进行聚类分析,获得各簇的借阅模式,结合读者信息,通过图书喜好度计算,完成了图书推荐的目标,并提供了可参考的建议。这一推荐服务系统的提出,提高了图书馆的使用率,提升了图书馆的服务水平,是网络时代图书馆发展的新道路。
〔关键词〕个性化推荐;图书馆服务;系统设计
DOI:10.3969/j.issn.1008-0821.2013.09.019
〔中图分类号〕G252.6;TP301.6〔文献标识码〕A〔文章编号〕1008-0821(2013)09-0095-04
图书馆个性化推荐则是指以读者的个人背景、专业、习惯、爱好和提出的特别要求等为依据,对每一个读者提供个性化推荐服务[1]。读者的个人信息是存储在图书馆的数据库里,借阅信息是存储在读者的借阅日志中,这就需要采用数据挖掘技术[2],在大量的隐藏信息中挖掘出读者的喜好和借阅模式,便于进行个性推荐。各个高校开始这方面的研究,并各自推出了推荐系统,如中国人民大学、浙江大学及武汉大学,这才开启了国内个性化推荐服务的研究[3]。
就理论发展而言,从多种角度和多种方向研究PRSL领域的文章很多,揭示了图书馆中发展个性化的推荐服务具有重要意义,预测了发展的良好态势[4-5]。目前开展个性化的推荐服务的高校有中科院的文献信息中心、浙江大学和中国人民大学等,甚至连清华大学网络信息实验室的研究课题中都有个性化的信息检索系统,并发表了数篇基于该课题的论文[6]。
图书馆拥有大量图书,是提供给读者学习资料的重要场所。其服务对象各有特色,图书馆提供的服务应该满足不同读者的需要,才能真正有效的利用资源。采用文献[7]的和声模糊聚类算法(Harmony Fuzzy Clustering,HFC)的推荐系统主要是为图书馆的管理提供帮助。系统主要是通过记录读者的借阅行为、采集各个读者的借阅数据,然后对采集的数据进行预处理,存储在数据表中。利用HFC算法分析数据集,得到隐含的各类图书的借阅模式和规则。最后根据读者的相关信息,预测读者可能喜爱的图书资料,通过各种形式向其推荐感兴趣的图书资料,以达到为读者提供个性化的信息服务的目标。
本文从设计思想、系统框架以及具体的实现来介绍系统,为图书馆工作提供参考意见。
1个性化推荐系统的框架
根据个性化推荐系统的设计思想,完成系统的框架结构设计。本节主要从系统的整体结构、各个功能模块的工作和个性化推荐的工作过程详细的介绍了系统的框架结构设计。
1.1整体结构
已有的大多数图书馆个性化推荐系统中,多采用输入读者喜好关键字和传统的聚类算法对读者借阅日志进行分析处理,效果较差。本文采用HFC算法来处理读者借阅日志,不需要输入读者喜好关键字就能自动的进行个性化的推荐,在文献[7]已经详细的验证了HFC算法较其他算法的高效性,在聚类中获得了很好的效果。根据系统要完成的功能将系统结构分为三层,一是界面层;二是个性化推荐层;三是数据库层,如图1所示。界面层是跟读者面对面的可视化层,向读者推荐个性化的图书资料。个性化推荐层主要是进行数据的采集和预处理,采用HFC算法处理数据,得到图书借阅的模式,推荐个性化的图书资料。这一层的功能模块由读者借阅日志的采集、数据的预处理、聚类分析和推荐个性化的图书资料4个部分组成。基本数据库层主要是存储读者、图书和借阅日志的数据信息。