数据挖掘技术在图书馆推荐系统中的应用研究
2019-01-08吴文臣
吴文臣
摘要:互联网技术和数字化技术在各行各业中的应用较为广泛,在现代图书馆管理工作中运用数字化技术有助于提高图书馆管理效率,可以为读者提供高质量的阅读各类服务,包括图书推荐服务等等。数据挖掘技术是一种高效的出具整合和处理技术,可以实现对各类数据的分类处理,从海量信息中筛选出有价值的信息,从而为图书馆管理平台的建设服务。图书馆的服务质量与图书阅读推荐息息相关,向读者提供个性化的推荐服务是图书馆的工作之一,借助于数据挖掘技术可以促进图书馆智能管理系统的建设。本文首先对数据挖掘技术和图书馆管理系统进行了阐述,指出了运用数据挖掘技術的重要意义,提出了具体的优化对策。
关键词:数据挖掘技术;智能图书馆;图书推荐系统
中图分类号:TP3-05 文献标识码:A
文章编号:1009-3044(2019)33-0241-02
数据挖掘技术是互联网信息技术的一种,是先进科技在时代发展下的产物,数据挖掘技术的统计能力和计算性能较强,具有强大的数据整合和处理功能。在图书馆管理系统中使用数据挖掘技术可以充分发挥原有数据和信息的作用,对各类数据进行统计分析,包括馆藏书籍及资料的数量、类别、性质等等,还有用户的信息,借阅书籍的客户基本信息,主要借阅哪类书籍、借阅频次和时间等等,从而为个性化推荐系统的建设提供科学的依据和参考的数据和信息。
1数据挖掘技术与图书馆管理系统分析
1.1数据挖掘技术的内涵
数据挖掘技术是信息处理技术的一种,主要针对海量数据和信息的处理和整合工作而言,对有关资料进行分析,进而找出一些规律和隐藏的知识,这样可以保证对有效数据的及时获取,提高数据处理的效率。在实际数据挖掘技术的应用缓解中,数据挖掘技术主要分为两种,包括预测性数据分析法和描述性数据分析法。预测性数据分析主要是指借助于现有的数据和信息,获得一些指导性的结论,预测数据分析又可以分为分类数据预测和统计回归型预测。描述性数据分析是指对系统描述类的资料进行收集和处理,具体分为关联分析、序列分析及聚类分析。
1.2图书馆管理系统
图书馆信息管理系统是基于各类数据和信息的管理平台,是图书馆管理现代化模式的一种,对专业技术要求很高,具有较专业的行业特征,其中蕴含着海量的数据和信息,处理难度较大,占据空间较多。在实际图书馆管理工作开展过程中,书籍和读者的联系就是通过图书管理系统实现的。从具体的信息系统应用来看,该系统主要的功能有三类。首先,图书管理系统可用于图书查询、图书撤退和注销;其次,图书管理过程中用户增加或消减的各类信息;另外,书籍资料的流借出、归还、赔偿等信息管理。保证建立高效信息处理机制是有效为用户提供阅读服务的基本保障。
2数据挖掘技术在图书馆推荐服务中应用的必要性
2.1有助于丰富图书馆的信息资源
图书馆馆藏书籍和资料文献数量十分庞大,伴随着图书馆建设和发展的过程也产生了大量的数据和信息,运用数据挖掘技术可以实现对海量数据和信息的整理,如何搭建智能化和自动化的管理平台是图书馆面临的重要任务,将图书馆管理与数据处理技术结合起来是时代发展的必然要求。数据挖掘技术可以应用到图书馆管理系统中,尤其是图书文献推荐系统中,可以对图书馆馆藏资料信息进行统计,盘活书籍资源,为广大用户提供所需的书籍和资料,对馆藏信息进行整合,有助于及时采购新的书籍和文献资料等等,进而丰富图书馆的信息资源。
2.2有助于实现用户信息的分析
图书馆中用户信息资料十分多样,因为图书馆的阅读用户各种职业都有,各种专业行业人员都有,结合用户信息做好数据挖掘和处理可以表现为三点。首先,图书馆为各类用户提供各类书籍和资料,用户信息的多样性决定了图书资料信息的多元化,采用数据挖掘技术可以对用户信息进行处理,总结用户的喜好和阅读爱好。其次,运用数据挖掘技术可以为用户推荐其感兴趣的图书和资料。
3数据挖掘技术在图书馆推荐系统的具体应用
3.1图书文献推荐服务
图书馆馆藏中最主要的就是图书文献资源,图书馆资源使用效率是评价图书馆服务质量的关键因素,也是图书推荐系统的主要依据。图书馆各类服务中,书籍推荐系统的建设是至关重要的,这也是图书馆服务的重点内容。可以采用关联分析或聚类分析方法,对读者历史借阅数据进行分析和统计,对读者的借阅行为进行研究,根据读者喜好确定其喜欢的读物的类型,进而提高阅读推荐的可靠性,构建读者的借阅模式,进而将适合的书籍和资料推荐给读者。如运用数据库技术,将用户信息合理存储和整合,做好图书文献的科学推荐。
3.2书籍文献检索
图书馆管理平台和系统应用中,图书文献检索是最基本的功能模块,传统的文献检索,图书馆只是将馆藏书籍和文献提供给借阅者,没有进行针对性的推荐。图书馆对读者提供书籍推荐服务,主要目的是减轻图书馆人员工作强度,为读者提供其喜欢和需要的书籍和文献资料,提高图书馆运行的效率,提升图书资源的利用率。在书籍文献检索系统建设中,首先要做好数据的准备,做好相关数据的收集,这是数据挖掘技术的基础,主要收集读者的过往查阅和借阅数据和信息。其次,做好数据信息的筛选和处理,对筛选的数据进行处理,消除重负数据和信息,把处理的数据进行和转换,建立结构化数据库。另外,做好数据挖掘,采用关联分析和聚类分析方法,将一些读者的相关信息进行收集和处理。
3.3馆藏书架管理
在高校中,图书馆的作用更为明显,对广大学生和教职工提供了各类书籍和资料,为学校教育和科研事业的发展提供了广泛的资料,为学生学习提供了一些工具书等等。社会上的图书馆具有一些公益性质,也有的涵盖图书销售功能和图书有偿借阅服务。图书馆的馆藏书籍和文献数量十分庞大,内容囊括了多个专业和各个领域,采用数据挖掘技术对馆藏书籍和文献进行整理是十分必要的,可以为书架整理和书籍摆放提供科学的依据。图书馆要对用户进行分类处理,做好采购新书的准备,因此,书架上要预留出足够的位置,价值逐渐衰退的文献要及时剔除。图书馆还要针对借阅量较大的各类书籍进行统计,做好书籍借阅量排行统计,对图书进行分类处理,一些借阅量较高的书籍文献要放在显眼和重要的位置上,当然要结合书籍定期更新文献资源。
4图书馆个性化推荐系统功能模块设计
图书馆要结合读者需求设计个性推荐系统模块,如图1所示。
4.1系统管理
图书馆个性化推荐系统主要设置包括配置管理、备份管理、日志管理等。配置管理主要是指设定系统名称、读者角色、导人数据模式、上传文件的保存路径。备份管理是指对数据库中的重要数据信息进行备份,这样防止系统故障和黑客侵入导致数据丢失。另外,日志管理是指对书籍相关数据系统记录、操作、维护都是常项工作。
4.2用户管理
图书馆推荐系统用户管理是指对用户信息和数据的科学管理,用户管理主要是添加用户、编辑用户、屏蔽用户、修改密码,设置权限等功能。图书馆用户管理要识别登录者的身份,如管理员、读者。用户管理系统模块可以看到用户的基本信息、创建日期、登录时间和登录次数,为图书推荐提供科学的根据。
4.3数据管理
首先,图书馆推荐系统中读者信息导人十分重要,按照数据预处理方式对数据和信息进行处理,将有价值的信息保存起来。其次是图书信息导人功能和借阅信息导入功能,都是将预处理信息保存到数据库中。
4.4图书推荐管理
图书馆要对借阅量进行统计,建立图书借阅排行统计表,对借阅频次较高的读者信息进行挖掘和统计,设置好各项参数。个性化图书推荐系统应包括历史书籍推荐、相同作者推荐、和浏览推荐。
(1)历史书籍推荐。对读者借阅记录进行分析和统计,采取关联挖掘技术对读者借阅记录进行研究,将得出的规律输入数据库,读者登录系统就会看到推荐的书籍。
(2)相同作者推荐。读者登录系统后,点击借阅的书籍,会显示相同作者的推荐,如果没有借阅记录,点开任意书籍文献也会有相同作者的书籍推荐。
(3)浏览推荐。读者在借阅平台上浏览图书信息时,图书索引会带有类似图书推荐。
4.5购书推荐
图书馆在提供个性化推荐服务过程中,购书推荐也是其中重要的一个环节,图书馆可以将一些书单上传到阅读推荐平台,读者登录系统后可以选择喜欢的数据进行采购。图书馆还可以运用推荐系统征集广大读者的意见和建议,及时对馆藏书籍和文献进行调整。
5结束语
综上所述,随着数字技术的快速发展,在图书馆管理系统运用数据挖掘技术是具有十分现实的意义的,图书馆要发挥数据挖掘技术的重要作用,为广大读者提供需要的书籍和文献,构建个性化推荐系统对于读者而言至关重要,进而发挥书籍和文獻资源的作用。