数据挖掘技术在图书推荐系统中的应用
2019-07-08张雷蕾
张雷蕾
摘要:随着网络信息技术的快速发展,高校图书馆传统管理模式和系统受到了巨大的冲击,现阶段,结合大数据和云计算等技术,提高图书馆系统管理功能显得尤为重要。目前,读者对于图书馆要求不仅仅限于传统借还服务方式上,还包括网络检索、快速查阅、个性化服务等多方面。图书馆系统建设中要充分利用现代网络及信息技术,促进推荐系统的逐步完善,加强信息审核,结合读者需求定期推荐,进而提高图书服务水平。本文首先对数据挖掘的概念进行了分析,指出了图书馆系统应用数据挖掘技术的优势,对具体算法、数据处理和关键技术改进提出了有效的建议和对策。
关键词:数据挖掘技术;图书馆;推荐系统
中图分类号:TP311 文献标识码:A
文章编号:1009-3044(2019)13-0001-02
现代网络技术的发展,使图书馆发生了翻天覆地的变革,最初的纸质图书馆到目前的自动化、智能化图书馆,网络虚拟技术在图书馆系统中的应用较为普遍。目前,图书馆系统中服务项目逐渐增加,读者图书服务水平逐渐提高,但是针对性的个性化的服务项目还有待挖掘和完善。我国高校建设也十分重视图书馆的建设和发展,推进数字化校园建设。数据挖掘技术作为信息技术中的重要组成部分,在图书馆推荐系统中应用该类技术,可以实现为读者提供个性化服务,创新管理形式,促进系统功能优化,进而促进图书馆建设的日趋完善。
1 数据挖掘的概念
数据挖掘概念最早是在加拿大被提出,1995年加拿大蒙特利尔第一届知识发现和数据挖掘国际会议上国外学者Usaama提出,后期在美国底特律举行的学术会议上,对人工智能进行了系统的分析。从20世纪依赖,数据技术逐步万汉,数据库系统建设逐步更新,数据信息整合和挖掘的水平显著提高,很多有价值的信息被快速提取出来。由于海量信息处理的难度加大,数据挖掘和筛选技术应运而生,数据挖掘技术逐渐被人们关注和认可。数据挖掘技术的发展是与计算机技术革新、数据库建设发展和网络信息技术发展息息相关的。知识发现也是一个重要的相关概念,是指在海量信息中辨别出有价值的知识,这是对数据和信息的高级处理过程。数据挖掘技术是知识发现的核心技术,是从数据库中提取特定规律的数据和信息,作为参考,进而提炼出用户所需的最终信息和资源。
2 图书馆服务系统中应用数据挖掘技术的优势
数据挖掘技术对于人类生活和工作的影响是十分突出的,这是一种高效便捷的数据整合和筛选技术,集成了多个领域的知识系统,目前正逐步走向成熟,将数据挖掘技术应用于高校图书馆智能体系中,十分必要。
2.1 数据挖掘技术的优势
2.1.1 信息需求的促进
随着网络信息技术的快速发展,人们对于信息的需求量逐渐增加,使用层次加深,在众多海量信息和数据中,如何将复杂的数据转换成有价值的资源和信息是十分必要的。在图书馆系统中庞大的数据和信息资源难以计算和筛选,必须采用一种先进的技术,实现数据的整合和处理,进而筛选出有价值的资源,为读者提供针对性的图书服务。
2.1.2 争取潜在读者的需求
图书馆管理系统中,很多读者的访问数据都存在这里,如何将这些数据和信息进行整合至关重要,数据挖掘技术就是这样一种技术,可以对数据进行分类处理,从而确定图书馆中那类书籍借阅量较大,读者感兴趣的书籍都是哪些类别。数据挖掘技术可以将一些隐藏的信息挖掘出来,将智能整合后的资源和信息推送给读者,进而更好地为读者服务。
2.1.3 提高获取信息和数据的速度
图书馆系统要定期更新,在传统系统使用中,对于数据和信息的处理和计算速度较慢,数据挖掘技术可以有效地避免这些弊端,计算速度极快,信息筛选能力强,使用这类技术可以显著提高图书馆系统的各项功能。数据挖掘技术的应用可以提高图书馆获取资源的速率,提升读者应用体验,提高系统反应能力。
2.2 数据挖掘技术的可行性分析
我国高校图书馆积累了很多的经验,数据挖掘技术在实际应用中是具有可行性的。首先,我国高校现代化建设水平逐步提高,为了发挥图书馆的价值,要充分利用信息资源,挖掘数据和信息中有价值的资源,提高数据的利用率,从而提高图书馆服务质量。图书馆哟满足读者的需求,要提供个性化、针对性的服务,这也是图书推荐系统的主要功能,这就需要对现有数据和信息进行挖掘和处理,对数据进行分析,加强信息管理,组织各类数据,为图书馆的知识管理提供依据。其次,数据挖掘技术逐渐成熟也为图书馆推荐系统的逐步完善提供了可能。数据挖掘技术目前应用多种领域,包括工业生产、医疗机构、图书管理系统等等,数据挖掘技术逐步的发展和完善,运作方式方法日趋成熟,管理方便,技术逐步革新,图书馆推荐系统应用数据挖掘技术十分可行。另外,图书馆信息化建设水平逐渐提高,数据库建设较为完善,数据库系统分析能力不断增强,图像数据库、对象数据库、智能数据库逐步建设,这也为数据挖掘技术的应用提供了平台。
3 数据挖掘算法
3.1 分类分析
对于数据分类的分析是比较基础的,要对数据集进行训练,要采取科学的算法进行计算,数据库确定后要进行初步分析,做好数据类别的基本分类,要做好类别描述,要根据数据性质进行建立模型,之后要利用原有信息和数据进行研究,加强信息和数据预测。
3.2 聚類分析
聚类分析是指将数据和信息分为若干类别,主要根据分析对象的特征找出一定的规律,进而对同一类型数据进行分析,数据分布模式较为特殊,对数据之间的关系进行分析。
3.3 关联分析
数据挖掘技术中的算法还有关联分析,这也是基础算法之一,主要是针对不同的数据建立一种联系,可以是因果联系、时序联系或简单联系等等,进而实现各类数据的瞬间提取和筛选。