APP下载

数据挖掘技术在图书馆工作中的应用探析

2021-11-30韩雷

魅力中国 2021年29期
关键词:馆藏数据挖掘图书

韩雷

(伊宁市图书馆,新疆 伊犁 839300)

当今图书馆的数字化、信息化、自动化是伴随着信息通信技术和计算机网络的高速发展。除为读者提供丰富的知识库外,图书馆还需要在浩如烟海的多种信息载体中,有选择地向读者提供科学的参考咨询服务,在资源建设方面实施数据化的信息管理。面对数据丰富而信息匮乏的严峻困境,如何从海量的数据信息中挖掘适用于管理者决策的知识至关重要,数据挖掘技术将为图书馆的资源管理、组织和拓展服务范围、提高服务质量提供科学合理的技术支持。

一、浅谈图书馆的数据挖掘

运用数据挖掘技术对用户检索和借阅的馆藏文献进行分析,可以为管理采访计划提供有效的决策,通过对客观真实的数据进行分析,进而预测社会市场需求和未来采访趋势。运用数据挖掘技术,对文献的需求状况进行探讨,最终结合传统的管理方法,在减少借阅率低的情况下,对陈旧的图书资源进行清理,科学地提高馆藏的利用率,合理地指导图书采访任务,尽量减少因主观因素造成的偏差问题,优化纸质图书资源的结构。许多图书馆专业人员以数据挖掘技术为基础,对个性化服务课题进行了深入探索,主要体现在个性化服务模型和软件的构建上。智能化集成技术能为图书馆提供个性化服务,方便地获取读者用户的爱好和兴趣方向;结合知识管理、个性化参考咨询服务和数据挖掘,形成一个全新的个性化参考服务咨询模型。此外,在数字图书馆的应用方面,数据挖掘技术能促进数字资源统一管理的规范化,推动信息服务水平的提高,使图书馆数据管理系统分工明确,实现数字资源的集中处理。它可以优化数字资源的馆藏结构,实现期刊馆藏的合理布局,利用数据挖掘工具的分析和统计功能,使分散的数字资源得到大量实用的信息。利用该技术,还可以在电子数据库和多媒体资源中挖掘出较为精确的数字资源使用情况,使用户在获取数字资源时能够产生大量的交互信息,对信息检索技术的应用有着特殊的意义。

二、图书馆管理信息系统

图书馆管理工作非常复杂,涉及多方面的信息,面对的是社会各界读者。所以图书馆的管理工作主要是在图书馆藏书与读者之间进行。图书管理包括图书管理、用户信息管理和图书流通信息管理等内容。藏书信息管理主要是指图书馆借阅图书及注销、退书的相关信息。用户信息管理是指图书馆添加、删除、查询、更改用户信息,用户信息包括用户的个人信息、查询信息、借阅信息等。图书流通信息管理是图书馆的主要工作,主要是图书的借出、归还、补偿等管理工作,还包括读者登记管理、流通查询等工作。这一信息管理模式存在很多问题。现有的信息管理模式都是死板的划分,不能流畅高效地获取和共享信息,很难完成信息服务建设。目前图书馆MIS 还缺乏对信息自动化的处理能力,目前的系统大多依靠人工操作,庞大的数据信息很难进行有效的整理和操作,缺乏自动化的处理手段,使得获取的信息失去应有的实时效果。此外,在信息管理系统中还缺乏决策能力,现有的数据信息无法进行有效的信息分析和规划未来发展,不能准确判断信息,影响未来的发展规划。

三、数据挖掘技术在图书馆信息服务中的应用探讨

(一)数据的收集和整理

图书馆数字馆藏资源不仅包含馆藏信息,还包含着馆藏资源与众多馆藏相关的在线资源,这些资源分布非常广泛,内容丰富,给图书馆的信息存储和分析工作带来不便和困扰。面临着巨大而繁复的数据信息量,图书馆必须对其存储方式进行更新,对数据信息进行分类处理,在较高层次上统一描述,保证数据信息的完整性和一致性,符合信息资源管理的标准,以满足信息服务的要求。数据挖掘技术是一种以信息处理为主的技术,它具有完善的聚类功能,可以将具有相似特征的数据信息归类为同一类,在图书馆进行数据收集整理时,如果要提高数据的有效性,应合理地利用数据挖掘技术。

(二)文献资源建设

收集文献是图书馆信息资源保障必不可少的一环。大多数传统信息采购都是通过书店、出版社或期刊社的新书目录渠道,由专业的馆长或馆员来决定,也可以由一小部分专家来决定。这两种方式不能避免有强烈的主观性和个人偏好,但每年图书馆的文献购置经费都十分有限,如何利用有限的购买费用,合理地收集多个学科的专业数据信息,最大程度地发挥采集经费的效益。利用数据挖掘技术,通过对图书馆的借阅流通记录和检索请求分析,将频繁借阅集与文献柜阅集进行分类统计,实现信息采集的目的,补充和完善信息资源。它通过对海量信息资源进行智能服务的表现,为图书馆的读者服务工作提供不可替代的技术支持,为文献资源建设提供可靠的决策依据。

(三)应用数据咨询服务

图书咨询服务工作从馆员和读者实际咨询发展到数字化网络虚拟咨询模式。借助于网络,读者不仅可以从专家或咨询管理人员那里获取信息,而且可以进入知识资源库享受自助式服务。构建知识资源库需要运用数据挖掘技术对历史数据进行分析,探索隐藏在其中的信息规律,创造出符合用户需求的深层信息产品。另外,根据读者的历史阅览和咨询信息,推断其研究兴趣的方向,运用数据挖掘技术为每位读者提供多种咨询服务。也能方便咨询管理人员从大量的信息中为读者提炼答案,使主动咨询成为信息服务的主流途径。利用数学分析法记录读者的借阅历史,从中获得不同读者的阅读倾向,挖掘图书馆每一类书中潜在的读者信息,然后根据自己的兴趣爱好和主要研究领域和方向,逐步把它发展成为一个特定的、稳定的读者群。

(四)提供决策支助

数据挖掘技术是有效的科学决策工具,可为图书馆管理决策提供合理、可靠的依据。综上所述,在数据挖掘的基础流程中,可见其以数据存储技术为基本依托,实现更充足的信息集中。因为数据仓库能把数字图书馆的所有信息进行汇总,并进行统一处理和加工整理,从而形成信息决策一体化,全面地分析和比较集成信息,从而不仅弥补了信息的缺陷和漏洞,而且可以明显提高信息决策的可靠性和可行性。为此,将信息挖掘技术应用于图书馆管理,可以最大限度地提供决策支持。通过数据存储和挖掘技术建立图书情报机构,能够形成强大的信息资源优势,并具有较强的信息分析、浓缩和转化功能,为信息服务决策提供支持。

(五)运用期刊管理和信息管理系统

图书馆能运用数据挖掘技术,自动处理数字化信息,实现特定场景下数据和信息的自动分类检索。自动文摘是根据文本分类识别信息的一种方法,并将其分为若干种类型的主题;自动文摘使摘要信息以文本的形式呈现,其基本原理是依靠应用统计方法。怎样合理、科学地利用图书馆期刊购置费来分配各学科期刊的数量,平衡不同文献的种类和载体的采购,从而使经费得到充分、有效的使用,是需要慎重考虑的问题。通过数据挖掘技术收集网络上大量的非结构化、杂乱的非结构化数据,并对其进行详细的分类,能够有效地实现期刊的丰富和多样化。此外,为了提高期刊的流通量,合理满足读者和用户的需要,运用数据挖掘技术分析读者的借阅和流量状况,可以优化期刊馆藏结构。

(六)改善信息服务质量

运用数据挖掘技术,全面了解用户的使用需求,根据实际情况制定出科学、规范的数据监护流程和制度,以保证数据监护工作的可持续发展。进行数据处理时,要对数据的价值进行审核,检查数据的正确性和完整性,以保证最后输入的信息的有效性。系统数据存储与备份机制的优化,保证系统的兼容性。同时,图书馆也可以整合不同领域的专家,建立不同学科的数据标准,为数据共享奠定坚实的基础。并可加大经费投入,针对收集到的资料资料,分析读者的阅读需求,根据所得结论加强图书馆建设,为用户提供更好的阅读环境。

(七)建立数字图书馆

在资源数字化方面的工作是图书馆必须予以重视的一个方面。推进图书馆数据库建设,进行高效管理,能更好地满足时代对图书馆的发展要求。图书资料库主要有数字化图书、数字化期刊和数字化专业文献。目前,这种数字化数据库所包含的信息资源是传统图书馆无法比拟的。通过对信息资源的数字化处理,并将其存入专门的服务器中,用户可以通过网络实现对此类信息资源的在线浏览。图书资料库建立的资料库应当便于使用。为使用户能够更快速、准确地搜索到所需的信息,图书馆可以与供货商合作,一起对数据库进行改进,以获得更加理想的检索方式。与此同时数据库也具有记录功能,可以记录用户的搜索习惯和搜索内容,方便用户的使用。

结束语:在信息化时代,数字图书馆是实现图书信息共享和传播的重要途径和途径,为大众的信息需求构建了信息高度整合的有利场所,在信息保存、发布、传递、应用等功能上积累了丰富的数据资源,满足了各类信息需求。在图书馆信息处理自动化任务中,数据挖掘技术占据着重要地位。伴随着科学技术的日益成熟,鉴于数据挖掘技术的强大功能,图书馆必将展现出更长远的发展潜力。我们相信,通过数据挖掘技术,能够使图书馆信息服务的能力和效率实现跨越式的飞跃,进一步满足社会大众对信息服务多样化的需求。

猜你喜欢

馆藏数据挖掘图书
改进支持向量机在特征数据挖掘中的智能应用
馆藏几件残损《佚目》书画琐记
黑龙江省书法活动中心馆藏拓片选
云南省档案馆馆藏《东巴经》
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
图书推荐
欢迎来到图书借阅角
班里有个图书角
软件工程领域中的异常数据挖掘算法