APP下载

综述数据挖掘在国内图书馆数据库应用领域的研究

2017-10-20郭艾华刘业亮

科技资讯 2017年25期
关键词:数据挖掘应用研究

郭艾华++刘业亮

DOI:10.16661/j.cnki.1672-3791.2017.25.007

摘 要:本文将从数据挖掘在国内图书馆数据库应用的领域进行研究,从数据挖掘在国内的数字图书馆、高校图书馆以及图书馆个性化服务等方面入手分析数据挖掘在国内图书馆数据库应用的现状,总结其中存在的问题,并找出解决问题的方法,提高数据挖掘在国内图书馆数据库的应用效率。

关键词:数据挖掘 图书馆数据库 应用研究

中图分类号: G25.73 文献标识码:A 文章编号:1672-3791(2017)09(a)-0007-02

随着数据挖掘学科的不断发展,很多领域都引进了数据挖掘知识,解决人们对数据分析、处理、应用的难题。数据挖掘是一项综合性很强的学科,不但涉及到了数据库的技术,还有统计学、人工智能、检索信息等领域,适用范围十分广泛,当今国内的很多图书馆也关注到了数据挖掘,通过对数据挖掘在图书馆中的应用研究,提高数据挖掘应用效率。

1 数据挖掘在国内图书馆数据库应用研究存在的问题

1.1 理论研究不够深入

虽然从20世纪90年代至今,都有国内外的专家学者们对于图书馆数据挖掘相关理论的研究,但是这样的研究还不够深入和全面,没有建立起系统的理论模型,这也是导致我国图书馆数据库应用数据挖掘效率不高的原因之一。

1.2 图书馆数据库应用研究不够全面

数据挖掘是一门综合性很强的学科,它集计算机、统计学、可视化以及人工智能等学科相关知识于一身,并且在很多领域包括金融、医疗、互联网等都得到广泛的应用。但是在国内的图书馆中,由于对数据挖掘学科认识的不足,数据挖掘并不能充分地发挥其强大的作用,所以在图书馆数据库应用数据挖掘过程中出现多种问题,如对图书馆数据挖掘应用研究不够全面的问题。

1.3 研究项目和经费支持少

数据挖掘在国内图书馆数据库应用研究存在的又一难题是对于数据挖掘在图书馆数据库应用的研究项目和经费支持少。国家对于研究项目的支持很少,从现有数据可以发现国家对于863计划资助的研究项目只有1篇,这样低的支持率造成了论文基金资助率低下的情况发生,仅仅只有3.47%的论文基金资助率,远远低于其他领域的资助水平。和其他研究领域相比,数据挖掘在图书馆数据库应用的类型研究项目的支持经费不高。但是图书馆的发展和管理的推进都需要大量的经费作为后盾支持,特别是数据挖掘,此技术的研究和应用门槛高,研究人员需要有全面的知识,对计算机、统计学、数据库等都精通,这样的研究自然需要大笔的经费支持。

1.4 研究成果与图书馆管理信息系统开发不紧密联系

虽然目前我国的数字图书馆、高校图书馆以及公共图书馆个性化管理等都进行数据挖掘的相关研究,然而对于这些研究结果却不能结合到具体的图书馆信息系统建设工作当中。世界上已经开发出了具有数据挖掘功能的图书馆管理信息系统,这些系统把数据挖掘的优势发挥出来,真正地应用到实际的图书馆发展中。但是相对于外国,我国的图书馆并不能研究开发出具有操作性强、易于实现并且能够指导实际业务的成熟产品。造成这样的情况发生很大一部分原因是研究成果与图书馆管理信息系统开发不紧密联系,并且对于图形图像和用户评论等非结构化的挖掘不够深入。

2 加强图书馆数据挖掘应用的策略

通过加强图书馆数据挖掘应用,可以优化图书馆的管理。图书馆数据挖掘的利用展现见图1。

2.1 进行资源建设,馆藏优化

在图书馆信息资源的建设中,其文件的采访是建设的关键,是否建设好文献的采访直接关系到文献的资源共建、共享以及信息服务水准的提升。图书馆经常是通过学科的需要及专业制定购买方案,同时还需要结合图书馆藏书学科专业分布情况和发展趋势、现有的藏书量来制定购买计划,但这样的购买计划并不能很好地进行优化图书馆的藏书。所以最佳方法是通过数据挖掘的方法,客观分析图书馆的现况,需求以及变化趋势,再科学合理地进行资源建设,从而优化馆藏,根据图书馆数据挖掘的应用,有针对性地对藏书进行补充,不断丰富馆藏资源,优化馆藏的结构,进一步提高馆藏的利用率。

2.2 利用数据挖掘提升服务质量

图书馆可以利用数据挖掘来提升数据资源服务的质量。通过信息服务的智能化,让被动服务变成主动服务,改变传统的服务方式,让图书馆的服务质量得到提升。通过OPAC的服务智能化,支持概念检索、模糊检索、联想检索等功能,利用数据挖掘中的文本挖掘技术让检索结果质量提高。其次应用数据挖掘技术,在查询咨询中发挥优势,通过对网络信息的挖掘以及网络信息的序化、网络信息的应用加强和优化图书馆信息服务质量。图书馆的服务质量直接影响到了图书馆的运行效率,发展方向,所以要充分研究数据挖掘在图书馆中的应用,并发挥其优势,帮助图书馆优化服务质量,提高各方面的综合能力。

2.3 挖掘学科动向,发现学科之间的隐性关联

各个学科的动向直接影响到了图书馆的新书购买及藏书的相关工作,因此学科动向与学科隐性关联是图书馆文献使用规律挖掘的重要方面之一,利用数据挖掘中的文本聚类、文本分类以及关联挖掘等功能强化图书馆的购买规划,通过挖掘学科动向,发现学科之间的隐性关联,研究出在海量数据中存在的规则,而这些规则对于我们发现学科之间的隐性关联很有帮助。有些学科之间的关联并不容易发现,需要通过内在联系、内涵分析等才能发现其隐性关联。挖掘出了学科之间的隐性关联,对于提高图书馆的藏书借阅和电子资源服务学科研究等工作的开展都有重大的意義。

3 数据挖掘研究热点及趋势

3.1 关联挖掘

在以后的数据挖掘在国内的图书馆数据库应用领域研究中,其研究的热点以及趋势是学科之间的关联挖掘。通过对读者与书籍、书籍与书籍之间的隐性关联的研究,可以为图书馆的藏书建设提供重要的指导意见。数据挖掘技术在图书馆中最常见的是馆藏建设的优化,馆藏结构的优化以及藏书布局等。通过关联挖掘的研究,可以找出图书馆中的图书与图书之间的隐性联系,或者读者与文献之间的联系。比如读者借阅了文献A,一段时间后又借阅了文献B,通过研究文献A与文献B之间的联系,不断优化图书馆的藏书,使图书馆更好地服务于读者。

3.2 读者行为分析

图书馆中的读者行为分析与挖掘对于图书馆的发展有着重要的作用。通过读者行为的分析,可以优化馆藏结构,提高读者对图书馆的信息资源的利用率。比如图书馆挖掘在图书馆中的常活动读者,对于读者的身份和读书习惯分析,对于文理科读书群体的分析等,对这些读者行为进行跟踪与分析,通过分析和总结,发现图书馆存在的问题以及优化馆藏资源结构,并且寻找出相应的调整方案,从而优化图书管理和服务推送,让更多的读者喜欢图书馆,也让图书馆的管理与发展更进一步。

3.3 个性化服务

每一个读者的行为习惯都不同,阅读的习惯也各不相同。如果图书馆能够建立起个性化服务,并且对读者对信息使用行为习惯的特定需求建立起完整的个性化服务体系,那么就能进一步提高图书馆的管理水平。而个性化服务也始终贯穿于数据挖掘在图书馆数据库应用研究过程中。根据读者的兴趣、爱好、浏览模式等研究开发出适合不同读者的个性化服务。比如阅读推荐、个性化公告板、邮件订阅等根据读者的喜好推荐与之相符的书籍供读者阅读。

4 结语

当前数据挖掘技术在快速的发展当中,其在多个领域也得到广泛的应用。数据挖掘技术为图书馆在海量信息资源中检索有价值的信息从而为指导图书馆的工作提供了便利。优化了图书馆的藏书结构,信息管理结构等,它是图书馆革新的重要手段。虽然目前国内图书馆的数据挖掘应用还不够完善,受到各种条件的制约,但是数据挖掘在图书馆中仍然有着广阔的应用前景,有待我们进一步的挖掘和研究。

参考文献

[1] 俞锦梅.数据挖掘在国内图书馆数据库应用领域研究综述[J].图书与情报,2015(2):137-141.

[2] 田瑞雪.国内图书馆数据挖掘技术应用研究述评[J].科技信息,2014(1):167.

[3] 庞天丙.数据挖掘技术在图书馆系统中的研究现状分析与研究[J].福建电脑,2012,28(2):72-74.endprint

猜你喜欢

数据挖掘应用研究
数据挖掘技术在内河航道维护管理中的应用研究
数据挖掘综述
软件工程领域中的异常数据挖掘算法
进驻数字课堂的新兴教学媒体
AG接入技术在固网NGN的应用研究
空域分类关键技术及应用研究
分层教学,兼顾全体
基于R的医学大数据挖掘系统研究
一本面向中高级读者的数据挖掘好书