数据挖掘在高校数字图书馆中的应用
2020-03-03林强强
林强强
(吕梁学院 离石师范分校,山西 吕梁 033000)
数字技术的广泛应用促进了高校图书馆在建设方法与管理模式上的数字化发展,因此数字图书馆在我国高校中得到了广泛的普及应用,极大地提高了高校图书馆的建设水平和服务效率。但伴随着高校数字图书馆建设的不断推进,其存储与传播的信息数据在数量、形式以及种类等几方面都呈现几何式的增长,出现了由于信息数量巨大造成了信息查找困难、信息质量高低不一等问题。如何缩短信息搜索的时间,提高搜索的效率充分发挥数据挖掘的技术优势,挖掘数据背后的联系与规律,提高信息数据的质量,成为当前高校数字图书馆建设管理研究的重要问题。推进数据挖掘技术在高校数字图书馆中的应用,为提高图书馆管理水平和图书服务质量提供了有力的技术支持。
一、数据挖掘的定义及实施步骤
(一)数据挖掘的定义
数据挖掘(DM)作为数字时代的一种信息处理技术,其工作原理可以简单描述为挖掘海量数据中的内在规律和联系,从而挖掘出有用的数据。在当前学术界普遍认同的定义为,数据挖掘,也称为从数据库发现知识(Knowledge Discovery from Database,KDD),是一种从大量数据中提取未知数据的方法、知识以及有价值的模式与规律的复杂过程。[1]
(二)数据挖掘的实施过程
数据挖掘的实施过程是一项复杂的系统工程,大体可以分为六大环节,需要分步骤、递进式、推动式的展开。
首先,确定数据挖掘的目标。明确数据挖掘信息源的性质与特征,明确数据挖掘的目的,为数据挖掘的整个过程奠定基础[2]。在目标尚未确定的前提之下开展数据挖掘,其数据挖掘的结果必然无法准确。
其二,分析数据的准备。对数据挖掘的对象进行全面地调查与分析,搜集所有的关于对象的来自外部与内部的数据,对搜集的数据进行二次归类与分析,确认搜集数据的质量与操作类型,最终确定分析聚焦。
其三,分析数据的转换。在确定分析聚焦的基础之上,结合数据挖掘的数据算法分析,使用专门的方法对确定的聚焦数据进行转换,确定数据分析模型。
其四,数据的挖掘。数据的挖掘是利用数字化的技术手段,通过数据算法和分析方法对确定的聚焦数据进行分析,找到数据间的内部联系与规律,并形成详细的数据报告。
其五,数据结果的分析。结合数据挖掘阶段形成的数据报告,结合数据挖掘的目标,采用可视化的技术手段对数据结果进行预测和分析。
其六,结果的应用。这一部分是数据挖掘技术的应用环节,即将分析研究的结果应用到相应信息系统的组织结构中。
二、数据挖掘在高校数字图书馆管理中的需求
“以用户为先,满足用户需求”是当前高校数字图书馆服务的主要目标之一。为高校师生提供优质的图书服务,为高校教科研工作提供有力的支持,要求当前高校的数字图书馆的服务流程以用户需求为中心。首先,通过多种方式或途径采集用户的信息或数据,创建用户信息库,有效地识别用户。其次,通过对收集到的用户信息进行分类,反映不同用户组之间的组差异,并分析不同用户组之间的特征,确定其独特的用户需求。最后,结合调查分析的用户需求,进行个性化的信息推荐,给用户提供有针对性的、个性化的图书阅览服务。在通过信息收集、分析、服务提供和预订服务数据的统计记录用于用户信息的识别和分类的过程之中,需要大量信息数据记录的支持,而正确结果就隐藏在海量的数据之中,需要专业数据挖掘技术及专业人员的支持。但是,对于当前高校的数字图书馆管理人员的组织构建现状,大部分的数据挖掘与分析工作很难有效地展开。因此,必须寻求有效的路径对数据信息进行有效地分析与处理。数据挖掘技术是用于数据分析的数字技术[3]。借助其模式识别、神经网络、逻辑分析等方法,可以发现海量数据中潜在的规则和联系,并通过特殊的方法进行整合,为数据分析和决策提供参考。因此,将数据挖掘技术应用于高校数字图书馆,有利于促进用户需求驱动的图书管理,提高图书服务质量,提高管理水平和用户服务质量,是高校数字图书馆发展的客观要求。
三、数据挖掘在高校数字图书馆中的应用对策
在数字和网络信息时代,作为新时代图书馆发展的新产品,数字图书馆已经挑战了图书馆管理员的信息技术素质。图书馆管理必须创新工作方法和深入的数据挖掘技术,并在高校数字图书馆中推广和合理应用数据挖掘技术。如何充分发挥数据挖掘的作用,实现高校数字图书馆的稳定、高效的发展,可以从以下几个方面进行。
(一)构建专业化的服务队伍
做好服务的关键在于数字图书馆服务队伍的构建,充分发挥数据挖掘的技术优势,通过网络大数据找到当前数字图书馆管理人员需要的专业技能资源,对当前大学数字图书馆管理人员进行有针对性地、高效地教学指导。通过挖掘各类教学资源,将大大提高图书馆服务队伍的整体数字素养,为数字化背景下的高校数字图书馆服务和科学管理奠定基础。
(二)优化数字图书馆资源建设
在传统的高校数字图书馆管理方法中,图书馆数据的采集主要通过管理人员的主观选择,数字图书馆的资源建设受主观因素的影响过大,使得图书馆资源建设因管理人员知识面和对客户的认知的不足受到限制。因此,数据挖掘技术在高校数字图书馆中的应用,通过对诸如图书馆各种资源的使用频率、借阅记录等数据的分析,建立了数字图书的用户需求,并且根据需要采用数字图书资源,以满足大学教学和研究的需求。
(三)提高数字图书馆资源的利用效率
高校数字图书馆的管理与建设之中,信息资源的采集与处理是最为关键的环节,这一环节的工作质量直接影响着高校数字图书馆实力的高低。高校数字图书馆数字资源的丰富程度直接关系到图书馆的质量和吸引力[4]。传统管理模式下,高校数字图书馆的信息资源的采集方式主要采用人工方式进行,由于图书管理人员素质的差异,使得高校数字图书馆的质量无法得到保证。充分发挥数据挖掘的优势,全面归纳和梳理图书馆的信息资源,分析与汇总图书馆的情况,并结合分析的结果制定科学的管理对策,为用户提供高效、便捷的图书阅读体验,提高图书馆信息资源的利用效率。
(四)改善数字图书馆的个性化服务
在传统的图书馆管理服务模式下,针对用户的需求,图书馆会设置专人专岗进行收集与答复,在此种模式中,用户的需求获取途径单一,获取的数据量有限,图书馆的管理常常处于被动的状态之下。为了扭转这种被动的局面,获得服务的主动权,高校数字图书馆在管理中应充分发挥数据挖掘的技术优势,收集与分析日常图书工作中用户图书借阅数据,根据用户的喜好与兴趣,个性化地为客户提供服务。诸如根据数字化图书馆使用者的客观需求与特征,管理工作人员将互联网上的资源信息及时有效地、针对性、个性化的推荐。除此之外,还可以利用数据挖掘中的分类分析方法,结合兴趣模式的算法,根据图书阅读用户的需求,为数字图书馆挖掘潜在的用户,为用户免费提供需求信息,使其成为高校数字图书馆的固定的、忠实的用户。
四、结语
数据挖掘技术作为数字信息时代的新兴科技,成为社会诸多行业管理中广泛应用的科学理论。高校数字图书馆作为数字时代图书馆发展的新兴产物,数据挖掘技术的应用是提高数字图书馆的应用水平、促进其快速发展的重要技术途径,成为高校数字图书馆改革的重要技术支持。