APP下载

浅谈数字图书馆数据挖掘

2017-03-24武艳荣宋宇辰

参花(下) 2017年5期
关键词:数据挖掘数字特征

◎武艳荣 宋宇辰

浅谈数字图书馆数据挖掘

◎武艳荣 宋宇辰

随着我国经济的迅速发展,计算机网络技术方面也取得了尤为突出的成果。而在数字图书馆的管理中,数据挖掘是一个特别重要的环节。但因为诸多因素的限制,数据挖掘存在着一定的问题,从而对整个数字图书馆的发展造成了阻碍。本文就对数字图书馆数据挖掘进行简要的探讨。

数字图书馆 数据 挖掘

在科学技术日益发展的今天,已经有越来越多的领域在运用信息化数字技术,并且成效非常显著。数字挖掘技术作为数字图书馆中极为重要的一部分,把传统图书馆需要大量人员来完成的工作转变为数字技术操作,极大地节省了人力和物力。但与其他发达国家相比,我国整体水平仍然偏低,为了有效地改善目前的现状,我们必须积极地借鉴先进的数据挖掘技术,从而更好地运用在我国的数字图书馆管理中。

一、数据挖掘的概念

在数字图书馆中,要想更好地使用数据挖掘技术,就必须要先准确掌握数据挖掘的具体概念。数据挖掘主要是指从大量的数据当中,运用信息技术准确地挑选出和挖掘一些隐藏的信息,并将这些信息应用在工作实践中。数据挖掘是一个相对较为繁复的过程,其中包含数据的准备、采集以及结果的显示与解释,因此,我们必须在应用数字挖掘技术之前做好这几项工作。而数字图书馆则是通过计算机和信息检索技术,整理和保存全部的图书信息,同时又是收集和使用数字信息的综合智能数字信息管理和服务的中心,为读者提供更为全面的服务。

二、数据挖掘的功能特性

(一)聚类分析

聚类分析是数据挖掘中一个较为重要和复杂的功能特性,主要是指把全部的数据个体所具有的特点,通过计算机技术进行归纳,继而将这些数据汇聚成具有特殊属性的一个数据群组。而聚类又可以分为两种,一种是把同一类型的数据汇聚在一起进行管理和保存,另外一种是把不同类型的数据汇聚后进行统一管理。之后就能够从获取的特性中知道同类事物的共同点和不同种类事物之间的差异性。

(二)关联分析

关联分析与聚类有着极大的差异性,它主要是指数字图书馆中收集起来的各种数据,它们之间是具有一定关联性的信息。举例来说,就是在数字图书馆中的某一组数据,其中大多数的数据都相互之间存在着联系,从而我们能够通过对其中一项具体属性的了解,就可以掌握与其相关联的其他项的属性。

(三)概念描述

概念描述是指探讨和分析某类对象的内在涵义,并概括出这一类别对象的有关特征,这其中又分为区别描述和特征描述。前者是对不同类别对象之间存在的差别进行描述,后者是对某类对象的共同特征进行描述,并汇总成一个类别的共同特征。

三、数据挖掘在数字图书馆中的应用

(一)结构挖掘

结构挖掘的应用,就是通过网络页面中的链接和组成结构,从中可以尽快地掌握图书馆页面整体的结构形式,以此来对模式的各个特征做好进一步的分类和分析。通过结构挖掘的使用,我们能够及时准确地为数字图书馆在网络建设方面给出建议,并且还可以从这些链接了解和分析到各学术的发展方向如何。此外,还能够节省大量的人力和物力,使数字图书馆的工作效率得到提升。

(二)内容挖掘

内容挖掘相比较结构挖掘而言,过程更加复杂,内容也较为丰富。其主要包含组织文献数据、特征的自动提取和描述以及自动采集整理专题信息等。首先,组织文献数据主要是指采用现代化的信息技术,整理和分类数字图书馆中全部的文件,清楚地了解和掌握每个分类所包含的内容,这样有利于用户在数字图书馆查找信息的过程中,能够通过想要查询的信息分类,更为迅速地找到有关的内容区域。另外,还能够有效地保证准确地查找到所需信息。其次,自动提取和描述特征是一个需要较高技术性的过程。在进行数据挖掘的过程中,利用一个较为具体的内容分析器,分析和提取出其中有关的内容特征,从而可以让用户在这些被准确提取的内容特征中更为快捷精准地查找到所需信息的具体位置。最后,是自动采集整理专题信息。数据挖掘虽然取得了一些成果,但其在我国作为一种新型的智能化科技的产物,在发展过程中还会存在很多的难题等待我们去解决,因此,这就要求我们必须积极地借鉴国外的先进数字挖掘技术,并通过不断地探究和完善,提高我国的数据挖掘技术水平。

四、结语

总之,在数字图书馆的日常管理中,采用数据挖掘技术能够有效地优化和丰富信息资源,以给用户提供更加优质的服务。但为了满足发展的需要,我们要不断地完善我国的数据挖掘技术水平。

[1]唐吉深.图书馆数据挖掘技术研究现状述评[J].图书馆界, 2011(01).

[2]洪丽平.数据挖掘在图书馆读者忠诚度研究中的应用[J].情报探索,2016(08).

(责任编辑 刘冬杨)

武艳荣,内蒙古科技大学经济与管理学院硕士研究生,包头市委党校,助理馆员,研究方向:数据挖掘与图书馆信息;宋宇辰,博士,内蒙古科技大学经济与管理学院,教授,研究方向:能源经济环境可持续发展、数据挖掘、大数据分析)

猜你喜欢

数据挖掘数字特征
根据方程特征选解法
探讨人工智能与数据挖掘发展趋势
不忠诚的四个特征
答数字
抓住特征巧观察
基于并行计算的大数据挖掘在电网中的应用
数字看G20
一种基于Hadoop的大数据挖掘云服务及应用
成双成对
高级数据挖掘与应用国际学术会议