基于数据挖掘的数字档案信息管理探讨
2016-05-14阮景雯
阮景雯
摘要:档案管理工作是许多机构的基础管理工作之一,而随着数字化进程的加速,许多机构依据自身的需要已建立起了相对完善的数字档案信息管理平台,为自身的档案管理和利用提供了方便。作为信息技术发展的重要成果,数据挖掘技术在数字档案信息管理中也得到了广泛的普及,对推动档案信息管理的进步起着重要的作用。本文从数据挖掘的定义和技术方法出发,总结了其于数字档案信息管理中的应用模式和重要意义。
关键词:数据挖掘 数字档案 信息管理
中图分类号:TP3 文献标识码:A 文章编号:1007-9416(2016)05-0000-00
随着科技的发展和计算机技术的日渐成熟,人类已经进入了信息化时代,这使得人们生活和工作的方方面面都结束了传统的重复性的工作模式,变得更加便捷。在档案信息管理工作中,由于其工作内容相对繁杂,数据量相对较大,因此,计算机技术的应用大大改进了以往的工作模式,满足了信息的共享性、时效性和便捷性等多种特征。数据挖掘作为档案信息管理工作的重要信息技术之一,具有其自身独特的功能和地位。
1数据挖掘的定义
随着数据学科的兴起,越来越多的科学家针对数据挖掘等技术进行了深入的研究,现在,数据挖掘已经成为一个专门的学术领域,横跨多个学科,涵盖了统计学、数学、机器学习和数据库等多方面内容。从普遍意义上而言,数据挖掘就是从包含大量模糊、随机、有噪声的数据中通过一定的技术手段进行识别,将有效的、新颖的、或者潜在有用的数据进行集中处理,进而形成可以理解的知识。在实际应用中,数据挖掘往往通过各种分析工具的利用,从海量的数据中发掘模型和数据之间的关系,并可以据此作出一定的预测。
2数据挖掘技术方法
数据挖掘技术的方法有很多,主要包括:
(1)分析方法:主要包括统计分析方法,诸如回归分析和时间序列分析、多元分析等。其中,回归分析针对自变量和因变量及其之间的变化关系进行分析;时间序列分析利用时间序列模型进行相应的分析。
(2)决策树:在信息理论的基础上对数据进行分类,在建立决策树的同时,也生成了相应的规则,并可以据此预测数据。主要包括分类及回归树法,卡方自动交互探测法等等。
(3)神经网络:即通过模拟人脑的思考结构进行一定的数据分析,具有一定的自我学习功能,并以此调整对应的参数,借以得到有关的资料。该方法可以对大量复杂的数据进行分析。
(4)相关规则:主要进行关联分析,按照“如果——则”的逻辑进行有关数据资料的细分。
(5)数据可视化:通过一定的、合适的图形等进行数据的展现和表示,同时,该方法还支持多维数据的可视化,有利于从不同的层次进行有关的分析。
除了上述方法之外,数据挖掘技术的主要方法还包括遗传算法、近邻算法、粗糙集、联机分析处理等等,不同的方法都有其适用的不同数据库或者数据资源,为有关数据的信息化处理提供了更多的方便。
3数据挖掘技术在档案信息管理中的应用模式
3.1档案信息的收集
档案信息的收集是数据挖掘技术应用于档案信息管理的重要内容之一。其主要内容是概念模型的建立,也就是通过一定基础的数据分析,对有关的数据或者集合按照一定的方法进行描述,即建立起有关的模型,并据此对比测试相应的样本对象等,在能够获得较高准确性的基础上,以此作为标准,继而将不同种类的对象进行划分。例如,在档案管理者针对某一信息进行录入后,则数据库会自动生成相应项目的属性描述,即形成了一个标准模型。当同类的信息再次输入时,数据库则会按照该标准模型对信息中的不同项目按照属性进行分类,大大节约了工作时间。
3.2进行档案分类
在档案管理中,其工作任务相对繁重,主要是因为数据量较大,而对档案进行分类整理往往需要耗费大量的精力。但是,通过数据挖掘技术的施行,可以自动对大量不同的档案依照属性的不同进行不同级别的分类,可以辅助有关的档案管理员进行更高效率的检索。该功能的主要过程为:依照某些数据的不同特征对其进行分类,使之形成相应的训练集;在此基础上,建立对应的分类模型,对数据库中的其他数据进行分类。
3.3档案信息的分析与整合
档案的建立以及档案信息化管理的重要用途之一,就是为了在特定时期,有关的管理者可以对数据库中的庞大数据进行迅速的信息提取、分析、整合,继而使其发挥应用价值。利用数据挖掘技术,有关的管理者可以针对某种现象发生的原因进行深入的分析,并挖掘背后的原因继而采取一定的措施,杜绝此类现象的出现。另外,数据挖掘技术还可以针对有关的档案查阅等,提供相应的信息便于管理者做好充足的准备。例如,在某个档案的管理网站中,数据挖掘可以自动统计使用者大量查阅档案的高峰期,有关的管理人员可以据此做好充足的准备,并采取一定的措施预防网站瘫痪等问题的发生。
4数据挖掘技术应用于档案信息管理的意义
数据挖掘技术的应用为档案信息的科学高效管理提供了更加便利的条件,使得繁重冗杂的档案管理工作摆脱了传统的模式,使得其上升到了新的管理层面。智能化、信息化的档案数据管理提升了有关数据处理的速度,这不仅节约了有关管理人员的工作时间,同时,也降低了其工作难度,提升了管理者的工作效率和工作水平。
另一方面,数据挖掘技术的应用对档案信息管理的保密性和保存时间等多方面也具有十分重要的意义。一般而言,档案信息的保存往往具有较高的保密性,有关信息的泄露很可能引发一系列严重的问题。而对于某些特殊机构等,其保管的档案往往在具有一定机密性的同时,也需要进行长期的保存,借以保存或者提升其价值,但是在使用过程中,很可能出现档案信息的丢失等现象。而采用数据挖掘技术,这些问题和不良现象可以得到相应的改善。
5结语
综上所述,数据挖掘技术在档案管理工作中具有十分重要的意义,它不仅提升了档案管理的效率,还增强了档案的使用效率,这对当前的档案管理工作而言是一个重大的进步。
参考文献
[1]高燕飞,陈俊杰.试析计算机数据挖掘技术在档案信息管理系统中的运用[J].内蒙古师范大学学报(哲学社会科学版),2012,04:44-46.
[2]栾志福.探讨档案信息管理系统中数据挖掘技术的应用[J].吉林省教育学院学报(下旬),2015,11:149-150.