APP下载

档案管理数据挖掘中的大数据技术的融入

2018-05-26张枝

卷宗 2018年12期
关键词:数据挖掘大数据档案管理

张枝

摘 要:伴隨着大数据时代的到来和档案智能化管理的需求,现在的档案管理中,为了更好的采集信息和检索整理信息,提高现有的档案管理水平,大数据技术的应用越来越被各个领域所重视。随着计算机技术的成熟,建立档案管理已存在必要性,档案管理信息的核心就是大数据信息的管理和数据挖掘,通过计算机挖掘有效的信息,优化检索程序,最终实现资源共享,研究基于大数据技术的信息管理挖掘技术,对于提高档案管理的合理性以及检索程序的从简化具有重要意义。

关键词:档案管理;数据挖掘;大数据

现在的档案管理系统中存在一定的弊端,不足以满足现有的需求,为了提升数据的快速查阅和检索性能,大数据技术应用于档案管理系统走向必然,将数据挖掘技术应用于档案管理中,首先需要构建信息的数据库,并对录入信息的有关联特征进行提取分析,从而建立档案信息管理系统的闭频繁项集后缀项表,进行大数据的数据挖掘,计算机挖掘技术挖掘技术应用于档案管理中,能有效的节省检索时间,优化档案管理流程。

1.大数据时代下的数据挖掘技术

数据挖掘已经成为信息管理检索信息的关键,数据的产生和收集是信息管理的基础,而数据挖掘就是要检索出信息中隐晦的和未知性的但潜在有用信息的程序化过程。

提及大数据就不得不提到云计算,二者的关系密不可分,大数据的计算需要采用分布式架构,运用云计算综合进行处理,海量信息的分布式数据挖掘需要依托云计算的处理技术。大数据的“大”字并不在于为了掌握庞大的数据信息,而是对所收集的数据进行专业化的处理,从而提高数据的有用性,实现产业增值。因此,可以定义大数据就是在一定的时间范围内,有效的收集和捕捉信息,运用常规的工具分析和处理集合数据,是需要新处理模式才能具有更强的决策力、洞察发现力和优化能力的海量、高增长率和多样化的信息资产。

大数据时代下的数据挖掘具有以下四个特征:

(1)应用性:这是数据挖掘区别于其他交叉学科的一个重要特征,数据挖掘产生于实际的生产生活中的应用需求,数据挖掘中的数据来自于应用实践,同时又服务于应用实践,将最合理的算法应用于实践中,并在实践中检验算法的准确性。

(2)工程性:数据挖掘的步骤繁琐就决定了其工程化的特征,数据挖掘不是单一的数据分析和应用,实践其应用性的过程当中需要准确的数据管理和准备,数据的处理和转换,以及最后成果的验证和使用的完整过程。

(3)集合性:一个具体的应用数据往往涉及多个功能,探索分析和关联性探索,分类预测和聚类分析都需要诸多功能的支持,

(4)交叉性:数据挖掘更侧重应用,这是其区别其他交叉学科的重要标志,统计学和人工智能等学科都与数据挖掘觉有关联性,也正是学科之间的关联性为自身的发展提供了一定的技术支持。

2.数据管理数据挖掘中大数据现有应用问题

2.1应用深度不足

随着大数据开始进入人们的视野,人们看到了其对信息服务质量的有效提升,初步应用于档案管理之中大数据也存在一定的不足,首要的问题就是现有的应用缺乏应有的深度,过分的依赖数据分析而片面的忽视了人的作用,大量的依赖大数据技术片面的忽视了大数据技术应用的最终目的是优化服务。

2.2应用技术水平不足

目前对于大数据技术掌握的高端人才是社会上比较紧缺的,大多数档案管理人员对于技术层面是一知半解的,熟练掌握需要集中培训或者长时间熟练,因此在现阶段的应用中很难达到预期的效果,处于探索时期的应用需要得到重视。

2.3应用风险评估不足

大数据技术的应用虽然有效的提升了档案管理的数据挖掘水平,但是应用的同时还是有一定的风险的,潜在的安全风险在数字记忆这个部分是难免存在的,一旦收到黑客的攻陷,核心数据的泄漏是毁灭性的,这样会导致档案的数据流失,这会滋生一系列的问题。

3.大数据技术全面应用改进的必要性

数据挖掘中的大数据应用主要是利用技术提供信息化的手段,随着档案信息数据的规模扩大,在对档案信息进行存储和查询的过程中,及时的分析显得尤为重要,传统的方式显然不能满足现有的需求,海量的数据是传统的方式不能理性处理的,大数据通过云计算尽性分析,从庞大的数据中将其运算能力最大程度的发挥,能从中得出有效的信息结论,智能化的处理能有效的为档案的管理提供决策,从而能更好管理档案,满足不同层面客户不同需求,最终能有效的提升档案管理的数据挖掘水平,优化档案管理的质量,因此,大数据的应用显得必要性十足。

面对现有的大数据应用中的问题,我们很容易看到其中的问题,但是也不可否认,大数据技术本身的有点也是十分明显的,面对问题,我们应对的方式无非就是最大程度的发挥其优势,最小化其劣势,但也不能规避问题,而是应该正面理性解决不足。现有的应用水平是必须直视的,档案管理人员作为管理的主体,必须要有自身意识,大数据技术的应用要尽可能的提高数据的深度和维度,数据量的积累,数据挖掘的速度,数据的种类,数据的真实性都需要维度的积累,所说的数据量的维度指的是,数据量的积累的同时还需要加强对数据的应用,这能一定程度上提升数据量的深度;数据挖掘速度的维度指的利用大数据来提高档案中数据的查找速度,对档案进行迅速的归类和整合,能有效的对信息数据进行挖掘;数据种类的维度指的是档案的分类合理化,利用软件有效的处理档案信息对数据资源进行集中分析;数据的真实性维度指的是在冗杂的数据当中,应用大数据技术摒弃信息录入中的错误信息,将真正有价值的信息挖掘出来。

现有的技术应用水平是备受争议的,坚持大数据理念的应用,利用大数据技术对现有的档案信息进行全面的深度挖掘,大量的数据技术能够建立数据档案库,同时要切实加强数据的收集整理工作,在深度分析的基础上,不断的扩充信息库的有效内容,这样能有效的全面的应对服务过程中的个性化的需求。建立智能化的信息平台也显得很有必要性,能更高的丰富档案库的信息。不难发现,在提及大数据技术的时候,我们提到了云计算技术,二者之间的关联性不言而喻,因此,云计算技术的应用也需要与大数据做到有效的结合,云计算的优势是在信息数据处理中发挥作用,这是大数据产生的重要途径,云计算技术同时可以作为大数据基础框架建构的载体。因此,只有加强云计算技术的应用才能提升档案管理服务端的客户体验。云计算技术能加强对大数据的分析和预测,并设计出具有针对性的解决方式,云计算技术的应用能够一定程度上对潜在的风险进行分析和处理,再此基础上能有效的建立风险评估机制,从而更好的在档案管理的过程中规避风险,避免档案数据流失造成的一些列不必要麻烦。

大数据技术的应用已经成了当今时代背景下的一个必然趋势,因此为了更好促进其与档案管理中的数据挖掘就需要我们在档案管理中,注重应用深度和我维度的拓广,加强应用水平和云计算技术的应用能有效提升和优化档案管理的数据挖掘。

参考文献

[1]董洁,信息时代高校人事档案管理的研究[D],山东大学2008

[2]乔瑞花,档案管理在大数据背景下面临的挑战和对策分析[J],科技创新,2015

[3]钟静,探析大数据时代背景下的档案管理[J],兰州世界,2014

猜你喜欢

数据挖掘大数据档案管理
档案管理中的电子档案管理
档案管理与企业内部控制关系的思考
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
健康档案管理的“云”前景
基于GPGPU的离散数据挖掘研究
加强工程项目档案管理的有效途径