大数据时代档案数字资源整合的难点及对策分析
2018-08-18姜玉辉
姜玉辉
摘 要:当前计算机网络技术不断发展,给其他各行各业都带来了很大的便利,而大数据这个理念也在很多领域得到了推广应用。档案管理工作主要是针对重大事件进行记录,所以其对于人类的重要性是不言而喻的,而随着时代的发展,越来越多的新技术的应用,给档案管理工作带来了很大的机遇,同时档案管理工作也在面临着一些困难。当前就我国的情况来看,数据安全问题一直没有解决,并且人才短缺,所以数字化档案依然迟迟没有实现。本文主要针对大数据时代下的档案管理工作进行了探讨。
关键词:大数据时代;档案数字资源;整合;难点;对策
在当前很多人对于数据非常重视,认为其是对于管理工作来说,最具有决定意义的一个元素了。现在已经进入了大数据时代,而人类的生活工作以及娱乐都离不开一系列的数字化资源。档案记录了人类社会发展的全过程,可以说是一系列非常重要的材料,现在已经进入了大数据时代,在这个时代下,档案管理工作被提出了更高的要求,所以档案管理工作的效率有待于提高,这就需要应该对数据处理方式进行一定程度的改良和优化,保证档案管理工作的科学性。
一、在大数据背景之下档案管理工作的特点
大数据就其本身的构成来说,成分是非常复杂的,并且随着表现形式的不同,其体现出的状态也分为很多个类型。但是大数据这一理念的诞生,其目的是让人类社会可以发展方向更加明晰,思路更为简单。大数据通过其预测的方式来达成上述的效果,人类往往可以根据大数据的统计结果来确定出一个发展方向,并且给人们提供一个新的视角。所以大数据这一理念在以后很长一段时间内都会处于上升时期,并且给人类的生活带来很大的改变,其中对于档案管理工作也会造成以下几点影响。
(一)数据总量增加
进入大数据时代以后,我国的档案建设工作可以分成两个部分,一部分是增量档案,另一部分是存量档案,并且这两部分档案工作都要事先数字化。当前我国的档案馆藏已经非常丰富了,根据相关预测,到2020年时,档案馆藏卷数可能会超过6亿卷,并且随着我国档案工作的继续开展,档案资源还将进一步丰富。在大数据时代,电子档案的增长复读也会继续加快,并且包含的内容十分丰富,一方面包括电子文件和相关的影视音频资料,另一方面也包括那些在纸质档案时代进行保管的原始档案资料。但是随着信息技术的发展,很多过去我们无法利用到的档案形式也会相继被发掘出来,例如浏览记录和来访记录等等,所以档案数据正在以前所未有的速度增长。
(二)档案资源的分布范围更加宽泛
随着大数据时代的到来,档案管理工作也突破了原有的局限性,信息资源在分布上呈现出了更加广泛的趋势。当前人们对于数字资源的利用率正在不断提高,这使得数字资源的发展速度正在不断加快,当前也不断有越来越多形式的移动社诶投入使用,产生数据的方式更为多种多样。通过上文的总结,我们就可以看出,在大数据时代进行的档案管理工作,由于其涵盖面更为广泛,所以难度也有所提高了。而结构化的信息和非结构化信息之间互相形成了融合,数据结构上存在较大的差异。
(三)数据资源可靠性得到提高
对于数据资源来说,人们往往非常重视其可靠性和真实性。在当前大数据背景之下数据的密度得到了很大的提高,所以人们就更加容易获取信息。在当前很多人在不了解事实的时候通过查阅资料来达到目的,并且以此为基础进行判断,从这个角度上看,信息资源的真实性将会直接决定人的判断能力是否准确。而档案就其性质来说,其真实性也是毋庸置疑的。所以在当前大数据的背景之下,相关工作人员也要完善自身的知识体系,完善整个档案管理的开发工作和管理工作,这样才能让档案管理工作更加具有价值,给人们带去更为真实的信息。
二、数字化档案资源的整合中的难点
(一)数据存储间题
在大数据时代,档案数字资源整合的首要挑战来自数据存储。一是档案管理系统在面对海量数据时需要高可扩展性的支撑二而目前集中式的数据存储和管理模式非但资金投入较大,更无法适应档案数字资源体量激增的新情况,在档案数字资源的高效存储和快捷访间方面面临严峻挑战。二是目前基于关系型数据库研发的档案管理系统无法适应大数据时代占数据总量80%以下的非结构化数据存储和处理的需要。
(二)数据分析间题
大数据时代是一个泛在信息、泛在知识的时代,随着信息化程度的加深,档案数字资源的来源结构将发生巨大变化,传统的基于封闭的结构化数据进行的数据挖掘算法在分析处理非结构化数据时存在局限。而且,要获得大数据分析的价值,就应关注档案数字资源中的数据关系和语义表征,实现信息整合与知识整合。
三、解决问题的对策
想要解决资源整合问题,就需要对档案数字资源的管理工作进行相关改进。工作人员需要灵活应用云技术和数字处理技术,来提高档案部门的工作效率。
大数据时代赋予了档案数字资源新的特征,因此要实现其整合在很大程度上考验着档案基础数据的质与量。这就要求档案工作者突破固有狭义的档案资源观的局限,在大数据技术和理念的指引下,积极构建适应大数据时代的“大档案观”。即要从“社会记忆”的高度重新审视档案数字资源的构成范围和收集视角,改变过去以党政机关文书档案为主体的收集模式,加大对社会民生、对个人等复杂化、碎片化信息的关注,使档案能真正反映政治、经济、科技、文化、社会生活等的全貌,反映国家和社会的实时变迁。
从技术上来说,实现大数据时代档案数字资源整合的关键是要建立适应大数据要求的档案数字资源分析生态系统,这就需要云计算技术与大数据处理工具的协调配合。云计算(CloudComputing)技术具有虚拟资源池化、高可扩展性、高可靠性、按需付费、泛在接入等显著的特征。它适应了大数据时代分布式存储与海量数据并行处理的需要,实现了计算机资源的服务化,是大数据时代挡案数字资源整合的基础平台和支撑技术。结束语为适应大数据时代的发展趋势,档案数字资源整合工作必须得到有效的保障。
四、结语
在当前大数据时代的背景下,运用数字资源对档案进行整合已经被提上了日程,所以档案管理人员应该从当前的管理工作出发,积极寻找现行工作方式中的缺点和不足,并且进行完善,才能保证我国档案管理工作的先进性,适应当前时代的需要。
参考文献:
[1] 周峰林.大数据时代的数字档案馆(室)建设——专访国家档案局档案馆(室)业务指导司司长孙钢[J].浙江档案.2013(08)
[2] 楊冬权.关于随馆藏数量增加而相应增加各级国家档案馆人员编制的提案[J].中国档案.2013(04)
[3] 王飞跃.知识产生方式和科技决策支撑的重大变革——面向大数据和开源信息的科技态势解析与决策服务[J].中国科学院院刊.2012(05)