APP下载

论“大数据”背景下的档案工作现状

2019-04-23冯晓霞冯晓玲

文艺生活·下旬刊 2019年2期
关键词:档案馆大数据信息

冯晓霞 冯晓玲

摘要:2012年“大数据”一词被介绍到中国,如何在大数据时代取得更大的发展,成为社会各界探讨的热点。大数据对各行各业的发展带来了巨大的影响,档案工作也不例外。本文主要介绍了“大数据”的内涵,从大数据的概念、价值作用以及大数据的特点三个方面介绍大数据,在此基础上,结合现阶段档案工作馆的发展,对大数据背景下档案工作馆遇到的机遇和挑战做简单的分析,真正了解大数据对档案工作发展的影响。

关键词:大数据;信息;档案馆

中图分类号:G271 文献标识码:A 文章编号:1005-5312(2019)0b-0284-01

一、“大数据”的概念

(一)“大数据”的概念

大数据不是对数据量大小的定量描述,而是一种在种类繁多、数量庞大的多样数据中进行的快速信息获得。大数据是结构化数据、半结构化数据与非结构化数据的总和,是对海量数据的管理;大数据的核心是海量数据的决策,日常生活中智能设备、物联网、社交网站等产生的半结构化数据、非结构化数据量远远大于在学习、工作中产生的结构化数据。如何处理这些半结构化数据与非结构化数据成为大数据的主要业务与内容。

综上所述,大数据的概念可以总结为:大数据是指通过对结构化、半结构化、非结构化数据的挖掘、分析,进而为社会决策提供数据依据的一种数据研究。

(二)“大数据”的作用、价值

通过对大数据概念的理解,可以归纳为以下几个方面:一是通过数据的分析、挖掘,为企业的可持续发展做出科学预测,减小企业发展风险,实现企业的科学发展。为社会经济的发展提供科学的分析依据。二是对用户的研究分析,从海量数据中的深度分析,挖掘利用者的行为习惯和爱好,充分了解利用者的需求。三是有助于提高信息安全,为信息安全部门应对安全威胁提供有效途径。四是通过对公共大数据的分析、挖掘,可提高公共机构的执行能力,减少错误数据的负面作用,帮助政府节省开支,为政府决策提供可靠依据。

(三)“大数据”的特点

业界认为满足“4V”(Variety、Velocity、Volume、value,即种类多、流量大、容量大、价值高)指标的数据才可称为大数据。

1.容量大:数据量级已从TB(1012字节)发展至PB乃至zB,可称海量、巨量乃至超量。

2.多样化:数据类型繁多,愈来愈多为网页、图片、视频、图像与位置信息等半结构化和非结构化数据信息。

3.快速化:数据流往往为高速实时数据流,而且往往需要快速、持续的实时处理;处理工具亦在快速演进,软件工程及人工智能等均可能介入。

4.价值高和密度低:以视频安全监控为例,连续不断的监控流中,有重大价值者可能仅为一两秒的数据流;360。全方位视频监控的“死角”处,可能会挖掘出最有价值的图像信息。

二、“大数据”背景下的档案工作馆现状

(一)大数据背景下档案工作现状

档案工作是一项基础性的工作,是对各类信息的综合管理。随着社会的发展,档案工作的对象和工作内容都在不断地发展改进,档案的范围从纸质档案扩展到了音像档案、电子档案,档案工作的方式也从手工扩展到了计算机,这些变化都展现出了档案工作与时俱进的特性。然而目前在计算机技术快速发展的背景下,档案工作的发展出现了一些问题,这些问题或多或少地影响了目前档案工作的发展。

(二)电子档案的管理水平参差不齐

计算机应用已经渗透到了各个方面,电子文件、电子档案已经在各个行业中得到了广泛的运用,然而关于电子档案的收集、归档等基础性工作却没有得到良好的指导和规范,导致大量电子文件、电子档案信息资源的流失。各单位对电子文件、电子档案的收集、归档流程、规范都有所不同,导致目前电子档案的管理水平良莠不齐。

(三)档案信息资源建设发展缓慢

在大数据背景下,档案信息资源的建设更加需要综合各类档案信息,只有将档案信息资源池建设好,才能够进一步地建设数字档案馆,才能够发挥档案信息资源的真正价值。

(四)大数据背景下的档案工作多体现在硬件设施的现代化,而缺乏对档案工作实质性地改革

档案人员信息处理能力不足,综合性档案人才缺乏。

当前档案工作大多还停留在传统档案工作模式中,档案资源的开发利用也多是以档案汇编、档案编纂资料的形式开展,并没有很好地利用网络、计算机技术、大数据技术对档案资源进行深度地分析整合。如何将档案信息资源进行深度的开发,不仅是对档案馆存储能力提出更高的要求,更对数据的分析、挖掘能力提出更生層次的挑战,如何从如此复杂大量的数据中找出有效的信息,分析出有效的数据,为用户提供更加准确的信息服务都将是档案工作馆面临的新问题。

猜你喜欢

档案馆大数据信息
全省部分档案馆新馆掠影
太仓市数字档案馆成为“全国示范数字档案馆”
when与while档案馆
科隆档案馆突然坍塌