APP下载

档案与大数据关系之我见

2015-06-25张丹

档案管理 2015年4期
关键词:离线记忆利用

张丹

随着全球信息化进程加快,大数据是继云计算、物联网之后到来的社会信息化的又一产物,是社会信息化的必经阶段,与同是信息领域的档案工作有着必然联系,我们应该利用大数据完善发展档案工作。但同时却有一些档案界学者认为大数据与档案毫无关系可言,两个是属于不同性质的事物。本文认为,大数据与档案,同属于信息领域的两个名词,必然有着不可切断的联系。本文将从三个方面来论证档案与大数据有着紧密关系。

1  档案与大数据同属信息领域

中国人民大学冯慧玲教授给予档案的定义是:档案是社会组织或个人在以往的社会实践活动中直接形成的具有清晰、确定的原始记录作用的固化信息。 这也就意味着档案是信息的一部分,与大数据有着密不可分的关系。反过来讲,对于大数据的定义,企业和学术界目前尚未形成公认的准确认识,维基百科将其定义为“无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合”。从概念上讲,大数据与档案一样产生主体皆为人,也都是在具体实践活动行为中产生,而且两者类型多样,同样包含着文字、图像、视频、音频等多种形式。两者也同样具有极高的价值,传统档案的价值在于它的凭证性和参考性,而大数据存在的最终价值是能够预测。如: google流感趋势利用搜索关键词预测禽流感的散布等。档案遇上大数据后,档案价值将延伸到能够社会化利用,不仅仅是作为凭证与参考存在。

2  档案与大数据同是社会记忆

有些学者认为档案是清晰明确的,具有原始记录性的,它从产生之初就被各种标准框架相约束,是一个规范的、完整的信息集合,而大数据的产生是零散的、碎片化的信息,毫无规范可言。从这个角度讲,确实毫无关系。但本文认为档案之所以规范,是因为有标准规范的档案工作对其进行收、管、用等管理,有管理的意识存在。而大数据之所以杂乱,是因为它自从产生就无人管理。再加上大数据中大部分信息属于原生数字信息资源,其存在的载体为数字平台,此载体上的信息容易形成、复制、传播与销毁,易于受到外来攻击等导致大数据的杂乱、不规范、不标准,无管理的意识存在,这才造成了两者存在状态完全对立的状态。就如上文所说,大数据产生的主体是人,这些数据是对人类生活和客观世界的测量和记录,涵盖了人们生活的各个方面,它不仅是人们发表的随身小记录,更是整个大社会的记忆库。然而近些年来,档案工作也将社会记忆、集体记忆观念纳入理论框架和实践范畴,越来越自觉地参与集体记忆的构建、维护与传承,认为档案也是社会记忆的一部分。毋庸置疑,社会记忆是零散的,它是每个个体产生的零碎信息,但其又体现社会记忆的具有重要价值,是珍贵档案的一部分。

3  档案与大数据互相包含

有些学者认为大数据属于在线数据,而不包含离线数据,因为在线数据是开放的,能够分析利用且创造更多财富价值的数据。而离线数据是不公开的,其价值也具有出入性和针对性的,且基本无财富可挖掘的数据,比如银行内的客户数据。因此,他们认为,大数据是有价值可以创造财富的在线数据。但本文认为这是相关IT企业对大数据的片面认知,此认知只是有利于相关企业能够更好地利用大数据创造更多价值,而并没有参透大数据真正的意义。大数据之所以称“大”,是因为它容量之大,种类之多;之所以称为“数据”,是因为每天所产生的一条数据相对于该天产生的总量来说就如同传统意义上的数据一样渺小,它应该同时包括在线数据和离线数据。另一方面,档案中有公开可利用的档案,也有绝密不可公开的档案,若依照上文所说,档案的利用人群确实有针对性和出入性,看起来并无关联。但档案无论公开与否,它们都具有极高的价值存在,况且有些机密性档案的价值并不是可公开档案的价值所能比拟的,如国家机密档案,从斯诺登的“棱镜事件”就可看出国家机密的重要性。如此说来,前后具有矛盾。因此,本文认为,大数据应包括在线数据和离线数据,当然档案也包含于大数据之中。档案中也应保存有大数据中有长久保存价值的数据,二者相互包含,有密切的联系。

档案工作从古至今就一直存在着,它不断地发展、不断地更新,如今大数据的出现又可以为档案工作注入新鲜的血液,使它焕发生机,更好地为档案事业服务。

(作者单位:上海师范大学人文与传播学院信息管理系  来稿日期:2015-04-18)

猜你喜欢

离线记忆利用
利用min{a,b}的积分表示解决一类绝对值不等式
异步电机离线参数辨识方法
呼吸阀离线检验工艺与评定探讨
浅谈ATC离线基础数据的准备
利用一半进行移多补少
利用数的分解来思考
Roommate is necessary when far away from home
离线富集-HPLC法同时测定氨咖黄敏胶囊中5种合成色素
记忆中的他们
记忆翻新