APP下载

浅谈大数据背景下的档案馆建设

2016-05-30杨加勇

西江文艺 2016年10期
关键词:档案馆大数据建设

杨加勇

【摘要】:大数据是继云计算之后近年来信息技术领域最热门的话题之一。档案部门在大数据的背景下,将是未来的发展趋势,是值得思考和重视的新问题。这里结合工作实际,粗浅谈谈大数据背景下的档案馆建设。

【关键词】:大数据;档案馆;建设

一、大数据是价值观、方法论和通往未来的钥匙

社会已经处于互联网、移动互联网时代,数以百亿计的机器、机关、团体、企业、个人都会随时随地通过网络获取信息,并成为信息的制造者和传播者。在这个时代,不仅数据量呈现爆炸式增长,同时种类繁多。对于这些数据的收集、存储、挖掘,既是时代难题,也是时代机遇。

二、大数据时代来临对于档案馆的冲击

“档案馆”顾名思义是管档案、用档案的地方。档案馆的核心是档案载体所承载的信息。如果把档案所承载的信息换算成数据,在大数据时代来临的背景下,值得关注的问题很多,冲击将是不可避免的,也是巨大而全面的。

首先是思想观和思维方式。传统档案馆习惯于大门紧闭、坐等上门、被动服务、档案要少而精,在大数据时代显然不合时宜。大数据时代对于以“守”为主的传统档案思想观和思维方式的敲打将是多角度、深层次的。

其次是目标定位。在大数据时代来临的背景下,原有的目标定位不能停止不动,而应该水涨船高。区别的分水岭是坐守外部推动,还是主动内部发力。宏观的谋划、微观的切入与主观的态度,都需要有一个精确的算计和考量。力量应该来源于思辨的透彻、实践的提炼与技术的整合应用。

其三是发展路径。建设适应大数据背景下的第四代档案馆,路要一步步走,基础很重要。进入21世纪以后的头十几年,面对社会信息化的浪潮,中国档案部门的思维焦点主要是档案信息化、档案数字化、电子档案管理和数字档案室、数字档案馆建设。其发展的速度快,成绩大,效果显著。档案馆也不能仅仅满足于现有技术条件下的档案信息化、档案数字化和数字档案馆,而应该在新技术的基础上寻找新的出路与航程。总体上,大数据时代的来临已经和正在对社会方方面面产生深刻而持久的影响,档案部门对此应该保持高度的清醒和警觉,并学习应用大数据的预测工具和方法,及早提出应对的思路和策略,部署新的规划和措施,最大限度地争取主动,避免陷入“猝不及防”的边缘化风险。

三、智慧档案馆是适应大数据时代要求的档案馆

档案馆建设的实践脉路大体可以分为4个不同的阶段。一是实体档案馆。档案馆作为一种社会实体,存在的历史由来已久。实体档案馆以档案馆建筑实体为标志,侧重于传统档案的实体管理。二是智能档案馆。20世纪80年代,建筑界提出了智能建筑的新概念。它是现代计算机技术、通信技术、控制技术发展和相互渗透的结晶。所谓智能建筑,是指将计算机、通信、办公自动化、保安监控、防火等技术有机整合在一起的高新技术建筑综合体。只要是按现代管理方式运作的行业,它的建筑都有智能建筑的要求。智能档案馆是现代智能建筑的伴生产物。由此可见,所谓智能档案馆,侧重于建筑硬件的智能化、自动化、集成化,是对传统实体档案馆的一种现代化升级。智能档案馆比传统实体档案馆的高明之处在于融入了现代建筑思想,突出了技术进步对于档案馆建筑设计的巨大贡献。但并没有脱离传统实体档案馆的窠臼。三是数字档案馆。数字档案馆,也可以称为虚拟档案馆,是与实体档案馆的一种对称,所谓数字档案馆,是指以实体档案馆为基本依托,以智能档案馆为基本支撑,以电子档案为基本对象的一种新型档案馆形式,是基于电子档案产生而带来的档案管理与服务的大变革,是档案馆事业发展一个新时代的跨越与标识。四是智慧档案馆。智慧档案馆是适应大数据背景下的第四代档案馆,是继数字档案馆之后档案信息化发展的高级形态。智慧档案馆借鉴了智慧地球、智慧城市的理念。智慧檔案馆的目标则是应用新一代信息技术及相关工具和方法,最大限度地提高档案资源的整合建设能力和开发服务能力。

四、智慧档案馆的最好解释与关键节点

智慧档案馆的最好解释是“聪明”。“聪明”的标识是不仅能让机器“说话”,而且能够通过机器的深度学习听懂人的语言,看清人的手势,理解人的意图,并恰如其分地提供令人满意的服务。

智慧档案馆的关键节点主要包括以下几个方面:一是大数据的来源。二是大数据特征的认知。首先是数据量要大,同时要注重数据的完整性。三是大数据技术的运用。大数据应用的领域非常广阔,前景也十分光明。但目前大数据技术的运用仍存在一些困难与挑战,主要体现在大数据挖掘的四个环节中。首先是大数据的收集。要对来自网络包括物联网和机构信息系统的数据附上时空标志,去伪存真,尽可能收集异源甚至是异构的数据,必要时还可与历史数据对照,多角度验证数据的全面性和可信性。其次是数据存储。要达到低成本、低能耗、高可靠性目标,通常要用到冗余配置、分布化和云计算技术,在存储时要按照一定规则对数据进行分类,通过过滤和去重,减少存储量,同时加入日后检索的标签。第三是数据处理。有些行业的数据涉及上百个参数,其复杂性不仅体现在数据样本本身,更体现在多源异构、多实体和多空间之间的交互动态性,难以用传统的方法描述与度量,处理的复杂度很大,需要将高维图像等多媒体数据降维后度量与处理,利用上下文关联进行语义分析,从大量动态而且可能是模棱两可的数据中综合信息,并导出可理解的内容。第四是结果的可视化呈现,使结果更直观以便于洞察。现有的数据挖掘算法在不同行业中难以通用。这些困难与挑战在智慧档案馆的建设进程中将会显得更加突出和集中。

参考文献:

[1]郑燃,唐义,戴艳清.基于关联数据的图书馆、档案馆和博物馆数字资源整合研究[J].《图书与情报》.2012年1期.

[2]周枫.资源·技术·思维——大数据时代档案馆的三维诠释[J].《档案学研究》.2013年6期.

猜你喜欢

档案馆大数据建设
自贸区建设再出发
基于IUV的4G承载网的模拟建设
《人大建设》伴我成长
保障房建设更快了
全省部分档案馆新馆掠影
基于大数据背景下的智慧城市建设研究
太仓市数字档案馆成为“全国示范数字档案馆”
when与while档案馆
科隆档案馆突然坍塌