大数据时代背景下数字档案馆建设的分析
2019-09-10李华
李华
摘 要:随着我国大数据时代的到来,数字档案馆建设成为现阶段的重要发展目标之一。在数字档案馆建设中必须认真分析档案资源建设的重点,加强人才培养。本文叙述了大数据时代背景下,数字档案馆建设中存在的问题,提出了解决问题的对策,对当前数字档案馆建设提供了建设性意见。
关键词:大数据;数字档案馆;模式建设;对策
随着我国大数据技术的快速发展,传统的档案馆已经不能满足现阶段的发展需要,利用大数据技术,建设数字档案馆,是适应我国经济建设发展的重要手段。在大数据时代背景下,数字档案馆的管理体系、管理模式、管理理论等都发生了极大的变化,在数字档案馆建设过程中,如何充分发挥大数据的作用,为广大用户提供优质、高效的服务成为现阶段数字档案馆建设的重点。
一、大数据时代背景下对数字档案馆建设的影响
在建设数字档案馆工作中,随着大数据时代的到来,数字档案馆的数据结构和体系结构都发生了巨大的变化,因此,要充分运用大数据技术来对档案进行数据化分析。
关于大数据,维基百科的定义是:由数量巨大、机构复杂、类型众多数据构成的数据集合,是基于云计算的数据处理与应用模式,通过数据的整合共享,交叉复用形成的智力资源和知识服务能力。尽管目前大數据还没有统一定义,但对其存在一个共识:大数据不是对数据量大小的定量描述,而是一种在种类繁多、数量庞大的多样数据中进行的快速信息获取和应用。
1.大数据的种类及特点。大数据的类型大概包括以下几种:(1)数字化数据:扫描并借助光学字符识别转化而成电子形式的传统文献数据,其主要存在与国家和地方的档案、图书等文献数据资源库中;(2)自然数据:即直接形成用于计算机和数据处理系统的数据,其主要存在与应用程序、管理平台、交易系统、数据库、电子邮件、公众网络、社交媒体及GPS定位系统中;(3)模拟数据是从物理世界发散出来但可以不断被转化成数字格式的,其主要存在于手机、相机、摄像设备、传感器以及可以穿戴设备中。以上数据以实时、迭代的方式不断生成、转化和融合。
2.档案大数据的获取。数字档案馆的信息资源与大数据在内容价值上是相互交叉的。一方面,数字档案馆的信息资源是大数据的重要组成部分。因为数字档案资源最重要的特点是有机联系,而大数据的主要特点也是相关性,因此,本身即存在有机联系或存在潜在联系的数字档案资源是大数据精华的一部分。另一方面,大数据又可以划归为数字档案资源的理论范畴内。因为大数据也是国家机构、社会组织或个人在社会活动中直接形成的各种形式的信息记录。如,收集运营商掌握的人们实时通信记录,金融行业掌握的国家、机构和个人资金交易记录,网络服务商掌握的人们各种社会交往、交流记录,监视器留下的人们行动的信息记录等,这些都是大数据内容,而从“大档案”的角度看,这些大数据又是数字档案资源的组成部分。
由于数字档案馆里的数字资源内容较多,各不相同,过去的数字档案馆资源类型主要是档案数字化后形成的图像数据和以数据库为载体的机构化数据,而大数据时代非结构化数据大量产生,如各种格式的文档、文本、图片、报表和音视频信息等,数字档案资源的类型越来越复杂多样,管理难度也不断增加。在实施过程中,要充分考虑到数字档案馆的数据结构类型和实效性要求。在数据结构上,要满足各种数据结构的要求,能够同时的支持定期同步或者数据实时共享的要求。另外,在大数据的背景下,要满足数据的抓起和数据的实时推送的要求。
3.档案大数据平台的建设。由于数字档案馆的资源众多,结构复杂,采用大数据技术进行相关内容的获取后,如何保存相关的海量数据,是建设数字档案馆需要重点考虑的内容。因此,在档案大数据平台的建设过程中,需要建立起大量的异构异质数据的底层存储以及分布式的系统架构,当数据存储容量超过服务器的承载能力时,数据存储平台能够满足可扩展和可用性的要求,同时档案大数据平台要具备大数据分析和应用等功能。
4.档案大数据的分析。在数字档案馆建设中,由于不同的档案数据所存储的价值是存在着一定的差异的,在使用过程中,不可避免的会增大用户获取有价值信息的难度,这就要求在大数据的技术背景下,能够对档案信息进行及时的区分和联系,多方面、多角度对数字档案进行分析和挖掘,改变数据提取过程中的方式,充分发挥大数据的相关特性和优势,支持对各种数据的聚合分析,改进数字档案业务的流程。
5.档案大数据的应用。在档案大数据的应用过程中,要在保证档案数据真实性的基础上,针对档案业务中的难点,在档案数据建设中加以规范化处理,使数据结构和档案业务能够满足大数据的需求,实现数字档案馆相关数据的关联分析、档案数据查询等功能。同时,为了更好地满足数字档案查询结果的多角度、多层次、多样性分析,可以加强数字档案馆建设过程中的可视化技术的应用等,从而保证数字档案馆建设的合理性,提高公民的档案诚信度,实现数字档案馆的优化配置。
二、数字档案馆在大数据时代面临的挑战
在大数据时代背景下,数字档案馆面临着新的发展机遇的同时也面临着新的挑战,主要体现在两个方面:一方面,在数字档案馆大数据平台下,如何采用大数据处理手段和工具实现对于数字档案馆的简单化管理和自动化管理。另一方面,在数字档案馆建设中,实现档案大数据专业化、可视化处理,才能充分挥出大数据所带来的潜在价值,只有通过数据处理来增加相关数字档案的价值,才能实现数字档案馆在大数据时代背景下快速的发展。
三、大数据时代背景下,数字档案馆建设存在的主要问题
1.统筹规划力度不足。总体来说,在大数据时代背景下,数字档案馆建设缺乏相关的指导文件和标准化规范,致使在建设过程中不能够实现资源的充分利用,建设的标准参差不齐,各地数字档案馆建设水平也存在着较大的差距,同时,一些数字档案馆在建设过程中过分地重视数字化建设而轻视数字档案内容的建设,使后期在数据处理与挖掘过程中无法充分发挥数字档案的自身价值。
2.人才结构有欠合理。数字档案馆内的资源较为丰富,类型众多,大数据时代背景下对档案工作者处理数据、分析数据和挖掘数据的能力提出了更高的要求,而在一些数字档案馆中,受人員结构等因素的影响,缺少专业的档案管理人才和计算机人才,数字档案馆建设工作很难适应现代化的要求。
3.技术应用尚不深入。目前,虽然部分地区数字档案馆建设水平较高,但在大数据时代下,相关技术的应用尚不深入,没有实现一体化管理,高新技术的缺失,造成了数字档案的应用不能满足现阶段的工作需求,难以应对大数据时代背景下海量数据压力。
4.资源组织有待加强。在大数据时代背景下,我国大部分数字档案馆由于客观条件和技术上的不足,电子文件没有进行及时存储、归档、接收,普遍存在馆藏数字档案资源内容不丰富,门类不齐全,在档案资源开发过程中缺乏一定的深度和广度,从而使各级数字档案馆的档案资源难以实现有效的整合、共享。
5.信息服务亟需推进。我国数字档案馆档案服务中虽然取得了一定的成效,但存在数字档案资源结构单一,数据发掘的深度和广度不够,难以实现知识的转化,数字资源利用仍然停留在简单的数据查询上,同时在档案网站的在线信息服务过程中,一定程度上降低了数字档案资源的竞争力。
四、大数据时代下数字档案馆建设策略
1.明确知识提供者的身份。在数字档案馆建设中,要对知识提供者的身份加以确认,从大众思想上改变数字档案馆的职能定位,在档案的管理上充分实现知识的共享与利用,发挥出数字档案资源自身价值,实现数字档案更好的服务社会大众。
2.构建高效的知识提取系统。在数字档案馆建设过程中,可以充分利用大数据的特征提取技术来更新数据档案产品的种类,及时推送给需求人群,使数字档案馆充分发挥自身的馆藏特色,发挥出自身产品的优势。这就需要在数字档案馆建设过程中,建立知识提取系统,做到客户所需就是自身需求,同时在各个数字档案馆之间实现数据之间的共享,相互取长补短,实现真正的大数据管理。
3.制定统一的数据标准。在大数据时代背景下,各数字档案馆之间实现资源共享的前提就是使用统一的数据标准,同时各数据库要相互的兼容。这就要求在数据交换过程中,要确保资源交换过程的数据安全,统一电子资源格式,在数据提取过程中确保数字档案馆数据的质量,制定大众需求的共同资源转化及时,在统一管理中推进数字档案馆的顺利建设。
4.与平台提供商共赢发展。在数字档案馆建设过程中,要充分发挥出自身的数字资源的优势,在与平台提供商的合作过程中,运用现阶段的思维管理理念,构建多种档案服务体系,充分推进档案服务工作向知识化服务的方向改变,从而提高档案的利用效率,充分发挥出知识对于社会发展的促进作用。
五、结论
综上所述,数字档案馆建设仍然存在着许多问题,大数据时代为数字档案馆建设提供了新的发展机遇和挑战,因此,在现阶段的数字档案馆建设过程中要做好统筹规划、合作机制和人才培养工作,从而实现数字档案馆的可持续发展。
参考文献:
[1]段 丽.大数据时代背景下数字档案馆建设的思考[J].城建档案,2017(03):17-18.
[2]黄少芳,刘晓鸿,孙 玲,朱青峰.初论大数据时代地质资料信息集成与服务[J].中国矿业,2016,25(02):170-172.
[3]周耀林,朱 倩.大数据时代我国数字档案馆的建设与发展[J].信息资源管理学报,2015,5(02):108-113.
[4]宋美霞.大数据背景下数字档案馆信息服务研究[J].档案管理,2015(02):45-46.