浅析档案数据在大数据背景下的保全
2021-12-06廖梅
廖梅
摘要:在大数据时代,传统的档案存储思维无法满足互联网环境下的实际存储需求。因此,本文讨论了传统档案的存储与互联网环境下档案数据的存储之间的概念差异,阐明了档案数据保全原理和技术思路。在大量数据的背景下,档案归档工作必须以数字保全为基础,从传统的档案存储工作转向数据保全,因为这两者之间的关系从根本上改变了档案归档的基本属性。
关键词:档案数据;大数据;保全
1 绪论
大数据时代的到来对人类生存的本质和虚拟空间产生了戏剧性的影响。个人和组织之间的关系界限及其自身权利越来越取决于确定和维护个人和组织的数据主权,特别是在司法有效性和数据存储原创性的背景下处理档案数据,这与个人是否参与网络虚拟空间中的身份确认和行为识别等一系列活动直接相关。这样,个人存在状态和运行痕迹的大数据肖像进而整个时代的社会记忆就被编制出来了。
本文以物联网为基础,论述了保全档案数据的内涵、保全档案数据与传统保全档案数据的区别以及保全档案数据的基本原则和技术思路。
2 档案数据保全概述
本文认为数据保全的概念可以理解为保全存档数据。在此基础上,首先要理解归档数据和数据保全的概念。数据是档案科学领域的热门术语。档案资料在中国“十一五”档案发展规划纲要等官方文件中多次提及。在科学研究领域,关于档案数据的讨论越来越热烈,档案数据的概念不仅包括生成的档案数据,如物理档案的数字化改造结果还包括以实时生成的原始数据为形式的档案数据。这样做时,归档数据随着其多来源和异构特性的进一步发展,不仅包括归档内容、结构、背景数据,它还应包含来自存档业务的相关数据,但没有集成到管理系统中的完整数据。例如业务系统数据、历史数据、过程数据、应用程序数据和重要数据。
总的来说,现在讨论的档案数据应该是综合体的通用名称,而不仅限于具体内容,还包括数据本身及其相关环境和信息收集。在电子数据保全研究中,“保全”一词常常被理解为重点应放在电子数据的整合和存储上,并检查和确认其内容的真实性和可靠性。保全数据可以从这个想法中吸取教训,确实有必要在整个过程中使用整合前端管理和动态维护的想法。因此,本文指出,存档数据的存储可以理解为归档部根据归档记录本身及相关属性信息,利用相关技术对特征进行分析,预先提取并标记数据,并实时跟踪数据本体或数据标签,以确保管理和维护归档数据资源的原创性、真实性、安全性。
3 档案数据保全的原则
3.1 用户需求原则
档案数据保全必须满足用户作为目标的需求,并满足不断变化的社会需求。因此,能否满足用户需求,是评估和验证存档数据完整性的标准。因此,档案数据管理和维护系统必须以需求为导向,首先,目标是使用户的需求易于理解,并对其进行充分地研究和分析。其次,必须将系统中每个层的定位分开,使整个系统协调有序;最后,必须建立有效的反馈和评价机制,及时接受用户的评价和反馈,并对系统进行优化和调整。社会和用户的需求贯穿于保全归档数据的整个过程。
3.2 政府主导第三方参与原则
中国的档案工作有很强的行政领导和集中领导力。档案本身是档案资源最重要的“收藏者、管理者和服务提供者”。互联网治理不是政府主导的模式,但也是政府宏观管理现代化体系的重要组成部分。档案工作必须注重政府管理的宏观现代化,并开始协调数据管理的标准。国家对制度建设、资本、人力和物力的倾向支持,对于提高档案机构能力、稳定资源主导地位、有效实施档案数据保全、实现长期、稳定和可持续发展目标具有重要作用。目前,国内外第三方组织正在利用其在归档数据、维护和保全归档数据方面的独特优势,相互促进,共同推动发展。
4 档案数据保全技术思路
为了确保上述归档原则的实现,我们可以从数据保留技术、数据安全技术和数据可信度技术等各个方面实现归档数据的保全。值得注意的是,这些技术的使用通常侧重于传统文件保全和文件数据存储在大数据方面的区别:传统文件保全强调微观文件保全者(档案或其他机构)的秘密工作和文件管理,以及由真实性引发的可信任问题而且背后的逻辑是由规章制度形成的。
本文分析了档案数据在物联网背景下的行为,强调档案数据本身与互联网海量数据外部环境之间的关系可以从数据本身和技术层面进行快速、高效、高密度的管理。从而使其信任网络的较低层次认识到互联网的开放共享机制,并以分布式数据处理、数据冗馀、数据安全等技术为基础,保证互联网生态的稳定发展,特别是Bt Chan等新技术和量子通信应运而生。从而为这一思路的实现提供了有效的保障。
4.1 数据安全性技术应用思路
隐藏数据是一种隐写方法,用于识别版权、注解和其他内容。数据加密技术得到广泛应用。为了解决存储、处理和传输过程中非法访问和操纵存档数据的问题,它提供了硬盘加密技术以及IP加密、VPN加密、SSL加密和其他协议标准,以确保数据的安全传输。数字指纹也称为SHA,是一种未加密的算法,可确保传输的文件没有被篡改,生成一个伪装的数字指纹,并评估文件是否被篡改,网上档案数据保全也强调信息安全技术的应用,但其技术思路和手段更注重捕捉互联网的动态特性。
4.2 数据有效性技术应用思路
文件归档过程中的数据有效性技术主要包括数据时间戳和数据签名技术。传统归档是基于存储在计算机硬盘上的图像文件、关机前存储的所有信息、在收集归档数据期间获得的数据、管理人员每天记录的归档数据的副本等的临时标记,以确保归档数据内容变化的技巧,并确保数据的可靠性。数据签名技术旨在改变由行为权威和利益相关者的权利声明引起的数据可信度。在海量数据环境下,保全归档数据更加重视各种协议技术的应用,也就是说,在保全归档数据的过程中,数据时间戳技术的应用必须基于网络系统中不同类型的操作协议、安全协议或应用协议动态生成的互联网指纹,并动态详细地记录存档数据的执行信息、授权变化等可能影响数据有效性的参考信息。例如可以结合数据签名检查归档数据传输过程中日志文件的完整性和一致性,以避免危及归档备份系统和数据有效性的不正常操作,如伪造IP地址和管理帐号。
5 小结
传统时代档案材料的存储或保管与大数据条件下存储数据的保全之间的根本区别可以归纳为保全为今后使用的,几者之间的关系还没有达到范式转换的水平,这是由于存储时间的变化而形成的概念升级。传统的密封强调了在各种物理存储和通信环境限制下存储库管理的性质,而在数据量大的环境中存储的数据则强调初始准备。智能识别和监控整个数据存储过程基于多种在线数据技术,即存储数据过程的真实性和可靠性。通过internet功能(即存储数据)连接所有内容,强调集中资源的访问和控制,而存储数据则遵循分散的internet概念,并强调数据或管理节点之间的交互作用。新的信任关系和第三方的广泛参与是其发生和发展的重要因素。
互联网对人类社会的渗透彻底改变了人们和社会互动的方式,记录和描绘人类行为和社会发展痕迹的一项重要任务将是档案人员的长期使命。不同的是,记录工具已从归档切换到电子环境中的其他归档数据。我们必须面对这种大数据时代带来的颠覆性理念和实践创新,不要屈服于技术创新的威胁,不要专注于数字化过程,从保全档案数据入手,面对原始档案文献证据在物联网环境下面临的信任网络变革等新挑战,坚守学职阵地。
参考文献
[1]周烁奇. 单套制环境下档案数据保全研究[D].苏州大学,2020.
[2]王婧逸.數据保全视角下电子文件单轨制管理模式研究[J].档案与建设,2020(02):26-29.
[3]余亚荣.全国档案数据保全高端学术研讨会综述[J].中国档案研究,2019(01):250-253.
[4]李洪湖.档案数据安全存储及智慧监管平台建设实践分析[J].浙江档案,2017(02):58.