大数据时代电子文件档案化过程管理研究
2022-05-30李耀斌
摘要:大数据时代,电子文件的规模越来越大,档案管理从“管文件”迈向了“管数据”。从电子文件到电子档案之间还需要经历电子档案化过程,才能使电子文件真正成为电子档案。本文首先分析了电子文件、电子档案和电子档案化的内涵及区别,指出了电子文件档案化的现实必要性,并进一步探讨了电子文件档案化过程的具体措施,是大数据时代电子档案管理的有益探索。
关键词:电子文件;电子档案;大数据
概述
随着5G、云计算、物联网、大数据、人工智能等数据信息技术的快速发展,全球数据流量呈现出几何级增长之势。《中国大数据白皮书(2020)》公布的数据显示,2020年全球产生的数据量达47ZB(1ZB=10万亿GB),到2035年将达到2142ZB,中国产生的数据量将达到全球数据量的1/5,人类已经步入了大数据时代。大数据时代,电子文件、数字资源、信息资源都给传统档案行业带来了巨大冲击,档案管理已经从“管文件”向“管数据”转型。
大数据时代,区块链、云计算、大数据等信息技术的应用,以电子文件形式流转、归档、保存、利用成为必然趋势。单轨制模式下,电子文件生成、流转、归档、利用、销毁等过程均以电子文件形式实现。从电子文件到电子档案,要做好元数据建立、确保电子档案真实和安全,经历完善的整理归档过程,使其符合档案标准。
1电子文件、电子档案、电子文件档案化
1.1电子文件
《电子文件归档与电子档案管理规范》(GB/T18894—2016)规定,电子文件(electronicdocument)是指国家机构、社会组织或个人在履行其法定职责或处理事务过程中,通过计算机等电子设备形成、办理、传输和存储的数字格式的各种信息记录。内容、结构及背景共同构成电子文件。
1.2电子档案
《电子文件归档与电子档案管理规范》(GB/T18894—2016)规定,电子档案(electronicrecords)是指具有凭证、查考和保存价值并归档保存的电子文件。电子档案在电子文件范围之内。但电子文件与电子档案二者还是有着明显的区别:一是价值不同。电子文件侧重于凭证价值,不论其保存期限的长短,可以只有临时保存的价值,在业务结束后便失去保存价值,如电子会议通知。而电子档案除了凭证价值外,还突出强调其档案价值,超出业务周期的保存价值。换言之,如业务结束不具有保存价值的电子文件,则不作为电子档案。二是形成时间不同。电子档案仅包括归档后的文件生命阶段,主要是在业务活动结束以后,电子文件则包括文件整个生命周期。
1.3电子文件档案化
从电子文件与电子档案的概念来看,二者并非等同概念。电子文件只有经过归档处理,符合档案标准,才可称之为电子档案。可见,电子文件档案化是指电子文件进行归档处理为档案的过程。“归档管理”与“档案化管理”也是两个不同的管理措施。前者,是指电子文件形成后,将文件认定为档案,然后将电子文件移交至档案部门管理。后者,“档案化管理”则是指使电子文件档案化而采取的一系列举措,电子文件形成伊始需要建立元数据著录机制,等等。
2电子文件档案化的现实必要性
电子文件主要来自办公自动化(OA)系统与电子政务系统,产生的电子文件有XLS、DOC、PDF、JPEG等格式,其存储及记忆方式不同。只有将电子文件按照一定规范化处理,使其具有档案标准,才可称之为电子档案。将电子文件进行档案化处理具有其现实必要性:
2.1科学有效归档的前提
传统文件可通过确保其载体的原始性,能够在其形成的“末端”进行归档管理。而电子文件有其自身特性,若在“末端”实施“归档管理”,电子文件归档前的真实性将难以保证。电子文件档案化管理强调的是“前端”控制和全过程控制[1]。只有做好电子文件“档案化管理”,才能使电子文件前端、全过程得到有效落实。电子文件档案化管理是建立在电子文件科学有效归档为前提,在这基础上,采取科学有效的方法和举措,对XLS、DOC、PDF、JPEG等不同类型电子文件的“归档管理”,这是电子文件科学有效归档的前提和基础[2]。
2.2电子文件的特性使然
电子文件格式多样,有XLS、DOC、PDF、JPEG等不同类型;与传统纸质文件相比,电子文件具有易改性,且这种易改性还不容易被察觉;电子文件依赖于计算机实现读写,但计算机又极易受到诸如木马病毒的攻击而发生电子文件的丢失或篡改。电子文件的上述特性,使其不能直接作为凭证或依据,应经过归档处理、符合档案标准的档案化管理,才能具有档案的属性和功能[3]。
2.3档案管理的必然要求
电子文件内容与载体可分离、可变等特点,要求档案管理需要前延至电子文件形成阶段,从传统的末端管理前延至前端管理或超前端管理、全过程管理。从电子文件的实际需要来看,从一开始就对其进行档案化管理,能够保证电子文件随时可被认定为档案或者可被作为档案来使用。因此,主动、提早介入电子文件,对其进行档案化管理,才能确保电子文件的真实、完整和有效[4]。
3电子文件档案化面临的现实问题
电子档案具有信息非人工可读性、电子文件系统依赖性和载体的无信息性等特点,使其在从电子文件到電子档案的过程中,面临着一些需要解决的现实问题:
3.1电子文件信息可读性保证问题
传统的纸质文件,其载体与信息是同一的,纸质载体安全,承载于载体上的信息便具有自然而然的可识读性。电子文件通常承载于磁盘、软盘等,并借助计算机硬件、解密等方式实现可读性,一旦硬件、软件、编码方式等环境发生变化,电子文件信息便不再具有可读性。此外,随着信息技术的快速发展,不断有新的编码代替了原来的编码,电子文件所使用的编码方式与快速发展变化的计算机应用系统运行环境之间的矛盾日益尖锐,电子文件可读性问题成为了电子档案管理的制约因素之一[5]。
3.2电子文件逻辑和实体归档问题
电子文件实体归档是指电子文件形成后,经网络传输或磁盘等形式,将电子文件移交至档案管理部门。电子文件逻辑归档,则是指在网络环境条件下,告知档案管理部门某电子文件的存储的路径,而不改变电子文件的原存储位置、存储方式。电子文件逻辑归档下,电子文件、归档者、电子文档接受者未必需要面对面,有可能相距甚远,只需要借助互联网、计算机,便能夠实现归档。但逻辑归档也面临着电子文件在网络环境下的安全问题。
3.3专业人才培养的问题
电子文件档案化需要档案人员不仅要熟练掌握档案学知识,还要掌握一定的计算机信息技术方面的专业知识,以及相应的公文处理知识,等等[6]。但从现实情况来看,档案部门人员既熟悉档案知识,也掌握计算机信息技术的“全能型”人才缺乏,这也是在一定程度上制约电子文件档案化的重要因素。此外,电子文件档案化的思维转变问题,也是影响电子文件能否转化为电子档案的又一影响因素[7]。习惯于传统纸质文件“看得见、摸得着”的档案,而常常将电子文件拒之门外,即便保存了电子文档,往往还“不放心”,将电子文件打印成纸质文档,“单轨制”落实不到位,不仅造成资源浪费,也增加了电子文件归档工作量。
4电子文件档案化过程管理措施
电子档案具有原始记录性、相对稳定性和证据性,电子文件只有经过归档处理,符合档案标准,通过电子文件档案化管理,才能最终形成电子档案[8]。为此,根据电子文件的特点,以及电子文件档案化的要求,电子文件档案化过程中需要把握和解决的问题主要有:
4.1建立元数据
从电子文件的概念可知,是机关、团体、企事业单位通过计算机等设备形成的各种不同形式的信息记录,电子文件是处理公务过程中产生的。如“某局文件20220808.pdf”,如果直接将该电子文件归档,显然不符合归档要求。因此,在将其纳入应归档范围后,还需要将该文件的背景信息和元数据等一并归档保存。元数据的归档保存,能全面显示该电子档案的制发时间、审批领导、办理单位、办理结果等[9]。《电子文件归档与电子档案管理规范》(GB/T18894—2016)规定,“元数据”是指“描述电子文件和电子档案的内容、背景、结构及其管理过程的数据”。可见,建立元数据是保证电子文件档案化的重要基础,按照电子文件归档的标准和规范执行,才能保证电子文化档案化达到要求。建立元数据,应包括title(文件名)、creator(创建者)、subject(关键词)、description(说明)、date(日期)、type(类型)、source(来源)、relation(关联)等。建立元数据要尊重档案,确保元数据与档案内容信息之间的整体联系,构建起元数据与电子档案之间的逻辑关系,实现信息共享与数据交换。电子文件元数据管理涉及元数据生成、捕获、封装和维护。其中,元数据生成主要是对元数据值域及潜在选项进行筛选,确定元数据内容。元数据捕获,可利用人工著录+计算机方式,捕获生成的元数据,包括元数据的名称、形成时间、数据格式、专题类别注释等内容。元数据封装是实现系统与档案功能模块数据交换、信息共享的关键。将捕获的元数据按照档案卷宗级、文件级、全宗级等进行封装,最后按照《基于XML的电子文件封装规范》,将若干文件封装,获得全宗级数据文件。元数据维护,是保障电子档案与院数据之间的持续链接,防止因保管及档案迁移过程中导致电子档案间关联稳定性和文件完整性,通常采用元数据规范嵌入和切入文本方式进行维护[10]。
4.2确保电子档案真实性
与传统的纸质文件相比,电子文件更易被修改性,以及电子文件对计算机软硬件技术的高度依赖性。随着软硬件环境的改变,电子文件在迁移、格式转换过程中,电子文件中的某些信息会发生变化,如果未采取必要的控制措施,势必会影响电子文件的真实性。因此,电子文件档案化过程要重点关注其真实性。
电子文件真实性可从管理和技术两个方面予以保障。管理方面,根据《电子档案移交与接收办法》相关规定,明确要求“合格后方可接收”。可基于电子文件全生命周期,做好事前控制、跟踪记录和事后审查等。如电子文件归档移交时进行真实性检测。重点是要通过技术手段,确保电子文件档案化结果的真实性。具体来说,包括电子签名技术、身份认证技术、区块链技术、加密技术、数据备份技术、可信时间戳技术等。其中,电子签名技术,就是数据信息中以电子形式存在,用于识别签名人身份,并表明签名人认可其签署的文件内容的数据技术。电子印章技术作为电子签名技术的一种应用,是基于可信密码技术而生成的一种身份标识,是将电子签名变成签名+印章模式。公钥基础设施技术(PKI),基于公钥理论,利用密钥管理平台,为电子文件生成、传输应用提供信息加密和数字签名[11]。PKI技术的核心,解决了信息网络空间中的信任问题。区块链技术利用加密算法、共识机制、点对点传输、分布存储和非对称加密等新型技术,解决了电子文件数据信任问题,有效保障电子文件真实性。目前,电子文件真实性常用的技术有软签名证书、加密设备应用等。
4.3维护电子档案安全性
电子文件档案化为电子档案,需要严格执行相关归档标准和档案管理制度,使其符合档案标准,具有凭证、查考和保存价值。因此,确保电子档案安全性,是电子文件档案化过程中必须要解决的问题之一。目前,电子文件档案化,以及电子档案的安全技术包括:身份认证法,通过鉴别或标识用户身份,防止非法访问。具体到电子档案中,应从用户及节点的身份认证入手,由应用系统实现。应用密码法,数字签名、消息摘要、加密、密钥等密码技术可有效保障电子档案信息的完整性和保密性。访问控制法,根据主体与客体关系,将存储电子档案的计算机访问进行限制,具体包括自主性访问控制(如读、写及执行等访问属性的管理)和强制性访问控制(采用敏感标识来标识主客体密级,从而实现访问控制)。安全审计法,通过访问日志的具体分析,发现和追踪访问是否属于非法。安全监视法,及时发现入侵行为,并根据入侵痕迹及时进行漏洞报告、弥补。此外,还包括防火墙法。总之,利用加密、数据封装、数据水印、灾害恢复等相关技术,保证电子文件在进行归档、整理和检索利用过程中的安全,并对电子档案进行内容补充、载体更换、数据监测和档案拷贝,全程监控电子档案管理形成。电子档案的安全性,除了上述的技术之外,还需要具体从事档案管理的人员具备良好的职业素质和道德素质,增强守法意识,严格执行《档案法》《保密法》的具体规定。电子文件档案化过程中要高度重视安全性,一次极小的过失都有可能造成难以挽回的损失。
结语
大数据时代,电子文件的数量和规模呈现出快速增长态势,电子档案管理的要求越来越高。为了更好地管理好、利用好电子文件,将其档案化为电子档案具有很强的必要性和现实性。从电子文件转化为电子档案,既要严格执行各项归档标准和要求,也要建立丰富的元数据,采用相关的先进技术确保电子档案真实性、安全性,适应大数据时代电子档案管理的现实需要。
参考文献:
[1]谭兰芳.“单套制”模式下电子文件归档和电子档案管理研究[J].兰台外,2022(5):28—30.
[2]谢玉娟.电子文件归档和电子档案管理研究[J].中国民族博览,2022(3):124—126.
[3]高珊.电子文件单轨制管理模式下档案数据保全研究[J].档案天地,2022(1):21—24.
[4]吴龙华.建设项目原生电子文件档案化管理研究[J].未来城市设计与运营,2022(4):66—68.
[5]刘田宇,向禹.我国电子文件真实性研究综述[J].资源信息与工程,2022(1):148—152.
[6]王红敏,谢志成.建设项目电子文件归档和电子档案管理试点研究[J].中国档案,2021(3):68—69.
[7]陈斐然.水务企业电子文件归档和电子档案管理问题及对策[J].兰台内外,2021(12):35—36.
[8]张丽.企业电子文件归档和电子档案管理的分析[J].企业科技与发展,2021(7):174—176.
[9]姚姮.大数据时代企业电子文件归档和电子档案管理的探索与实践[J].陕西档案,2021(6):38—39,37.
[10]刘伟.电子文件档案化管理探究[J].中国宽带,2021(2):166.
[11]简远征.电子文件归档和电子档案管理新模式探讨[J].办公室业务,2021(21):171—172.
作者简介:李耀斌(1985.10—),大学学历,菏泽市人力资源和社会保障局馆员,主要从事档案管理研究。