传统历史视角下的电子档案管理体系研究
2020-12-06田支斌
■田支斌
一、研究现状
从甲骨文到竹简、从竹简到纸张,中国主流档案的载体及形式每个阶段基本上发生了千年演变。如今档案载体再次发生巨变,从纸质载体全面演化为电子载体,这是档案界前所未有之大变局。2018 年底,国家档案局14 号令规定“符合国家有关规定要求的电子公文可以仅以电子形式存档”。2019 年底,国务院16 号令《国务院关于在线政务服务的若干规定》明确了“除法律、行政法规另有规定外,电子文件不再以纸质形式归档和移交。符合档案管理要求的电子档案与纸质档案具有同等法律效力。”2020 年6 月20 日全国人大常委会修订的新版《中华人民共和国档案法》第三十七条规定“电子档案与传统载体档案具有同等效力,可以以电子形式作为凭证使用。”因此从政策到法律层面电子档案的地位已经正式确立。但令人尴尬的是电子档案配套实施的具体操作办法及标准规范却极度缺乏,即使有少量行业标准,也偏重理论与较为落后的离线归档,难于适应目前开放互联的网络环境。
电子档案的研究当前处于百花齐放的状态,但研究类型大体分为两类。一类是基于最新信息技术提出了一些改良理论,为电子文件归档提供了一些工程化解决办法;另一类是偏离主流的档案研究方法,提出一些有别传统档案理论的颠覆性理论。如付建忠提出随着存储成本的下降,“一切归档”的管理目标具备了实现的可能性;陈明洁从大数据概念出发,结合税务、教育、车辆管理等业务系统的数据管理,得出业务系统中每条记录都应该成为档案;于英香提出大数据时代的应该实时归档,数据化归档。这些理论为电子档案管理提供了解决思路,但对于全面解决电子档案规范化管理仍然远远不足。一是多数理论缺乏系统性;二是偏重于理论的探讨与理想的憧憬,缺少对现实环境的全面考量,并有将档案理论泛化的趋势。理论的演进是循序渐进的,脱离原有成熟理论完全另起炉灶,并将理论向其他学科无限延展,却有使学科理论特色弱化,甚至完全失去自我的危险。
传统的档案工作理论以文件收集、保管、利用为中心而展开,电子档案较传统载体档案虽有了巨大的变化,但尚未达到颠覆性的变化,它同样存在收集、保管、利用这几个核心问题。本文以互联网+的研究方法,从传统历史视角探讨如何在遵循原有的档案学理论基础上借助现代信息技术,以传统的档案定义、收集、保存、利用为线索梳理电子档案规范管理的成套办法。
二、什么是档案
什么是档案,这是档案学的核心概念,也是档案学其他理论的基础。2020 年6 月20 日人大常委会修订通过的新版档案法对档案的定义为:“本法所称档案,是指过去和现在的机关、团体、企业事业单位和其他组织以及个人从事经济、政治、文化、社会、生态文明、军事、外事、科技等方面活动直接形成的对国家和社会具有保存价值的各种文字、图表、声像等不同形式的历史记录。”新版档案法对电子档案也做出相应规定“电子档案应当来源可靠、程序规范、要素合规。”只有符合规定的电子档案才能具备与传统载体档案具有同等效力,可以以电子形式作为凭证使用。为了描述方便,本文将传统载体的文件材料,以保存模拟信号为主要特征的传统电子音像档案,以保存数字信号为主要特征的电子文件、电子记录、电子数据统称为信息记录,以便与正式的档案加以区分。同时将模拟态和数字态的信息记录统称电子信息记录,以区别于传统载体的文件材料。
1.信息记录成为档案的必要条件
(1)一切信息记录要成为档案,其来源必须是直接的生产活动形成一手记录,而非生产活动结束后经过加工的二次信息汇编;
(2)信息记录要成为档案必须要有保存价值,只有经过鉴定的信息记录才能成为档案,因此档案是经过严格筛选的高价值、高密度、高可信的信息记录。这与一般大数据的高容量、低价值、低密度形成鲜明对比。
(3)档案是历史记录,是固化的信息记录。那些信息化系统中实时变化的数据,在未有明确的固化机制前,实时归档成为档案是不适宜的。
(4)数字态的信息记录的要成为档案,其形式与程序要合规。数字态的信息记录要成为电子档案必须保证便于提取背景信息,便于用元数据进行描述,并适宜使用必要的如数字签名等技术手段来保证其可信性。更为重要的要保证归档的电子信息记录语义完整,便于展现。像数据库中单独记录及单独的数据项,甚至整个数据库文件,脱离了原系统,语义难于重现,当前作为电子档案保存实际是缺乏现实可行性的,充其量只能作为数据备份而已。
2.盲目扩大电子档案归档对象的危害
盲目将一切电子信息记录归入电子档案的收集范围,不是在强化档案机构的职能,相反是在弱化档案机构职能。随着政府层面大数据局的成立,各级机构数据中心的成立,如果本着电子信息记录照单全收的理念进行档案管理,档案机构的职能将与大数据局或数据中心的职能高度重叠,而在人力、技术、资金及职能地位方面,档案机构无法与上述机构比拼,将会在社会实际生活中被边缘化。事实上,2015 年9月,国务院发布《促进大数据发展行动纲要》(国发〔2015)50 号,以下简称《纲要》)。根据纲要,2016 年各省市陆续建立大数据局,并建立多部门联席会议制度,协调本地大数据发展,这些机构及机制多无档案部门参与,这说明档案部门难从国家层面成为各级大数据局(中心)核心参与单位,根本缺乏实现所有电子数据的归档保存的现实条件。
三、怎样归档
电子信息记录如何归档应该说是目前电子档案管理体系最为困难的一步,与传统载体文件材料相比,电子信息记录来源途径、鉴别手段、移交方式、著录方法与传统载体文件材料都有着巨大的差别。
1.电子信息记录归档困境
(1)目前信息系统使用单位及维护单位常常是分开的,职能部门负责使用,信息技术部门负责维护。这就导致电子信息记录的生成部门与保存部门是分开的。这种情况是职能部门归档还是技术维护部门是归档,在现实工作中是需要探讨的。
(2)跨多个部门使用同一软件平台,导致系统数据的权属关系难以区分。由于多部门协作,单个部门只对电子文件拥有部分的权限,这些数据由谁牵头归档成为必须明确的现实问题;
(3)部分机构还使用第三方公司的云平台行使一些职责,如利用微博、微信公众号、微信小程序、互联网公司的邮箱从事某些职能活动。这些系统软件平台不归用户单位所有,有些平台还规定相关电子文件未经授权不得私自转载。这些情况造成这类电子文件归档存在不少技术难题与法律难题。
(4)有些业务系统的数据实时动态存储于系统之中,脱离原系统后语义不明,难于独立使用。这些数据如何转变成符合规范的电子档案具有相当大的技术难度。
(5)国家档案局已经出台相关电子文件归档政策及行业标准,多为电子文件的离线归档方式而制订,难于实现目前的线上归档。
(6)目前普遍实行元数据加电子文件的方案也存在较大缺陷,有限的元数据方案难于适应日益增多的电子信息记录种类。
(7)当前普遍采用档案系统与应用系统对接实现在线归档。这种方式面临成本高、开发周期长、通用性差,难于适应系统的频繁升级等种种缺陷。
(8)电子档案收集要解决安全性、完整性、可靠性及可用性四性问题。最重要是解决档案可信度问题,目前多采用元数据加数字签名的方式加以保证。很多元数据的添加及数字签名往往是为了归档而施行后置行为,为事后补充,并不是实际工作的刚性需要,真实性自然难以保证。同时信息认证多由中心结点控制,可信度存在天然的缺陷。
2.走出电子信息记录归档困境的基本思路
(1)遵循传统方法,制订可操作的归档范围。传统文件归档办法首先是由档案部门在充分调研的基础上,制订切实可行的归档范围,实行部门立卷。电子信息记录归档与传统文件归档虽然有极大区别,但归档的本质还是一样的,因此制订归档范围的方法还是切实可行的。只是工作需要因势而变,将归档的对象由原有内部实体部门进一步扩充到内部应用系统、第三方应用系统等。
(2)优化信息系统与档案系统的接口形式。档案部门必须尽最大努力进行前端介入,在各类系统建设之初就在各类系统中预留档案归档接口,这种方式效率将大大优于事后系统对接。档案部门要制订规划好电子信息记录归档通用接口标准,并将预留应用系统档案归档接口的要求纳入到各类信息系统建设制度中。
(3)对部分电子信息记录进行适应性转换。档案系统归档业务系统中所有数据无必要与也不现实,目前可行的作法应该是将业务系统中结构化的数据、单条记录降级为语义完整清晰的非结构化数据,并以接口的形式输出。对海量的常规大数据,不全部归档,而改为归档一些异动数据。事实上常规数据中异动数据往往包含了最有价值的信息,这符合档案价值密度高的要求。
(4)充分运用区块链技术解决电子档案的可信度问题。区块链技术是一种去中心的信息可靠信息保证手段,它是实际工作中凭证的自然固化,事后无法修改,无法否认,天然就能满足的档案对可信度的要求。推进区块链技术在各类信息系统运用,是建立可信电子档案的重要技术保障。
(5)大力推进人工智能技术在档案收集中的运用。人工智能技术可以智能分析文档、图片、视频的内容,这为档案自动分类、自动标引提供了可行的技术工具,是自动归档海量电子文件可行办法。
(6)大力推进数据中心、大数据大平台建设,实现各系统公共数据共享,保证基础数据统一,提高数据利用效率。建立统一的政务审批平台,保证电子信息记录流转等背景信息高效提取。数据中心应该设置一个统一的档案资源预归档库,由各分系统将归档电子数据送到数据中心的档案资源预归档库。档案系统应该尽量减少与各分系统的对接,转而直接与数据中心的档案资源预归档库进行对接。
四、怎样保存档案
传统的档案主要是纸张作为载体,档案的内容与载体合二为一,保管时只要保证物理安全,就能长时间保存且无障碍使用。但电子档案与传统载体档案最大不同是内容与载体分离,信息的逻辑语义与物理存储分离,电子信息记录的逻辑语义的重现与特定的软件系统及硬件系统紧密关联。即使电子信息记录的物理存储完好,脱离了特定的软硬件系统,逻辑语义也无法重现。
1.一种可靠长期保存格式是电子档案保存的必然要求,这种格式必须是开放而相对稳定格式。它应该不易受特定的专利、特有公司制约,社会各级机构易于按照相关标准创建阅读工具。这种格式应该具有格式自包含、自描述能力、极强的新旧版本兼容能力,只有这样才能保证可以电子档案的长期保存。
2.创建一种通用的数据交换标准,保证元数据信息及电子原文信息能够无障碍进行交换,这样才能保证各级档案馆电子档案移交及新旧系统数据的无缝迁移。
3.大力发展档案云服务。电子档案及其关联数据库的安全备份是一项投入大且技术高度复杂的工作,一般的档案馆从财力和人力上难于承担此项工作。档案行政部门应该鼓励社会力量成立专业的档案托管机构,档案行政机构加强监管。技术力量及资金不足的档案馆宜将电子文件交由这些档案托管专业机构托管,以发挥这些专业机构的技术专长及规模管理带来的低成本效应。新颁发的档案法第一章第七条明确规定:“国家鼓励社会力量参与和支付档案事业的发展”,档案的外包服务将受法律严格保护和制约,包括档案云服务在内,档案外包服务将是大势所趋。
五、怎样利用档案
传统档案利用与电子档案利用最大不同在于传统档案主要是现场运用,而电子档案主要是网络运用。传统档案对使用的便捷性要求不高,档案安全容易控制;电子档案要求便于网络利用,同时又要保证安全。电子档案易复制、易篡改的特点使得档案利用与安全保障矛盾犹为突出。
1.以服务为导向,从用户的角度来设计档案系统利用流程,使档案利用更贴近用户需求。电子档案的利用多为非现场服务,用户使用过程中交流不畅。档案系统的利用环节设计必须以用户为中心,考虑到各个层次用户的需求,做到简单明了,易于上手。
2.电子档案为档案共享利用提供创造了条件。应推进档案信息资源共享服务平台建设,推动档案数字资源跨区域、跨部门共享利用。
3.推动档案开放利用。电子档案多采用在线自动归档,目录天然就比传统档案完备,并且带有全文,大大方便了档案鉴定。档案部门可以利用电子档案这些天然优势,加快档案鉴定,通过其网站或者其他方式定期公布开放档案的目录。部分档案甚至可直接提供原文下载,以期充分发挥档案的信息价值。
4.电子档案开放利用程度越高,其安全保障的难度就越高。总体来说,任何信息系统保障其安全,主要是四个方面的安全。
(1)硬件层面的安全。这方面主要是综合使用硬件防火墙、入侵检测系统,实现内网与外网隔离,防止网络入侵等。当前应逐步淘汰国外硬件系统,更多采用国产自主可控硬件系统,防止芯片级硬件后门。
(2)基础软件层面的安全。这里主要是指操作系统及数据库系统安全,这是信息系统软件安全的根基。随着国产操作系统及数据库系统的崛起,应大力推广国产操作系统及数据库系统在档案行业中运用。
(3)应用软件层面的安全。应用层面的安全贯穿于浏览、下载、打印等各个环节。要采用严格的身份认证技术保证合法授权使用、开发下载文件单独密码控制及失效自动销毁技术、开发文件打印防伪水印技术,强化审计日志制度,保证电子文件全程可控。
(4)管理制度的安全。信息系统最重要,也是最薄弱的环节是人的因素。再好的硬件与软件,也需要人严格按规范来管理,因此制定完备的安全管理制度并严格执行是档案利用最大的安全保障。