自主可控:我国电子文件归档的新方向
2024-06-10刘卉芳中山大学信息管理学院
刘卉芳/中山大学信息管理学院
近年来,世界政治经济格局加速演进,世界正面临着百年未有之大变局,在关键领域和技术上,我国受到外部的制约和制裁,出现了“卡脖子”的问题。特别是随着大数据、人工智能、物联网、云计算新技术与各领域的深度融合,国家和地区间围绕网络安全与信息安全的博弈也不断加剧。同时随着档案数字化转型的深入推进,档案工作中所面临的不稳定性与不确定性也进一步增加,亟待向更加自主可控的方向迈进。此外,自主可控是国家数字经济发展与数据安全的重要保障,档案资源作为国家数据资源的重要组成部分,其安全性的保障也有赖于自主可控的实现,而归档管理工作作为档案资源建设的基础保障,在这一环节实现自主可控更是不可避免的问题。
目前档案界对于自主可控战略的研究主要聚焦于两方面:一是自主可控环境下的信息技术的应用,比如档案系统的建设[1]、数字原生的计算体系架构[2]、档案数字资源存储介质选择[3]等;二是安全可控(即信创)环境下的档案管理实践,特别是自主可控环境下数字档案馆的建设[4-5]。在档案业务工作当中,基于实践的自主可控发展历经多年的“信创工程”,档案机构对部分国外的信息技术进行了原位替换,守住了安全可控的信息技术体系的底线。由此可见,现有文献多围绕国产化软硬件的应用情况以及自主可控的适配经验而谈,针对基于自主可控的电子文件归档相关的理论建构研究较少,但自主可控作为国家的战略性目标,其在电子文件归档中的应用应当包含对于档案领域的前瞻性思考、全局性谋划、战略性布局以及整体性推进。特别是我国进入新发展阶段,现代化发展理念、新发展格局等战略导向也成为在电子文件归档管理中实现自主可控的重要条件,更应将新发展理念的实践贯彻其中,把档案现代化的理念不断引向深入。在这个意义上,现有研究对自主可控战略背景下电子文件归档管理的生成逻辑、特征、关键问题的识别上仍有不清晰、不明确之处。鉴于此,本文立足于自主可控的国家战略以及电子文件归档的理论,对自主可控战略背景下电子文件归档动态进行分析,系统阐述自主可控战略背景下电子文件归档的生成逻辑、特征及其发展过程中的关键问题。
1 基于自主可控的电子文件归档的生成逻辑
基于自主可控的电子文件归档是我国电子文件归档实践与国家战略互动之下的产物,其中既包含着自主可控的国家战略对电子文件归档所提出的纵深的需求,又包含着电子文件归档实践及相关理念国家战略的契合之处。
1.1 国家战略对电子文件归档提出的纵深需求
首先,从国家战略的层面而言。在《“十四五”全国档案事业发展规划》中指出要“加快推进档案科技创新,助力档案工作转型升级”[6]并提出要重点开展自主可控环境下档案数字资源管理等重大课题的研究。在2022年发布的《关于加强数字政府建设的指导意见》中也指出要“加强自主创新,加快数字政府建设领域关键核心技术攻关,强化安全可靠技术和产品应用,切实提高自主可控水平。”[7]2023年发布的《政务服务电子文件归档和电子档案管理办法》则提出:“政务服务电子文件归档和电子档案管理工作应当遵循统一规划、全程管理、规范标准、高效利用、安全可控的原则。”[8]“自主可控”是手段,“安全可控”是目的,在电子文件归档过程中推进自主可控就是为了保障归档文件的安全可控,进而保障档案的绝对安全。这也是档案工作坚守底线思维,防范化解重大风险的重要举措。电子文件归档作为业务工作的最后一环,更应当顺应当前“数智化”的发展趋势,以场景应用推动电子文件归档技术的创新,提升电子文件归档自主可控的能力。
1.2 档案部门坚持服务国家战略的必然结果
随着档案工作的数字化转型,记录信息存在的粒度正逐渐由粗转细,电子文件归档管理也面临着更大的安全风险,因此为了坚持底线思维,保障档案的绝对安全,电子文件归档亟需转向自主可控。2020年全国档案局长馆长会上提出了“积极推进自主可控环境下档案业务系统建设”[9]要求,此后各省市档案馆积极投身于自主可控的战略背景下的档案信息化建设之中,在当前基于自主可控的电子文件归档实践当中,自主可控的战略主要以两种方式体现:第一种是将自主可控作为信息技术体系建设基本原则和遵循,如上海市长宁区数字档案馆 、河北省数字档案(方志)馆[10]、珠海市数字档案馆 、福建省宁德市数字档案馆[11]、天津市数字档案馆[12]、安徽省档案馆电子文件单套归档和电子档案单套管理试点[13]等;另一种则是以归档文件的安全、可控为最终目的,以实现电子文件的全流程管控,如浙江省数字档案馆[14]、青岛市数字档案馆等。
总而言之,在当前的全国示范数字档案馆(室)和电子文件单套制归档和电子档案管理试点建设中,无论是应用软件、基础软件、基础硬件还是信息安全技术,都遵循自主可控的基本原则和安全可控的基本要求。由此可见,自主可控已经成为数字转型背景下电子文件归档管理中的关键一环。
1.3 电子文件归档理论与国家战略的内生契合
从电子文件归档理论来看,“前端控制”“全程管理”等恰恰体现了电子文件归档与自主可控的契合之处。前端控制与全程管理是电子文件管理的两项并行的原则,前端控制是基于档案管理视角的阐述,它强调提前介入,如在档案系统中增设“预归档”模块,就是在文件的形成端对待归档的文件进行检查,并添加全宗号等档案元数据信息,之后再对文件进行归档。这种归档的流程破除了传统归档的滞后性,强调了档案工作对前端业务工作提前、主动地“控制”。这与“自主可控”的理念不谋而合,这意味着档案部门在电子文件归档活动中能够对前端的业务工作提供反馈,进而推动前端业务工作的优化;而全程管理则是我国电子文件与电子档案管理工作的基本原则之一,它是基于文件生命周期视角的阐述。在数字时代,全程管理的理念愈发突出,比如在电子证据保全过程中,证据“三性”(即真实性、合法性与关联性)的保障要求电子档案管理系统能够保证全程留痕,此外,还要“动态记录电子文件全生命周期的状态”[15],可控作为安全性的体现已经蕴含于电子文件归档的基本。自主可控国家战略的需求与电子文件归档理念上的一致性决定了二者之间内生的契合。
2 基于自主可控的电子文件归档内涵及特征
自主可控战略是指在国家安全和发展利益的基础上,实现对关键领域和关键环节的自主控制,保障国家信息安全和数据安全。而电子文件归档则是指“具有保存价值的电子文件已经形成或办理完毕后转化为具备档案属性的电子文件的过程”。笔者认为,自主可控战略背景下的电子文件归档,就是要运用自主可控的技术手段,实现对电子文件和电子档案的全生命周期管理,确保其真实性、完整性、可用性和安全性。基于自主可控的电子文件归档作为根植于中国现实语境下的概念,对其内涵的理解应当立足于档案事业现代化的基本特征、“三个走向”的基本遵循。基于此,自主可控战略下的电子文件归档主要包括如下两个方面的特征:
2.1 自主创新
习近平总书记在对档案工作作出的重要批示中强调,要“推动档案事业创新发展”。这为新时代档案事业实现高质量发展提出了明确要求、提供了根本遵循。2022年6月国务院发布的《国务院关于加强数字政府建设的指导意见》中也指出要“加强自主创新,加快数字政府建设领域关键核心技术攻关,强化安全可靠技术和产品应用,切实提高自主可控水平”。一般语境下的技术创新多强调积极运用区块链、时间戳、哈希值校验等技术保障电子文件的安全性。但在自主可控的战略背景下,要求档案部门与相关业务部门所使用的核心技术、标准、流程等相关要素具有掌控能力、掌握主导权,此外对于电子文件和电子文件归档的环境也要有足够的了解。比如在归档过程中,文件及其相关要素分别流转到哪一个库?这种控制能力除了源于管理人员对电子文件及其归档的环境有足够的了解之外,还源于档案工作者对电子文件归档技术、流程等多方面的不断创新,进而实现长期可持续的自主可控。
2.2 安全可控
在电子文件归档过程中,对电子文件“四性”保障是关键,同时还要规范使用密码技术对归档电子文件进行保护。而自主可控视角下的电子文件归档不仅强调归档文件的真实性、完整性和可用性和安全性,还要强调抵御外部风险的能力。首先是文件归档格式的安全性,在2023年8月22日发布的《政务服务电子文件归档和电子档案管理办法》中就规定“政务服务电子文件归档格式应当符合国家标准规范,并且通用、开放、不绑定软硬件”[16],这样即便遇到软硬件系统提供商出现问题也可以保障归档文件的安全性。其次,要强调算法安全。在当前人工智能技术广泛应用于电子文件归档与电子档案管理的各个流程之中,比如上海市档案馆所采用的“多智能体”技术,就利用了深度学习,其中算法安全是不容忽视的问题,如何增强AI的可解释性,增强AI技术的安全性、可信性、可靠性和可扩展性。此外,更要强调整个业务系统的抗击风险能力,能够有效抵御外部的冲击,保证系统内部的稳定。
3 基于自主可控的电子文件归档关键问题
3.1 技术环境可信
技术环境由基础硬件、基础软件以及云构成,而自主可控的电子文件归档就是指在安全可信的技术环境下,实现电子文件的形成、积累、归档、保管、利用、统计等管理过程。技术环境可信度的保障主要包括信息化软硬件基础设施平台的维护,一方面是信创环境的适配,信创环境的适配包括基础硬件、基础软件、应用软件以及云环境的适配,具体而言包括CPU、数据库、服务器、操作系统、办公软件、中间件、签章系统、浏览器等,在当前数字中国建设的大环境下,兼容当下主流信创环境已经成为档案数字化转型过程中的必然要求。另一方面则是电子文件内容的检测技术,主要是指电子文件的“四性”检测技术,通过对电子文件的真实性、完整性、可用性和安全性进行检测,保障电子文件的生命周期管理。自主可控的电子文件归档应当更加依赖国产化的软硬件平台,以保障技术环境的可信性。档案行业如何依托自身的优势,在相关产业发力,为电子文件归档提供更加可靠的软硬件支撑。
3.2 归档过程可控
电子文件归档的可控性表现在五个方面:第一,归档过程可管、可控、可追溯。即利用大数据、区块链等现代信息技术实现电子文件归档的过程管控,保障电子文件内容的真实性与完整性,如利用数据溯源技术、基于国产算法的电子签章技术等,对电子文件进行加密。第二,归档文件可信、可控、安全。即归档过程中静态数据可知,动态数据可视。静态数据可知是指对系统中的归档文件自动发现并分类分级,对其中的敏感数据进行识别等操作,清晰地掌握电子文件的流转、分布和利用情况,为电子文件的安全防护提供基础。动态数据可视是指对归档文件进行实时的监控、分析、预警等操作,实现对归档文件的动态感知和有效调节,为“前端控制”和数据安全决策的提供支撑,如在电子文件归档与电子档案管理系统开发与设计当中,要设有归档、移交与接收的功能模块,以保证电子文件归档流程的安全可控。第三,归档文件格式标准。电子文件归档应当符合国家的标准,保证版面固定、不跑版、所见即所得,比如OFD版式文件就是我国电子公文交换和存储格式标准。第四,归档文件访问控制,最典型的是档案工作者在线操作和资源利用权限分级,即可以应对各类权限分配的场景,保证电子文件的长期保存和精准呈现,保障文件的可读、可用与安全性。第五,识别风险可控,近年来,我国的发展面临着更加严峻的国际形势,网络攻击屡见不鲜。系统风险、算法风险、数据安全风险。
3.3 政策环境完善
虽然新一代数字技术开启了电子文件归档的自主可控时代,但对于档案领域而言,自主可控的电子文件归档的实现仅仅考虑技术层面的可及性并不现实,为保障技术环境可靠、归档过程可控以及系统功能的稳定,需要各类政策法规及相关标准的保障。目前从国家层面来看,已经出台了多项利好政策为自主可控的相关产业提供支持与保障,在《国家政务信息化项目建设管理办法》《国务院关于加强数字政府建设的指导意见》等多项政策都强调了提升自主可控水平的重要性。而从档案领域来看,《“十四五”全国档案事业发展规划》《政务服务电子文件归档与电子档案管理办法》等文件均强调了“安全可控”与“自主可控”的重要性,为自主可控环境下的电子文件归档提供了政策支持,同时也有《信息技术OFD档案应用指南》《基于XML的电子文件封装规范》《电子档案单套管理一般要求》等档案行业标准为自主可控环境下的电子文件归档提供标准指导,但针对算法安全、AI技术应用、可信存储等方面的标准规范仍有欠缺。从政策环境角度出发,要保障自主可控环境下电子文件安全归档,新技术的应用安全也是保障电子文件归档安全可控的关键因素,因此要构建一套与安全自主可控技术相适应的标准体系,以规避“卡脖子”难题和电子文件归档过程中的信息安全风险,奠定自主可控环境下电子文件归档的安全基石。
3.4 主体职责明确
自主可控环境下的电子文件归档需要相关的主体部门协同合作,才能更好地增强电子文件归档的自主性与可控性,而各方主体则需要在职责明确的前提条件下才能发挥合力。根据《中华人民共和国档案法》和《电子文件管理暂行办法》等相关法律法规,电子文件归档的主体责任主要包括:档案主管部门、电子文件形成或办理部门、综合档案室、信息化部门等。这些部门均是电子文件归档自主可控能力的重要来源。在自主可控的国家战略背景下,档案主管部门应当依据《档案法》有关条款内容,协同有关部门制定以“电子文件归档”为核心的电子文件归档相关标准规范;电子文件形成或办理部门在电子文件归档过程中应当通过哈希值校验、可信时间戳等技术保证电子文件归档的全流程可信;信息化部门:信息化部门则需要为电子文件归档与电子档案管理工作提供技术支持,并且保障电子文件归档过程中基础设施运维工作。