区块链技术在数字档案馆中的应用特点分析
2022-04-07覃海利杨征尹海波陈孝经
覃海利 杨征 尹海波 陈孝经
(湖南天河国云科技有限公司 湖南长沙 410000)
大数据时代,电子文件的增加使得数字档案和全文数据库成为数字档案馆馆藏资源的重要增长点。2018年6月,国务院办公厅印发《进一步深化“互联网+政务服务”推进政务服务“一网、一门、一次”改革实施方案》,强调要加快构建全国一体化网上政务服务体系,推进跨层级、跨地域、跨系统、跨部门、跨业务的协同管理和服务[1]。与传统档案馆相比,数字档案馆具有接入形式多、存量数据大、管理难度高、授权程序复杂等问题,让数字档案高效流通,是当下发展新型智慧数字档案馆的必经之路。
2020年,国家明确将区块链列为新型基础设施中的信息基础设施,其与社会生活融合程度日益紧密。我国目前已拥有近100家数字档案馆、档案室,通过全国示范测评,数字档案馆、档案室建设初具规模。利用区块链技术,促进数字档案馆数据汇聚及共享,提供方便、高效的档案利用功能,使档案以数字化形式充分融入现代化网络世界,对于培育新型智慧数字档案馆生态体系、推动数字档案馆转型升级具有重要的实践意义。
1 数字档案馆的特点
数字档案馆是政府信息资源的数据中心和数据交换站,它是在现代信息技术普遍应用的基础上,利用数字手段,以高度有序的综合档案信息资源为处理核心,以高速宽带通信网络为技术设施的超大规模、分布式数字信息系统。在现代技术迅速发展的今天,打造数字档案馆是政府信息化建设工作的必要发展趋势。
1.1 多领域的信息采集渠道
数字档案馆拥有丰富的信息资源库,其内容不仅涵盖了原本采集的文字档案资源,随着现代信息技术的发展,如今档案馆的采集范围也进一步扩大到各行业的专业数据库、社会服务信息等,磁盘、光盘等电子存储文件大量出现,档案被以语音、视频、图形、图像等更为丰富的形式记录,形成具有社会综合性质的信息资源库,满足政府、图书馆等组织机构对档案信息资源的需求。
1.2 海量化的信息存储空间
数字档案馆保存的各类信息主要是计算机生成的电子文件和经过计算机进行数字化处理的各类档案信息及其他社会信息,电子文件的存储介质密度远大于以往各种人工可识读信息介质[2]。随着信息技术的进步,电子文件介质的存储密度还将继续增加和扩大,可以满足海量存储数据的需求。
1.3 多样化的访问与查询机制
数字档案馆通过信息网络技术,将分散的档案信息数据库以互联网的形式连接起来,对电子文件资源进行远程查阅和调用,摆脱时间和空间的限制,满足跨馆查询的需求。数字档案馆强大的检索机制及完善的借阅管理和调用控制功能可以根据检索项对关键词、标题、日期等条件进行筛选、组合,并对查询结果进行显示、排序、转存、打印输出等技术处理,实现精准查询与使用。
1.4 有限性的信息传播形式
数字档案馆具有公信力及权威性的原因之一来自于其对档案信息的真实性维护。基于其光盘发布和网络发布这两种传播方式,受传播载体的局限性,前者的受众只需将档案信息复制到光盘,执行光盘阅读程序,即可对档案进行浏览与查阅;后者的传播范围更广,有局域网跟公众网之别,一些不能公开发布的档案信息就必须在局域网上发布传递,对时效和保密程度进行严格限制。
1.5 严密的信息安全保护
数字档案馆的安全包括网络、系统、信息、物理等方面。从系统安全层面上看,数字档案馆分为信息认证和访问控制,信息认证更多是基于利用者身份进行认证核实;访问控制更多是基于计算机及档案信息进行认证,通过授权相关权限,控制用户可访问的范围。从信息安全层面上看,数字档案馆是管理和技术等多个体系的整合,在边界防卫、入侵监测和安全反应等环节,需要建立多重信息安全保障体系来维护系统安全。
1.6 有序的系统管理
根据档案性质的不同,一般的数字档案馆以完全公开的档案信息、需要授权访问才可查阅的档案信息及从外界采集的其他数字化信息为主,通过专用的系统软件,对入馆的各类信息按照年份、品类等进行分类排序,鉴定档案价值,对所记录的数据进行校验,生成信息目录并标记,确保档案信息能被完整引用和查阅,形成有序的信息数据库。
2 区块链技术的特点
区块链是去中心化的分布式账本技术,利用块链式数据结构来验证与存储数据、利用分布式节点共识算法来生成和更新数据、利用密码学的方式来保证数据传输和访问的安全、利用自动化脚本代码组成的智能合约来编程和操作数据的一种全新的分布式基础架构与计算范式。
2.1 去中心化
利用链式结构保障数据安全,采取分布式核算和存储的方式,不存在第三方管理机构或中心化管制,任意节点之间的权利和义务都是均等的,且任一节点的损坏或者失去都不会影响整个系统的运作,塑造稳定的区块链运行系统[3]。
2.2 信息可追溯
区块链利用带有时间戳的链式区块结构存储数据,从而为数据增加了时间维度,具有可验证性和可追溯性。同时,由于区块是由整个系统中所有具有维护功能的节点来共同维护的,因此,当数据出现错误或者扰动时,系统能通过时间戳对数据进行溯源,提升数据的可验证性。
2.3 数据共享
鉴于区块链是一个分布式平等部署的网络[4],且由各节点共同维护、共同参与,因此,任何数据变化都能通过共识机制在区块链网络中实现同步共享,解决数据共享难、管理难问题。
2.4 数据加密
区块链利用非对称密码学原理对数据进行加密,可以在验证数据真实性的同时,防止数据泄露,防止他人倒推数据源,为区块链数据不可伪造、不可篡改、可公开验证和隐私保护提供了基础保障,各区块节点的身份信息在无需公开或验证的前提下实现数据匿名传递。
3 区块链应用于数字档案馆的特点
与传统档案馆相比,数字档案馆的信息资源库种类丰富、形式复杂、规模浩瀚,对电子档案的真实性和安全性提出了新要求。结合区块链特点,将区块链技术应用于数字档案馆具有一定可行性。
3.1 打造可信操作环境
安全、可靠、可控地实现数字档案共享是数字档案馆核心功能需求。数据共享分为涉密档案、隐私档案、政务档案、公开档案等多个级别,不同级别具有不同的共享安全需求。利用区块链非对称加密技术,可对数字身份、用户体系、权限控制、授权机制,以及对全部档案管理及利用流程日志进行记录,对涉密文件进行加密及对部分可使用身份授权,确保涉密文件数据安全。同时,对数字档案采用分级、分类的加密存储设计和多重备份模式,加强数据存储安全。通过对数据安全的多方位保护及保障,确保档案在安全可控环境下运行,为数字档案互联互通营造一个可信的操作环境。
3.2 改变传统采集及检索模式,降本增效
通过人工智能及算法模型等技术,以区块链多中心治理机制,采用实时采集工作档案及简便易操作的授权及查询模式,降低数据检索及查询难度。政府单位、企业、个人可通过局域网(档案馆)、政务网络、互联网专用平台、数据接口及开放平台的方式进行数据查询,减少对实物资料的归档查阅,实现数据可信、可控,降低数据互通壁垒,简化档案管理流程及查阅流程,提高数字档案馆运行效率。
3.3 打造开放系统实现融合应用
基于大数据及区块链技术组件开放式系统架构,建立基于数据确权及授权基础的大数据共享服务平台,将数字档案馆系统融入具体的业务系统,降低数据汇聚难度,提高汇聚效率,实现与各单位业务系统的实时对接。另外,接通政府单位、企业、政务网络、互联网专用平台、数据接口等,逐步建立完整、完善的数字档案共享生态体系,提升公共档案服务能力,实现档案信息资源的社会共享,形成融合式发展。
4 区块链技术特点在数字档案馆中的应用实践
4.1 英国Archangel数字档案馆项目
2017年6月30日,英国萨里大学(University of Surrey)联合英国国家档案馆(The National Archives)、开放数据研究所(Open Data Institute)等机构,开展名为ARCHANGEL的研究[5],利用区块链技术,解决当时数字档案长期性与完整性管理问题。
4.1.1 多方“参与记账”管理提效
鉴于ARCHANGEL数字档案馆的档案管理者及参与机构大多都跨学科、跨国家、跨地区,因此,ARCHANGEL 项目在实践之初采用区块链去中心化和智能合约技术来实现“许可记账”,只有被许可的参与者才能在账本上存储新内容,更新数据库,每个参与者地位平等,实现数字档案馆的共同管理。被许可的参与者通过数字指纹、时间戳、数字签名等来验证身份,追溯数字档案的管理流程及经手人员,实现信任体系的相互制约和协同。
4.1.2 灵活架构验证档案完整性
ARCHANGEL项目基于区块链的哈希算法构建了一种可验证档案完整性的架构,从数字档案初始移入档案馆开始,在区块链上保存电子档案文件的哈希值及检索必要的档案属性元数据,一旦需要对电子档案进行验证时,仅需对现有文件计算哈希值并与区块链中对应值进行对比,如有差异,则表示保存文件被篡改。
值得一提的是,ARCHANGEL项目还开发了一种针对视频档案的专用哈希算法,即使视频的档案格式发生改变,但只要内容不变,则运算后的哈希值也保持不变。
4.2 湖南省长沙市长沙县智慧数字档案馆
长沙县智慧数字档案馆是在数字档案馆的基础上,利用区块链技术,加强权限控制及身份验证,升级数字档案安全防护,发挥数字档案更大价值。
4.2.1 实现档案资源智能化管理
长沙县智慧数字档案馆通过打造数字档案资源管理平台,对所接收的各类数字档案信息进行整理、比对、分类、著录、挂接、鉴定、检索、统计等操作,对重复数据进行识别及过滤,对馆藏数字档案及实体档案进行数据分析、汇总等智慧化管理,使无序信息有序化,对数字档案数据、元数据及索引数据(目录)建立自动生成及关联功能,实现一定程度的智能化自动或档案管理功能,满足基于身份验证、权限控制的数字档案管理需求。
在实现对档案信息资源有效管理的同时,长沙县智慧数字档案馆面向不同用户群体提供档案信息的共享利用,建立全市档案信息资源总库,库中数据通过鉴定后,可根据不同的性质面向不同群体的用户提供档案利用服务。例如,发布到电子阅览室系统中,面向到馆查档的用户提供查询利用;发布到党政机关利用服务平台中,面向市直立档单位用户提供档案查询服务;发布到互联网信息门户,面向社会公众提供档案信息服务等。
4.2.2 多重加密保障数据安全
利用区块链技术的可追溯、不可篡改和分布式存储特征,长沙县数字档案馆将系统操作日志保存在区块链上,在工作时间之外,如有系统启动办理查询业务,则会将操作人员、操作时间、操作结果等业务信息上链存证,同时通知相关管理人员,能有效避免数字档案查询权限的滥用,防止档案文件泄密。
针对数字档案海量数据所带来的隐私保护及数据安全问题,长沙县数字档案馆打造大数据安全保障服务系统,在区块链分布式节点网络的基础上,通过数据分级分类加密存储[6]、数字身份关联绑定、分级数据授权访问、隐私数据分离等技术,结合常规互联网网络安全、数据安全及控制安全的技术所形成的综合安全保障服务体系,实现大数据汇聚、确权、授权、应用、分析、监管等全生命周期的监管及预警,确保数据隐私及数据安全,能够在统一安全策略下防护系统免受来自国家级别的、敌对组织的恶意攻击,避免受严重的自然灾难及其他相当危害程度的威胁所造成的资源损害,及时发现安全漏洞和安全事件,并在系统遭到损害后迅速恢复所有功能。
4.2.3 水印追溯便于定责维权
在长沙县数字档案馆的自助和人工查询界面中,所查询的数字档案将会添加区块链认证编码,并以数字水印的形式显示在查询界面或者打印出来的纸质文件中。Web 端显示档案时,统一调用带有保护功能的档案显示引擎,它具有不可复制、数字水印、不可下载等保护功能,防止大部分情况下用户未经授权的数据下载及泄露情况,可确保数据未经授权的下载及外泄。如果出现档案的非法泄露,如被旁观的人非法拍摄和传播等,可通过区块链认证编码对非法传播的源头进行追溯,为档案泄露的追责和维权提供有力的证据。
目前,长沙县智慧数字档案馆已完成20多万卷馆藏和37万件档案的区块链上链认证[7-8],并成功被中国工程院《中国区块链发展战略研究》项目的“发现100个中国区块链创新应用”栏目收录,为区块链赋能其他档案馆应用和其他行业区块链落地有非常好的借鉴意义。
5 结语
随着国家和社会信息化进程的加快,档案信息化建设是档案事业适应社会信息化发展的必然趋势,是创新档案服务机制、全面提高档案工作为社会服务能力的必要手段。利用区块链技术,打造新型数字档案馆,将为档案馆海量数据管理与服务带来深刻改变,进一步发挥其知识管理、知识开发和知识服务的核心载体功能,为国家信息化建设提供重要知识支撑。