区块链技术在水电工程电子档案管理中的应用探析
2022-05-30胡祥科陈静
胡祥科 陈静
摘要:该文结合水电工程档案管理的特点,研究了如何将区块链应用在水电工程电子档案管理中,以实现电子档案的防伪存证和可追溯性,同时提出通过对水电工程电子档案设计全局唯一编码,并结合倒排索引构建技术,提升电子档案的追溯、查询效率的可行路径,以供档案管理人员参考。
关键词:区块链应用 水电工程档案 计算机应用
水电工程建设属于大型工程项目建设范畴,其建设周期长、工程规模大,涉及参建方、关联方众多,形成的档案文件类型复杂,具体表现为来源广、数量大、类型多、多方审签、传播周期链条长等特点。如何保障全过程电子档案的真实有效、防止人为篡改,成为当前亟待解决的问题。
区块链技术由中本聪在2009年提出,是新一代信息技术的重要推动力,它利用了存储、密码学、点对点网络及共识算法等四大基础技术,具有去中心化、可追溯以及不可篡改等三大特性,可以用来解决信任及安全问题。在该技术背景下,可将区块链应用到水电工程电子档案的管理中,达到电子档案的可追溯和防伪效果,并辅助使用其他技术手段提升电子档案的查询利用效率。
一、水电工程电子档案管理现状和存在的问题
当前,水电工程建设形成的电子档案由相关业务信息系统形成、分发和传递,并由专用的档案管理信息系统进行长期管理,电子档案的“四性”保障(即真实性、完整性、可用性和安全性)主要依赖于数字认证技术(即电子签名)。由于该项技术重度依赖服务提供方,在服务时效、信息权威以及数据安全性方面存在可能的风险。此外,所有电子档案的存储一般是基于中心数据库实现的,而由于水电工程档案的传播周期和链条路径较长,一旦发生数据库级别的篡改,难以保证档案绝对安全,且很难追溯电子档案的修改和流转过程,因此便无法保障其真实性、时序性和有效性。
另外,当前对电子档案的检索大多通过建立索引的方式进行以提升效率,一般采用的是正向索引方式,而一旦涉及数量庞大的水电工程电子档案时,采用此方法將极大影响检索效率。
二、区块链在水电工程电子档案管理中的引入
围绕上述问题,本文拟通过引入区块链技术,构建水电工程电子档案区块链系统,利用其去中心化、可追溯以及不可篡改等特性并辅助倒排索引技术,解决当前水电工程电子档案管理中所遇到的问题。
(一)区块链系统节点搭建
水电工程建设过程中涉及众多业务子系统,这里以工程管理系统、招投标系统、施工管理系统、智能建造系统为例,在区块链系统框架下,每个业务子系统均关联若干区块链节点(见图1)。每个节点都能接受该子系统工程电子档案的操作请求(如上传、审签、流转、移交、使用等),所涉及的工程电子档案通过区块链实现上链、发布、验证、共识。
上述区块链节点图中,每个业务子系统均是一个去中心化的、点对点区块链节点组成的网络结构。节点中的数据和状态是由其所在网络中所有节点共同维护的,每一个节点都能对外提供服务,同样也能从其他节点请求服务。即使某一节点出现故障,只要还有正常运行的节点,该业务子系统就可以照常运行。
业务子系统中的各区块链节点是对等的,每一个节点存储的数据都是一致的,即便出现突发情况导致部分节点中的数据丢失,但只要还有一个节点有效,就能确保历史数据完好,避免单点故障带来的服务不可用和数据缺失等问题,极大提升了系统可靠性和稳定性。
(二)确定全局唯一编码标识并建立倒排索引
在本区块链系统中,通过引入全局唯一编码标识的方式对每份电子档案进行编码,编码规则为“全宗号-类别号-项目号-业务系统编号-流水号-时间戳”。该编码将贯穿整套系统,具有唯一性和全局性,可作为后期查询检索的编号标识。
在确认全局编码标识后,本系统将建立电子档案的倒排索引。而传统正向索引技术主要是建立档案与关键词的映射关系,将档案ID或者标题作为文档唯一标识Key,例如“档案A”“档案B”“档案C”中包含水电工程这个关键词,其对应的正向索引为:{“档案A”:“水电工程”、“档案B”:“水电工程”、“档案C”:“水电工程”}。利用通过此种方式建立的映射关系,在对“水电工程”这个关键词进行检索查询时,需逐一从每份档案中进行全文检索,此举将影响检索效率。
本区块链系统应用倒排索引技术建立档案与关键词的映射关系,即将档案内容关键词或者属性作为文档唯一标识Key。仍以上述为例,采用倒排索引建立的映射关系为:{“水电工程”:“档案A”,“档案B”,“档案C”},后期通过“水电工程”关键词检索时,只需要查询一次就可以得到所有包含该关键词的档案信息,从而有效提升检索效率。
(三)水电工程电子档案上链
1.利用SHA-512算法为每个电子档案生成可标识该档案的哈希指纹,其中半结构化、非结构化的档案可通过电子档案的元数据生成。
2.将电子档案的元数据、哈希指纹进行上链,并生成操作记录。这里的操作记录包括发起方、接收方、操作的方法(如上传、修改等)、电子档案的相关参数(如全局唯一标识、元数据、哈希指纹等)、操作的时间戳以及操作发起方生成的数字签名。
3.将业务系统中一个周期(如1个月)的操作记录形成区块,并进行区块的链式记录,其中区块的存储结构和每个区块存放的数据如图2所示。
如图2所示,区块中的每一次操作都会进行哈希函数运算,往上相邻的叶子节点将再次进行哈希函数运算,得到的哈希函数运算结果作为这两个叶子节点的父节点,依次往上,最后一次哈希函数运算的父节点就是操作的根哈希节点。
若区块中的某个操作被恶意篡改,该操作对应的叶子节点哈希运算结果会发生变化,并向上逐一传递到父节点和根节点。操作根节点的哈希运算结果实际上是包含了所有叶子节点的哈希运算过程,一旦出现篡改,能快速定位有问题的操作节点。
三、区块链在水电工程电子档案管理中的实际应用
通过构建水电工程电子档案的区块链系统,可将区块链的防伪存证和可追溯的特性应用到档案管理中,同时依托倒排索引技术,可有效提升档案数据检索利用效率。具体应用场景如下所述。
(一)防伪存证应用
1.数据发送:操作发起方(如某个业务子系统)将电子档案和生成的哈希指纹发送到接收方(另一个业务子系统)。
2.身份验证:每个操作均由操作发起方的私钥进行数字签名,接收方通过操作发起方的公钥进行解密来对该签名进行验证,如果验证通过,则证明该操作确实是由操作发起方发起。
3.防伪验证:接收方获取该电子档案,利用SHA-512算法生成该档案的哈希指纹,与发送方的哈希指纹进行比对,如果一致则证明该电子文档未被篡改,否则不予接收。
(二)溯源应用
针对水电工程档案数据的传播周期链条长等特点,系统中所有操作均通过区块进行链式存储记录,当需要对某份电子档案进行追溯时,通过全局唯一编码标识检索查询,可将存放在区块中的所有操作进行遍历,并将遍历结果形成链式的记录。
由于所有数据全部记录在区块链存储系统上,且为去中心化的存储方式,节点中的数据是按时间先后顺序串联存储的,将前一时间段的数据指纹与后一时间段的数据整合在一起,这样后一时间段的数据永远都会包含前一时间段的数据指纹,形成了一条由数据指纹串联的信息链条。
如果要非法修改中间某一时间段的数据,依照哈希算法原理,对应的数据指纹将会改变。因此,必须修改后续的每一个时间段的数据,否则数据链条就会在修改这一刻断掉,不再具备可追溯性。同时,为避免非法入侵修改相关记录,可通过容错PBFT共识算法防止篡改。
(三)檢索应用
针对水电工程形成的电子档案数据量较大的特点,当涉及检索应用时,传统做法是通过检索关键词进行匹配,并反馈检索结果。本应用前期建立了倒排索引,当输入检索关键词时,可直接通过建立好的倒排索引进行关键词匹配,当查询到匹配的关键词后,其所对应的电子档案以列表的形式依次串联,可第一时间获取到所需的电子档案列表,将结果反馈给用户,此举将有效提升档案数据利用效率,并可节约大量的计算资源。
四、结语
将区块链技术应用到水电工程电子档案管理后,可降低传统以数字证书认证方式为主的第三方依赖,通过构建链式区块的存储方式,可做到电子档案的防篡改和全过程溯源,所有链式操作均不可抵赖,极大提升了电子档案的安全性。另外,通过引入全局编码标识并利用倒排索引技术,有效提升了水电工程电子档案数据的查询、检索、利用效率。作为新兴技术,区块链在档案行业应用尚处于探索阶段,档案工作者应以需求为导向,兼顾技术与管理间的融合,持续不断探索,以找到最适合的实施路径。
参考文献:
[1]贾宁霄,冯敏,黄博豪.基于区块链技术的水利工程智慧化建管研究[J].人民长江,2021,52(增2):312-315.
[2]骆建珍,杨安荣,马来娣.电子档案“四性”检测要求及其实现方法[J].浙江档案,2017(12):27-30.
[3]黄文燕.区块链技术在电子档案管理领域的应用探析[J].北京档案,2021(7):25-27.
[4]杨伟华,汪辉,刘武念.区块链技术在工程项目管理中的应用构想[J].建筑经济,2020,41(S1):141-143.
作者单位:1.中国长江三峡集团有限公司档案中心2.中国长江三峡集团有限公司科学技术研究院