基于区块链技术的铁路边坡监测数据录入存储方法研究
2023-06-29娄星宇王齐荣
娄星宇 王齐荣
目前,在铁路边坡灾害监测预警系统中,预防、减少、阻止边坡灾害,减少因灾害所导致地经济损失及人员伤亡任被认为是最有效的措施。铁路边坡监测数据的安全性和稳定性是铁路边坡灾害监测预警系统的重要保证,利用区块链技术录入存储铁路边坡监测数据是保证铁路边坡监测数据安全性的有效解决方案。将铁路监测信息分类,形成记录特定项目的边坡监测数据库。基于区块链技术将各个特定项目的边坡监测数据库的通过Hash加密方法加密打包成区块,并将各个区块组链构成时间逻辑上并行的区块链数据库。基于区块链技术设置数据中心,从而储存通过分析特定类别的边坡监测数据库得出的边坡稳定性的结果信息。根据铁路边坡监测工程实际特点和区块链技术的特点设置边坡监测数据的依空间信息的数据链,完成基于区块链技术的铁路边坡监测数据时空组网。
区块链; 铁路; 边坡; 数据库; 预警系统
U216.41+9.1 A
[定稿日期]2022-01-24
[作者简介]娄星宇(1997—),男,硕士,主要从事铁路线路研究工作。
截至2020年7月底,中国铁路运营总里程达到14.14万km,位居世界第二,其中高铁总里程达到3.6万km,位居世界第一。2020年9月,党中央、国务院批准新建雅安至林芝段铁路,新建正线预计1 000余公里,其中线路桥隧比预计90%以上,建设、运营难度较大,是对中国基建的一次考验[1]。中国已经从铁路建设的量要求进入到对质与创新的要求的全新阶段,已经从对铁路技术的掌握转变为对技术创新的全新征程。铁路边坡,作为铁路建设运营中的基础性工程,影响并决定了铁路建设的安全可靠性。铁路边坡监测管理系统目前缺乏统一的数据管理方式,边坡监测数据传输、储存信息化程度有待提升,边坡监测预警系统的效率与准确性受到了的制约。因此,建立一个统一标准的、技术先进的、安全高效的铁路边监测数据录入系统,依靠信息技术全面提高数据管理水平,为铁路边坡监测提供强有力的数据支撑是必要且实际的。
本文研究内容集中于区块链技术在铁路边坡监测系统中的应用,提出了基于区块链技术的铁路边坡监测数据录入存储系统的架构方案,利用区块链的自有技术优势,为铁路边坡监测预警系统提供一种去中心化的、信任度可判别的、可追溯的数据架构方式,有效提高了铁路边坡监测预警系统数据的结构效率,使系统信息化水平进一步提升变为可能。
1 区块链技术的相关技术
2008年Satoshi Nakamoto在《比特币:一种点对点的电子现金系统》中阐述了基于区块链技术的比特币虚拟货币[2],2013年Vitalik Buterin在比特币的基础上改进推出了区块链2.0版本的虚拟加密货币以太坊[3]。区块链技术是一种新型的数据库技术,与一般数据库相比,区块链技术具有去中心化、高冗余度、高可信度的优势,适用重要数据的存储架构。
1.1 区块链技术类型选取
区块链技术根据访问和管理权限分为3种类型:公有链、联盟链、私有链,如表1所示。铁路边坡监测预警系统需要记录大量数据,综合考虑各方面,本文采用私有链的方式进行研究。
1.2 区块链技术数据架构
工信部指导发布的《区块链技术和应用发展白皮书2016》中对于区块链技术做出定义:区块链技术是一种按照时间顺序将数据区块以顺序相连的方式组合成的一种链式数据结构,并以密码学方式保证的不可篡改和不可伪造的分布式账本技术[4]。实际案例中,区块链是利用相关技术验证具体数据并给出整体数据的信任体系的技术过程。区块链数据结构方式是区块链技术命名的主要依据,该技术可以分为区块和链2个部分。
区块是链结构的基本数据单元,存储对应事件的信息,区块可以分为区块头和区块体2个部分。区块头包含上一区块标识、时间戳、默克尔树根等标志与指向性信息,区块体负责记录代表的项目信息,如图1所示。
区块头是区块间指向的信息标记点,这种信息间的指向标记确保了信息的安全,同时构成了区块链去中心化的基本原理。区块头由2个部分构成:默克尔根、时间戳。默克尔根是链上事件信息总和的加密结果,按照“二叉树”规则生成,作用原理如图2所示。时间戳是表征区块事件信息在特点时间节点下已经存在、完整、可验的指标[5],时间戳往往设置为唯一标识某一刻时间的字符序列。由于单一区块下形成的中心化系统中时间戳的篡改无需成本,时间戳在单一区块中的作用不显著[6]。在链式区块中结合默克尔加密技术,则构成可信的去中心化系统,整体时间戳系统的可信度和篡改成本大幅增加。系统中区块数量伴随时间戳数量与可信度的提升而提升,时间戳系统构成去中心化系统中时间链可信度的基础依据。
1.3 加密算法
加密算法是区块链技术信息安全的重要保障。区块链应用的加密技术建立在信息共享公开的基础上[7],兼顾去中心化和安全性要求。常用的加密方式有3种:对称加密、非对称加密、散列加密,三者对比如表2所示。区块链技术要求加密的过程是单向不可逆的,散列加密更适用这一要求。散列算法又称哈希算法,是利用有限域上椭圆曲线的离散对数对输入进行加密,在保证安全性的基础上快速、储存量小、低带宽要求地获得较短的密钥[8]。
常用的哈希加密算法包括SHA-1、SHA-256、SHA-384、SHA-512、MD2、MD5等。将文本信息“hello human”采用不同的哈希算法加密,在不同程度约束的情况下枚舉求解,得到约束程度与耗时关系如图3所示。哈希算法破解难度与约束程度大致成指数相关,指定信息的加密约束足够高,信息安全程度趋近于无穷。
1.4 Hash加密通讯基本原理
哈希加密通讯是利用哈希加密单向不可逆的特点,其过程类似无标底竞标过程,由3步骤组成。第一步竞标各方广播竞标价的加密结果,第二步各方公布竞标价格,第三步校验各方价格与加密结果的一致性,具体过程如图4所示。
2 铁路边坡监测信息录入与存储架构
铁路边坡监测技术趋于时间上的实时化、内容上的多样化,对于边坡监测产生的大量的数据,采用区块链技术可以有效地保证数据的安全性,同时提升整体数据被篡改的成本和难度。
2.1 基础录入单元及单复链的选择
采用区块链技术按照分布式账本的方式记录数据时,铁路边坡监测得数据是多方面的,设置单一的数据链,会导致数据录入的过程中容错率低。以某日的边坡监测数据为例,原数据记录采用不同的格式转换成哈希值时,结果完全不同,见表3。这使得验证信息时很难以程序化的流程验证信息的准确性,同时给分析利用数据时造成困扰。
为了提升信息记录和验证效率,减少边坡监测数据录入系统后期的运维成本,本文采用多条数据链并行的方式进行架构。按照不同的单元将信息分解,并各自形成区块链数据记录,结果如表4所示。这种记录形式下,数据录入和存储的可靠性和容错率进一步提升,为数据分析和应用提供了基础结构。
2.2 整体数据结构和安全性保障措施
并行的数据链结构中,当数据记录的时间逐渐延展,数据结构会趋于网状结构,此时原先适用于链状数据结构的默克尔树技术不再适用于整体的网状结构。本文采用设置数据中心的方式进行解决。数据结构的秩序是建立数据验证的必要前提,多条数据链并行时,建立一种新的适用于网状数据的数据结构是必要的。针对数据类型的多样性,网络状的数据结构可以被适用其中,具体结构形式如图5所示。
2.3 数据库与数据中心
为解决网络状数据结构的时空顺序,从而建立起整体链状的完整数据结构,本文设计了解决方案。通过组成网状数据的各个项目按照相同的时空排列方式分别组链。数据中心记录各个项目的秩序信息,并补充时间、空间的验证信息,如图6所示。这种解决方案中,数据中心本质上是记录各个项目的关系的区块链数据库。
3 边坡监测信息录入和存储方式
3.1 项目的组链方式
以连续7天的铁路边坡监测位移量为例见表5,组建边坡位移量的数据链,具体步骤如下。结果见图7。
第一步:创建创世区块。其他的边坡监测数据将以初始区块的内容为基础进行组链,同时默认初始区块的时间点为0。
第二步:将每一个时间节点的监测数据按照预设的格式进行整理。
第三步:将监测数据进行Hash加密,为了确保加密数据的安全性,設置时间戳进行控制,此例中选用加密数据的年月日为对应的时间戳。
第四步:将整理好的监测数据内容和加密出的Hash值打包整理成区块,以加密数据为链是区块联通前后区块,构成区块链。
第五步:架构默克尔树,确定默克尔根。
3.2 空间信息组链方式
在对铁路边坡监测数据记录系统进行架构时,具体的项目无论是按照时间还是按照空间进行组链,都只能是单一基本要素的组链,这与铁路边坡数据上时间和空间的高度关联性不相匹配。
为了解决这种矛盾,本文采取了图8的数据链的组合方式。每个时刻的数据中心的记录内容结合地理信息形成一个新的数据区块,包含地理信息的数据区块根据地理位置的先后秩序组成该时刻的数据记录的空间链。
3.3 区块的识别
区块按照时间和空间进行组网之后,并行的数据链之间是没有任何区别的,如何区分不同的数据链,是后续有效使用时空区块数据网络的重要前提。本文采用了如下的方式进行标记,以某铁路边坡记录数据为例进行说明。本文通过对所需要的Hash代码进行相应的约束,约束为重度01、内摩擦角02、边坡角03,标记结果如表6所示。
4 结论
区块链作为一种数据的链式结构,实质是通过牺牲数据存储效率和算力来保证数据的去中心化和安全性的数据库。作为一种数据库的存储形式,区块链本身是不具有功能的。为了使区块链数据结构更适用于铁路边坡监测,本文类比于细胞结构对数据链进行探究:
(1)数据的核心:本文提出了将原有的一条数据链记录所有信息的结构调整为多条数据链并行的结构。在本文采用的数据记录结构中,有现场直接监测得到的各个监测项目的数据链构成了数据的核心。
(2)空间信息的组链:铁路边坡监测的工程实际当中,数据不仅是同一个监测点时间上的联系,还在于同一时间地理信息上的关联性。本文提出了数据链技术在时间和空间上的应用,是区块链数据信息更符合铁路边坡监测的实际。
(3)数据识别与接收机制:并行的数据链之间,除了记录的信息有所区别,在结构形式上是完全一样的。数据从并行的数据链中,经过分析得出结果,在记录到数据中心的数据链中需要一定的识别标志。为此,本文对并行的数据链中信息加密后的Hash值进行约束,从而对各个区块进行相应的标记,为数据的分析和运用提供基础。
参考文献
[1] 谢毅, 寇峻瑜, 姜梅,等. 中国铁路发展概况与技术展望[J]. 高速铁路技术, 2020, 11(1):11-16.
[2] 关静.区块链技术应用领域及存在问题研究综述[J].科技创新与应用,2021,11(12):134-136+139.
[3] Buterin V . A next-generation smart contract and decentralized application platform[R]. 2014.
[4] 仲盛, 黄欣沂. 区块链应用中的安全隐私专题简介[J]. 中国科学:信息科学, 2020, 50(3):161-162.
[5] 袁亮. 时间戳在区块链技术中的运用研究[J]. 中国化工贸易, 2017, 9(15):109-110.
[6] Ren Y, Zhu F, Sharma P K , et al. Data Query Mechanism Based on Hash Computing Power of Blockchain in Internet of Things[J]. Sensors (Basel, Switzerland), 2020, 20(1).
[7] Nakamoto S . Bitcoin: A Peer-to-Peer Electronic Cash System[R]. 2009.
[8] 李明株,刘瑞芹.椭圆曲线数字签名的两种改进算法[J].华北科技学院学报,2020,18(5):84-87+102.