APP下载

区块链技术在医疗大数据平台架构中的应用分析

2022-09-09王维宋倩

电子技术与软件工程 2022年13期
关键词:加密算法区块主体

王维 宋倩

(新乡医学院三全学院 河南省新乡市 453003)

区块链技术是继云计算、大数据之后最有开发潜力的核心技术,通过建立网络公共账本,网络中所有参与主体在账本中记账,所有数据公开透明,可保证信息的真实性与不可篡改性。基于区块链的网络结构具有公开透明、分布广的优势,适合用于医疗场景,目前已经有区块链医疗数据项目的案例,比如阿里健康的“医联体+区块链”,将区块链用于医疗大数据架构中,保证医疗结构之间数据相互联通。

1 区块链技术

实际上,区块链技术主要源于比特币底层技术,以分布式账本为核心,整体架构包含网络层、数据层、应用层等部分。随着区块链应用范围的扩大,以及技术应用场景的日益丰富,关于区块链的技术架构逐渐演化,人们依靠区块链技术建立电子病历与患者疾病数据,可完整的记录所有生命体征、诊断结果以及病史手术等数据,同时采集医护人员和器械设施相关数据。医疗大数据平台以区块链为前提而构建,整体架构包含基础设施、核心业务以及应用层三部分,其中基础设施层主要负责提供网络通信服务,兼顾数据存储功能;平台架构的核心业务层主要负责账本数据交换与数据隐私保护;平台应用层可以为用户提供不同场景的接口,为用户访问提供便利条件。现阶段我国用于医疗大数据的常见区块链模式主要有以下几种:

(1)腾讯区块链,常见基础设施TrustSQL 与服务平台TBaas 两方面,前者负责提供通讯协议、数据存储以及智能合约等基础功能;后者负责实现对区块链网络的部署与维护,确保智能合约高效落实。

(2)阿里云区块链,该服务一般以Kubernetes 为前提,在区块链引擎技术的试用下和阿里云服务加以整合,允许用户跨地区完成业务协作,可促进区块链业务场景在最快时间内落地。

(3)百度区块链,该平台以超级链为基础,能够减少网络部署与运维难度,通过业务和区块链的高效融合,方向用户实现业务模式的创新。

(4)华为区块链,这是华为向企业提供的技术服务平台,旨在帮助用户实现在华为云中的快速工作部署,降低区块链使用门槛,促进业务上链。

2 区块链与医疗大数据平台耦合分析

立足于医疗大数据平台,优化平台设计理念,将其与区块链相融合,基于区块链的技术特点实现医疗数据平台的搭建。对于区块链和医疗数据平台间的耦合关系,具体体现为以下几点:

(1)去中心化,实际上区块链的本质就是一种去中心化数据库,各节点保存所有数据,整个系统拥有数据访问与维护的权利,节点发生异常是不会影响系统运行的。医疗大数据平台中包含诸多节点,比如数据生产、数据分析以及数据消费等,各部分相互独立。

(2)透明化与市场化,区块链的运作应坚持公开透明的原则,节点之间数据相互交换,存在冗余备份,经过节点认证后可完成数据更新,医疗数据平台内所有数据生产与交易都是公开透明的,坚持市场化运作模式,推动医疗大数据产业链的创建。

(3)智能合约,区块链依靠链上代码促进合同智能化执行,比如比特币在线交易。医疗大数据平台的确立需要以数据在线采集和应用的自动化为前提。

(4)可追溯,区块链内所有数据都会被节点完整记录,在达到数据可追溯的同时所有数据不可篡改,医疗大数据平台经过各节点存储数据,以此完成对所有医疗数据操作的有效溯源分析。

3 区块链技术在医疗大数据平台中的作用

3.1 参与主体

迎合区块链技术发展趋势,医疗大数据平台内的主体众多,其中最主要的当属数据生产、数据分析、数据消费三部分,在各主体的相互协调作用下建立大数据平台,凭借着区块链的去中心化与智能合约特征,为平台的运行提供必要技术支撑。

数据生产主体除了医疗机构,还包含体检中心、养老机构、保险公司以及个人医疗智能设备,由于数据生产主体众多且多元化,所有主体内的医疗数据敏感性较高,数据规模庞大,这些数据具有极高的商业利用价值。凭借着区块链的分布式特征,迎合技术去中心化发展趋势,将参与主体的数据分布式存储在各节点内,以此提高数据存储效率。发挥智能合约的技术优势,为数据生产主体提供更广阔的交易渠道,同时数据在正式交易之前可完成脱敏处理,从而达到用户对于数据隐私保护的需求。

数据分析主体主要指的是提供数据采集与加工处理等技术服务的组织,同时还兼顾数据可视化服务,这是数据生产与消费主体间具有传播作用的主体,所以数据分析主体内存在海量数据流,应用区块链能够保证数据的可追溯性,确保数据分析主体发布的数据信息透明,经过处理后的数据不可抵赖。基于智能合约的数据加工服务支持自动化交易,各主体协同运作,提高区块链技术的应用价值。确立区块链共识机制,为表现优异的主体赋予更高权重,促进数据分析演进。

数据消费主体一般集中于医疗机构或涉医企业,由于医疗数据有着多样化消费模式,费用支付方式不同,当数据分析主体不同时,区块链为主体提供的数据加工服务也会不同,最终区块链技术的实际应用效果存在一定差异。由于区块链具有自动化交易的特征,且区块链在信用认证和技术服务计量上优势明显,数据消费主体可以按照自身需求设置信用门槛,选择自己所需的数据分析服务模式,确定最便捷的支付方式,提高医疗大数据的利用效率。

3.2 系统功能

建立医疗大数据平台的目标在于实现对医疗数据的高效采集与分析,将数据应用管理集中于平台中,优化系统功能,区块链可为各功能的实现提供技术支持。区块链技术用于医疗大数据平台的系统功能如下:

(1)服务计量认证,这是平台数据信息高效流动的基础,平台内涉及诸多市场交易信息,交易对象计量与认证需要得到第三方组织担保,而区块链具有分布式账本,可保障服务计量可靠,并在区块链的共识机制下提高服务计量权威性。比如区块链可以为医疗机构提供公开的SaaS 平台,可完成数据存储与加工的计量认证。

(2)服务交易,这是医疗数据生态链产生的关键,确立满足多方主体参与的市场机制,优化服务交易模式,为医疗大数据平台的建立提供保障,凭借着区块链的去中心化数据交易方式,使数据交易更加公开透明,并在一定程度上降低数据交易成本,凭借区块链的智能合约达到数据交易的自动化目的,使合约执行更加可靠。

(3)信用认证,这指的是对平台内参与主体的认证,同时可对主体进行信用评价,可作为平台公开透明市场机制确立的重要前置条件。以区块链为技术前提的信用认证体系一般会按照参与主体数据生态位和平台服务效能,以此形成具体的信用指数,这些指数会被平台内的节点准确记录,随后在共识机制的应用下完成对参与主体的评价与认证,以便医疗机构更好的掌握参与主体的实际信用情况。

3.3 数据属性

医疗平台会存储所有平台内的数据,比如健康医疗信息、服务交易信息、主体注册数据以及追溯数据等,所有基础数据在经过加工与分析之后都会被存储于医疗大数据平台内。基础数据属性冉,存储量较大但是结构简单,有着结构化特征,而基础信息与知识一般是非结构化的,具体的存储需要根据数据处理技术的应用而转变,采用去中心化和分布式存储方式,发挥区块链的技术优势,让数据存储主体产生生态群落,以共识机制完成对属性相近数据信息的存储和追溯,为数据认证提供帮助,使数据能够在区块链的作用下高效存储。

4 区块链技术在医疗大数据平台中的关键问题

医疗大数据平台在运行期间面临着较多挑战,虽然区块链技术的应用推动了平台的发展,但受到医疗大数据管理模式的限制,医疗领域内的数据挖掘和数据分析技术在实践应用期间也会遇到一定困难,比如数据标准缺失,无论是临床数据还是诊疗数据,都需要有相应的数据标准,这一标准制定可促进各平台间的数据共享与交易,为后续数据质量管理提供帮助。再比如数据隐私保护方面存在问题,以及数据的使用权不够明确,导致医疗大数据交易机制受到影响,不利于整个产业链的发展。关于区块链在平台内遇到的关键问题,主要体现如下:

(1)以区块链技术与Hadoop 平台为基础的平台架构设计问题。过去医疗云数据平台主要依靠Hadoop 来搭建,数据的操作需要依赖管理人员和有权限的人员,这些人员可对数据进行删除与修改,通过数据集中式管理的方式实现医疗数据统一管理,但是该模式有一定可能导致数据被滥用或者被随意篡改,而医疗领域内的数据信息多数为隐私数据,对数据的存储应用提出较高的安全性需求,所以以区块链技术为关键的防篡改和加密技术可保证数据传输与存储安全,将集中式管理模式转为分布式管理模式,建立共识机制,采用智能合约的方式可实现医疗数据的共享共治,这是医疗平台整体架构设计面临的重点问题。

(2)关于混合加密算法的设计问题。以往医疗大数据平台选择的加密算法比较单一,通常是使用ECC 加密算法或者MD5 算法,但是该项目的数据源于医疗领域,医疗大数据具有4V 特征与多元异构特征,对数据的隐私性要求较高,所以选择加密算法成为区块链技术应用的重点,采用ECC+AES+MD5 相结合的加密算法可最大程度上保证数据安全。

(3)基于Raft 的分布式一致性协议共享机制的建设问题,一般情况下区块链会采取P2P 点对点网络,这种网络在工作期间会有一定的延时,数据最终到达时间会有不一致的情况。除此之外,区块链数据在P2P 网络传输期间会遇到延时与堵塞的问题,数据平台节点也会遇到系统性问题,如何设计分布式一致性的算法,在保证医疗数据一致性的同时,兼顾区块链智能合约的作用,以此定时完成数据的检查和节点监控,这是区块链在医疗平台架构设计中面临的关键问题。

5 区块链技术在医疗大数据平台架构内的实践应用

5.1 实施方案

区块链用于医疗大数据平台中,需构建数据模拟平台和ETL 平台,建立区块链数据平台与可视化平台,模拟出医疗数据从输入到输出的全过程,其中区块链数据平台的建立和关键技术应用是项目实施的重点。

加密防篡改旨在保障数据传输中所有数据安全,提高数据隐蔽性,避免数据在传输期间遇到恶意窃取与篡改的情况,通过对混合式加密算法的使用,对比不同算法性能,选择最适宜医疗大数据平台的算法,为区块链与大数据平台之间的高效结合提供科学参考依据。

建立共识机制,以保障数据一致性为目的,实现所有数据内容的实时同步,防止平台内各节点处数据不一致,加强对多节点的数据管理。在混合式加密算法下自动选出数据操作者,无论是存储数据,还是修改数据,都要同步到数据其他节点中,这部分内容需要掌握共识算法的差异情况,经过对算法的比较分析选择最适宜医疗大数据平台的共识机制,为保证数据一致性和数据的同步性提供技术支撑。

应用智能合约的关键在于定期执行脚本,已完成对区块数据的预警和节点的智能监控,避免大数据平台架构中遇到无法预估的问题,为剩余自动化脚本的编写提供可操作的模板。

5.2 关键技术

5.2.1 以区块链技术为基础的Hadoop 医疗云大数据平台

区块链作为分布式数据库,其结构是有序的,各区块都能与前一区块相连,并在相应的顺序下完成数据存储,每个块都与前一块有效衔接,这样的结构有利于获取最新的块,同时在哈希算法的帮助下以最快的速度检索最新块。Hadoop医疗平台的部署模式主要有三种,其中公共链与去中心化分布式系统相对应,联盟链采用部分去中心分布式系统,而私有链则采取了弱中心分布式系统,区块链项目内主要拥有数据、网络、共识三部分层次,本项目分别从两部分进行云大数据平台的建立。

一方面,大数据架构设计。总结区块链技术使用下的医疗大数据平台创建的可行性,模拟平台应用架构情况,挖掘其中的关键问题。另一方面,分析区块链在平台架构内的实践应用,由于医疗大数据提出了隐私性与安全性需求,为保证数据安全,需要使用数据加密技术与防篡改技术,采用共识算法和智能合约,实现对数据的分布式存储,以此开发医疗大数据平台。

5.2.2 采用ECC+AES+MD5 混合式加密算法

作为平台开发环节用到的技术,无论是数字签名,还是信息加密,所使用的加密与解密算法主要有三种类型,依据不同类型的算法比较情况,本项目决定采用ECC+AES+MD5 相结合的混合式加密算法,以此实现对医疗大数据的加密处理。表1 为三种加密算法的性能比较情况,经过表中信息研究得知ECC 算法有着较强的抗攻击能力,对于数据的处理速度很快,但是存储空间比较小,由于非对称算法自身比较复杂,所以ECC 算法不适合用于大数据加密,只能与其他算法联合应用。AES 算法速度和资源效率较高,且安全级别比其他算法高,一般被称为下一代加密标准,该算法抗攻击能力较强,对网络带宽的要求偏低,适合用于加密数据量庞大的业务场景。MD5 算法类似于HASH 算法,需要在掌握密钥生成算法的情况下完成数据传输,MD5 算法的处理速度更快,一般可用来验证数据信息是否存在篡改。

表1 :ECC 算法、AES 算法、MD5 算法比较分析

采用混合加密算法,优化医疗大数据设计,有加密算法可逆,所以确立加密算法与哈希算法共用逻辑,依靠ECC算法加密小数据料,再依靠AES 算法加密大数据量,实现对用户信息的高效对比。

5.2.3 分布式一致性协议Raft 算法

立足于共识机制的确立,遵循少数服从多数的原则,常见的共识机制有很多,而共识算法的选择应当根据具体应用场景。比如Paxos 算法作为首个被证明的共识算法,一般以两阶段提交与扩展,旨在解决无恶意节点的分布式一致性问题,但是该算法在本项目中的应用难度较大。Raft 算法是对Paxos 算法的改进,其中包含总统节点、追随者节点以及候选人三部分节点,可以将一致性为划分成两个子问题,采用Raft 算法作为该平台共识机制算法,在达到平台共识机制要求的同时,降低算法应用难度。

5.2.4 智能合约促进区块预警与节点监控

实际上,智能合约就是采用数字形式的承诺,共识机制作为区块链内的法律,而智能合约就属于区块链的合同。智能合约与传统合约不一样,有着公开、透明、不能篡改的技术优势,联合共识机制与智能合约,机器替代人,为平台编写智能合约脚本,以便对区块数据及时预警与节点实时监控,向平台研发人员定期发送报告。

5.3 研究内容

5.3.1 医疗云大数据平台应用架构设计

过去的医疗云平台主要是利用Hadoop 技术实现的处理医疗与临床大数据的网络平台,数据共享模式是通过统一数据仓库和平台完成数据的集中采集与处理,此时平台应用存在着信息被篡改而失真、信息孤岛、隐私泄露等问题,导致数据共享受到影响。以医疗数据的隐私性为前提,以现有平台架构为基础,在数据整理层和数据处理层间增加区块链层,以此达到数据加密与防篡改的效果,强化数据管理效率,利用区块链技术完成自动预警与监控,优化平台工作环境。

5.3.2 医疗云大数据平台数据安全设计

“互联网+”和5G 技术的快速发展推动了数据管理技术的变更,挖掘数据价值的同时也引发数据安全问题。对于平台数据传输期间遇到的安全问题,一般会涉及到加密算法,采用ECC+AES+MD5 混合式加密算法,同时利用区块链技术,以兼容医疗大数据平台中所有数据,保证数据安全,通过对数据的加密传输与验证分析,从传输环节开始保障数据安全,转变以往单一化加密算法应用的做法,实现对平台数据安全的优化设计。

5.3.3 医疗云大数据平台数据共享共治设计

一方面,数据共享设计,即采用数据共识算法达到目的。基于区块链技术的医疗大数据平台需对数据的流转加以控制,采用Raft 分布式协议完成数据管理,确保数据存储的实时性,达到ACID 内部与ACP 外部一致性,提高数据节点存储有序性。

另一方面,数据共治设计,立足于数据块预警和节点控制的思维,采用智能合约完成对数据的自动化管理,整个过程不需要管理人员参与。基于区块链的医疗云平台可以按照实际业务需求自动编写脚本,程序可根据平台实际情况判断区块数据各节点运行的是否正常,一旦遇到异常情况,平台将会立即通知管理人员处理,从而提升系统鲁棒性。通过数据共治设计可有效优化大数据挖掘和大数据分析技术,对于临床诊断、健康管理等领域,这是医疗大数据与区块链技术关注的重要应用场景,比如辅助诊断决策的准确率高达85%。

6 总结

总而言之,随着区块链技术应用范围的日益广泛,医疗领域内开始依靠区块链技术创建大数据平台,强化医疗健康机构的数据管理水平。通过对区块链与医疗大数据平台耦合分析,分别从参与主体、系统功能、数据属性等方面阐述区块链技术的应用要点,根据平台架构设计、混合加密算法以及Raft 分布式共享机制,实现区块链技术在医疗大数据平台架构中的实践应用。

猜你喜欢

加密算法区块主体
论自然人破产法的适用主体
区块链:一个改变未来的幽灵
区块链:主要角色和衍生应用
区块链+媒体业的N种可能
读懂区块链
关于遗产保护主体的思考
基于小波变换和混沌映射的图像加密算法
Hill加密算法的改进
论多元主体的生成
对称加密算法RC5的架构设计与电路实现