APP下载

基于区块链技术的缺血性卒中医疗质量评价应用初探

2020-07-07李子孝刘翔宇朱皞罡王孟杨昕王春娟姜勇林琳王韬赵性泉1王拥军1第一作者

中国卒中杂志 2020年6期
关键词:调用事务缺血性

李子孝,刘翔宇,朱皞罡,王孟,杨昕,王春娟,姜勇,林琳,王韬,赵性泉1,,王拥军1,(*第一作者)

作者单位

1100070 北京首都医科大学附属北京天坛医院神经病学中心2国家神经系统疾病临床医学研究中心

3国家神经系统疾病医疗质量控制中心

4北京航空航天大学生物与医学工程学院

5软件开发环境国家重点实验室

6北京大数据精准医疗高精尖创新中心(北京航空航天大学&首都医科大学)

7首都医科大学附属北京天坛医院信息中心

健康医疗大数据作为我国国家战略资源,助力《“健康中国2030”规划纲要》和人工智能发展战略的实施[1]。来自医院信息系统的数据,如电子病历、检验报告、影像资源、医嘱和病案首页成为健康医疗大数据主要来源之一[2],应用于医疗质量过程评价的数据来源[3]。如何实现医院间的数据可信、安全和持续的互联互通是开展基于数据决策的医疗质量评价和改进的基础。

医疗质量评价和改进是提高缺血性卒中医疗服务质量和降低患者卒中复发的有效途径之一[4-5]。持续地获得患者诊疗过程数据是开展医疗质量评价和改进的基石[6]。基于人工二次录入的卒中诊疗过程医疗质量数据采集和上报是目前国内外常用的数据采集模式[7-8]。然而,这种数据采集模式存在数据质量准确性、连续性、人工成本、时效性等问题,以及参与医院对数据安全性和分享性的疑虑,制约对医疗数据溯源性、可持续、及时性、可及性的缺血性卒中医疗质量评价和改进[9]。基于电子病历、实验室检测、影像报告和医嘱等医院信息系统的数据进行结构化和汇交并形成医院诊疗数据库成为开展缺血性卒中医疗质量过程评价的新的数据来源[3]。但是为了确保信息安全,传统的数据库形成以医院、科室,甚至是设备为单位的“信息孤岛”[10],这种传统的数据中心化聚合分析思路制约多中心远程调用计算和评价,成为阻碍医疗大数据、人工智能等新兴技术应用于医疗质量评价和改进的重要因素之一[11]。

基于智能合约区块链的医院信息系统数据平台建设已逐步在国内开展[12-13]。区块链(block chain)采用分布式的数据存储、点对点传输、共识机制、加密算法等计算机技术,实现去中心化的分布式结构的医疗数据共享,为数据存储传输、溯源性、安全性等提供了良好的解决方案。在医院间,实现去中心化并最终形成统一标准的数据分中心,为进一步医疗数据分析和开展人工智能应用奠定坚实基础[14]。

本文介绍了探索采用“模型投放”,即算法流替代数据传输的思想,以区块链[15]和智能合约[16]技术为依托,整合安全沙箱[17]、密码学、摘要生成等关键技术,开展基于医院信息系统数据的缺血性卒中医疗质量过程指标评价体系。

1 平台模型和技术

1.1 基于区块链的技术模型和架构 缺血性卒中医疗质量评价应用基于区块链及相关技术,构建医疗指标评价共享的实施方案,完成相关的信息交换指标。该场景中的研究对象主要有3类:①医院:选择前期已完成缺血性卒中医疗信息系统相关数据结构化的医院。②患者:采用ICD-10编码确定的主诊断为缺血性卒中患者(I63)。③缺血性卒中医疗质量控制指标:采用国家卫生健康委颁布的缺血性卒中医疗质量控制指标中用药相关指标。

缺血性卒中医疗质量评价整体应用场景分为敏感域和公共域两个部分。敏感域属于各医院自有和相互隔离,内部存放用于进行缺血性卒中医疗质量指标评价的基础医疗信息,禁止外部网络访问个案数据。公共域作为开放环境,负责提供用于进行缺血性卒中医疗质量指标评价的数据分析算法,可对算法进行迭代更新。算法以“算法流”方式进行投放,随用随取。

技术架构采用软硬件混合搭建,主要硬件以“数据网关”作为前置机;软件则以区块链、智能合约以及安全沙箱等技术为基础进行开发。架构分为基础层、管理层和操作层三层(图1)。基础层为嵌入式操作系统,提供基础的硬件接口访问能力;管理层以Docker沙箱技术[18]为蓝本,针对沙箱的创建、管理、维护、清除等生命周期管理以及数据安全擦写等功能进行了针对性的补充和增强;操作层则在沙箱内部提供对算法的基础环境支持。

1.1.1 执行方法 在已完成缺血性卒中医疗质量数据结构化的医院部署数据网关,完成“敏感域-公开域”隔离带的搭建。执行过程中,智能合约依据各医院审阅授权,并记录在区块链上的操作主体,负责整体控制;数据网关中的安全沙箱作为授权执行机构,具体协调算法流、数据流,并输出分析结果和运行日志。

在具体执行时,用于评价缺血性卒中医疗质量的智能合约根据实际操作医院的情况,在数据网关生成安全沙箱,并将算法流从公共域引入。此后,可能包含敏感信息的患者数据(如患者隐私信息、人口学特征等)以加密方式通过私有域进入安全沙箱。在沙箱内部,数据完成解密后,算法完成数据分析并输出结果,反馈给预先指定的用户。并将操作流程记录在区块链上。沙箱管理系统在捕获完成信号后,对沙箱进行销毁,保障敏感数据安全无泄露,整个流程如图2。

图1 区块链系统架构

图2 区块链系统中数据和算法的流程

1.1.2 关键技术

(1)敏感数据的跟踪保护

从需求产生并准备执行开始,区块链系统对数据调取、算法分析、结果输出、沙箱销毁等全部操作进行共识和记录,其不可篡改的特点保障数据的安全,同时也记录了数据与结论之间的关联关系。采用了基于微实数并行排序思想的微误差共识协议(ϵ-differential agreement,EDA)[19]。通过抢占式排序和并发共识,以提供适合业务场景的系统性能。

(2)基于智能合约的算法调用机制

区块链系统在完成数据跟踪保护的同时,对医疗质量评价算法的调用情况进行记录,以统计算法运行效率、准确率等参数。采用智能合约技术对算法进行整合,使每一个算法成为一个独立的智能合约,通过调用智能合约,获得算法的运行权限,并将算法流投入安全沙箱,对沙箱内的数据进行分析。智能合约的每次调用和运行记录同样会被区块链系统记录,并与安全沙箱的输出日志一一对应。

(3)基于元数据链的跨中心检索机制

采用目录链共享检索机制,应用摘要生成算法,将医疗信息非敏感的元标签存放于公开的元数据链上。采用基于局部敏感哈希[20]的特征检索系统,生成特征区域的局部敏感哈希字符串并建立映射关系。因为哈希值与原始数据为单向映射,可以实现保护原始数据的同时,完成数据的“以图检图”。通过特征检索,找到目标数据后,调用预先签署的智能合约或采用文件交换途径,向医院的数据库借取对应的资料,并完成统计分析。

1.2 形式化语言和工作流建模工具 众多的研究表明临床指南和临床决策路径可以被计算机程序解释执行[21]。其中有代表性的工作流建模语言和工具会嵌入逻辑规则来表示任务的结构,如计划、决策和动作。这些任务组成面向时间的流程来代表临床决策路径和指南,例如Asbru、EON、GLIF、GUIDE、PRODIGY与PROforma[22]。

本文提出一种去中心化的工作流建模语言和引擎工具,该工具通过认知计算模型引入工作流建模过程,使用认知分析出的本体及其关联规则并封装成要素构件,以构件拖拽方式实现工作流的可视化设计,创建后的工作流程可以在区块链上运行。此工作流建模语言和引擎工具可以替代以代码形式建立的智能合约,用于构建并部署一系列决策支持系统、指南和其他临床应用程序。

通过工作流引擎,可以将临床指南和医疗准则建模为任务和数据项的组合。其中任务模型分为4类:“动作”表示需要在外部环境中执行的过程,“查询”是指需要从外部系统获取信息和读取数据过程,“决策”是必须做出选择的过程,“计划”是按照规则和分类组合在一起的任务集合。工作流引擎形式化过程可以用有向图来表示,其中节点表示任务,连线表示调度关系。“动作”被表示为正方形,“查询”被表示为菱形,“决策”被表示为圆形,“计划”被表示为平行四边形。模型本身包含一个根计划,根计划可以递归地划分为子计划(图3)。

图3展示了工作流引擎的技术架构图。Web应用端是工作流创建的编辑器、状态跟踪器和查询器,提供工作流设计、创建、状态监视、校验、查询功能。在应用端界面存储了工作流的任务基础模块:“动作”“查询”“决策”和“计划”。通过拖拽任务模块和组合资源库模板库,可以定义出新的资源库模块以及更复杂的工作流程序。资源库以本体资源库、合约模板库、语法语义库为基础,支持上层可视化合约的构建。服务与组件主要有两个部分,一是合约虚拟机(smart contract virtual machine,SCVM),负责测试和执行构建的合约,二是服务模块,完成工作流、资源定位、远程调用等服务。存储与查询应用程序接口(application programming interface,API),以标准化API的方式对合约的执行过程及结果进行存取。持久化存储与索引,以区块链的方式进行存储,建立资源和合约的索引,便于存取。

图4演示了一个通过工作流引擎创建的智能合约。从开始节点开始执行后面接两个“计划”——分别通过沙箱提取“抗血小板药物治疗率分子统计”和“抗血小板药物治疗率单项药物统计”数据,然后连接一个决策——“抗血小板药物治疗医疗质量指标算法1”,用来评估缺血性卒中患者抗血小板药物治疗率,从而明确需要改进的指标。最后,沙箱在通过数据网管输出计算结果后,完成自销毁。

图5 基于医院信息系统的缺血性卒中医疗质量评价平台

2 运行及测试结果

2.1 系统运行结果 采用上述思路和方法,搭建了基于医院信息系统的缺血性卒中医疗质量评价平台(图5),选择三家已完成缺血性卒中医疗质量数据结构化的试点医院的数据库参与医疗质量评估工作。通过合约创建工具,研究人员在系统中以图形化流程的方式创建、校验和发布智能合约。

用户通过调用相应的智能合约,自动对医院的数据进行分析评估,并生成分析结果。在验证中,系统对各参与医院的病案记录、检验信息和医嘱信息等数据进行分析,完成缺血性卒中住院日、费用、死亡率等效率、负担、结局指标的测算。分析过程中,智能合约通过调用外部测算方法,对院内医疗信息摘要进行检索,并对需要分析的内容进行提取。整个过程中,全部计算发生在数据网关根据智能合约创建安全沙箱中。分析结束后,沙箱对医院输出分析结果,并完成自我销毁,受保护的医疗数据未离开医院私有域,安全性得到了有效验证。

系统在三家医疗机构的数据中完成初步验证,并获得了良好的系统性能(表1),区块链秒平均写入通量达到9000条记录,特征检索时间不高于10 ms,能够在多中心协作和敏感信息受控场景中,开展缺血性卒中医疗质量药物相关过程指标评价,具体结果见表2。

表2 缺血性卒中医疗质量过程指标评价

2.2 系统测试结果

(1)沙箱测试结果

功能性:实现沙箱创建、沙箱销毁、沙箱单次执行、沙箱多请求执行、沙箱超时控制、沙箱数量控制、沙箱内禁止访问外网域名控制、沙箱内禁止访问外网IP加端口控制、沙箱内存监控、沙箱内禁止文件写入磁盘和沙箱中禁用linux系统中/usr/sbin下相关指令等功能。

性能效率:支持沙箱单次执行,超时设置为9 s、算法延时设置为5 s时,沙箱支持合约算法执行完成运行时间为5.146 s;支持沙箱多请求执行,超时设置为29 s,在沙箱数为3,队列数为3的情况下,共执行727次算法合约,沙箱支持合约执行完成的平均运行时间为16.603 s。

(2)合约测试结果

在单用户场景下,数据目录写入事务平均响应时间为1.58 s,查看事务平均响应时间为0.08 s,提交事务平均响应时间为1.59 s;在10 654条分布式数据中进行数据目录查询,事务平均响应时间为0.13 s;进行数据目录详情查看,事务平均响应时间为0.11 s;提交数据库事务平均响应时间为1.30 s;加载全部库目录事务平均响应时间为0.07 s;进行库目录详情查看事务平均响应时间为0.73 s;提交表目录事务平均响应时间为0.99 s;在10 703条数据中进行表目录查询事务平均响应时间为0.15 s;表目录详情查看事务平均响应时间为0.11 s;在远程源数据库中对己上链的库表字段进行修改,操作结果同步到系统中时延为10 s;在远程源数据库中对已上链的库表字段进行删除,操作结果同步到系统中时延为10 s;在远程源数据库中对已上链的库表字段进行新增,操作结果同步到系统中时延为5 s;通过可视化方式创建不带算法的数据合约,事务平均响应时间为0.72 s;通过本地上传方式创建不带算法的数据合约,事务平均响应时间为0.29 s。

10个用户并发场景:调用数据目录上链接口,事务平均响应时间为0.17 s;调用库目录上链接口,事务平均响应时间为0.36 s;调用表目录上链接口,事务平均响应时间为0.17 s;可视化创建合约接口,创建不带算法的数据合约,事务平均响应时间为1.41 s;本地上传创建接口,创建不带算法的数据合约,事务平均响应时间为0.83 s;带数组去重算法的数据合约执行接口,事务平均响应时间为0.68 s。

20个用户并发场景:调用查看职责目录详情接口,事务平均响应时间为0.06 s;调用数据目录查询接口,在10 654条数据中进行数据目录查询,事务平均响应时间为0.18 s;调用查看数据目录详情接口,事务平均响应时间为0.07 s;调用库目录查询接口,返回全部库目录数据,事务平均响应时间为0.08 s;调用查看库目录详情接口,事务平均响应时间为0.08 s;调用查询表目录接口,在10 703条数据中进行表目录查询,事务平均响应时间为0.10 s;调用查看表目录详情接口,事务平均响应时间为0.30 s;调用不带算法的数据合约执行接口,事务平均响应时间为1.01 s;调用带数组去重算法的数据合约执行接口,事务平均响应时间为1.26 s。

50个用户并发场景:调用不带算法的数据合约执行接口,事务平均响应时间为3.01 s。

3 讨论

本文初步探索了区块链技术在缺血性卒中医疗质量评价体系中的应用,其中融合智能合约、安全沙箱、摘要生成等区块链技术手段,建立了缺血性卒中医疗质量评价平台。在三家已完成缺血性卒中医疗质量数据结构化的医院的数据库架构上,有效实现了缺血性卒中医疗质量指标评价。进一步应用数据信息提取、数字化追溯和跨域投放,为开展基于医院信息系统的医疗质量评价和持续改进奠定了技术基础。

这种医疗质量评价体系基于区块链技术实现了数据不易篡改、很难伪造、可追溯、分布式基础机构,与计算范式的医院信息互联互通信息平台建设。平台利用分布的区块链式数据结构来验证与存储脑血管病质控医院临床数据,采用分布式节点共识算法来生成和更新医院的临床数据,应用密码学方式保证临床数据传输和访问的安全,利用由自动化脚本代码组成的质控医院间智能合约来编程和操作临床数据。

平台基于区块链技术的关键环节如下:

(1)对质控医院的脑血管病临床数据资源和结构进行评估,形成详细的临床数据目录链系统,覆盖临床数据结构和内容。之后对临床数据资源进一步进行规范化完善,逐步达到有价值临床数据的目标。

(2)项目医院有价值临床数据证明的发放,这个过程主要针对有价值临床数据证明本身文件实现防伪,利用区块链可以做到电子权益证明去中心化发放,并且保证不可篡改。

(3)项目医院有价值临床数据的流通,这个环节反映有价值临床数据的流动性。基于区块链,这个有价值临床数据资产可以实现点对点流通,并可以再切分,促进流动性的增强。

综合上述三个环节,平台在医疗领域中可将临床数据转变为有价值的临床数据,这种权威而专业的评估有着非常重要的作用,可以提供评估、风控、增值等服务。

本探索研究是在区块链系统的基础上,采用基于智能合约的缺血性卒中医疗质控指标算法整合和调用机制,使每一个算法成为一个独立的智能合约,通过调用智能合约,获得算法的运行权限,并将算法流投入安全沙箱,对沙箱内的数据进行分析。智能合约的每次调用和运行记录同样会被区块链系统记录,并与安全沙箱的输出日志一一对应。在完成数据跟踪保护的同时,对质控指标的算法的调用情况进行记录,以统计算法运行效率、准确率等参数,便于总结算法瓶颈,为后续升级提供方向。

在利用医疗数据开展质控评价工作中,经常需要进行跨医院协调支持。然而,传统的检索是建立在对数据库的直接访问基础上,这在多中心医院协同中存在数据管理和安全等的屏障,而应用区块链技术的优势实现了基于元数据链的跨中心检索机制,采用目录链共享检索机制,应用摘要生成算法,将医疗信息非敏感的元标签存放于公开的元数据链上。医院通过特征检索,找到目标数据后,调用预先签署的智能合约或采用文件交换途径,向原始医院借取对应的资料,并完成统计分析。

在数据安全方面,数字化信息具有易复制、难追踪等特性,很难做到有效保护。本研究通过引入区块链的数字资产化思想,将数据作为特殊资产,在区块链上进行管理,明确权属并跟踪记录其流动,同时,结合安全沙箱和加密技术,做到使用留痕、用后销毁,保障原始数据的安全性和唯一性,从而使得数据的管理和保护成为可能。从需求产生并准备执行开始,区块链系统对数据调取、算法分析、结果输出、沙箱销毁等全部操作进行共识和记录,其不可篡改的特点保障了数据的安全,同时也记录了数据与结论之间的关联关系,使之可以在不获取原始数据的情况下,证明结论的有效性和可重复性。

医疗行业是典型的高通量并发场景,全流程的记录需求会对区块链系统产生巨大的压力,传统的公有链系统共识协议[如工作量证明算法(proof of work,PoW)、股权证明(proof of stake,PoS)等]无法提供足够的并发性能[21]。本研究采用了基于微实数并行排序思想的EDA共识协议[19],通过抢占式排序和并发共识,以提供适合业务场景的系统性能。

本研究的快速实施依托“十三五”国家重点研发计划正在开展的基于医院信息系统的脑血管病大数据平台建设,根据卒中医疗质量评价的需要变量进行结构化和标准化的处理,建立医院卒中质控专用的数据库,这为开展基于区块链的缺血性卒中质控平台建设、数据调取和分析奠定了坚实的基础。目前已完成如下工作:设计信息系统标准数据接口,规范数据字典;收集各医院的接口数据,校验上报数据,对整体性、种类完整性、数据项完整性等进行检查;数据清洗,处理问题数据,收集原始资料,保障数据溯源;组织医疗专业人员进行业务逻辑核查和数据修正,并对数据字典和采集规范进行补充、完善等。

本研究主要为解决如何在非本地中心开展缺血性卒中医疗质量指标的评价,即在不暴露医疗信息等敏感数据的条件下,基于“模型投放”架构,解决医疗质量指标算法的推送、应用、迭代以及后评估问题。在数据分析及评估应用的完整流程中,算法需要在运算平台上调用数据,并形成运算结果对外输出。在上述生态内,算法、数据与运算平台三者缺一不可。而传统的以保护敏感信息为目的的“信息孤岛”则彻底将数据从生态中割离开,形成了巨大空洞,阻碍了未来“人工智能+医疗”的深入结合与推进[11]。未来将区块链和人工智能相结合,基于深度学习的医疗人工智能分析技术,是一种以数据基础与应用效果直接正相关的统计分析方法。随着目前医疗数据的使用途径缩窄,未来这种技术的发展方向也正被社会各界广泛关注[14]。对于人工智能这种严重依赖数据迭代和更新的应用,“一次成型”的部署方式难以发挥其功能和价值。目前系统已经具备了算法的投放能力,下一步将与多中心数据统计,特别是联邦学习、多方安全计算相结合,解决应用算法在敏感信息环境中的投放问题,打通数据交汇渠道,探索并推动形成医疗数据模型设计开发的新模式,即医疗机构提供数据基础、医疗知识和应用渠道,科研机构提供模型的智力支持,整体环境将从现在的以科研机构或企业为中心,调整为以医疗机构为中心,将为医疗行业与信息技术融合提供更坚实的发展基础和广阔前景。

致谢:北京嘉和美康信息技术有限公司张雷、郭伟光,张义超、郝昌龙、王涛、邵义工程师对结构化数据库建设的技术支撑。

猜你喜欢

调用事务缺血性
白芍-甘草药对及其主要成分抗缺血性脑卒中作用的研究进展
北京市公共机构节能宣传周活动“云”彩纷呈北京市机关事务管理局
替罗非班联合尿激酶在缺血性脑卒中治疗的应用效果
缺血性脑白质脱髓鞘病变的影响因素
系统虚拟化环境下客户机系统调用信息捕获与分析①
针对基于B/S架构软件系统的性能测试研究
一种Web服务组合一致性验证方法研究
Hibernate框架持久化应用及原理探析
仙鹿活骨丸治疗股骨头缺血性坏死的实验研究
基于属性数据的系统调用过滤方法