区块链技术在重大慢病大数据临床科研领域的应用
2019-08-21韩士斌王士泉于慧杰王爱娥
韩士斌,王士泉,于慧杰,于 楠,王爱娥,李 伟*
(1.东华软件股份公司,北京 100191;2.火箭军特色医学中心核与辐射损伤实验室,北京 100088)
0 引言
区块链技术是继云计算、物联网、大数据、人工智能后最有潜力触发第五轮颠覆性革命浪潮的核心技术[1]。区块链的基本思想是通过建立一个网络上的公共账本,由网络中所有参与的用户(计算机)共同在账本上记账与核账,每个用户都有一样的账本,所有数据都是公开透明的,且不需要中心服务器作为信任中介,就能在技术层面保证信息的真实性和不可篡改性,即可信性。区块链用技术设计取代权威控制和情感信任,并以此建立了一种网络结构,所有用户都可以参与并成为无数节点之一,从而进行认证、确权、交易、追溯和调整等一系列操作。区块链技术公开透明、成本低、速度快、分布广,且不会被篡改、伪造和取缔记录,可广泛适用于医疗场景。
1 区块链技术在健康医疗中的应用
1.1 区块链技术的应用
区块链技术本质上是一种分布式记账技术,可以看作是一个没有中心节点的数据库,它不是由某一方掌握的,而是各方共同参与记账,利用签名私钥和共识机制,确保数据不被篡改或损毁。区块链技术的基础架构分为6层,包括数据层、网络层、共识层、激励层、合约层和应用层,每层分别完成一项核心功能,各层之间相互配合,从而实现了一个全员参与的信任机制[2]。区块链技术可以显著提升数据的安全性,节省显性及隐性的互联互通成本,因此在健康医疗领域,区块链适合应用于以下几个方面:
(1)医联体区块链。将区块链技术应用于医联体底层技术架构体系中,以解决长期困扰医疗机构的“信息孤岛”和数据安全问题。以分级诊疗就医体验为例:居民就近在卫生院体检,通过区块链技术进行体检报告分析,筛查出心脑血管慢病的高危患者,需要转诊的患者可以由社区医生通过区块链实现电子病历向上级医院的授权和流转,而上级医院的医生在被授权后可通过电子病历迅速了解患者的既往病史和体检信息,患者不需要进行二次基础检查。
(2)区域慢病、肿瘤大数据中心。基于区块链分布式存储技术建立大数据中心,可打通各医疗机构间慢病、肿瘤等医疗数据共享的壁垒,促进机构间完成数据共享,通过智能合约自动分配共享收益,助力实现持续、跨地区、跨机构的医疗大数据服务。
(3)药品溯源。区块链技术在药品防伪领域的应用与身份认证极为相似,都是利用区块链可追溯的特点,赋予药品原料与成品唯一编码,从而实现药品溯源。
(4)蛋白质折叠。蛋白质可凭借相互作用在细胞环境(特定的酸碱度、温度等)下自我组装,这种自我组装过程就是蛋白质折叠。如果蛋白质没有正确折叠,将会使人患很多病症,如阿尔茨海默症、肌萎缩性脊髓侧索硬化症、帕金森氏症等,而计算蛋白质折叠结构需要庞大的算力[3]。利用区块链技术可以建立一个分布式网络协助折叠蛋白质,网络中每一个节点在进行运算时都可以调用全网的算力,从而大大降低科研项目中服务器的采购成本。
此外,还可将区块链技术应用于医保理赔、药品流通、健康管理、医疗审计以及DRGs等领域,打造健康医疗产业新架构,助力医院、医保、医药、监管等机构能实时连接、无缝分享数据,且无需担心信息泄露与篡改。通过建立一套互信共享机制来规范医疗行为,为在医院、医保、患者之间建立透明可信的新型关系提供了创新途径,进一步激发了深化医药卫生体制改革的动力和活力,提升了健康医疗的服务效率和质量[4]。
1.2 区块链技术的优势与局限
从目前国内情况来看,区块链技术在医疗领域中仍处于尝试与应用探索阶段。区块链技术最大的价值是在一个不可信的环境中提供信任,利用技术手段建立一套互信机制,这恰恰是我国医疗行业所急需的。
例如医院将患者的诊疗过程以数据的形式写入区块链,可为医患纠纷提供证据,避免出现医闹现象或者医院篡改病历等事件;在集团化医院中,A院将电子病历、医学影像、病理等数据存储于区块链并及时同步到B医院的数据库中,使患者的治疗方案以一种精准实时、安全可信的方式在医疗体系内流转,这不仅能节约医疗人员的人力时间成本,还提高了患者信息透明度,在增加患者对医院、医生信任的同时也避免了一些重复检查项目,节省了就医成本[5];在临床科研中,共同协作的科研单位可将患者的临床数据,如性别、年龄、生理信号、实验数据、症状、诊疗过程、诊疗结果、用药等信息用区块链技术进行存储,汇聚成连续的、可共享的、实时更新的大样本疾病队列,并应用于疑难杂症、重大慢病等课题研究,有助于人工智能筛查诊断、早期干预等人工智能算法的加速研究,开发智能辅助诊疗装备;在区域分级诊疗或转诊平台中,利用区块链保存居民电子健康档案及检查、检验结果,并对相关字段进行隐私保护与权限控制,可有效解决当前居民电子健康档案更新不及时,以及在转诊(上转/下转)环节由于需要单独机构审核(一个可信的运营者),互认共享困难,难以在地区大规模推广的现状(目前,在一个区域示范医联体内部之间才能比较容易地实现转诊)[6]。
区块链技术通过计算来获取信任,其局限是效率不高。因此,在吞吐量高、交易频次很高或实时性较高的场景(如大宗商品交易)中不太适用。此外,如果业务自身要求集中式管控或者授权(比如医药订单的审批)也不适宜用区块链技术处理。
2 区块链技术在慢病科研领域中的需求分析
2016年8月,国务院发布了《关于促进和规范健康医疗大数据应用发展的指导意见》,将健康医疗大数据纳入国家发展轨迹。2017年2月,国家卫生计生委发布《关于印发《“十三五”全国人口健康信息化发展规划》的通知》(国卫规划发〔2017〕6号),要求大力促进健康医疗大数据应用发展,探索创新“互联网+健康医疗”服务新模式、新业态。在上述政策利好背景下,各类区域健康医疗大数据中心、健康大数据产业园/基地/实验室纷纷落地开花,其应用涉及健康管理、慢病服务、便民惠民、公共卫生、医疗协同、行业治理、医药研发等各类新业态。此外,由各大科研院所/中心承担的各类单病种科研项目的申报、获批也如火如荼,如由国家癌症中心牵头的“一库一网”项目,覆盖了30家省级肿瘤医院及177家市级肿瘤专科医院,计划在3 a内建成国家肿瘤数据中心及肿瘤大数据平台;由科技部主持的“精准医学研究”大规模人群队列研究类项目、专病队列研究项目(包括心血管疾病、脑血管疾病、呼吸系统疾病、代谢性疾病、罕见病等)、重大慢性非传染性疾病防控研究等科研类项目。
上述项目/课题普遍都涉及了患者病案首页信息、电子病历等临床与诊疗多模异构数据的分布式传输、汇聚、存储及分析利用。因此,对上述数据,既要求能够真实可靠地在各医院、研究单位、管理机构间流动,又要求对敏感数据进行脱敏与隐私保护,同时还要建立起各单位间完善可信的协作运行机制。区块链技术的应用推广,为临床科研领域解决上述问题提供了强有力的手段。
3 重大慢病可信共享区块链技术框架
研发重大慢病流行病学大数据监测平台,需要从临床医学中心(区域中心医院)实时汇聚心血管临床研究数据、糖尿病临床研究数据、肿瘤登记信息,从疾病预防控制中心(centers for disease control,CDC)定时采集慢病危险因素监测数据,从区域卫生健康委员会获取全员人口、住院病案首页以及死亡医学证明数据,能实现重大慢病海量结构化与非结构化数据的纵向链接,以及模糊匹配、精确检索、患者画像等功能[7]。
传统的数据共享主要采用中央服务器和灾备中心统一存储技术,各用户客户端基于中心数据库实现在线访问,但同级用户之间缺乏可信的数据共享交换机制,而基于去中心化的区块链技术从根本上可以解决这个难题。针对重大慢性非传染性专病数据共享,可通过确定基于核心关键变量及随机抽样变量的可信链账本,依托响应式编程实现自主可控的许可链,逐步建立慢病共享、交换信息的高阶共生生态运行框架。该框架通过超级账本开源项目HyperLedger来实现,共分为6层,从底层到上层分别是数据层、网络层、共识层、合约层、API层和监控层,如图1所示。其中,数据层主要封装底层数据区块以及相关的数据加密和时间戳等技术;网络层主要封装分布式组网、数据传播、消息订阅和验证等机制;共识层主要封装网络节点的各类共识算法;合约层主要封装各类脚本、算法和智能合约,是区块链可编程特性的基础;应用层主要封装区块链的各种应用场景[8]。
图1 高阶共生生态运行框架
区块链技术可解决重大慢病大数据的共享机制建立问题,通过共享权确认数据的所有权,实现区块链初始化。通过区块链一致性协议共享数据的有序扩散,采用公钥体系实现用户授权。在慢病可信数据共生生态下,每个共享资源端的机构是一个自成长的节点,均有一套独立的账本,每个客户端数据一致,即使部分客户端数据被毁也不影响数据安全的可靠性[9]。通过可视化的去中心记账原型系统,各协作机构可进一步提出数据共享索取需求,按照共享审核流程实现重点分发。面向合约容器的可视化去中心记账原型系统主流程如图2所示。
图2 可视化区块链记账原型系统主流程
原型系统包括合约容器、区块链、共识机制、可视化界面、网络传播和API接口6个部分。其中合约容器内包括合约部署、合约执行和合约验证模块。区块链包括区块存储与区块检索模块。在合约执行过程中用户可通过可视化界面或API接口方式实现调用。共识机制是区块链建立信任的基石,其内容包括账本的规范化(如何组织区块、组织交易链)、交易的确定性执行结果、交易的非双花唯一性、交易的顺序完备性以及其他保证网络安全稳定运行的其他信息(如数据可用性)。此外,账本底层还需要有共享的网络传播机制(包括各种P2P算法),便于进行基于权限的相关交易数据的快速同步。
区块链设计采用HyperLedger Fabric技术架构,使用Redis数据库持久化存储,共识算法可插拔,采用Python语言实现运行任意智能合约,慢病、肿瘤数据通过API调用实现互联互通。
4 利用区块链技术支持慢病数据共享与隐私保护
区块链技术的特性包括分布式、不可篡改、匿名性、可信共享、安全性等。利用区块链技术的分布式链式结构特性来支持健康数据的共享;利用不可篡改的时间戳特性可解决数据追溯及信息防伪问题;利用高冗余度及多私钥的复杂保管权限特性以满足安全和隐私保护要求。其中,个人隐私保护基于区块链的安全性;电子健康档案流转基于区块链的不可篡改性,通过多签名私钥与非对称加密技术来防止个人记录被窃取。个人健康数据通过哈希函数处理后放置在区块链上,之后使用多签名私钥技术,只有获得授权的单位/机构才可以对数据进行访问。如将个人健康体征数据放在区块链上,通过分配组合一个私钥private key,由几个医疗机构(或协作单位)间共同持有private key的不同部分,只有private key遇到上面任何一方,才能授权访问个人健康体征数据。
5 结语
如果说人工智能带来的是生产力的巨大提升,那么区块链技术则提供了生产关系的变革手段。利用区块链技术确保数据不被篡改或损毁的方式,更适用于医疗场景,其分布式结构可应用于医疗数据共享,其灵活的可编程特性可帮助医疗机构建立拓展应用。在去中心化的背景下,临床医学中心、疾病控制中心、卫生健康委员会等机构中慢病、肿瘤医疗数据的查询和使用记录都将以不可篡改的方式记录在区块链上,使科研人员能获取完整的队列资料用于临床研究;使卫生管理者能够动态掌握各类慢病资源,实现科学管理和决策;使患者能够掌握个人连续的健康资料,享受跨区域、跨机构的健康医疗服务,从而建立临床科研与区块链技术相结合的新模式。