APP下载

基于云存储的电子健康记录隐私保护策略探讨

2021-12-02陈静CHENJing付玉敏FUYumin

医院管理论坛 2021年5期
关键词:医疗机构加密合约

□ 陈静 CHEN Jing 付玉敏 FU Yu-min

Cloud computing has the characteristics of ultra-large scale, virtualization, on-demand services, and strong data processing capability,which means that it has built-in advantages for storing electronic health records (EHR) of patients. However, cloud computing requires a large number of users, which brings drawbacks such as privacy leakage, security risks, and data silos. Based on the privacy protection scheme of blockchain smart contract, the medical institution creates a scattered, decentralized content management system for EHR with homomorphic encryption algorithm. The system automatically hides the identity information of the patients when accessing their EHR, which promotes the EHR information sharing among the medical institutions while protecting patient privacy.

电子健康记录(电子健康档案,HER)是电子化的个人健康记录[1],记录着患者个人疾病检测与治疗的整个过程,包含病患的电子病历(Electronic medical record,EMR)[2]。在医疗过程中,通过云计算存储患者EHR已经越来越普遍,医疗机构可以根据互联网终端的实际需要对相关共享数据信息进行计算和分析。云计算处理数据信息的能力十分强大,存储HER具有先天的优势。然而,云计算也带来HER隐私泄漏与信息安全方面的隐患。

1.隐私泄露与安全隐患。存储在云端的患者疾病与健康信息一方面解决了信息共享,推动着医疗技术进步,但同时患者个人信息也遭受着泄露的风险,患者个人一般无法对访问自己医疗数据的他方设置权限,隐私随时可能被侵犯。另外,医疗机构及其工作人员需花费相当多的时间和精力向有关部门提交访问申请,在医疗数据使用前要先通过权限审查,一方面工作效率低下,另一方面也存在医疗数据被泄露、篡改以及数据传输中的安全隐患等风险。

近年来互联网技术的高速发展与医疗数据的爆炸式增长,迫使医疗机构的数据信息从内网逐渐走向云端,然而医疗行业的数据安全并未得到足够重视,导致其成为信息泄露的高发领域,医疗信息泄露的事故接连发生[3]。2017年《法制日报》报道了一起特大医疗信息泄露案件,某部委医疗服务系统被“黑客”入侵,7亿多条患者电子健康记录遭到洗劫,8000多万条公民个人信息遭倒卖。除此之外,医疗机构对患者的EHR具有绝对的控制权,EHR中包含的如身份证号、手机号、电子邮箱、活动轨迹和居住地址,医疗就诊记录等用户不愿透露的敏感信息,在存入云端之前都缺乏相应的处理[4]。然而,EHR的应用对象繁多,有医疗机构人员、疾控部门、政府卫生行政部门、药企等,当将个人的电子健康记录统统置于云端,个人隐私的泄露更易发生,数据安全的保障也更加困难,相应的,云服务提供商规划安全策略也会更加复杂,安全隐患也大为增加[5]。

2.数据孤岛。通常情况下,EHR是将患者病历或医生办公室笔记中的记录或材料加以电子化的结果。患者的EHR具有综合性,包括各阶段检查报告、手术记录、诊断中的各项检查依据、出院报告以及和所有医务人员接触后的相关记录,记载信息全面准确,所以经常会被调用。即便云计算环境下的EHR存储已是专业化的示范系统,但无法互联互通仍然是个大问题,医疗机构或医生之间的意见在数据上传云端之前就缺乏沟通或协商[6]。以美国为例,其就医分流机制让这项工作变得十分艰难,65岁以上的老年人每年平均在4个医疗机构的7个医生处就医,即便这些医疗机构中的部分或大多数使用EHR,也只会在特定情况下加以汇总,即便尝试汇总,档案的综合过程也会相当困难。数以百计的医疗机构或医务人员独自运作着程序互不兼容的EHR,使得碎片化程度成倍上升。换句话说,患者的EHR往往存储于各医疗机构,无法实现诊疗信息在医疗体系中的无障碍流通,实现医疗数据共享[7]。多年的监管遏制了医疗信息管理领域的技术创新,同时,一系列不兼容的后端系统和零散的数据限制了患者参与治疗的能力。“数据孤岛”“不实用”是目前这种互不兼容系统的现状。

区块链的EHR隐私保护思路

目前,国外已经有较多学者在研究并设计基于区块链技术的EHR系统,这些系统不仅在理论上具有指导意义,更具有一定的实践操作性,相当一部分EHR系统已经应用于医疗实践中。虽然我国对基于区块链的患者敏感数据保护的研究还处于刚刚起步状态,但我国具有庞大的医患群体。创新的关键在于,如何从细节方面切入,通过提供安全且个性化的医疗数据服务,科学地推动患者参与医疗保健[8]。依托于区块链的医疗智能合约可有效防范数据安全隐患,区块链的网络环境特点在于去中心化、不可篡改,患者的EHR可被上传并加密存储在区块链上,患者用户不但可以通过智能合约对个人EHR设置访问权限,实现对个人EHR完整的控制权,实现医疗信息之间的共享,进而实现信息综合分析,提供决策支持[9],同时无需担心数据泄露与篡改[10]。所以,采用区块链技术为医疗机构之间的患者EHR创建分散的内容管理系统,在保护患者隐私的同时促进信息资源共享[11],是一种可行的方式,该系统可以为患者用户提供一个新颖的、分散的数据管理系统,使用区块链来保存和管理患者的EHR,它可以最大限度地满足患者、医疗机构和医疗机构从业人员的需求。

用户进行云服务的主要手段是数据传输,这个过程也就成为了最容易发生数据泄露的环节,因此可以采取如对称加密或非对称加密的方式,以确保数据传输过程的安全性和隐私性。除此之外,还可以赋予患者用户访问控制权,系统通过分析数据传输过程中潜在的风险,对无权访问者设置针对性访问权限,同时注重加密方式的多样性,只有当用户有访问权限并满足各项条件时才能访问。一般情况下,相关组件信息等重要的数据,必须相互关联,且集中存储在同一个信息区块中,以防范数据篡改。这样一来,不但可以实现数据资源共享,还极大地保障了数据的安全与隐私。

以健康保险理赔为例,传统的理赔方式是,保险公司通过查看患者的EHR,将其与数据库中的投保信息作比较,最终作出理赔与否的决定。在这个过程中,患者的EHR隐私极易被保险公司侵犯,但似乎又难以找到一个既不侵犯隐私又不影响理赔的两全方案。而区块链联合同态加密技术的方案可以解决这一难题。总体思路是:在医疗领域建立一条公共链,患者在该公共链上注册成为用户,并将自己的EHR信息上传至区块链,使EHR保存在一个去中心化的系统上,供医疗机构及其人员做研究,同时患者也可以随时访问查看自己的EHR信息。值得一提的是,患者EHR与以太坊地址是以一组散列分布的数组和对应数组的哈希值存在于合约中。该合约在患者第一次入院治疗时就会创建,作用类似于传统保险理赔中的申请书,只不过是由医院保存。患者通过医院提出保险理赔申请,医院将该申请告知保险公司,保险公司将访问理赔合约中的数组,但由于EHR中的数据信息已通过同态加密处理,与患者有关的身份信息和EHR信息也已经同时隐藏,保险公司通过密钥对数据进行解密后获取计算结果,将其反馈给合约,若符合理赔条件,则自动向患者的以太坊地址进行转账。该方案正是将智能合约和同态加密技术相结合,在隐藏理赔对象(患者)身份信息和电子健康记录的情况下,实现保险公司的自动理赔[12]。

智能合约与同态加密下的EHR隐私保护方案

如何保护患者用户的EHR隐私,如何加强患者用户对EHR的控制权以及如何保证保险公司的安全理赔,对基于区块链系统的EHR建设具有重要的意义。本部分仍以传统理赔存在的隐私泄露为例,通过改进传统理赔方式中保险公司可肆无忌惮地查看患者明文EHR的弊端,强化对患者EHR信息的保护,最终提出一个基于智能合约与同态加密的自动理赔方案。在本方案中,医疗机构会为每一个患者用户创建一个理赔合约,该合约的功能相当于传统保险理赔中的理赔申请单,一旦公布智能合约,就不能再进行更改,这样合约中的信息才不会被篡改。倘若调用智能合约,只需要知道该合约所在的以太坊地址即可。

在理赔进行之前,假设医疗机构和保险公司已经约定好使用某一特定的同态加密算法,并且公钥和私钥已分别由双方保存。那么,同态加密下的自动理赔合约运行过程如下:

第一步,患者去医疗机构就诊,医生将该患者的EHR上传并保存至医疗机构的数据库;第二步,医疗机构向保险公司发出获取患者保险信息的请求;第三步,保险公司在收到该请求后,将患者参与投保的疾病病种分别加密,比如1号病种加密形式为E(M1),2号病种加密形式为E(M2),…,E(Mn)然后将加密的病种发送给医院;若是保险公司没有该患者的投保信息,依然要发送通知提示医疗机构;第四步,医疗机构开始创建自动理赔合约,并分别计算出由对称加密密钥加密的EHR和患者EHR中所记录疾病M的哈希值;计算E(M1)×E(M)-1,E(M2)×E(M)-1,…,E(Mn)×E(M)-1,并将计算结果散列分布在一列数组A[a]中,然后将患者用户的以太坊地址、计算出的EHR哈希值、EHR病种的哈希值以及数组A[a]存储至自动理赔合约中,至此,基于区块链与同态加密的自动理赔合约创建完成。与传统理赔不同的是,患者不是直接面向保险公司提出理赔申请,而是先向医疗机构提出请求,医疗机构收到患者的请求之后,再向保险公司发送理赔合约的以太坊地址,保险公司通过访问该地址查看理赔合约,并获取数组A[a]中的计算结果,使用私钥进行解密,根据解密的结果判断两个明文是否有区别,进而得出理赔与否的结论。由于计算结果是以密文形式乱序存储在数组A[a]中的,保险公司无法辨别解密后的明文与哪个密文相互对应,而且访问以太坊地址查看理赔合约时,也不能识别患者的身份信息,即通过设置智能理赔合约,并在相关数据上实施同态加密的方案,实现隐藏患者用户身份信息的功能,所以,也就无从知晓患者用户的任何投保信息,极大地保障了患者的EHR隐私。此外,在理赔过程中,保险公司还可以将医疗机构计算的EHR哈希值与合约中的哈希值作比较,以验证患者EHR信息的完整性。

将医疗记录及其哈希值存储在医疗机构的数据库中,利用区块链的连续性集成一个访问控制层,提高系统的可扩展性、可操作性和对患者的EHR隐私保护。为了抵御内部人员或者黑客的恶意攻击,将无效数据和区块链上的有效数据混合,或者将患者的EHR存储在权限区块链中,同时对EHR及其哈希值进行同态加密,以提高数据的安全性。总的来说,医疗机构及其人员、患者用户和保险公司组成一个权限区块链,并利用相关技术将医疗机构、患者用户和保险公司之间复杂的协议内容代码化,转化成基于区块链的智能合约,也提升了合约的透明度。为了使患者用户享有EHR的所有权和控制权,基于区块链的隐私保护框架,在每个节点的接入和注册阶段就划分出明确的权限,区块链上的各个节点的权限被智能合约严格控制,患者对个人EHR的控制权相应地扩大。

在理赔过程中,保险公司只能获取并访问患者用户的以太坊地址,而无法知晓与患者有关的身份信息,使患者的身份信息免遭泄露;同时也可以结合电子签名或者环签名技术,以保护交易发起人的信息[13]。这样一来,所有上传至区块链的信息都进行了加密处理,未授权节点访问敏感信息的可能性大大降低。任何节点在接入和注册时,相关的合约都会自动验证该节点是否合法,从而保证了区块链中所有节点的合法性。在传统的中心化系统中,恶意毁坏或泄露数据的情况时有发生,让数据的集中管理者防不胜防,而在区块链数据存储系统中,假设存在某一恶意节点试图访问和获取患者的EHR,则在访问之前须经权限合约的合法性验证,若该节点通过合法性验证,才能获取密钥以访问患者的明文EHR。在各个节点的交互过程中,除医疗机构和被授权者之外的各参与方都不能获取到患者的明文EHR;在转移EHR时,只允许传输密文状态下的EHR,进一步提高了EHR数据信息的安全性;在理赔过程中,医疗机构仅仅可以收到患者密文状态下的投保信息,且医疗机构无法在安全的加密状态下对其解密;同样的,保险公司也只能获取患者密文状态下的EHR和疾病病种,无法得知患者的身份信息,从而保证了患者用户敏感数据的隐私性。

基于区块链的EHR隐私保护方案之缺陷

高速发展的区块链技术,为数据资源的存储、传播和共享提供了新的工具和视角,但是作为一项新的互联网技术,在实际应用中依然面临着许多问题。从区块链智能合约的发展现状以及数据获取、存储与共享等应用的情况来看,存在以下较为突出的问题。

1.合约的转化存在翻译误差。传统合同是以语言文字表达其内容,但智能合约却是依托于互联网技术,以二进制代码的形式自动执行合同内容,二者之间存在巨大的语言鸿沟。前者为了应对实际生活中通常难以预料到的特殊案例,经常使用一些抽象性、模糊性的语言文字,以最大限度涵盖现实生活中的案例,实现合同文本的通用性;而后者为了避免或降低系统运行的安全风险,必须使用规范且精确的语言。简单说,传统合同更注重内容的广泛性,而智能合约更注重内容的精确性。所以,传统合同转化为智能合约时,翻译误差是不可避免的,相应的智能合约的法律效力也会受到一定的影响。这种影响具体表现在:第一,智能合约无法涵盖所有情形。智能合约能够处理的情形都是预定义代码所表示的案例,如果在医疗过程中或者保险理赔中发生情势变迁等特殊情形,智能合约则无法应对。第二,设置合约之前的意思表示有瑕疵。在设置智能合约之前,医疗机构及其人员、保险公司或者患者用户之间的欺诈、胁迫等行为,或者输入编码有误,将导致合约不能反映当事人的真实意思。在我国《合同法》中,上述情形是合同的可撤销情形,但智能合约是以区块链技术为依托,秉承了区块链去中心化、不可撤销的特性,所以智能合约无法撤销。第三,智能合约的违约救济存在困难。基于区块链的智能合约是匿名交易,当事人之间无从知晓对方的行为能力、履约能力等,一旦出现违约,追责就变得相当困难。针对这些问题,目前除了将语言转化得更为规范、将条文设计得更为精确之外,可以结合人工智能技术,模仿现实中的律师和法官,以应对未知场景。

2.合约性能低下。首先,由于患者EHR数量十分庞大,有的可能要分类处理,受限于区块链的计算能力,目前仍无法快速完成EHR的上传、下载和更新,这对EHR的获取、共享和利用都会产生不利影响[14]。其次,一个医疗区块链系统通常涉及到多个智能合约,且医疗机构会为每一个患者创建一个自动理赔合约,合约的种类和数量会极其庞杂,需要存储的患者EHR也越来越多,每个节点都需要大量的时间和超强的计算能力去执行合约,导致运行效率低下。最后,虽然以太坊地址不能反映个人信息,使得黑客等恶意攻击者很难根据以太坊地址获取个人身份信息,这在一定程度上保护了患者EHR隐私,但通过分析医疗机构或保险公司被特定节点访问的频率,可能会推断出该节点的信息。即便同态加密算法是目前保护数据安全最可靠的技术,但随着密码学和信息技术的快速发展,加密算法将来可能会被破解,使患者EHR面临安全隐患。

总体来说,基于区块链的EHR隐私保护方案实现了更多的功能,如缓解数据孤岛、保障数据安全和实现自动理赔等,尤其是在保护患者EHR隐私方面,隐藏了患者最为敏感的身份信息,但是在方案的性能上,尤其是效率方面稍显不足。在后续的研究中,在保障安全性的前提下可以适当减少合约的数量,注重效率的提升。

猜你喜欢

医疗机构加密合约
湖南省老年友善医疗机构建设评审与分析
FMEA法应用于现代医疗机构药事管理工作中的体会
基于广义logistic混沌系统的快速图像加密方法
在医改大背景下医疗机构财务管理人员如何适应发展需求
保护数据按需创建多种加密磁盘
加密与解密
浙江1200多家医疗机构入驻省药品采购新平台