APP下载

基于分割的云存储医疗大数据分级保密模型设计

2021-04-01殷亚萍凌毅德朱芳华

计算机与网络 2021年3期
关键词:云存储隐私保护

殷亚萍 凌毅德 朱芳华

摘要:为提高在云存储环境中具有密度高、关联复杂的医学大数据安全保密级别,基于数据分割和等级关联结构,以数据加密的隐私保护算法为支持,提出了一种新的大数据资源的隐私保密模式。从云环境下医疗大数据特征入手,分析云存储中数据隐私保护机制,提出基于分割的云存储数据分级保密模型,大大提高了数据的安全性。研究表明,该模型可以有效保护数据安全和隐私,提高云端数据的安全程度及提高执行效率。

关键词:云存储;数据分割;分级加密;隐私保护;医疗大数据

中图分类号:TP393文献标志码:A文章编号:1008-1739(2021)03-65-3

0引言

近年来,云计算已在医疗信息化建设领域得到广泛应用。云存储、管理、集成共享技术和健康医疗业通过高效、准确和深度融合,满足了病人就诊、优化医疗卫生业务流程及提高服务效率等方面的要求,促进了医疗卫生服务模式和管理方面的深刻变化,也为促进业内健康的快速发展,提供有力支持。我国将健康医学大数据定位为“国家重要的基础性战略资源”,安全是健康医疗大数据的核心基础,数据安全的重要性不断凸显,直接系着国家安全[1]。

云计算可以使大数据的提取与分析成为可能,实现了云端的健康医学大数据存储。云存储系统中,数据安全问题的核心是数据管理权和所有权的分离,云服务提供商获得数据的优先访问权,由于内部存在问题,因此数据安全存在问题[2]。基于上述分析,提出改进的分离存储方法,即真实的数据在客户端分割后加密传输到云存储服务器,数据目录信息保存于本地。这种方式实现了文件数据与元数据割离,使服务商无法获取元数据,再对分割数据分级加密上传,进而提高数据上传到云端后的安全性。

1医疗大数据特性

医疗大数据平台对全院数据采集、清洗、形成云存储数据中心,数据中心逻辑串联后形成以患者就诊为核心的资源中心,具有以下几个特点:

①多态性:区别于其他大数据最明显的特性,同一就诊序号对应的数据既包含真实姓名、身份及年龄等纯文本型数据,又包含B超、CT、MR等图形数据,还包括各类检测的生理生化的数字型数据。

②冗余性:相同的患者不同时间、不同医院就诊会产生相同信息、不相关信息和矛盾信息。

③不完整性:部分医疗数据,在记录时产生的信息有缺失,应用共享时不能反映出本身不完整性。

④时间性:心脑血管等疾病发生、就诊均在一定时间内产生,数据具有时序性。

2体系架构

基于分割的云存储分级数据隐私保护模型是基于客户端/服务器模型构建的,客户端包括分割模块和分级加密模块;服务器是指云端处理系统,包括分块模块和存储模块[3],体系架构如图1所示。

3关键模块

3.1分割模块

在大数据分割过程中,通过固定大小分割和非固定大小分割2种方式将文件在上传前根据情况分割成大、小数据库。

①固定大小:产生0~(文件尺寸)之間的随机序列,长度与小块数据的大小相等;从小到大地排列随机数据,得到字节所在的位置;将对应的字节位置由原文件分割,并与顺序序列的随机数字节保存,作为一个小块的数据;将分割过的文件视为大量数据。

②不固定大小:自动将文件的大小设置为随机数范围(1~10),随后生成一组随机数,将此值作为抽取位置的增量,满足随机数的范围。依次从固定的位置中抽取一个字节,使该位置和随机数一起获得下个字节的位置,直到该位置比待上传的数据小得多;再将相应位置的字节从原始文件中分离出来,并与顺序序列的随机数字排列合并,作为一个小块的数据,将原文件分割成大量的文件。

3.2分级加密模块

根据医疗大数据特性,本分级加密模块采用3种不同程度的加密算法,安全级别如下:

①低级:基于TEA算法的加密机制,这种机制的安全程度相对比较低,但处理速度占非常大的优势,适合隐私要求相对低的数据。

②中级:基于数据染色的加密机制,安全性适中,计算难度远远低于传统加密计算,适合隐私要求普通的数据。

③高级:基于高度椭圆三角曲线数据加密的高级算法,应用此加密算法时数据安全性最高,但数据处理速度有所减慢,适合对个人隐私极高安全要求的用户数据处理[4]。

当客户端上传文件时,提取对应的上传文件分割成大量的数据,分级加密模块启动用户的数据和选择安全战略,根据用户的选择使用相应算法处理上传数据,并维护安全战略映射表,保存与本地相对应的参数。

在下载文件时,当密文被下载到本地后,分级加密模块可快速查找文件、加密策略映射表、加密及解密文件生成大量数据。

加密过程中的加密算法基于本地小块数据生成,通过对此项数据块进行Hash操作,生成128位数值作为TEA的密钥。

4基于加密的隐私保护算法

4.1 TEA加密算法

TEA是一种小型分组对称加密算法,其明文密分组长度64 bit,密钥长度128 bit。利用不断增加的Delta值作为变化,使每轮加密迭代次数改变[5]。算法特征存在0x9e3779b9,核心加密算法,如下:

猜你喜欢

云存储隐私保护
基于层次和节点功率控制的源位置隐私保护策略研究
关联规则隐藏算法综述
大数据环境下用户信息隐私泄露成因分析和保护对策
大数据安全与隐私保护的必要性及措施
基于云存储的气象数字化图像档案存储研究
试论云存储与数字版权的冲突、法制与协同
云存储出版服务的版权侵权责任风险分析
云存储技术的起源与发展
基于云存储的数据库密文检索研究
社交网络中的隐私关注及隐私保护研究综述