数字教育资源云存储安全策略
2015-03-28张玉伟姚红玲
张玉伟,姚红玲
数字教育资源云存储安全策略
张玉伟,姚红玲
(石家庄信息工程职业学院 传媒艺术系,河北石家庄 050035)
云存储为数字教育资源带来海量存储的同时也带来数据安全性问题,针对现有的教育资源云存储平台在数据保密性方面的不足,在数据保密性方面对现有的数字教育资源云存储平台给出改进的方案,主要改进文件加密/解密、数据库加密/解密、密钥管理和客户端4个模块,引用加密算法设计,保证加密效率和加密数据的安全性.
教育资源;云存储;系统架构;安全策略
云计算具有安全、方便、数据共享及无限可能等优势特点.然而,对于网络教学资源而言,云环境下数据都存储和运行在远端的云计算中心,而非传统的数据中心.云计算复杂性、用户动态性等都使网络教学资源云存储的安全性、保密性、可用性变得不确定,云环境在为用户提供高效、海量、便捷服务的同时,也对教学资源云存储安全带来了新的挑战.目前,随着国家及省级相关文件的先后出台,致力于打造优质数字教育资源成为各大院校和各级教育机构竞相追逐的目标,如何更加安全可靠地实现教育资源共享,成为了数字教育资源云存储平台建设亟待解决的一项难题.但是目前,云计算作为一个整体概念还处在发展时期,相关的技术规范还不健全.本文在分析省内数字教育云资源主要的安全威胁前提下,构建出云存储安全分层模型,并将研究重点锁定在数据保密性方面,把文件加密、数据库加密、密钥保护作为改进云存储安全的策略,以保证基于云平台的数字教育资源存储安全,从而为河北省各院校、培训机构打造优质教育资源,满足人才培养需求,进而促进服务地区经济建设和产业发展,构建终身学习体系有着重要意义.
本文基于教育资源云存储平台的安全性问题,分析了现有的教育资源云存储平台在数据的保密性方面的不足之处,并对其中关键问题如文件加密、数据库加密、密钥保护的问题进行了重点阐述.基于上述的关键问题,方案给出云存储实验平台的设计,并提出了云存储加密/解密和密钥管理的方式,从而建立起可信的网络教学资源安全云.
1 云安全现状和研究目标
1.1 云计算和云存储
1.1.1 云计算
云计算[1]作为现今重要的资源服务方式,已经被越来越多的商业及教育机构采纳和接受.它以资源的虚拟性和动态伸缩性,将数以亿计的资源以服务的形式通过互联网提供给广大用户.一般的云计算被分为以下3类:基础设施即是服务,也就是Iaas;平台即服务,也就是Paas,还有软件即服务,也就是Saas.现在世界上越来越多的大型科技公司和科研机构都加入到了云计算的研究领域,并且一些公司已经推出了自己设计的云平台,逐步实现从软件服务提供商到信息服务提供商转变的过程.
1.1.2 云存储
云存储作为云计算中的重要组成部分,以其海量的、易于扩展,并且虚拟化的资源存储池所著称.其出现解决了用户资源海量存储的问题,也就意味着存储以服务的形式通过互联网提供给广大用户,提供商对用户主要按照存储时间和占用的空间量进行计费.
云存储的主要存储形式分为文件存储和数据库存储2种:
1) 文件存储
相对传统的文件存储而言,云存储具有虚拟性和较大的可扩展性,因此云存储不像传统存储一样具有存储分区,云存储大都采用的是域或者命名空间的形式来分隔各个用户的数据资源.通常每个域或者命名空间中仅存储同一用户的数据,同一域或者命名空间的数据存储都是并列的,即平级存储所有文件,也就没有了文件夹的存在.
2) 数据库存储
基于云中数据库的海量存储、存储和访问的高效性和高扩展性等特性方面的要求,传统的数据库达到完成这些方面的目标,因此大多的云数据库广泛采用的都是NoSQL数据库.NoSQL数据库在设计上更多关注海量存储的问题和数据的高并发读写特性,实现了表中无Schema存在,采用的数据模型为ST的稀疏表,即表中任意行的属性不同.
1.2 云存储安全现状分析
目前而言,比较主流的开源产品有很多,其中Hadoop以其较好的容错特性以及高性能的部署特性为大多数的企事业单位和教育机构所使用,它其中自带一个高性能的数据库HBase,考虑到Hadoop的本身架构对于数据的可用性和完整性特点已经比较完善,保密性的讨论目前相对较少.国内外的很多公司也在从事云存储服务产业的开发,比如亚马逊公司的S3、谷歌的App Engine,其中亚马逊的S3研发时间相对较早,在技术上比较成熟,比较注重完整性、加密、授权等方面的安全性设计,但是其加密仅实现了通讯过程的协议加密,而对于存储数据则没有采取任何加密措施.
虽然相对传统的存储方式而言,云存储技术具有极大的优势,但是不可避谈的就是云存储的安全性问题,2011年的索尼公司的信息外泄事件为本来看似乐观的云存储技术敲响一记警钟,该次事件共造成了超过10亿元经济损失,并且泄露了数以亿计的用户数据;而就在同年的4月份,作为云服务提供商的亚马逊公司也遭遇了前所未有的宕机事件,给其用户带来了巨大损失.两大云事件的相继出现,为有着无限憧憬的云产业笼罩了一层阴霾,这也使得人们将视线重点转向了云存储的安全性问题,也为本项目的研究提供了契机.
1.3 研究目标
针对现有的教育资源使用的云存储平台而言,其对数据保密性相对较少,而如果忽视保密性问题则会对信息资源的安全带来很大隐患,为此我们决定对现有云存储平台的保密性方面做出改善.根本目标是保证存储数据的安全,即数据的保密性、完整性和可用性;涉及的过程有数据生成、传输、保存、访问.这其中,既包括传统的信息安全、存储加密等技术,又包括云存储的特殊性带来的安全问题和技术.
2 使用到的关键技术和拟解决的关键问题
2.1 加密和解密原理
众所周知,数据是文件的存在形式,而数据的组成单位是字节,无论是否为可执行文件,都可以看作是有序的一些字节流或者字节的集合.而加密则是把有序的易于理解的各种数据转换成无序的无法理解的数据,换句话说,就是把可读变为不可读,把可用变为不可用,把文件固有的格式进行破坏,这就是所谓的加密,以提高其在使用和传输环节上的安全性.解密的过程则是加密逆过程,通过与加密相同的密钥,通过算法进行解密,把数据重新恢复到可读可用状态[2].
2.2 混沌映射
混沌对于系统参数和初始条件具有极端敏感性和对长期演化结果的不可预测性,具备非常稳定的密码学特性.
2.3 DES、RSA、AES算法
2.3.1 DES算法
DES作为典型的分组算法,也是世界上目前应用最广泛的密码算法之一.其明文和密钥分别为64 bit,各自作为其算法一端的输入,被加密的明文通过复杂的16轮的密钥运算,得到64 bit的密文进行输出,其目的是尽可能增强混乱性和不可推断性,以防止攻击者的破译.
2.3.2 RSA算法
除了可能的混杂因素以外,测量方法的主观性、缺乏患者完成日常生活任务的实际背景也会阻碍患者日常生活能力的改善。动物研究和现代康复研究都证实环境是运动学习的重要因素。而且,由于可能有潜在的认知功能的损伤,卒中患者通常在把学习到的运动技巧转化运用到日常生活中都存在困难。
RSA作为ISO推荐的公钥加密标准,能抵挡迄今为止的所有已知的密码攻击,RSA算法采用的非对称式密码算法,即必须具备同时一对密钥才可以对文件或数据加密和解密,该算法是目前最富影响力的公钥加密算法.
2.3.3 AES算法
AES算法作为用以替代DES的算法标准,使用的迭代的对称密码分组,比较便于抵御空间和时间上的攻击,是集高效、安全、高性能于一体的高级加密标准,已经为多方认可和使用.
2.4 拟解决的关键问题
在数据保密性方面对现有的数字教育资源云存储平台给出改进的方案,采用文件加密、数据库加密、密钥保护等措施,引用加密算法设计,保证加密效率和加密数据的安全性.
3 系统方案设计
我们以现今教育资源普遍采用的Hadoop平台为实验基础,其中HBase作为其数据库系统,HDFS为其文件存储系统,实行文件加密设计、数据库加密设计和密钥保护三方面的改进,从而构建安全云存储平台.我们分别从系统构架、系统各个模块及模块加密算法的设计做如下探讨:
3.1 构架设计[3]
依据云存储平台的特性,对其划分为应用层、运营层、平台层、虚拟层和设施层,其中应用层作为一个WEB客户端,是面向用户的,负责提供各种云存储服务和简单的文件、数据库操作;而运营层作为应用层的基础,主要实现业务的部署和运营,在本实验平台中不涉及运营方面的功能,所以不涉及运营层的设计;平台层主要提供运行环境的支持,在此层上构架Hadoop平台,并加以HBase和HDFS与之相配置,其中HBase中的数据通过数据库加密模块对其进行加密,而HDFS中文件则设置文件加密模块对其加密,其中的密钥保护模块则保护这两个模块中的密钥;虚拟层使用的KVM虚拟机,以实现设备的虚拟化;设施层提供了包括硬件和软件的基本存储、计算设备,建立一个由20台PC和网络设备构成的集群.
3.2 模块设计
3.2.1 客户端模块
客户端模块主要包含文件和数据的上传及获取两个功能,分别由文件管理子模块和数据库管理子模块管理.该模块实现用户向云传送和读取文件及数据,通过调用API,进行加密和解密.
3.2.2 文件加密/解密模块
文件加密/解密模块将经由客户端传来的文件加密,并保存到HDFS;如果需要读取文件则有HDFS获取并解密已加密文件,再传回客户端.每个文件配有单独的数据密钥,需要提供相应用户的私钥、用户ID及文件ID才能获取文件的数据密钥,数据密钥用以对文件的加密和解密.
3.3.3 数据库加密/解密模块
其重要功能为实现由客户端模块传来的文件及数据的加密,并保存于HBase;对于解密过程则由HBase读取并解密已加密数据,并传回到客户端.由用户自行选择需加密的敏感字段进行加密,以提高加密/解密性性能,保证数据库检索的效率,基于对称密钥加密速度快、运算量相对较小的特点,对于大量数据的加密采用AES算法,AES算法相较DES算法而言,更具安全性,为新一代对称加密算法.
3.3.4 密钥管理模块[5]
该模块主要为文件、数据库加密/解密模块提供并管理数据密钥,数据密钥用以加密数据,不能用明文形式保存,因此使用公钥加密RSA算法加密数据密钥;而在资源用户注册的时候会生成2个RSA密钥,我们可以由可信的云存储平台保存用户公钥,以加密数据密钥,而对于用户私钥则交由用户自己保管,以备解密密钥时使用.
4 可行性和创新
4.1 可行性分析
4.1.1 市场可行性
随着教育资源云存储的日趋盛行,社会上的各大云储存服务和产品的推出,必然导致市场竞争的白热化,服务商之间的竞争大都从价格、性能及容量上下功夫,往往忽视了安全的重要性.因此,对现有云存储平台在数据保密性方面的改进是有必要的.本方案分析了现有的教育资源云存储平台在数据保密性方面的不足之处,并在数据的保密性方面对云存储平台提出改进,解决了教育资源云平台存储的安全性问题,带动了省内教育资源云平台的发展.
4.1.2 技术可行性
本方案不需要改变下层存储构架,主要功能模块完全建立在文件和数据库存储之上;对上层也仅需调用加密/解密接口,而无需关心具体的实现细节.使用的相对成熟的加密算法,如DES、AES、RSA算法,保证安全性的同时兼顾效率.
综上,从市场和技术角度来说本方案是可行的.
4.2 创新点
本方案与去传统的存储安全性方案相比,具有以下创新:
首先,提出用户密钥和数据密钥的概念,其中用户密钥分为公钥和私钥,公钥用于加密数据密钥,私钥用于解密数据密钥,数据密钥用以加密和解密用户数据.
其次,将用户数据与密钥分开存储于不同模块中,采用这种方式,攻击者获取单一某个模块的数据都是没有实际意义的,而同时攻破两个模块的可能性很小,从而保障了用户数据和密钥的安全性.
再者,采用大小文件分开处理的形式,对于大文件,采用DES和基于混沌映射相结合的算法进行加密,集两种算法的优势于一体,相比较采用单一的某一种算法,比如单纯采用DES或者RSA算法,都更加适用于大文件的加密,提高了加密效率.
本文针对现有云存储平台的架构和一些关键性问题进行分析,基于现有平台的加密方面的不足之处,重点对诸如文件加密、数据库加密以及密钥加密等关键性问题进行论述,并给出了基于现有教育云资源平台的安全性改进解决方案,并通过了安全性的验证.
[1] MILLER M.云计算[M].姜进磊,史美林,姜进磊,等,译.北京:机械工业出版社,2009:17.
[2] 吴朱华.云计算核心技术剖析[M].北京:人民邮电出版社,2011:167.
[3] 马晓亭,陈臣.云安全2.0技术体系下数字图书馆信息资源安全威胁与对策研究[J].现代情报,2011(3):62-66.
[4] MATHER T.云计算安全与隐私[M].刘戈舟,杨泽明,刘宝旭,等,译.北京:机械工业出版社,2011:64.
[5] 柳青.我国云计算安全问题及对策研究[J].电信网技术,2012(3):5-7.
Strategy of Cloud Storage Security of Digital Educational Resources
ZHANG Yu-wei, YAO Hong-ling
(Faculty of Media Art, Shijiazhuang Information and Engineering Vocational College, Shijiazhuang, Hebei 050035, China)
Cloud storage has brought a mass storage of digital educational resources and also brings data security issues. For the deficiencies of the data confidentiality in the existing educational resources cloud storage platform, some improved plans have been put forward: mainly improving file encryption / decryption module, database encryption / decryption module, key management module and client module. Try to ensure the efficiency and safety of data encryption by referring to encryption algorithm design.
educational resources; cloud storage; system architecture; security policy
(责任编校:李建明 英文校对:李玉玲)
10.3969/j.issn.1673-2065.2015.01.006
TP393
A
1673-2065(2015)01-0019-04
2014-06-25
河北省高等学校科学技术研究青年基金项目(QN2014314)
张玉伟(1981-),女,河北石家庄人,石家庄信息工程职业学院传媒艺术系讲师,工学硕士;
姚红玲(1979-),女,河北石家庄人,石家庄信息工程职业学院传媒艺术系讲师,工学硕士.