云存储在数字图书馆应用中的安全与防范研究
2012-04-29徐国兰
徐国兰
〔摘 要〕提出了云存储的概念,总结了云存储在数字图书馆信息资源存储中的优势。通过研究和分析云存储在数字图书馆应用中存在的安全问题,主要有数据传输安全、存储安全、访问安全等。提出了改进技术、建立行业标准和规范、引入第三方审计等防范措施。改进了云存储在数字图书馆信息资源存储中数据的安全与稳定性。
〔关键词〕云存储;数字图书馆;数据;数据安全;防范
〔中图分类号〕G250.76 〔文献标识码〕A 〔文章编号〕1008-0821(2012)04-0057-03
目前数字图书馆广泛采用的存储方案主要有DAS(Direct Attached Storage,直接附加存储)、NAS(Network Attached Storage,网络附加存储)、SAN(Storage Area Network,存储区域网络)、ISCSI(Internet Small Computer System Interface,互联网小型计算机系统接口)和网格存储等[1]。这5种存储方案各有其优势,但单独采用其中任何一种方案,都无法全面解决数字图书馆资源存储面临的众多问题。针对这些现存问题,现代数字图书馆正在探索使用云存储方案。
1 云存储的概念及在数字图书馆数据存储应用中的优势1.1 云存储的概念
云计算至今没有一个统一的定义,每个定义都是从自身理解的角度来定义的,但主流的定义主要有技术层面和服务层面的定义。云存储是在云计算(cloud computing)概念上延伸和发展出来的一个概念。在这里笔者也根据自己的理解来定义云存储。云存储是指通过集群应用、网格技术或分布式文件系统,将网络中分散的、不同类型的存储设备统一到一个或几个大的存储池下,形成一个统一的整体,作为一个动态的存储资源实体向用户提供数据存储和业务访问功能。由于云计算系统运算和处理的核心是大量数据的存储和管理,云计算系统中配置有大量的存储设备,所以云存储是一个以数据存储和管理为核心的云计算系统。
在数字图书馆信息资源存储中应用云存储可以低成本的实现海量数字资源的存储,提高存储资源的利用率,并能提高数字图书馆之间信息资源的共享。与前面提到的存储方案相比,数字图书馆采用云存储方案具有较强的优势。
1.2 云存储在数字图书馆应用中的优势
1.2.1 节约成本
云存储向图书馆用户提供以网络为基础的在线存储服务,把云存储集群的一部分提供给图书馆用户。对于图书馆用户来说就是通过网络和一定的应用软件或应用接口得到一定类型的存储服务和访问服务,不需要配置基础设施,并对这些基础设施进行安装、升级和维护,以及数据完整性保护和容灾备份。云存储通过多租户模式使得使用成本和管理成本大幅度降低。
1.2.2 安全和稳定
云计算采用分布式存储的方式来存储数据,采用冗余存储的方式来保证存储数据的可靠性(为同一份数据存储多个副本),采用数据加密技术保证云存储中的数据不会被未授权的用户所访问。同时,通过各种容灾技术和措施可以保证云存储中的数据不会丢失,保证云存储自身的安全和稳定。数字图书馆采用云存储,当用户突然增多、访问量突然加大时,通过云存储系统,利用其自身的分布式系统、集群系统,能合理分担存储和访问的压力,有效地防止数字图书馆系统瘫痪,提高数字图书馆的信息资源存储系统的稳定性。
1.2.3 实现资源共享
在云存储系统中,各个数字图书馆的信息资源保存在“云”中,所有符合权限的读者只要通过互联网连接到“云”,就可以不受物理地址和时间限制的访问所有资源,实现了数字图书馆之间的资源共享。
2 云存储数字图书馆数据存储应用中的安全问题
云计算的吸引力在于其经济上的可扩展性、资源复用、低成本和高效率。为了支撑这种低成本高效率,云供应商提供的服务必须足够灵活,但这种灵活性会降低其对安全控制的能力[2]。根据2009年CSA(Cloud Security Aliance,云安全联盟)发布的一份云计算安全风险简明报告总结了7条最常见的风险:滥用和恶意使用云计算;不安全的接口;内部员工的滥用;基础设施共享问题;数据丢失或泄漏;账号或服务劫持;未知的风险。云存储在数字图书馆信息资源的存储应用中主要存在以下安全问题:
2.1 数据传输过程安全
数字图书馆采用云存储模式,原来局限在私有网络的资源和数据现在暴露在互联网上,并且这些资源和数据放到了第三方云计算提供商所有的共享公共网络上。图书馆在将信息资源数据通过网络传递到云计算服务器进行处理时,会存在这样的问题:数据在网络传输过程中是否进行了严格加密,保证数据不被中途侦听,即使被侦听了也无法还原;能否保证数据的完整性;在传输过程中能否不被被莫名其妙的修改。
2.2 数据存储安全
数字图书馆信息资源数据存储在云存储系统中,他所使用的基础设施是共享的,非隔离的,当一个攻击者得逞时,全部服务器都将成为攻击者的攻击对象。所以数据存储是否安全要看云计算服务商是否有强大的分区和防御策略;是否有强大的实时监控系统防止有未经授权的修改和活动;对所托管数据是否进行备份,备份使用的是单服务器多硬盘方式还是多服务多硬盘方式,是否实现异地备份。
2.3 数据访问控制安全
数字图书馆信息资源数据在云计算提供商公共云存储时,恶意软件和木马将会在云中变得更强大,垃圾邮件发送者和恶意代码作者可以利用云服务中的匿名注册和云服务模式进行网络犯罪。在云环境中,如果攻击者能够获得你的凭据,他们可以看到你的活动,处理你的数据,并给云计算服务提供商客户端导致问题。另外,当用户不再需要已分配的IP地址时,云计算提供商会再分配给其他用户使用。IP地址再分配使用就会带来问题。用户无法确信他们对资源的网络访问能随着IP地址的释放一并终止,因为从DNS中的IP地址改变到DNS缓存清理,这之间存在一段时间延迟。因此在老的地址被清楚之前,还会一直存在于ARP缓存中。这意味着即使地址可能已经变化,原先的地址在缓存中依旧有效,因此用户还是可以访问到那些理应不存在的资源。最后,虽然资源可能无法通过互联网直接获得,但出于管理的目的,这些资源必须可通过专用地址在提供商网络上进行访问。图书馆的云计算提供商的其他用户有可能从内部通过云计算提供商的网络获得图书馆资源。
2.4 云存储服务商信用
由于数字图书馆的信息资源数据存储在公共云,我们不能保证云服务商在得到数据时不将保密数据泄漏出去。有些云服务商的服务合同中规定:我们对于任何未经授权的访问或使用、破坏、删除、销毁或弄丢任何你的内容或应用的程序不负有责任。像这种在合同中不承诺对任何数据泄密事件以及被破坏行为承担法律责任或义务的服务商很难保证数据的安全。
2.5 知识产权保护
数字图书馆的知识产权问题在云时代有了新变化。图书馆购买云存储服务后,将自己的数据交给云,由云托管这些数据。从理论上讲,图书馆应该完全拥有被托管数据的知识产权。但是在现实中,云存储商会千方百计利用这些数据,并以数据整合、数据挖掘、知识服务的名义使图书馆数据利用合法化。使得他们利用馆藏数据开发出来的一些产品很难界定知识产权的归属,这成为一个新问题。
以上数据安全问题主要是由云服务商来保证,而数据备份是最基本的安全保障措施。
3 防范措施
为了解决数字图书馆云存储存在的安全问题,下面主要采取安全技术措施和法律规范措施两方面进行讨论。
3.1 技术措施
目前有关云计算的安全性问题主要集中在访问控制(基于层次密钥生成与分配策略实施访问控制的方法);利用基于属性的加密算法(如密钥规则的基于属性加密方案(KP-ABE));虚拟安全技术(Santhanam等人提出了基于虚拟机技术实现的Grid环境下的隔离执行机);数据保护(Mowbray等人提出了一种基于客户端的隐私管理工具,提供以用户为中心的信任模型,帮助用户控制自己的敏感信息在云端的存储和使用)等方面[3]。
3.1.1 访问控制
图书馆的云存储服务访问控制认证和授权两个方面。身份鉴别就是图书馆读者向云存储服务提交操作请求时,云存储服务在接收到读者的请求后,要鉴别读者的身份。为了有效地鉴别读者的身份,云存储服务事先就要为每个读者用户分配一个秘密访问密钥和一个用户标识;读者访问云存储服务时,首先要生成请求报文,然后利用密钥采用某种HMAC对请求报文进行签名,并将该签名和访问密钥惟一标识一起附加到请求报文中;云存储服务在处理请求前,会对该签名进行验证。权限判定就是图书馆云存储服务完成对读者用户的验证后进一步验证该读者是否有进行所请求操作的权限,只有有权限的图书馆读者才能进行相应的操作,否则操作请求将被拒绝。图书馆云存储服务还可以通过对读者用户进行授权,并进行授权控制,对大量用户进行管理[4]。
3.1.2 数据加密
数字图书馆的信息资源中有很多涉及图书馆的绝密数据,有时会在传输过程称遭到侦听,给图书馆造成巨大的损失,所以数字图书馆的重要数据需要进行加密,以防被盗取或破坏。图书馆数据在云计算存储时由谁来加密,是图书馆自己加密还是云计算服务提供商加密,采用什么加密算法和什么强度的密钥,这取决于所选择的云计算服务提供商。图书馆数据在图书馆与云计算提供商之间进行传输,对于那些静态数据如果使用简单存储可以进行加密,但有些数据在云计算中处理时,绝对是不加密的。这种未加密状态的数据很容易遭到破坏。目前关于数据加密的手段很多,普通的加密方案如需对加密文件进行操作,必须将加密数据回传,解密操作后再加密回传云端,效率低下。在2009年6月,IBM宣布其研究人员与斯坦福大学的研究生合作,开发出一种完全同态加密方案,这种方案允许在不解密的状态下处理数据[5]。利用全同态加密技术对数字图书馆的数据进行加密,就是将数据加密后存储在云端,从而提高数据的安全性,即使这些数据被窃取,没有相应的密钥也无法还原,而密钥只有用户才知道,云端不知道该密钥[3]。由于同态加密的特性,云端可以直接对加密文件进行操作,从而提高了对加密数据进行操作的效率。利用全同态加密技术对数字图书馆的数据进行加密既能确保用户数据安全,又能避免传统加密方案的弊端的新的云计算数据安全方案。
3.2 制定相关的行业标准、规范、法规
不同云服务商对数据的技术管理能力不同,在对用户数据管理执行标准上有较大差异,为云计算服务提供商提供了规避大部分安全风险,而将风险转嫁给用户的可能,导致用户权利难以保证。所以,建立国际行业标准,规范服务,确保有国家级的监管来保障云服务质量和安全标准迫在眉睫。OASIS标准组织在SOA安全方面的现有标准,如IAM、IDM。强化的认证标准,数据加密标准,密钥管理标准以及VM安全配置标准等,都可以被应用到云安全领域。在云安全领域,不是要制定或发明新标准的问题,而是要研究如何把现有的安全技术很好的和云计算对接,最好地发挥作用。Cloud Security Aliance(CSA,云计算安全联盟)的定位和目标是制定关于云计算安全问题的一些“最佳实践”和指南[6]。此外,还应对“云”管理服务提供商(MSP)在开放性、共享性、标准化、安全性能、保密级别、企业的诚信与可持续发展制定不同行业等级,依据行业级别运营相应安全级别的数字图书馆“云”业务[7]。
一些数据泄漏事件出自云计算提供商内部员工,所以加强对云计算提供商雇员的管理,在聘用合同上明确雇员的法律责任,在违反安全规定造成安全事故时有权送交司法机关。
3.3 引入第三方的认证机构进行数据审计
无论图书馆放在云计算中的数据有无加密,了解云计算中的数据专门存储的地点和时刻是非常有用的,甚至有时候是必须的。数据沿袭(对数据路径的跟踪)对审计有很重要的作用。云计算提供商确保既能提供有效地数据,又不损害其他已有客户的利益,又在审计过程中保证审计机构不泄露相关客户的敏感数据的情况下,协助第三方机构对数据的产生进行安全性和准确性的审计。
4 结束语
云存储模式的出现,给互联网环境下数字图书馆信息资源中心作用的发挥带来了机遇。数字图书馆云服务平台具有动态的、自适应的系统组成能力与集成机制,能实现分布式数字图书馆服务的虚拟化,能实现更大程度的资源共享与协作。同时,云存储的应用还处在探索阶段,在发展过程中还存在着安全问题和风险。随着图书馆对云计算技术的关注和安全技术的广泛应用,以及云安全标准的进一步完善,我国数字图书馆的发展将进入一个崭新的阶段。
参考文献
[1]刘文云,鲍凌云.“云”下的数字图书馆资源存储研究[J].情报资料工作,2011,(2):51-54.
[2]丁秋峰.云计算环境下取证技术研究[J].信息网络安全,2011,(11):36-38.
[3]吴旭东.云计算数据安全研究[J].信息网路安全,2011,(9):38-40.
[4]王平建.云存储中的访问控制技术研究[J].信息网路安全,2011,(9):41-43.
[5](美)Tim Mather,Subra Kumaraswamy,Shahed Latif.云计算安全与隐私[M].北京:机械工业出版社,2011:64.
[6]周洪波.云计算技术、应用、标准和商业模式[M].北京:电子工业出版社,2011:332-333.
[7]马晓亭.云计算环境下数字图书馆信息资源安全威胁与对策研究[J].情报资料工作,2011,(2):55-59.
(本文责任编辑:孙国雷)