一种校园混合云存储系统的设计与实现*
2019-05-09季益龙杨传斌
季益龙, 杨传斌
(浙江师范大学 网络安全与信息化建设办公室,浙江 金华 321004)
0 引 言
云存储是在云计算概念的基础上发展起来的一种新的存储方式,它是将大量不同类型的存储设备通过软件集合起来协同工作,共同对外提供数据存储服务[1].随着计算机技术和互联网应用的快速发展,校园师生学习、工作所产生的数据正以几何级数的方式增长.数字资源存储的目的是为了用户保存、获取和分析数据,校园数字资源管理是实现智慧校园战略的第一步,而数字教育资源的存储与管理已成为一个亟待解决的难题.传统校园数字存储方式主要有2种:一种是自建式存储系统,常见的平台有师生ftp、网络存储平台、自动备份系统等,但存在可获取性差、动态扩展能力差、兼容与管理不便和安全可靠性不高等问题;另一种是公共服务网盘,常见的有百度云、360云盘、腾讯微云等,与传统的存储模式相比,在文件管理、移动访问、多端同步和存储容量等方面具有优势,但也存在服务质量不可控、数据私密性弱、个性化定制差等问题.笔者分析了传统存储中实际存在的问题与需求,比较3种云存储模式的性能优缺点,设计并实现一个基于混合云模式的校园云存储系统.
1 3种云存储服务模式的对比
云存储目前在学术界还没有一个权威的定义,但基本的共识是,云存储不仅是一种存储设备或技术,也是一种全新的服务[2].从服务对象和范围来讲,云存储模式可以分为3种:公有云、私有云和混合云.不同的云存储模式均有利弊,需要分析其优缺点,学校可根据自身的实际情况选择最优方案.
1.1 公有云模式
公有云建立在校园局域网外部,放在一个共享的基础存储平台,并且保障每个用户的存储、数据和应用都是逻辑分区、互不干扰.简单地说,公有云就是云计算服务提供商为用户提供服务的云存储平台.公有云模式具有建设成本低、数据共享、扩展性高等优势,但在安全性、可靠性和版权等问题上存在问题.在云计算、移动互联、CDN分发等技术迅速发展的背景下,公有云存储发展迅猛,国外有亚马逊提供的公有云服务Amazon Web Services、微软发布的公有云计算平台Widows Azure和谷歌推出的在线云存储服务Google Drive[3],国内有阿里云、百度云、360云盘、华为网盘等,这些公有云存储系统简单易用,可以实现随时随地多种形式互联,成为校园师生个人网络存储的工具.
1.2 私有云模式
私有云建立在校园局域网内部,通过局域网协议建立在机构内部提供云存储服务,是一个可扩展的云环境.它建立在用户专用的基础构架之上,不同于公有云的开放生态圈,私有云运行在机构数据中心防火墙内,也可以部署在一个安全可靠的主机托管场所.私有云模式具有数据安全性高、服务质量可管控、统一管理和资源利用率高等优势,但在建设成本、可扩展性和社会共享性等方面存在劣势.私有云有2种形式:其一是软硬件合体类型,云储存运营商会提供专业的硬件和集成软件,主要有IBM公司的XIV网格存储系统,联想公司的私有云存储系统,爱数公司的Anyshare Cloud系统等;其二是纯软件安装包,机构需要自身提供服务器和存储设备,比较成熟的平台有基于Hadoop的HDFS分布式系统[4],基于对象存储的Swift[5]和由国内技术团队开发的Seafile开源云存储平台[6].
1.3 混合云模式
混合云是建立在私有云和公有云服务之上的,是为特定用户提供和管理一些内部资源和外部资源的云存储环境[7].这种模式最大的优势在于利用了公有云成本低的优势,同时确保了高度敏感信息的保护.用户根据不同业务性质来区分存储对象,一些重要、核心或机密的数字资源放到机构建立的私有云存储,而通知公告、公共业务和公开信息等则放在公有云存储.混合云的概念不可能是一个简单的混合服务的提供,如何正确有效地对公有云和私有云服务进行切换、融合是一个非常复杂的过程[8].这种模式也存在一些挑战,如内部数据中心与公有云之间的连接问题、系统监测和管理方面的间接费用较高、多个单一故障点增加安全风险[9].
通过对上述3种存储模式的分析,得出了公共云、私有云和混合云的异同点,并分别指出其适应范围,如表1所示.
表1 3种存储模式的不同特点及区别
2 校园混合云存储系统的设计
图1 一种校园混合云存储系统的整体架构
2.1 系统整体构架
混合云存储系统本身的服务是将公有云和私有云存储构成一个有机的整体[10].混合云存储系统整体结构包括校园网和互联网两部分,将校园内部的私有云存储服务和互联网上的公有云存储服务结合起来,为校园师生提供数字资源存储服务.系统的整体架构如图1所示.
私有云存储服务部署在校园网上,包括用户接口、文件服务器、数据业务服务器、WEB服务器、数据库服务器等.用户接口通常以3种方式为用户提供云存储服务:移动端、网页端和客户端.文件服务器提供底层用户文件的存储与访问服务,私有的文件服务器不提供外网访问接口,以保证数据安全;数据业务服务器、WEB服务器、数据库服务器共同承担核心业务服务,包括文件的上传、下载、预览等.公有云存储服务将选择主流的亚马逊S3、微软Azure、阿里云、百度云等云存储服务商,实现各种服务调用功能.若用户在校园网内,则数据操作通过校园网调用互联网云存储服务;若用户在公网上,则数据操作直接在互联网调用服务.云存储服务商决定了整个系统的可扩展性和服务质量,需要根据服务模式、运行环境和费用等多种因素,选择最适合的云存储服务商.
图2 一种校园混合云存储系统的功能设计图
2.2 系统功能设计
系统通过单点登录的方式从统一身份认证平台中获取所需的人员信息、部门信息、岗位信息和角色信息,并将存储信息、操作信息及日志信息返回给统一身份认证平台.如图2所示,系统主要模块包括:文件管理、文件夹管理、权限控制、作业收集、实时同步、系统管理和个性工具等配套子模块.
2.2.1 文件管理模块
文件管理是云盘系统的基础业务,遵循文件存在本地、服务部署云端的原则.可以对文件实现上传、下载、删除、在线预览、审阅、评论和分享等多种操作,拥有移动端、网页端和客户端等多种入口方式,实现文件管理共享、协作交流的场景.
2.2.2 文件夹管理模块
通过文件的边界属性对文件夹进行分类(用不同的颜色表示不同属性的文件夹):黄色代表个人文件夹,除本人外其他任何人都无法查看编辑;蓝色代表协作文件夹,用于学校用户之间的文件共享和交互;紫色代表部门文件夹,根据部门信息自动创建,用于部门之间的文件共享和交互;绿色代表外部文件夹,当需要外部协作时,可创建外部文件夹,用于与外部用户的文件共享和交互.文件夹管理通过不同颜色,轻松实现文件安全管理.
2.2.3 权限控制模块
当邀请成员加入共享文件夹时,可以进行权限设置.同专业教师之间可以设置为“编辑者”权限,课件共享给学生可以设置为“查看者”权限.根据文件访问属性可划分为五级权限设置,分别为“所有者”“编辑者”“查看者”“预览者”和“上传者”.每种角色代表对文件的不同访问权限,通过严密的权限控制,保障数字资源的安全可控.
2.2.4 作业收集模块
作业收集是云盘系统根据学校自身特点设计的自定义功能,利用文件夹收集功能,可以实现指定文件夹作为作业收集目录,创建任务并邀请班级的学生,学生在规定的时间内向老师上传并提交作业相关的电子文档,方便教师收集管理作业,学生之间作业也可设为互相不可见.
2.2.5 实时同步模块
实时同步既可以进行大量文件的快速上传下载,也可以通过同步端与云端文件保持实时同步.其中,移动端、网页端或客户端的本地文件一旦被修改,云端就实时更新,可以实现便捷、实时和快速的文件同步,文件的修改也无需频繁地上传下载.
2.2.6 系统管理模块
主要包括用户管理、使用统计、个性化设置和日志查询等.用户管理主要实现对云盘系统中用户的增加、修改、删除等操作.使用统计是对系统中的用户数量、存储情况、文件总数等使用情况进行统计.个性化设置是对系统的名称、形象、安全等自定义设置.日志查询是对时间、操作者、操作对象、客户端详情等内容的查询.
2.2.7 个性工具模块
个性工具是用户根据学校特点提供的特色服务.全文搜索支持标题搜索、文件内容搜索、关键词搜索、消息搜索等.在线编辑支持网页端在无需下载文件的情况下直接实现在线编辑,编辑完成后自动保存到平台.随时消息可直接将文件分享到对方QQ、微信、邮箱、短信等各种沟通工具上,实现随时随地的文件分享.设备管理是指用户对自身账号的登陆设备进行管理,可禁止其他相关设备非法登录系统,确保账号安全.
3 校园混合云存储系统的实现
依据设计的框架来部署系统,混合云存储系统体系结构按层次可以划分为4层:资源层、平台层、应用层和用户访问层[11].资源层用于构建混合云系统的底层硬件,包括底层的服务器、存储介质、网络和云服务商等.笔者采用专用机架式服务器、高速多协议存储方式和万兆核心交换机,并根据学校自身特点及公有云的存储大小、数据请求、数据传输流量、可用性、网络传输速率等[12]相关参数选择合适的云服务商.平台层通过软件集群对资源层进行整合封装,实现用户权限控制、数据存储、数据安全等业务,为应用层提供平台接口,软件集群由物理服务器和虚拟机构成,3~5台物理服务器分别部署混合云系统的业务服务、Web服务和数据库服务,4~6台虚拟机搭建Hadoop分布式文件服务器集群,完成对资源池的管理.应用层通过终端软件为用户提供云存储终端接口,实现用户的定制业务,该系统终端的后台开发利用Java、Spring MVC、Hibernate、Jerasure等关键开发技术实现系统的功能,前端设计采用HTML5、jQuery、Ajax等主流技术,数据储存技术包括Hibernate、HDFS、Redis等存储数据表和教育业务的结构化数据.用户访问层是实现任何一个授权用户都可以在任何时间、任何地点,使用不同的终端设备,按照标准的公有应用接口登录云存储平台,享受云存储服务,通常以3种方式为用户提供云存储服务:移动端、网页端和客户端.
通过对该系统的功能、性能、安全性、可扩展性等方面近一年时间的全面测试与使用,发现该系统应用功能完善,能实现高达百T级别的海量教学和科研资料安全统一的管理.性能上表现稳定,局域网内存储数据的上传、下载速度≥5 Mb/s,对系统访问的响应性很高;系统采用碎片化存储、3份加密保存、用户数据隔离,确保系统的安全性;用户数量可在后台增加,存储空间可实现动态扩容,功能基于云端统一升级,确保系统具有良好的可扩展性.
4 结 语
面对数字化环境和信息技术变化带来的挑战和机遇,混合云存储系统的建设符合“互联网+”时代要求,它可以更新管理理念、打造数字化存储空间、改变传统服务方式.存储系统采用混合云模式部署,是“互联网+校园”新发展阶段的新思路,既可以打破传统私有云开发周期长、更新困难、部署成本高的缺陷,又能满足文件存储、校园数据安全、动态扩展容量、移动应用、实时同步及作业收集各项功能的需求,让其享受到更多的云端服务价值.