对存储高可用性的技术标准与实现方法的分析
2018-04-17国家新闻出版广电总局五七三台
国家新闻出版广电总局五七三台 冯 莉
引言
在互联网、多媒体等信息技术取得快速发展的同时,各行各业都将产生大量的数据信息。而在存储系统建设方面,无论是新系统建设还是旧系统改造,都应加强高可靠性技术的运用,从而解决数据安全存储问题。因此,还要加强对存储高可用性的技术标准与实现方法的分析,以便更好的完成系统建设。
1.存储系统可用性问题分析
伴随着大数据时代的到来,数据存储安全问题引起了人们的普遍关注。对于企业来讲,数据为重要的资源,能否保证数据得到安全、可靠的存储,将对企业的发展产生直接影响。对存储系统展开可用性分析,则能反映出数据存储的安全性和可靠性,从而结合数据存储存在的问题加强数据安全保护。目前,对存储系统可用性能够产生影响的因素主要有两种,一种为故障率,另一种则为修复周期。数据存储系统构建需要采用存储设备实现,主要包含硬盘和存储控制器,平均无故障时间能够达到百万小时以上,年故障率平均为0.88%。然而就实际情况来看,受机房温湿度、灰尘、静电等环境因素的影响,同时受自身固有特性引起的元器件损坏等问题的影响,硬盘会出现损坏、老化等问题。此外,软件设置和病毒入侵等问题的存在,也将引起硬盘数据结构混乱,继而导致设备产生无法识别的故障。为解决这一问题,存储行业大多采用热插拔技术,在硬盘发生故障时可直接进行备份硬盘的预置或更换新硬盘,促使存储系统重新建立数据,整个过程无数据丢失问题。但是采用该种技术,需要较长的时间恢复数据,同时也将造成系统存储性能下降,难以满足存储的高可用性技术要求。采用存储控制器,可以将多个磁盘驱动器组织在一起,提供高效数据读写、传输和存储等服务。但是这类存储设备存在控制器故障这一安全隐患,一旦故障发生尽管不会造成数据丢失,却将导致系统服务器难以进行数据的正常读写,因此同样难以满足存储系统的高可用性要求。
2.存储高可用性技术标准
结合存储可用性问题,还要利用高可用性技术构建存储系统,并对系统展开高可用性评价,以便使系统在实践应用中可以发挥更好的功效。目前,针对存储系统进行高可用性评价可以采用较多的技术标准,但是结合实践经验来看,主要可以采用故障恢复技术标准和技术的适用性标准展开评价,从而保证系统的应用效果。
2.1 故障恢复技术标准
采用故障恢复技术标准展开评价,需要利用RPO和RTO两个参数作为系统的故障恢复评价指标。所谓的RPO,即为Recovery Point Objective的英文缩写,为故障发生时系统可接受的最大容忍数据丢失量。该指标将受到系统采用的数据复制技术的影响,如采用同步数据复制技术能够使该指标达到秒级。而RTO为Recovery Time Objective的英文缩写,为系统发生故障后从业务停止到恢复需要的时间[1]。该项指标将受到系统采用的系统切换技术的影响,采用系统自动恢复技术能够达到秒级。对于具有高可用性的存储系统来讲,还要尽量降低设备故障率,即便发生故障系统在数据恢复期间数据丢失也应当趋近零,并且业务中断时间同样趋近于零。
2.2 技术的适用性标准
针对存储系统展开高可用性评价,还要采用技术的适用性标准,对存储设备的读写性能、兼容性能、实施性能和管理性能展开评价。分析设备读写性能,要求采用高可用性技术构建的存储系统能够保持良好的数据读写性能,数据吞吐量和读写次数保持原有水平。其次,构建的存储系统需要对不同型号和品牌的存储设备进行兼容,并对各种操作系统进行兼容[2]。再者,存储系统无需实现结构的大幅度改造,实施改造不会造成长时间业务中断。最后,存储系统在技术升级和运维管理方面较为容易,有助于加强系统管理。
3.存储高可用性实现方法
3.1 传统技术方案
伴随着数据信息的海量增长,企业大多采用海量存储系统架构进行存储系统建设,利用集群满足海量数据信息存储需求,实现数据备份管理。系统由数据服务器群、前后端高性能网络和应用服务器集群构成,利用应用服务器集群可以从数据服务器进行数据的读取或向服务器写入数据,提供数据存储、查询等服务;利用数据服务器群可以采用管理节点服务器实现元数据保存,如对象地址、控制信息等,并采用数据节点服务器实现与后端网络的数据协同;利用前端高性能网络,则能进行数据存储请求的发送,利用后端网络可以实现数据节点间的数据同步,完成数据的监测和通信。目前,海量存储系统采用的传统高可用性技术方案包含主从方式、对称方式和多机互备方式。采用主从方式,即利用主服务器进行服务的提供,利用备服务器进行主服务器的监测,并在主服务器断电、故障等情况下进行服务的接管。采用对称方式,即实现服务器两两相互监测,一旦一台故障,另一台会实现工作接管。采用多机互备方式,存储系统各服务器都要进行多种服务的提供,同时进行相互监测,随时准备进行其他服务器的替代。
3.2 系统技术方案
针对海量存储系统,采用单一某种高可用性技术方案难以满足服务器存储数据的安全需求,但是设置过多备用设备也将导致系统成本过高。结合系统服务器特征,还要采用相适应的高可用性技术方案。具体来讲,就是分别采用不同技术进行管理服务器和数据节点服务器的管理。针对管理服务器,由于其需要完成元数据的存储,并为应用服务器提供数据查找路径和实现数据节点管理,采用一台服务器难以保证系统安全性和可用性,因此还要采用主从方式进行服务器配置。而在主从服务器之间,需要利用后端网络确保数据协同,继而使备用服务器能够顺利接管主机。针对数据节点服务器,通常利用不同数据节点服务器进行多个数据副本的存储,因此还要采用多机互备的方式提高服务器群的数据存储安全,利用后端网络保证服务器间数据同步。
3.3 技术实现方法
结合系统高可用性技术方案,在具体进行方案实现时,需要利用GFS文件系统进行海量存储系统的构建,并利用开源软件Heartbeat实现服务器间的通信,采用Pacemaker对服务器集群进行管理。在实际进行系统构建时,主备用管理服务器的CPU为Intel quad core 2.13GHz,采用的操作系统为Federo,网卡为千兆网卡,内存为2GB 133MHz。采用的文件系统为KFS 0.5,采用的使GFS架构。采用GFS,其实就是利用开源分布式文件系统提供数据存储密集型服务,具有较高的数据读写效率和较高的可靠性,能够实现数据阵列的共享[3]。在该种架构下,可以利用Client端对Master服务器和Chunk服务器进行访问。利用Master服务器,则能对系统元数据进行维护,加强数据地址信息、控制信息和命名空间等内容的管理。采用Chunk服务器,能够进行对象数据存储管理,利用后端网络实现服务器间数据同步。针对管理服务器和数据节点服务器,还要采用Heartbeat3.0.4 stable Pacemaker 1.1高可用软件。采用Heartbeat,可以利用其发送的心跳信号对其他服务器状态进行检测,并利用软件提供的多播、组播和单播等方式进行信息发送或接收,完成服务器状态查询[4]。该软件内部包含集群协同模块,可以对各服务器间平等协调通信进行保证。采用该软件,也能对系列进程间的通信函数进行定义,并对伙伴进程实现无障碍访问,同时也可以进行系统日志的记录。采用Pacemaker,可以与Heartbeat配合,促使打开服务停止。利用该软件,能够为集群管理软件的拓展提供支持,并结合管理软件提供的监测节点状态将服务适时打开或关闭,对服务在集群上的位置进行调整,增强集群的可用性。此外,系统的应用服务器采用的CPU同样为为Intel quad core 2.13GHz,操作系统为Federo,网卡为千兆网卡,内存为2GB 133MHz。
4.存储高可用性技术评价
采用高可用性技术方案完成海量存储系统构建后,还要对存储系统展开高可用性评价,确定技术方案的实施效果。具体来讲,就是要利用应用服务器每隔50ms进行数据请求的发送,管理服务器则需要实现请求接收,并利用数据服务器返回5k数据包。在RTO测试的过程中,需要对主管理服务器网络、数据节点网络进行分别中断,然后对中断前后应用服务器接收数据的时间间隔进行测量,得到服务器恢复时间。在RPO测试中,需要利用同步镜像方式进行系统检查,确定数据丢失情况。此外,需对系统读写性能、兼容性等性能进行综合分析,确定系统构建效果。
从测试结果来看,重复30次对管理节点服务器网络进行中断,得到的服务恢复时间在4.8-5.6s之间;重复30次对数据节点服务器网络进行中断,得到的服务恢复时间在5.3-6.2s之间。由此可见,采用该种存储系统,服务器中断恢复时间将在5-6s之间,而系统设定的服务器请求为50ms,因此从RTO测试结果来看,服务器发生中断后,备用服务器会在5-6s内完成主机自动接管,整个过程不需要人工干预,提供的服务也未发生中断。从RPO测试结果来看,系统未发生数据丢失问题,存储可用性得到了有效提高。此外,系统每秒读写次数、吞吐速率等指标均无明显下降,因此可以认为方案能够满足数据服务的可用性要求。
5.结论
通过研究可以发现,伴随着大数据时代的到来,互联网、多媒体、医药等行业都需要完成海量数据信息的存储,对数据存储提出了较高的安全性要求。而采用高可用性技术进行海量存储系统的构建,能够按照相应的技术标准进行系统建设与实现,并对系统的高可用性展开评价,从而为数据信息存储提供更多的安全保障。因此相信在企业存储系统架构设计方面,高可用性技术标准和实现方法能够获得较好的应用前景。
[1]赵伟.基于vSphere平台的iSCSI存储网络高可用性方案的研究与实现[J].电脑知识与技术,2015,11(6):47-48+50.
[2]罗常.基于K-V模式的高可用性分布式存储技术研究[J].机电工程技术,2014,43(4):137-140.
[3]李东辉,沈丽菁,方方等.分布式云存储高可用框架研究[J].计算机与数字工程,2014,42(1):76-80+144.
[4]朱俊洁,梁阿磊,马汝辉.海量存储系统高可用性研究[J].计算机应用与软件,2012,29(7):81-82+86.