数据中心信息系统本地磁盘保护和在线扩容技术的研究与实现
2018-04-24王鹏
王鹏
(洛阳光电技术发展中心,洛阳471000)
0 引言
随着信息技术的不断发展,企业对数据的需求快速增长,大数据时代下如何确保数据存储的安全性、稳定性和可扩展性成为企业信息化建设的重要环节。某企业将关键业务系统数据备份到虚拟带库和物理带库上,实现了数据的异地保护,但当服务器本地硬盘发生故障急需恢复时,信息系统数据保护方式单一,难以实现业务数据分级分层保护及快速恢复的要求。磁盘阵列RAID技术,将服务器本地存储的多块物理硬盘构建成磁盘组(RAID组),当本地硬盘出现故障时,可通过其余硬盘上的数据信息和校验信息快速恢复损坏的数据,保证本地业务数据的完整性以及系统能够正常运行;某企业采用传统方法对关键业务系统进行扩容时,需要更换大容量物理硬盘,将原有业务数据完整复制到大容量文件系统上,数据拷贝时间较长,影响业务系统的连续性,利用LVM技术,将多个物理分区整合成一个逻辑卷组,可在线增加逻辑卷组的大小和扩展逻辑卷容量,建立一个可弹性调整容量的文件系统,能够降低存储扩容导致业务系统停机的时间。
1 本地磁盘保护技术
采用RAID 5技术的信息系统服务器,组成本地存储的物理硬盘数量N≥3,业务数据分布存储在N块物理硬盘上,每块磁盘不仅存放业务数据,还存放数据校验信息,且校验信息和相对应的数据分别存储于不同的磁盘上。当N块物理硬盘中的一块发生故障,其余N-1块物理磁盘将根据其上存储的数据信息和校验信息快速恢复损坏的数据,实现快速接管故障盘继续进行I/O读写,保证本地业务数据不丢失,系统能够正常运行;可将坏盘拔出,在线插入新盘,加入RAID 5磁盘组,自动同步数据,继续实现本地磁盘保护(采用RAID 5技术的磁盘组,由于每块数据盘上都需要存储校验信息,RAID 5磁盘组的实际可用容量为N-1块物理磁盘容量之和)。如图1所示。
磁盘A、磁盘B、磁盘C三块物理硬盘构成RAID 5磁盘组,其中B盘发生故障,A盘和C盘利用其上存储的数据信息和校验信息恢复出B盘上损坏的数据2和5,数据 1、2、3、4、5、6没有丢失,系统运行正常;将故障盘B拔出,在线插入新盘,完成数据同步,继续实现RAID 5磁盘保护。
图1 本地磁盘采用RAID 5技术方案
采用RAID 5+1技术的信息系统服务器,组成本地存储的物理硬盘数量N≥4,其中N-1块物理硬盘采用RAID 5技术,剩余的1块物理硬盘作为RAID 5磁盘组的热备盘,该热备盘含有RAID 5磁盘组的校验信息,当服务器本地1块数据盘发生故障,热备盘和其余数据盘将利用其上存储的数据信息和校验信息把故障盘上损坏的数据恢复出来存储在热备盘上,热备盘自动顶替故障盘与其余数据盘组成新RAID 5磁盘组,新RAID 5磁盘组可继续实现本地磁盘保护;当服务器本地2块数据盘发生故障,热备盘和其余数据盘将利用其上存储的数据信息和校验信息把2块故障盘上损坏的数据恢复出来。
图2 本地磁盘采用RAID 5+1技术方案
保证数据的完整性;采用RAID 5+1最大可允许2块物理硬盘发生故障而不影响系统正常使用。对于坏盘,可将其拔出,在线插入新盘,加入RAID 5+1磁盘组,同步数据,继续实现本地磁盘保护(采用RAID 5+1技术的磁盘组,由于每块数据盘上都需要存储校验信息,热备盘上存储磁盘组的校验信息,RAID 5+1磁盘组的实际可用容量为N-2块物理磁盘容量之和)。如图2所示。磁盘A、B、C、D构成RAID 5+1磁盘组,若B盘发生故障,A、C、D利用其上存储的数据信息和校验信息把数据2、5以及校验信息2恢复出来存储在D盘上,D盘与 A、B组成新的 RAID 5磁盘组,数据 1、2、3、4、5、6没有丢失,系统运行正常;若A、B盘均发生故障,D盘作为热备盘,利用恢复的数据1、3以及校验信息3替代磁盘A进行I/O读写,同时D盘与C盘利用RAID 5保护机制通过其上存储的数据信息和校验信息恢复出磁盘 B 上损坏的数据 2、5,数据 1、2、3、4、5、6均没有丢失,业务系统运行正常。
某企业一关键业务系统本地存储由4块300GB物理 SAS盘组成,如图 3所示,磁盘 A、B、C、D采用RAID 5+1技术组成磁盘组;磁盘正常工作时,状态指示灯为绿色,出现故障时状态指示灯变为橙色,磁盘C、D同时出现故障,由于采用RAID 5+1技术进行了本地磁盘保护,本地数据仍保持完整,系统运行正常;将故障盘C、D拔出,在线插入新盘E、F,自动完成数据同步后,继续实现RAID 5+1磁盘保护。
图3 采用RAID 5+1业务系统
2 文件系统在线扩容
将物理磁盘 A、B、C(A、B、C分别作为单独的物理分区)整合在一起,形成由大小相等的基本单元PE组成的资源卷组VG(根据业务系统I/O的需求,本项目中PE大小参数可设置为16MB、32MB),VG的大小为磁盘A、B、C容量之和,PE的数量=VG大小/PE大小;根据业务系统对存储空间的需求,在资源卷组VG上划分逻辑卷LV用来存放业务数据,LV由VG中可用的PE组成;根据业务数据对于文件类型的要求,将划分的逻辑卷LV格式化为相应文件系统后挂载给业务系统(安全邮件、装配MES、AEPCS、PDM文件系统均为Linux下的EXT3格式),完成对磁盘I/O的读写;当业务数据的存储空间不足需要进行扩容时,新增物理分区D,将其整合至资源卷组VG,VG中可使用的PE个数增加,将新增的PE扩展给存放业务数据的LV,即完成对文件系统的扩容。
图4 LVM技术的可弹性扩展的文件系统
某企业一关键业务系统数据库本地存储空间使用率已达75%,数据量达300GB,该业务系统采用LVM技术,扩容前VG大小为400GB,PE大小为16MB,PE总数量(Total PE)为25000,已分配PE(Alloc PE)25000,全部分配给该数据库LV使用,可用PE数量(Free PE)为0;将新增的物理硬盘2.4TB(5块600GB物理磁盘组成RAID 5磁盘组,实际可用容量为4×600GB=2.4TB)加入资源卷组VG,PE总数量(Total PE)扩展为 175000,可用 PE数量(Free PE)为 150000,将VG中可用PE全部分配给该业务数据库使用的LV,其容量扩展为2.8TB,实现系统快速在线扩容,如图5所示。
图5 扩容前该业务数据库VG、PE、LV
3 结语
本文通过研究和应用RAID 5、RAID 5+1以及LVM技术,实现了信息系统服务器本地硬盘保护、文件系统在线扩容,提升了业务数据的完整性指标,降低了存储扩容导致业务系统停机的时间,与采用RAID 1、RAID 10技术相比,采用RAID 5、RAID 5+1技术更节省成本、存储空间利用率更高。
参考文献:
[1]叶敏.大数据时代之下Raid的过去与未来[J].计算机与网络,2017(10):50-52.
[2]张新诺.浅析RAID技术在信息化建设中的应用[J].中国管理信息化,2017(09):139-142.
[3]张华,郑建志,郑永通,王绍然,赖福霖.地震监测系统服务器RAID选择[J].黑龙江科技信息,2017(11):110-116.
[4]Zhu Xu-dong,XuWei,Mao Yu-xin,Zhu Ping.RabbetUsing Layout-Aware Backup for RAID Reconstructiong[J].Chinese Journal of Electronics,2017(04):710-719.
[5]李振华,楼向雄.固态硬盘RAID阵列技术进展[J].世界科技研究与发展,2017(01):33-3