磁盘阵列数据快速恢复方法研究
2020-07-18顾天一柳刚刚
◆顾天一 朱 昊 董 宁 侯 杰 柳刚刚
(66139部队 北京 100144)
1 磁盘阵列
RAID是由美国加州大学伯克利分校的D.A.Patterson教授在1988年提出的。RAID是一种使用磁盘驱动器的方法,就是指用两个以上的物理硬盘进行协作,逻辑上作为一个磁盘驱动器来使用,但能提供数据冗余容错协同工作能力,以此来全面提升磁盘子系统的性能。一般情况下,组成的逻辑磁盘驱动器的容量要小于各个磁盘驱动器容量的总和。RAID的具体实现可以靠硬件也可以靠软件,WindowsNT操作系统就提供软件RAID功能。
现在,由于IDE硬盘性能的突飞猛进以及价格的不断下降,IDERAID技术已经趋于成熟。RAID技术经过不断的发展,现在已拥有了从RAID 0到RAID 6共七种基本的RAID级别。另外,还有一些基本RAID级别的组合形式,如RAID 10(RAID 0与RAID 1的组合),RAID 50(RAID 0与RAID 5的组合)等。不同的RAID级别代表着不同的存储性能、数据安全性和存储成本。
2 磁盘阵列环境
2.1 使用环境
本文所研究的局域网模型如图1所示:
图1 网络拓扑图
该局域网应该提供的功能如下:
(1)连接局域网内所有的PC和服务器。
(2)在局域网内部提供丰富的网络服务,实现广泛的资源共享,如文件传输、远程登录、电子邮件、内部域名访问等。
(3)各区域之间划分 VLAN,并可以互相通信,后期可根据视情况使用策略禁用。
(4)在内部建立数据库,如人员信息,办公计划,电子邮件等。
(5)使用双核心交换机进行热备份,并进行链路聚合,使用VRRP设置VLAN网关,分担VLAN流量及负载均衡。
2.2 恢复环境
磁盘阵列一般均由阵列柜与盘体等设备组成,当阵列出现故障时,原阵列柜数据由于各种原因不能读取数据或出现故障,故在作数据恢复时要有相应的阵列柜,服务器来对故障的阵列与磁盘进行数据恢复。
表1 阵列恢复环境
3 RAID5磁盘阵列数据快速恢复
3.1 RAID5存储结构
RAID5(分布式奇偶校验的独立磁盘结构)是一种存储性能、数据安全和存储成本兼顾的存储解决方案。
工作原理:将数据以块为单位分布到各个硬盘上。RAID5不对数据进行备份,而是把数据和与其相对应的奇偶校验信息存储到组成 RAID5的各个磁盘上,并且奇偶校验信息和相对应的数据分别存储于不同的硬盘中。当RAID5的一个磁盘数据损坏后,利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据。
读写:使用至少三块硬盘组成RAID5磁盘阵列,当有数据写入硬盘的时候,按照1块硬盘的方式就是直接写入这块硬盘的磁道,如果是RAID5的话这次数据写入会根据算法分成三部分,然后写入三块硬盘中,写入的同时还会在这三块硬盘上写入校验信息。当读取写入的数据,会分别从三块硬盘上读取数据的内容,再通过校验信息进行校验。当其中一块硬盘出现损坏的时候,就从另外两块硬盘上存储的数据可以计算出第三块硬盘的数据内容。也就是说RAID5这种存储方式只允许有一块硬盘出现故障,出现故障时需要尽快更换,当更换故障硬盘后,在故障期间写入的数据会进行重新校验。
3.2 RAID5磁盘阵列数据恢复过程
(1)将故障阵列磁盘卸下,安装到新磁盘阵列中;
(2)启动磁盘阵列,检查磁盘阵列与磁盘加电情况;
(3)启动服务器,检测磁盘阵列通道与磁盘检测状况;
(4)进入系统并查看磁盘管理系统,检查磁盘运行;
(5)打开故障磁盘,察看磁盘数据、分区信息、根据扇区数计算扇区大小;
(6)对磁盘阵列进行分析;
(7)选择 RAID模式与驱动器数,打开驱动器并选择校验位旋转方向;
(8)填入块尺寸与校验顺序后进行分析,若确定则填入正确的参数,如不确定则系统进行分析后人工进行选择;
(9)将要引出的数据选择到目标磁盘或存储器后进行拷贝.时间视磁盘容量大小与设备运行速度与通道性能,一般时间较长.由几小时至几十小时均有可能;
(10)将输出的文件打开并装载.选择磁盘和分区并将文件引出;
(11)打开分区并检查数据,如果文件显示正常,则可以将其恢复到目标磁盘阵列中,若不正常则在磁盘阵列块大小顺序等参数不对需要进行分析确定问题;
(12)若文件正常,则数据恢复成功并提供用户检查、拷贝、数据恢复成功。
4 结论
本文对磁盘阵列关键数据恢复技术方法进行了综合深入研究,结合当前高新技术和实际使用环境模式,根据数据载体类型研究适用的数据恢复技术方法,得出了磁盘阵列关键数据快速恢复具体方法,得出科学的结论,为有效提高各类数据可靠性、安全性提供方法。