RAID1技术在DCS工作站的应用
2021-12-06何凡帆
摘要:本文介绍了RAID 1技术,并结合RAID 1技术提出了对一些单硬盘DCS工作站(Distributed Control System)进行可靠性提升的改进方案,避免了单硬盘DCS工作站因硬盘单一故障导致不可用的情况,从而提高了工作站的可靠性。本文可为类似的DCS工作站改造提供借鉴。
关键词:DCS工作站;冗余磁盘阵列;固态硬盘
1.概述
工作站是DCS系统的重要组成部分,其可靠性直接影响到DCS系统的运行。十年前投用的DCS系统一般选用的都是32位的机架式工作站。以某电厂选用的Dell Precision 5400为例,其配置为单块机械硬盘,经过十年持续不断的运行,现已到了故障高发期,而市面上新型的64位工作站无法与原有的DCS软件兼容。如何提升工作站的可靠性是该电厂面临的问题。本文介绍了一种通过配置磁盘冗余阵列、升级固态硬盘提升工作站可靠性的方案。
2.某电厂DCS工作站现状
某电厂设计时其工作站选用的是Dell Precision 5400机架式工作站,配置单块机械硬盘(实际硬盘槽位有两个,支持冗余磁盘插口),未配置冗余磁盘阵列。现工作站已连续运行十年,硬盘作为连续运转的主要部件,现到了故障的高发期。一旦出现硬盘故障,将导致站点离线,将对主控室操作、监视功能造成影响。若更换硬盘,需要重装系统、打补丁,重新进行软件配置等,大约需16小时左右,将影响电站的安全稳定运行。
一般对于工作十年以上的工作站故障,首选的是整体升级替换。调研发现Dell Precision 5400机架式工作站现已停产,目前Dell最新在售可选机架式工作站为Dell Precision R7920。根据官网配置选型,Dell Precision R7920可以选配RAID卡硬盘配置。在现工作站停产的情况下,若升级为新型号且具有磁盘冗余阵列的工作站,将大大提高工作站的可靠性。但进一步研究及实验发现,目前官网Dell Precision Rack 7920工作站及市面上其它新型号的64位工作站均无法与原有的DCS软件兼容,若将工作站整体升级,需要找DCS供货商将DCS软件同步升级,费用昂贵。如何在现有工作站的基础上提高工作站的可靠性是该电厂目前需要解决的问题。
3.RAID1技术
RAID(Redundant Array of Independent Disks)即独立磁盘冗余阵列,是由多个独立的高性能磁盘驱动器组成的磁盘子系统,从而提供比单个磁盘更高的存储性能和数据冗余的技术。RAID 的初衷是为大型服务器提供高端的存储功能和冗余的数据安全。在整个系统中,RAID 被看作是由两个或更多磁盘组成的存储空间,通过并发地在多个磁盘上读写数据来提高存储系统的 I/O 性能。大多数 RAID 等级具有完备的数据校验、纠正措施,从而提高系统的容错性,大大增强系统的可靠性。
RAID1磁盘阵列也称为镜像,它将数据完全一致地分别写到“工作磁盘”和“镜像磁盘”。RAID1磁盘阵列提供了很高的数据安全性和可用性,当一个硬盘失效时,系统可以自动切换到镜像硬盘上读/写,并且不需要重组失效的数据。RAID 1磁盘阵列支持“热交换”,就是说阵列中硬盘的移除或替换可以在系统运行时进行,无须中断退出系统。RAID 1磁盘阵列是十分安全的,主要用在数据安全性很高,而且要求能够快速恢复被破坏的数据的场合。
4.固态硬盘
固態硬盘(Solid State Disk或Solid State Drive,简称SSD),又称固态驱动器,是用固态电子存储芯片阵列制成的硬盘。与传统的机械硬盘相比,其最大的优点是读写速度快,同时还有防震抗摔性好、无噪音、工作温度范围大等优点。
读写速度:固态硬盘持续读写速度可达到500MB/s,7200转的机械硬盘的读写速度一般为100MB/s。与之相关的还有极低的存取时间,最常见的7200转机械硬盘的寻道时间一般为12-14毫秒,而固态硬盘可以轻易达到0.1毫秒甚至更低。
防震抗摔性:传统硬盘都是磁碟型的,数据储存在磁碟扇区里。而固态硬盘是使用闪存颗粒(即MP3、U盘等存储介质)制作而成,所以SSD固态硬盘内部不存在任何机械部件,这样即使在高速移动甚至伴随翻转倾斜的情况下也不会影响到正常使用,而且在发生碰撞和震荡时能够将数据丢失的可能性降到最小。相较传统硬盘,固态硬盘占有绝对优势。
无噪音:固态硬盘没有机械马达和风扇,工作时噪音值为0分贝。基于闪存的固态硬盘在工作状态下能耗和发热量较低(但高端或大容量产品能耗会较高)。内部不存在任何机械活动部件,不会发生机械故障,也不怕碰撞、冲击、振动。由于固态硬盘采用无机械部件的闪存芯片,所以具有了发热量小、散热快等特点。
工作温度范围大:典型的机械硬盘驱动器只能在5到55摄氏度范围内工作。而大多数固态硬盘可在-10~70摄氏度工作。固态硬盘比同容量机械硬盘体积小、重量轻。固态硬盘的接口规范和定义、功能及使用方法上与普通硬盘的相同,在产品外形和尺寸上也与普通硬盘一致。其芯片的工作温度范围很宽(-40~85摄氏度)。
因此对于旧的DCS工作站,通过将机械硬盘替换为固态硬盘的方式也可以大幅提高其运行速度及综合性能。
5.改进方案
本案例中的Dell Precision 5400机架式工作站,由于其支持冗余磁盘插口,只需采购对应的固态硬盘,完成RAID1磁盘阵列配置后,进行功能验证即可。
对于不支持冗余磁盘插口的机架式工作站,需额外采购冗余磁盘阵列卡。步骤如下:
1) 安装新的冗余磁盘阵列卡,使用SATA线缆直接连接新的冗余磁盘阵列卡至原SATA硬盘接口;
2) 在更换件Precision R5400中的启动系统时进入相关BIOS配置硬盘,检查是否可配置为RAID 1;
3)使用原有的DCS相关软件对改造后的工作站进行重装;
4)测试相关硬盘性能、整体系统性能。
改造后的工作站支持硬盘在线更换。出现故障后,相比原重装的处理方式,大大降低了系统的不可用时间,从而保障了整个电厂的安全可靠运行,同时减少了维修工作量及运维成本。
6.结语
对于一些投用时间较长的DCS工作站,现在面临着工作站停产、故障率高发诸多问题,影响了系统的安全可靠运行。本文结合已有的RAID 1冗余磁盘阵列技术及固态硬盘技术,提出了一种最低成本的改造方案,在提高工作站性能的同时,也消除了单一硬盘故障对系统不可用的影响。可为同类型的DCS工作站改造提供借鉴经验。
参考文献:
[1]周伟 刘琨.RAID技术在数据存储中的应用研究[J].攀枝花学院学报.2006年(2).
[2]陈华英.磁盘阵列RAID可靠性分析[J].电子科技大学学报.2006(6)
作者简介:何凡帆(1983-),男,供职于浙江省三门核电有限公司维修处,研究方向:数字化仪控系统。