值得关注的ReFS
2016-03-15
引言:Windows Server 2012及Windows 8.1中出现了一种全新的文件系统,名为“弹性文件系统” ReFS(Resilient File System)。传统意识认为,RAID是一种硬件驱动的高可靠存储方案,但随着云架构系统和大数据广泛应用,简单的RAID奇偶校验难以容纳数千个磁盘卷。ReFS通过采用全新引擎“Minstore”,支持快照、加密、超大磁盘、巨量文件和最大卷容量16EB。
ReFS:可靠可扩展的磁盘结构
ReFS将B+树作为惟一且通用磁盘结构,借此展现磁盘的全部信息。ReFS中所有元数据校验工作都可在树层面进行,这些校验值会独立于树页面本身,单独保存。这样可避免各种形式磁盘错误。
ReFS能够实时检测和修复数据错误,无需卸载或干扰访问相应的卷。当一个文件被读取,读取文件的校验与存储的校验相比较,错误被自动检测。
在ReFS中,校验被放到文件元数据。一个附加的称为Integrity Streams的可选功能,确保更改写入时,它们被写入到一个不同的成员卷,以确保原始数据不受损害。这种错误检测对抗位损坏,磁盘上存储数据的降解,以及硬件故障、固件故障等破坏性事件,不影响联机文件系统的可用性。
ReFS还包含了对文件内容进行校验的额外功能。通过启用名为Integrity Streams的选项,ReFS会将文件改动写入到不同于原始位置的其他位置。使用了一种在写入事务中进行分配的模式(也叫做“写入时复制”)。这种方法可提供最大化的可靠性,同时无需采用日志结构的文件系统,既可避免在磁盘更新过程中,由于断电导致随机写入以及大量写入操作产生的问题。
为此,您可以通过自动化的方式将元数据的更新操作写入到其他位置,不对原数据进行原位更新。
ReFS设计上可以充分满足Windows存储栈的各种指标,通过其他栈层提供最大化的灵活性与兼容性。兼容各种常用软件,如备份与反病毒应用程序,ReFS在设计上依然能够很好地与存储栈的其他层完美配合。ReFS可无缝利用多台计算机以及虚拟磁盘上共享的存储池,并可在存储池之间实现无缝转换,在存储空间或ReFS基础之上提供额外的容错能力。
ReFS的局限性
ReFS继承了NTFS文件系统的出色功能,例如BitLocker驱动器加密、增强安全性的访问控制列表(ACL)、USN日志、变更通知、重解析点、卷快照、SymLinks/Junctions/Mount points、文件ID以及Oplocks。另外,ReFS还可使用与客户端上任何操作系统访问NTFS卷时相同的文件访问API进行访问。
但是,ReFS也有一些重要限制,包括:
1.无法将原有NTFS磁盘区直接转换为ReFS格式,只能在两种文件系统间以手动方式搬移与复制资料。
2.ReFS不能作为启动分区,这意味着Server 2012系统必须混合使用NTFS与ReFS两种文件系统,并以NTFS分区来启动。
3.ReFS不适用于移动储存如移动硬盘和USB盘,ReFS本身并未含有重复数据删除功能,也无法与Server 2012新增的重复数据删除功能并用(Server 2012的重复数据删除功能,仅适用于NTFS文件系统磁盘区)。
4.ReFS本身未内置可写入的快照功能,用户需通过其他工具软件,直接从ReFS底层的Storage Space虚拟磁盘建立可写入快照。
ReFS v2有哪些改进
在Windows 8及Windows Server 2012中,我们已经见识到了ReFS v1这种新颖的磁盘系统,不过这种所谓可靠性文件系统,并没有让我们看到比常见的NTFS有多少优势,况且它主要针对的Windows Hyper-V磁盘。如今,ReFS v2明显的技术改良让笔者顿时眼前一亮。
这里,笔者不禁想到了在Windows 8/ Windows Server 2012中出现的针对磁盘阵列的Storage Spaces技术,它提供了三种存储模式,即简约型(Simple)、镜像型(Mirror)和奇偶校验型(Parity)。Simple模式相当于单独磁盘的RAID 0;Mirror模式相当于RAID 1,会将所有数据复制到两块或三块物理盘上;Parity模式则相当于RAID 5,会跨接多块磁盘通过奇偶方式检测错误,Storage Spaces对于NTFS或ReFS文件系统均有效。
如今回想起来,ReFS v1有一项颇有野心的功能,就是所谓完整型数据流(integrity streams),主 要用于对运行中的文件进行检测和纠错,但令人失望的是,它对Hyper-V虚拟磁盘不仅无效,而且会对系统造成严重阻碍。因此,在正常运行的Windows Server 2012 R2系统总是竭力回避ReFS v1。而在业已公布的Windows Server 2016 TP版本中出现的ReFS v2,的确有很多改进值得关注。
ReFS格式的文件系统,较之NTFS的一项重要优势是,当意外错误发生之际,主要表现在Storage Spaces蓄池在将ReFS作为底层硬盘格式时,能够极大改进修复处理过程,因为CHKDSK在处理大型NTFS卷时,采取的是自然顺序方式,非常耗时,可是ReFS卷则效率明显加快,因为它对整个卷采用了多种并行运行方式。
Windows Server 2016 TP版本中提供的ReFS v2还有一项针对Hyper-V的重要功能,就是“数据块克隆”(block cloning),它可以优化处理虚拟数据负载,这里需要用到检查点(checkpointing)和快照(snapshot)技术。具体而言,就是ReFS能够将某个文件中的某些整块克隆到另外文件中,将执行一种复制加写入的中间环节,它能够极大地提高系统整体性能,同时有利于减少随机生成的数据垃圾。
ReFS v2还采用了一种“簇环”技术(cluster bands), 用于将数据分组“打捆”,从而有效改进I/O性能。为了检测ReFS v2的磁盘操作速度。
笔者做了一个简单的实验,即在NTFS卷上生成一个新的127GB的VHDX文件,用时为12分47秒,而将相同的磁盘(一块2TB SAS的磁盘)进行ReFS格式化后发现速度基本一样。分析其过程,原来ReFS仅仅是对文件分配空间,它并不对磁盘原有数据进行清理。而且,在ReFS v2卷上生成任何大小的磁盘时用时都没有明显差别。
顺便说一下,在了解不同格式文件系统的运行速度的实验过程中,笔者在微软网站还发现了一个专门的测速工具,即DiskSpd,笔者的实验配置为挂接着4块NVMe SSD磁盘的Dell R930,分别 采取 NTFS和ReFS格式进行比较。笔者的体会是,系统的错误处理和正常运行其实比速度更重要,这也许正是ReFS v2的用意所在吧。