新时代的前夜 看清当前存储市场
2022-05-30
如今回首近些年的电脑配置,有点尴尬的是,多年以来,电脑中最短的那块短板一直没有变化,数据存储始终无法跟上电脑其他配件的发展。当然,各个厂商也早就看到了这一点,为此而做出的努力并不少,只是结果……似乎并不能让人满意。好在近期的几项技术和产品发展,终于可能改变这一现状了,只是在真正的黎明到来前,混乱的市场还是需要我们来好好地捋一捋。
NVMe与PCIe升级 黎明就在前方
让数据存储跟上其他配件的脚步,技术早已不是问题,毕竟在半导体工业如此发达的今天,半导体存储的速度已经可以达到很高的水平。比如内存颗粒就是一种特殊的半导体存储设备,它一直在追随着CPU、GPU的脚步,提供了满足它们需求的高速数据存取服务。
所以,仅以半导体存储来说,规范标准、接口速度、价格成本才是其跟上其他配件的速度脚步的关键。其中最重要的,较新的固态硬盘规范标准和接口速度,在当前的消费级电脑中基本是一一对应的。即基于PCIe总线的消费级SSD绝大多数使用M.2接口,而NVMe 1.x规范也与PCIe版本有明显的对应,例如NVMe 1.3针对基于PCIe 3.0总线的产品,NVMe 1.4针对PCIe 4.0(图1)。未来可能带来巨大改变的,则是NVMe 2.0和PCIe 5.0.
●PCIe 5.0
英特尔平台在总线配置上的急迫已经不用赘述,11代酷睿引入PCIe 4.0,12代酷睿就提供了PCIe5 .0通道。这既有其支持标准已经过于落后的原因,也有为基于PCIe5.0/6.0的CXL总线技术做准备的考虑,但从最基础的原因看,快速升级的英特尔和最终决定在Zen4架构中引入PCIe 5.0的AMD一样,当然还是对PCIe 5.0又一次翻倍的带宽(图2)感兴趣。
③
④
在当前的电脑中,PCIe通道的主要使用者其实只有两个,显卡与存储。前者可以利用更大的带宽与CPU、内存通信,而且还在PCIe4.0的支持下实现了Smart AccessMemor y(智能寻址显存技术)(图3)等,看似非常美好。但近期关于RTX 40的一个新消息却让人看到了另一个现实,就是实际上显卡的GPU与板载高速显存已经形成了很好的循环架构,GPU和显卡架构没有重大变化的情况下,对接口的速度要求并不高,毕竟旗舰级RT X 30才勉强用满PCIe3.0×16插槽带宽,架构类似的RTX 40升级至四倍带宽的PCIe 5.0没有什么必要。当然,AMD的RDNA系列架构更新一些,它的最新发展型RDNA3(图4),也就是R X7000系列是否會积极地升级到这一标准还是个未知数,但至少在能否充分利用其带宽上,笔者认为答案应该也是否定的。
相对于显卡,存储对PCIe 5.0通道的利用就直接得多,在允许的情况下,有多大的带宽,就提供多高的存取速度。除此之外,PCIe 5.0还能带来很多额外的好处,例如使用系统内存做缓存的HBM(Host Memory Buffer,主机内存缓冲)技术(图5),在PCIe 5.0的高带宽下,显然会有更好的表现。
对玩家来说,英伟达的RTX IO和Windows11的DirectStorage可以大幅提升游戏画面从SSD到屏幕的速度。而它们也需要更高的PCIe传输速度,才能让游戏数据同时向CPU与GPU分发(图6),达到快速解压画面材质等数据,加快图像处理速度的目的。
不过这里也有两个问题,首先是PCIe 5.0平台的普及速度。由于当前支持PCIe 5.0的消费级平台仅有12代酷睿及相关主板,还要去除为了降低成本而降低配置的部分入门级主板。尽管12代酷睿表现良好,市场占有率快速上升,但仍不足以吸引厂商推出PCIe 5.0 SSD。
第二个问题就是PCIe 5.0 SSD的开发程度了,事实大概会出乎很多人的意料。PCIe 5.0SSD其实早就出现在商用市场(图7)上。即使是消费级产品,在年初的CES展前和展中也推出了不少相关的主控,其中有一些并非概念产品,而是进入了实际测试阶段,按照正常的周期,它们早就应该上市,或者至少有相关消息了。至今没有上市消息的原因则不外乎是两个,一是前面提到的PCIe 5.0普及度问题,二是PCIe 3.0/4.0SSD仍有巨大的利益,厂商不愿意用新品来影响其市场。
从这两个方面看,笔者预计PCIe 5.0 SSD的上市时间很可能会在暑促期间,与Zen4平台的发布同步,以获得最大的宣传效果,同时也可以借助暑促和Zen4平台的发售增加销量。
至于实际产品,如果从当前已经公布的主控能力看,我们很可能会看到上市即巅峰的14GB/s级别满速SSD(图8),这一速度已经极为接近PCIe 3.0×16插槽,只是略低于DDR4 2400这一不久前的主流内存速度(图9)。能想象吗?曾经需要使用内存虚拟硬盘软件才能获得的速度,很可能会在TB级别容量的SSD上获得。当然这些旗舰级产品的价格肯定会相当高昂,那么我们也可以关注与之配合的8GB/s~10GB/s级别中端型号,预计价格定位应该与当前的PCIe 4.0旗舰级型号相当甚至还低一些,性价比当然更好。
除此之外,PCIe 5.0的入门级S SD也可以通过其高带宽获得更高速的HBM缓存助益,也许在这一类型S SD中会彻底取消板载缓存设计,代之以HBM+SLC虚拟两级缓存,分别用于存放FTL表(Flash Translation Layer,闪存转换层)和临时数据。前者用于从系统的逻辑地址转换为SSD上的物理地址,便于主控快速定位存取数据,需要高速读写,并不适合放置在SLC虚拟缓存中。更有甚者,如果HBM模式得到充分开发,还可以与NVMe新版本中的相应功能和混合架构CPU配合,让CPU(特别是其中的效能核)承担SSD主控的部分功能,读取系统内存中HBM的数据,并将系统需求地址转换为S SD地址再向SSD申请,进一步加快存取速度的同时还能简化主控,降低SSD成本。
PCIe 5.0对另一方面的存储需求也大有裨益,那就是移动存储。其实从供电、传输速度等方面的能力以及配置数量等方面看,雷电接口的使用方式已经和US B有了一定区别,其最主要的连接设备显然是外部高速存储(图10)。但如今要想获得最强的外部传输速率,满速的雷电4已经需要使用2条PCIe 4.0通道,再提速就需要4条PCIe 4.0通道支持一个雷电接口,显然太“浪费”了。如果未来平台PCIe 5.0通道的数量可以提升,那么在显卡和SSD之外,就可以使用PCIe 5.0来支持雷电接口,只需单通道就能提供满速雷电4,下一代雷电接口才有可能提升速率。
NVMe 2.0
作為一次规范标准的大版本更新,NVMe 2.0的变化非常大,在针对SSD的管理上,至少有三个值得注意的新功能。
分区命名空间(ZNS)技术可以根据数据的使用频率,将其集中放置于存储设备的某些区域(图11),并且通过一种类似命名的区域管理方式划分区域(应该是通过F T L表的能力来实现),从而减少对存储数据的重写和重新排列。这不仅能提升读写效率,应该还能减少额外的写入消耗,提升SSD使用寿命。
持续性群组管理则是一种新的存储管理机制,可以允许灵活和动态的SSD配置,可实现动态容量管理和混合模式NAND操作,也许未来不仅会有模拟SLC缓存,还会出现真正的TLC+QLC颗粒甚至再加上SLC颗粒,分别应对不同需求的混装SSD。
关键值(KV)命令集将允许应用程序直接与驱动器控制器通信,无需再使用内存地址块。这可以降低CPU的计算负荷,但需要SSD支持相关命令集,也就是所谓的KV-SSD。
需要注意的是,与前文提到的NVMe标准与PCIe版本几乎一一对应不同,NVMe 2.0的重大更新可能不会在第一代PCIe 5.0 SSD上全部体现,也许有相当多的PCIe 5.0SSD实际仍采用NVMe 1.4标准。好在这种组合的应用性能应该是没有问题的,因为面向数据中心和企业用户的第一代,甚至很多第二代商用级PCIe 5.0 SSD(图12)其实就采用了这种组合。
另外,NVMe 2.0的一个重大改进就是模块化技术规范,商用产品当然要使用严格的企业级标准,这可能也是很多商用级PCIe 5.0 SSD不使用NVMe 2.0的原因。而消费级产品则可以放弃一些过高的要求,只使用部分NVMe 2.0技术规范,此时是否还能标称为NVMe 2.0标准产品也尚未可知。
除了对SSD的支持外,NVMe 2.0还提供了一个非常引人瞩目的新功能——支持“旋转存储介质”,说白了就是使用旋转磁碟的传统机械硬盘。也许有些人对NVMe的这一功能感到非常奇怪,难道机械硬盘能达到600MB/s以上的传输率吗?也许我们真的快要迎来这样的产品了。
无法割舍的容量 机械硬盘
当主流SSD向TB级别进发时,同价位下,机械硬盘保持着4倍的容量优势(图13),让很多资金有限,数据量又很庞大的用户难以割舍。而在高端市场上,机械硬盘更是已经可以稳定大量地提供16TB以上容量产品,但大部分S SD产品系列的最高容量却停留在4T B。所以至少在可见的未来,机械硬盘仍将与SSD一起,担负起数据存储的大任。
至于前面提到的能让SATA接口的速率捉襟见肘的技术,其实已经公布了一段时间,只是因为各种原因而延误了最终产品的面世,在近期我们也终于见到了它们的真容和实际表现。
●速度翻倍 多读写臂技术
传统的硬盘中虽然有多个读写悬臂和磁头,配合多个磁碟的上下表面数据层,但它们都固定在同一个动作机构上,不能做相对运动(图14)。也就是说,当读写第一张磁碟的上表面某处数据时,第一张磁碟的下表面磁头,以及其他所有磁碟的磁头,可能都位于不需要的数据区域,没有进行任何读写,读写其他存储面的数据时也是如此。
⒁
多读写臂技术(Multi Actuator)就是为了摆脱这个限制而开发的,它安装了两组(未来可扩充为更多组)可独立运作的悬臂,可以提供两个并行的数据流(图15),两组磁头可以同时读取、写入,或者一读一写,可极大地提升机械硬盘的吞吐能力,这与RAID 0的实际效果很相似,不过只需要单个硬盘就能实现。
⒂
希捷近期推出的Exos銀河系列Mach.2 14TB(Exos2 X1 4)硬盘是首款采用这一技术的产品(图1 6),在7200RPM的转速下,其最高读写速度达到了524MB/s,是目前世界上速度最快的机械硬盘,已经达到高端SATASSD的水平。其接口为商用硬盘的SAS 12Gb/s,暂时还不会成为瓶颈,但当这一技术如果加入消费级产品中,SATA3(6Gb/s)的接口速率就很勉强了,应该是最适合NVMe2.0规范的机械硬盘产品。
⒃
当然,这一技术也要付出一定的代价,除了成本之外,功耗是肯定会增加的,比如Exos银河系列Mach.2 14TB的空闲时功耗为7.2W,重负载时功耗13.5W,比20TB容量的Exos X20功耗更高。这一功耗甚至大幅超越了需要额外增加激光、微波源的新一代辅助记录技术。
●容量大增 辅助记录技术
近期的机械硬盘中,还出现了希捷(热辅助磁记录)和东芝FC-MAMR(微波辅助磁记录)等提升数据存储密度的技术,并通过这些技术推出了18TB~20TB容量产品(图17)。从当前的发展趋势看,在20TB以上的机械硬盘中,它们很可能成为必备技术。
这些技术的原理都类似,是在磁头前方增加激光或微波模块,通过激光加热(图18)或微波照射的方式,让磁头即将处理的位置产生磁场变化,降低超顺磁效应,可以缩小数据位,增加数据密度,据称可达到每平方英寸500GB的存储容量。存储密度的增加不仅可以使用同样的磁碟数获得更大容量,还可以在同样的转速下获得更高的读写速度。
⒅左侧为标准的PMR磁头,右侧为采用激光进行辅助加热的HAMR磁头
火速链接
本刊2022年第7期《超级数据中心 希捷酷狼Pro 20TB硬盘》一文详细介绍了希捷使用HAMR技术的产品,感兴趣的朋友可以参考。
摸得到的变化 新品与价格
如果说前面提到的技术与产品还距离我们比较遥远,那么近期一些市场变化应该可以更好地预示着新时代,正准备装机升级的朋友更可以直接买来体验新时代的到来。例如3000MB/s级别的新M. 2 SSD价格进一步降低,在容量价格比、性能价格比上全面超过了SATA SSD和较早的2000MB/s级别M.2 SSD(图19)。这些产品采用更高堆叠层数TLC或QLC,而且随着技术的进步,其中的QLC颗粒的写入寿命也已经达到了500次左右,已经完全够用,还能配合HBM等技术获得较好的持续写入速度与IOPS。
追求高性能的用户则可注意最新的5GB/s~7GB/s级别PCIe4.0 SSD,这些产品纷纷进驻高速PCIe 3.0 SSD让出的价格位,成为中端乃至主流平台的好选择。