知识帖:把N台个人电脑堆叠起来变成PC农场,是个啥操作
2023-04-18徐远志
徐远志
●个人电脑,PC,这个大家都熟,办公、影音娱乐、玩游戏,做些简单的创意性工作(比如视频编辑、简单的三维建模、简单的产品设计),完全OK !而PC 的特点,从英特尔这边来说,主要就是搭载(Core)酷睿处理器的平台。
●再往上一级是工作站。负载更重的专业设计任务,比如,设计一台摩托车发动机,常规的PC 可就有些吃力了,就得上工作站了!从工作站这一级开始,就开始使用(Xeon)至强处理器了,核心数量比PC 多,用的主板也不同了,且能使用ECC 错误校验内存避免工作过程中宕机,而且,开始搭载专业显卡了。
●那么再往上呢?那就是服务器,以及服务器集群了。采用的是数个或是海量的至强处理器,用Win Server 或Linux 系统,然后根据不同的应用需求,会插满内存(比如几千GB)或硬盘(比如10PB、100PB,1PB=1024TB),当然,也可以插满深度学习用的加速卡。总之,复杂的任务,比如电影、动画长片的渲染,比如大型的机械设计,比如游戏服务器,比如数据中心,又比如深度学习训练等,就要用到服务器或服务器集群了!
但实际上,从工作站到服务器(集群),中间还是有比较大的跨度。实际应用中,往往会有这样的情况:某些应用类型的算力需求远高于工作站,但如果上服务器(集群),成本又太高了——毕竟至强处理器,以及其专属的主板、内存等周边都相对更贵,且WindowsServer 系统还是收费的,Server 上很多应用也往往是付费的(甚至是按照节点数量收费的)——这,可就相当具体了!!
为了解决上述这些实际问题,在2018年,英特尔创造了一种新技术、新事物:把个人电脑(PC),通过机架进行组合堆叠来集合算力(并进行分配),大家可以理解为“用PC搭建的服务器”。而英特尔也给它取了一个特别贴切的名字,叫作“PC Farm”,也即是“PC农场”。
这是PC Farm的“官方定义”。
PC Farm也历经多次进化和迭代,但其统一的特征就是:它是由完整的“PC系统”即个人电脑系统组合而成的!上图里可以非常清晰地看到三套完整的个人电脑系统:三块主板,每块上都有两根内存、一根M.2 接口的SSD,并安装了一颗处理器,而且,每块主板上也都有一套完整的接口。
而后,PC Farm 進化为纵向拔插形态方便随时扩充和更多地堆叠(往机架上堆,堆成一个一个的机柜),但依然可看出是由单个PC单元组合而成的。
较新的PC Farm 产品已经非常方便插拔了,但单个组成单元依然是一套完整的PC,当然,也借助了一些服务器技术,比如服务器的散热技术。
PC Farm的具体优势是什么呢?
●首先是总算力可以很高!因为它也可以若干个机柜进行堆叠, 内部通过IPMI( 智能平台管理接口,Intelligent PlatformManagement Interface)或是基于IPMI 的第三方管理软件来进行管理和调配,实现硬件性能的组合(和分配),所以它的“总体性能”可以非常高(一个机柜貌似就可部署144 个算力节点),能胜任大量的专业应用。
●其次就是成本相对服务器系统要低不少。这个“成本相对低”是多方面的,首先PC 硬件系统相对便宜,系统和软件费用也低。另外,这些用于组合堆叠的PC是“完整的个体”,它们是可以轻松替换的,如今甚至能“跨代堆叠”(比如之前大部分是第12代酷睿平台,如今可部分升级到第13 代酷睿平台,不同代可混用)。最夸张的是,被替换下来(淘汰下来)的个体,是可以作为独立的PC 折价销售的——因为它的配件、功能是完备的。也就是说,PCFarm 的扩容、升级,既简单,成本也要低得多!
● 部署和管理灵活快捷。由于PC Farm引入了服务器的插拔扩容概念和远程管理概念,所以,其部署和管理是比较灵活快捷的。经过培训后,其实是很容易上手的。
而基于以上特性,PC Farm其实可以实现很多应用。目前主要活跃在电竞网吧、电竞酒店、云游戏、云渲染、VR 娱乐等领域。
大家不要被“云”字给唬着了,其实没那么复杂,下面牛大叔给大家举几个不同类型的例子,相信大家都能看得明白:
●电竞酒店。我们假设一家电竞酒店,分布在5 层楼共计100个房间。最传统的做法是:在每个房间放一台高性能PC,比如第12 代酷睿i7+RTX 3070/4060。总量是100 台,投资巨大不说,还面临配件被盗被破坏的风险。
而采用PC Farm 方案,我们只要在一个房间部署机架式的PCFarm“服务器”,或许只用30个节点(30 颗i7 处理器+30 块RTX 独显系统),进行统一管理和性能动态分配,就能满足100个房间的需求(毕竟绝大部分用户就玩玩网游,无需太多性能)。和该情况类似的还有网吧。
●又比如小型的影视工作室。这个很好理解,这些小型的影视工作室主要做特效视频,并完成海量视频的剪辑工作,对处理器性能和显卡性能要求高,单个PC 肯定是不够的。以往,这类工作室往往购买二手服务器用处理器来渲染(上全新的至强系统,不管是工作站还是服务器,成本都很高)。
● PC Farm 与服务器集群混搭搞定“云游戏”。
这个例子稍专业一点,但也容易理解:假设某游戏厂商开发了一个画面特漂亮的游戏(通常是网游),但问题是,如果把所有运算都在客户端完成(如手机、笔记本电脑),对客户端硬件的要求就很高,而客户端的程序也会非常大,就好像如今的大型3A 游戏,动辄上百GB 容量——这对于手机来说就是噩梦了!
那么咋解决呢?比较好的方式就是在云端完成游戏的渲染工作,把客户端的运算和存储压力大幅降低。但,渲染这活儿,并不适合于传统意义上的服务器——服务器可以用一颗处理器延展出TB 级的内存+ 海量的硬盘,但渲染这活儿是吃处理器核心数量、GPU数量和性能的——这要靠服务器系统来堆,可就贵上天了!那么合理的方案就是:传统的服务器完成数据部分,渲染部分就交给PCFarm完成!
这就是“云游戏模型”,实际上,最传统的“网页游戏”也是典型的云游戏。不过如今的云游戏,画质提升很大——考验的就是PC Farm的算力。
西山居的《剑网3》和《剑网3缘起》,就与英特尔和阿里边缘云ENS 合作,靠PC Farm 集群完成画面渲染,从而大幅降低客户端硬件的需求。
边缘算力,如测绘建模等。
不要被“边缘”这个“标准行业词汇”吓着啦,待牛大叔给你清楚解读:
2020年以前,大家都知道一個有意思的事情,叫作“演唱会抓逃”。好多逃犯耐不住寂寞,去看歌星的演唱会,谁知道被现场逮住!还别说,演唱会上真的抓了不少逃犯。
具体咋做的呢?其实机制很简单:会场每个进出口架上摄像头,摄像头抓取进场观众的人脸和公安部的逃犯数据库进行比对。而在这个系统中,摄像头就是“终端”,而公安部的逃犯系统在公安部服务器上,就是“云端”。
但这个方式有个现实的问题:如果所有人脸都要通过互联网“跨越千山万水”上传到公安部的服务器上进行比对,然后再反馈下来,那么速度就太慢了,无法及时出结果。于是,这个系统就引入了“边缘算力”——每个摄像头或者每几个摄像头,搭配一台电脑,这台电脑不仅录制摄像头拍摄的画面方便后续到公安部数据库中比对,而且它自己就带有几十万个逃犯的面部特征数据,然后它就可以完成快速的对比筛查,这就比全部通过云端进行要快得多,高效得多了。而在这个模型中,摄像头就是“终端设备”;这台靠近摄像头的电脑就是“边缘算力”(“边缘”指它物理位置上更靠近终端而不是云端);而公安部的数据库就是“云端”。
不过上述例子中,人脸识别只抓关键特征,所以对“边缘算力”的要求并不高,一台高性能PC 即可。但如果采集的、需要在边缘端预处理的信息比较复杂,算力要求比较高咋办呢?比如测绘数据,不仅是复杂的高精度图像,而且包含了坐标、海拔等一大堆位置信息,还要做识别分析,这时,边缘端就得靠高PC 来堆叠性能了——PCFarm 在这里就正好可以派上用场了——用一台多节点的PC Farm集群系统覆盖一片范围的测绘信息进行预处理,最后再上传到云端。
PC Farm(集群),应用前景广阔
看到这里,相信大家对PC Farm这种产品有了全面的认识和了解,而我想说的是:这种神奇的产品,其实应用前景非常广阔。之前有人说它是“介于工作站和服务器之间的产品”,对,但也不对——毕竟它具备了不少连传统服务器都不具备的特质,且其算力理论上也可以相当强悍,而总体拥有成本相对服务器系统又明显低得多,在不少应用上的确能大展拳脚——最终,就看大家如何发挥想象了!