APP下载

急速驰骋 十款GDDR5显卡全接触

2009-11-30望穿秋水

微型计算机 2009年19期
关键词:校验时钟总线

望穿秋水

如果说过去采用GDDR5显存的显卡还屈指可数的话,那么如今采用GDDR5显存的显卡已经呈现遍地开花的局面——从AMD最高端的双核心旗舰Radeon HD 4870x2,到主流的高端型号Radeon HD 4870,再到新近上市的中高端显卡Radeon HD 4860,甚至主流的Radeon HD 4750都采用了GDDR5显存。下面我们就带大家一起来认识GDDR5显存。

一起来认识GDDR5显存

频率是存储器最为显著的特征。目前GDDR3的数据传输频率最高可以达到2600MHz,相比之下,目前GDDR5可以达到5000MHz。不过这依旧不是终点,GDDR5最高数据传输频率将达到6000MHz。和之前几代GDDR显存一样,GDDR5也是建立在多倍数据预取技术上的产品。根据显存发展的历史来看,GDDRl显存采用2bit数据预取技术,GDDR2、GDDR3和GDDR4都采用了4bit数据预取技术,GDDR5正是新一代8bit数据取技术的产物,达到了令人惊异的高性能。

优秀的双总线设计——高速传输无忧

相比GDDR3采用的4bit预取数据而言,GDDR5的优势在于将预取数据增加到了8bit,因此GDDR5就能够在同样的物理时钟频率下达到更高的数据传输速度。不仅如此,GDDR5显存采用了双数据总线,能够同时在数据总线的上升和下降阶段传输数据。同时,每条总线都独立配备了完整的DBI,可以独立传输、校验数据,是完整的双总线规格。以往单数据总线的GDDR2、GDDR3等显存标称频率是等效工作频率的1/2(比如标称频率为900MHz的GDDR3显存,等效工作频率为1800MHz),而GDDR5显存由于双总线技术的存在,每条总线都可以在上升和下降阶段传输数据,因此标称频率是等效工作频率的1/4。以4000MHz等效工作频率的GDDR5显存为例,它的标称频率为1000MHz。由于采用了8bit的预取技术,因此它的实际物理运行频率为125MHz。

稳定+节能,其实很简单——Data eye optimization数据核心优化

对于数据的优化是存储器最为重要的方面,GDDR5重点采用了四项技术来保证数据的稳定性和安全性。Data/address bit inversion,即数据/地址位反演是指在传输过程中,数据或者地址位内的信鼠被按照一定的规则做了反演处理。数据/地址位反演技术的作用在于有效地改善了噪音对数据信号的影响,保证了数据在传输和存储过程中的稳定性。不难看出,数据/地址位反演技术是GDDR5在传输中最重要的处理技术,也是降低功耗和提高数据稳定性的首要法宝。

除了数据/地址位反演技术外,三项动态调节技术:a djustable driverstrengths、adiustable voltages和adjustable terminations也是GDDR5数据核心优化的重要组成部分。它们分别针对驱动器、电压和终止装置进行自动调节。在传统的显存数据传输过程中,由于显存并行传输的特性,对线长和外界干扰有着严格的规定。因此我们常常在显存周围看到大量的密密麻麻的终结电阻(减少反射损耗)等元件,显卡不得不在显存周围采用蛇形走线来尽可能做到信号线等长。但在GDDR5上这些严格的要求被弱化了GDDR5自带的调节系统可以在一定范围内保证数据信号在高速运行时不出错,甚至信号线都可以不用严格等长。除了更宽松的信号传输空间外,GDDR5对电压和温度的动态调节和实时监控,也使得整个信号在传输过程中的安全性更高。另外,工程人员可以在BIOS中写入设定好的调整信息,避免在PCB已经正式出样(1ayout)之后由于信号稳定性问题导致返工。

安全+自由,放心传数据——Adaptive interface timing时钟自适应技术

信号线和时钟稳定性是高速显存设计中最重要的部分。GDDR5显存拥有多达5条需要校准的时钟信号,分别是Clock,Command Clock,ADDR、Write Clock、DATA Clock时钟信号。在高速运行的情况下(诸如高达2GHz),任何一点微小的差距都会带来整个系统的数据错误、崩溃。因此,GDDR5在时序自动校准、自适应技术上已经有了一套非常完整的方案,能够带来非常高的数据运行效率。

首先,GDDR5会要求地址时钟和总线时钟(ADDR和CK)进行对照并对齐。实际上这是在进行一次芯片的初始化,在此阶段控制器可以找到最佳的相位设置。接下来就需要校准Write Clock(WCK)和基准Clock(CK#)之间的数据,这个过程被称为“WCK-to—CK”。在这个过程中,控制器可以找出WCK和CK#之间相位的差距,是“早”还是“迟”,然后为每一个DRAM给出相应的调节数据。最后,控制器会调整数据总线(DATA和WCK)。由于数据总线DATA的频率是WCK写入时钟的2倍,因此每次校准会涉及到两个字节。GDDR5的这种校准方法,使得整个数据线环环相扣,降低了由于时钟不同步带来的数据错误或系统延迟,也在很大程度上降低了PCB设计的难度。由于有内部校准机制的存在,工程师们在PCB布线的一致性方面就有了更宽松的空间,这让整个PCB的布线更为自由和宽松。

另外,更为自由的数据预取技术也让GDDR5在图形应用中充满了优势。在图形计算中存在大量密集而微小的数据,这些数据甚至会小于GDDR5每次预取的最低数据。如果采用固定的预取值的设计方法,即每次无论数据大小(甚至使用空位)都一定要完全占据传输总线,无疑会耗费很多能量。因此,GDDR5允许小于预取数量的数据传输,即采用低预取方式。这种灵活的设计,让GDDR5在传输大量小数据量运作时,功耗有明显的降低。

纠错+校验,完美保传输——Error compensation误差补偿技术

由于电磁环境或者传输中温度、电压等复杂因素的影响,显存在数据传输和存储过程中可能会产生少量的错误一个简单的显存数据错误除了导致渲染失败以外,还可能导致显卡彻底失去响应、蓝屏和系统崩溃等严重问题。因此对错误数据的校验和补偿,成为GDDR5瞄准的又一个重要目标。

GDDR5的数据校验采用了CRC(Cyele Redundancy Check循环冗余校验)方式。CRC校验是建立在GDDR5的DATA I/O和DBI的基础上,如果出现错误,则触发数据传输总线,然后快速重新读取数据,或者利用如DataMask(数据掩蔽)等功能修改数据并重新传输。这种校验方式的优势在于能够100%检测出所有单、双数据误差。

Data Mask(数据掩蔽)是这样一项技术:GDDR5显存在每次读写数据时,并不是改写所有的数据,大部分数据都不需要修改。因此GDDR5利用地址总线对一部分数据进行掩蔽,在T--

次数据读写到来时,仅仅对没有掩蔽的数据进行更改。这样就能在最快的时间内完成数据读写。

究竟有多快——GDDR5显存性能测试

为了进一步验证GDDR5显存究竟能为显卡带来多大的性能提升,我们将通过测试得出结论。由于Radeon HD 4870和Radeon HD 4850采用的都是RV770核心,在诸如流处理器、纹理单元等主要硬件规格上都是一致的。它们的主要区别是核心频率和搭载的显存类型——Radeon HD 4870的核心频率更高,搭载GDDR5显存,显存频率也很高;而Radeon HD 4850的核心频率较低,搭载GDDK3显存,显存频率也较低。因此我们利用第三方软件统一将Radeon HD 4870和Radeon HD4850的核心频率调到一致,以便通过游戏测试来检验GDDR5显存究竟能帮助Radeon HD 4870提升多少性能。具体的领先幅度可以通过RadeonHD 4870领先Radeon HD 4850的百分比得出。此时,Radeon HD 4870和Radeon HD 4850不同之处就是显存频率和显存带宽,前者的显存带宽为3600MHzx256bit÷8=115.2GB/s,后者的显存带宽为1986MHz×256bit÷8=63.5GB/s,几乎相差一倍。为了不使CPU成为测试瓶颈,我们使用英特尔Core i7 920平台。具体测试软件使用3DMarkVantage以及主流的3D游戏。

领先幅度达到10%左右

从测试来看,搭载了GDDR5显存的Radeon HD 4870的3D性能在3DMarkVantage的测试中领先Radeon HD 4850 8%左右,而在孤岛危机等游戏的测试中,领先幅度更是达到了10%以上。值得一提的是,在高分辨率、开启了全屏抗锯齿后,Radeon HD 4870的高显存带宽优势进一步发挥了作用,3D性能领先Radeon HD 4850 15%以上。这也进一步说明了显存带宽在高分辨率、开启全屏抗锯齿后的重要性。

总结:GDDR5显存或将成为主流

和GDDR3显存相比,GDDR5显存在数据传输频率以及带宽上有无可比拟的优势。更高的数据传输频率,可以有效降低显卡在数据传输时的瓶颈,提升显卡性能,甚至降低PCB布线难度。如果用简单的数据来表述的话,256bit显存位宽的Radeon HD 4850显卡,采用1 986MHz的GDDR3显存,显存带宽为63.5GB/s;而采用GDDR5显存的Radeon HD 4870显卡,在256bit位宽下,Radeon HD 4870利用数据传输频率高达3600MHz的GDDR5显存,显存带宽轻松突破115.2GB/s,远远超过RadeonHD4850。

除了高数据带宽带来的诱惑外,GDDR5的强大性能可以让采用128bit显存位宽的中端显卡焕发活力,比如Radeon HD 4770和Radeon HD 4860。它们都采用GDDR5显存来达到以往中高端甚至高端显卡才可企及的显存带宽。Radeon HD 4770在128bit显存位宽下采用数据传输频率为3600MHz的GDDR5显存,显存带宽为57.6GB/s——这也是256bit位宽下1800MHzGDDR3显存的带宽成绩。因此我们看到Radeon HD 4770甚至Radeon HD4750在大部分测试环境下的3D性能比采用256-bit/GDDR3显存的RadeonHD 4830还要好,足见GDDR5显存带来的性能提升。同时,更低的显存位宽会让显存布线更容易,降低了PCB设计的难度,甚至仅仅需要四层PCB就可以完成制造——这无疑对降低显卡整体售价和提升产品竞争力有明显帮助。

另一方面,GDDR5显存还有不错的超频性能。以主流的奇梦达“-40X”GDDR5显存为例,它的额定频率为4000MHz。但在不少环境中,它可以被超频至4800MHz,超频幅度达到了20%。

不过,我们也必须清醒地意识到高显存带宽对显卡3D性能的影响是有限的。例如本文Radeon HD 4870和Radeon HD 4850的测试,前者的显存带宽几乎是后者的一倍,但最终带来的性能提升也只有15%左右。可以这么认为,高显存带宽是让显卡3D性能更上一层楼的助推剂,但如果要让3D性能翻番,仍然需要借助全新的GPU和更先进的核心架构。

猜你喜欢

校验时钟总线
别样的“时钟”
古代的时钟
基于PCI Express总线的xHC与FPGA的直接通信
机载飞控1553B总线转以太网总线设计
炉温均匀性校验在铸锻企业的应用
时钟会开“花”
大型电动机高阻抗差动保护稳定校验研究
基于加窗插值FFT的PMU校验方法
锅炉安全阀在线校验不确定度评定
多通道ARINC429总线检查仪