GPU耽误比拟:AMD RDNA2完胜NVIDIA安培
CPU缓存与内存耽误测试,信托各人都有所耳闻,可是GPU同样的测试却险些没人做过。 Chips And Cheese就做了一次出格的测试,比拟考查了AMD、NVIDIA GPU架构的缓存、显存迟题目。 起首是AMD RDNA2、NVIDIA Ampere两家最新架构的比拼,代表是RX 6900 XT、RTX 3090,前者在险些全部阶段都完胜。 RNDA2架构创新性地插手了Infinity Cache无穷缓存,晋升带宽的同时,耽误也可圈可点,二级缓存掷中率上只增进了约莫20ns的耽误,明明低于Ampere。 更惊人的是,RDNA2显存耽误和Ampere险些千篇一律,可是别忘了,Ampere只有两个层级的缓存,RDNA2却有四个。 Ampere的缓存架构越发传统,SM阵列私有一级缓存到二级缓存要增进高出100ns的耽误,RDNA2从零级缓存到二级缓存则只增进了约66ns。看起来,GA102焦点面积过大,也直接增进了耽误。 这正好可以表明AMD RDNA2架构在低判别率下机能、能效更优越,由于二级缓存、三级缓存耽误很低,更得当执行较小的负载。Ampere则相反,高负载下上风明明,好比说4K判别率。 说完了GPU之间的比拟,那么GPU、CPU放在一路怎么样呢?这里以RX 6900 XT、Intel四代酷睿i7-4770为例来看看。 CPU的缓存天然不是一个级此外,以是这里Y轴用了线性数据,可以看到全程大大低于RDNA2,搭配DDR3-1600 CL9内存耽误只有63ns,RX 6900 XT、GDDR6的组合则有226ns,其它末级缓存均匀耽误别离是53.42ns、123.2ns。 再看看前几代的NVIDIA GPU,包罗Maxwell架构的GTX 980 Ti、Pascal架构的GTX 1080、Turing架构的RTX 2060 Mobile。 Maxwell、Pascal着实差不多,前者整体略高一些,也许是受制于芯单方面积较大、焦点频率较低。 Turing则已经有了Ampere的样子,一级缓存耽误低得多,二级差不多,稀疏的是显存耽误在32MB之后偏高,缘故起因未知。 AMD考查了TeraScale架构的HD 5850/6950、GCN架构的HD 7970,再加上RX 6900 XT,很明明在逐代低落,并且是各级缓存都在同时前进。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |