GPU显存延迟大比拼:AMD RDNA2力压NV Ampere

现在的显卡具有多级缓存结构,这些级别的缓存经过精心设计,可填补计算间的空白,对GPU的性能与速度有着重要影响。不同的GPU供应商(例如AMD和NVIDIA)具有不同大小的L1和L2缓存。例如,NVIDIA A100 GPU上的L2缓存为40MB,这是上一代GPU L2缓存量的七倍,这表明有许多新的应用程序比以前更吃缓存了。

TDP消息,国外一网站测试了最新一代显卡(AMD的RDNA 2和NVIDIA的Ampere)的GPU显存延迟。通过在OpenCL中使用指针追逐测试,可得出以下结论:RDNA 2的高速缓存非常快速,与Ampere相比,缓存延迟要低得多,而VRAM延迟几乎是相同的;NVIDIA使用由L1和L2组成的两级缓存系统,速度相对较慢,数据从拥有L1缓存的Ampere SM簇传输到外部L2的需要100ns左右的延迟。

AMD具有三级缓存系统,L1和L2之间的延迟只有66ns。Infinity Cache本质上是L3缓存,仅增加了20ns的额外延迟,与NVIDIA的缓存解决方案相比,AMD更具优势。

热门相关:大奉打更人   北雄   叶辰夏若雪   叶辰夏若雪   首席总裁,太危险