正文内容 评论(0)
一、前言:脱胎换骨的RDNA 4架构
实在不知道该如何评价NVIDIA的RTX 50系列显卡!
Blackwell架构的变化如此之小,除了增加了PCIe 5.0和DLSS 4技术之外,似乎就再没有其他显著的改进。
就连制程工艺依旧是2年前的台积电4N(实际上是5nm),晶体管密度没有任何提升,完全是依赖成熟的制程工艺所带来的超高频率以及GDDR7显存来实现性能提升。
在相同的价位上,RTX 50相比上代仅有区区15%的性能提升!而即便如此,消费者也几乎不可能以MSRP原价买到RTX 5070 Ti和RTX 5080,基本上都要加价千元以上。
所以整整2年的等待,消费者到底等到了什么!
NVIDIA站在山巅毫无对手,肆意挥霍着RTX 40系带来的巨大领先优势,挤牙膏程度比起10年前的Intel有过之而无不及!
AMD这边一直隐忍不发,将RX 9070系列的解禁日期放在了今天,而它将是HD 4850之后最为成功的GPU产品。
经历了RDNA 3的挫折之后,AMD对RDNA 4从最底层开始进行了改头换面般的革新。
RDNA 4采用了DCU(Dual Compute Unit)设计,一个DCU包含上下并行的2个CU单元,而每个CU单元又包含2组SIMD32矢量单元,这在一定程度上可以带来更高的并行效率。
RDNA 4的每组SIMD32单元中包含32个可同时处理整数、浮点运算的FMA/INT ALU、32个只能处理浮点运算的FMA ALU。
在极限状态下,所有的ALU单元都进行浮点运算时,每组SIMD32矢量单元相当于有64个流处理器,也就是每个CU有128个流处理器。
但是,AMD和NVIDIA不同,没有将FMA/INT单元算作流处理器,也许是AMD对于数字并没有太在意。
为了解决流处理器数量倍增所带来的调度问题,AMD扩展了标量单元(Scalar Unit)的指令集,能支持新的Float32 操作。
同时还引入了动态寄存器分配技术,使得显卡在处理复杂图形任务时能够更灵活地调度资源,基本上不会出现RDNA 3上的4个Wave竞争一个标量ALU的情况。
在内存效率方面,AMD做了2点:翻倍的L2缓存容量,无序内存处理技术!
以上是RDNA 3、RDNA 4两代架构图,可以看到RX 7900 XT配备了6MB二级缓存,RX 7800 XT则是4MB二级缓存。
RNDA 4将更多的晶体管用了二级缓存上面,RX 9070 XT和RX 9070都拥有8MB二级缓存,两倍于上代产品。更大的二级缓存有助于提升命中率,能让GPU减少直接访问显存的几率,。
同时AMD还推出了无序内存处理技术。
在RDNA 3中,来自不同着色器的内存请求是按顺序处理的,这可能导致延迟并影响性能。
RDNA 4允许这些请求无序执行,也就是说有需求的请求无需等待、直接处理,相当程度上优化了数据访问效率。
RX 9070 XT还拥有64MB Infinity Cache,虽然容量没有变化,但在运行频率、带宽以及访问延迟方面都有提升。
以上这些技术足以让256Bit 20Gbps显存的RX 9070 XT,在4K游戏性能上匹敌384Bit 20Gbps显存的RX 7900 XTX和256Bit 28Gbps显存的RTX 5070 Ti。
光追加速器则升级为第三代,包括一个光线加速器、一个光线转换引擎、两个光线交叉引擎、一个遍历堆栈管理单元等等,显然和NVIDIA走的完全不同的思路。
AMD宣称,通过增加一个光线交叉引擎,以及支持更先进的光追技术,RDNA 4每个CU单元的光追吞吐量都翻了一倍。
至于实际光追效果如何,后面的测试见分晓。
AMD Radeon RX 9070 & 9070 XT规格参数如下:
RX 9070 XT一共有64组RDNA 4构架的CU单元,总共4096个流处理器,当然如果像NV那样把FMA/INT单元也算成流处理器的话,那就是8192个流处理器了。
另外,制程工艺也从台积电5+6nm升级到了4nm,仅仅357mm2的面积就集成了539亿个晶体管,晶体管密度提升36%。
这里再说一下,NVIDIA新一代RTX 50系列的晶体管密度对比RTX 40没有任何提升。
- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...