正文内容 评论(0)
【DLSS 4:性能轻松提升至8倍】
NVIDIA DLSS其实就是基于RTX Tensor Core的神经网络渲染技术。
经过6年来的不断演进,DLSS目前已有超过540款游戏和应用支持,2024年前20大游戏中有15款支持,超过80%的RTX显卡玩家都会开启,游戏总时间超过30亿小时。
可以说,无论是技术创新,还是普及程度,NVIDIA DLSS都始终远远领先于AMD FSR、Intel XeSS。
全新的DLSS 4引入了2020年DLSS 2发布以来的最重磅升级:
DLRR光线重建、DLSR超分辨率、DLAA抗锯齿都在传统CNN(卷积神经网络)模型的基础上,引入了Transformer模型支持,这也是图形领域的第一个实时Transformer应用场景。
Transformer正是ChatGPT、Flux、Gemini等前沿AI大模型使用的基础架构,引入到DLSS之后参数量增加2倍,计算性能提升4倍,可以显著增强画质、提升稳定性、减少伪影,提供更多的细节表现。
此前,DLSS采用CNN架构,通过分析局部上下文、追踪连续帧画面有关区域的变化,来预测、生成新的像素和画面,其应用潜力已经基本被挖掘殆尽
DLSS Transformer模型采用Vision Transformer,可以通过自注意力操作(Self-Attention),来评估整个画面、多个帧画面中每个像素的相对重要程度。
由于采用了2倍于CNN模型的参数量,更深入地理解场景,DLSS Transformer生成的像素具有更好的稳定性、更少的伪影、更丰富的运动细节、更平滑的边缘。
最大的好消息是,DLSS Transformer并不是RTX 50系列独享的,所有的RTX GPU都能使用。
在密集型光追的处理上,比如光线重建,Transformer模型可显著提升画质,尤其是在光照条件复杂的场景中。
比如《心灵杀手 2》,DLSS 4处理的铁丝网区域更稳定,电线区域的闪烁完全消除。
再比如《地平线西之绝境》,DLSS 4下的背包纹理细节更丰富、清晰,整体清晰度也大大提高。
由于是第一次采用Transformer模型架构,DLSS 4仍有一些不足之处,比如图像伪影仍然会偶尔出现、超性能模式优化不够到位,但未来发展空间更大,会持续改进升级。
DLSS 4的另一大革新是多帧生成(MFG),AI可以生成更多的像素和帧。
DLSS 3首次加入了帧生成(FG),首先结合DLSR超分辨率、DLRR光线重建,渲染一个帧画面。
然后通过AI模型和游戏数据,比如运动矢量、深度等,再借助RTX 40 GPU的光流加速器硬件,获得一个额外的帧画面。
换言之,每生成一个帧画面,都需要大量的软硬件协同,开销非常大,效率也不够高。
DLSS 4的多帧生成(MFG)技术引入新 模型之后,全新AI模型生成帧画面的速度提升了40%,显存占用降低了30%,而且只需运行一次,就能为每个传统渲染帧额外生成多达三个帧。
再配合超分等一整套DLSS技术,可以将帧率提升至传统渲染的最多8倍!
软硬结合,DLSS 4可以生成16个像素中的15个(之前是7/8),同时保证出色的画质、流畅度和延迟。
同时,RTX 50的多帧生成模型不再需要 光流加速器硬件,而是使用效率极高的AI模型代替它来加速光流场的生成,从而显著降低额外帧生成的计算开销。
当然,GPU 仍然需要在几毫秒的时间里,为每一个渲染帧运行超分辨率、光线重建、多帧生成等5个AI模型,这时候第五代Tensor Core就发挥了其关键作用,可将AI处理性能提升最多2.5倍。
比如在《战锤40K:暗潮》中,RTX 5090 D显卡,4K分辨率,DLSS 4多帧生成可将性能从124FPS提高到137FPS,同时显存占用从9GB降至8.6GB。
流畅度方面,DLSS 3 帧生成技术使用CPU Pacing技术控制帧画面显示。
在这种情况下,节奏差异会随着附加帧数的增加而越发严重,导致每两帧之间帧节奏不一致,进而影响流畅度,直观表现就是卡顿。
Blackwell DLSS 4则改成了基于硬件的Flip Metering,使用显示引擎控制帧节奏逻辑,更精确地管理显示时间,从而平稳处理错综复杂的多帧生成过程。
Blackwell的显示引擎也做了改进,像素处理能力提高一倍,从而支持更高分辨率和刷新率,满足Flip Metering、DLSS 4的要求。
《赛博朋克2077》在不同DLSS下的性能对比:DLSS 2搭配超分辨率,可将性能提升至3倍,延迟降低大约50%;
DLSS 3.5搭配帧生成、光线重建,可再次将性能翻倍,延迟基本不变;
DLSS 4搭配多帧生成、Transformer模型,性能可达8倍之多,而延迟仍然只有一半左右。
《黑神话:悟空》现场演示DLSS 4多帧生成技术,性能轻松可达原生的8倍甚至更高!
正因为有了DLSS 4,RTX 5090或者RTX 5090 D这样的顶级显卡,就可以在4K分辨率下获得几百FPS的超高性能,完全可以匹配并发挥240Hz及以上高刷显示器的潜力。
DLSS发展至今,已经是一整套不同技术的结合,而不同的GPU显卡的支持程度也截然不同。
早期的RTX 20、RTX 30系列支持DLAA抗锯齿、SR超分辨率、RR光线重建。
RTX 40系列增加了FG帧生成,RTX 50系列则又独享MFG多帧生成。
这倒不是NVIDIA故意不让老产品支持新技术,而是新技术依赖老产品所没有的硬件单元,比如RTX 50系列的多帧生成,就离不开第五代Tensor Core。
目前已有75款游戏和应用确定在RTX 50系列显卡上市首日支持DLSS 4和多帧生成技术。
第一批首发游戏包括《心灵杀手2》《赛博朋克2077》《夺宝奇兵:古老之圈》《星球大战之绝地:幸存者》等 。
同时,后续还会有大量游戏更新支持DLSS 4技术,包括《永劫无间》《漫威争锋》《微软飞行模拟2024》《黑色国度》《毁灭战士:黑色时代》《沙丘:觉醒》《黑神话:悟空》等等。
如果游戏还没有更新支持DLSS的最新模型和功能,NVIDIA App也会随着RTX 50系列的上市而更新,提供专门的DLSS Override优化设置选项。
新选项位于图形、程序设置界面中的“驱动设置”,可以为每个支持的游戏启用不同的DLSS选项:
模型预设:游戏DLSS开启,RTX 50/40系列用户可以使用最新的帧生成模型,所有的RTX用户都可以使用基于Transformer架构的DLSS超分辨率、DLSS光线重建模型。
帧生成:游戏帧生成开启,RTX50系列用户即可启用多帧生成技术。
超分辨率:游戏超分辨率开启,所有RTX系列用户都可以使用DLAA抗锯齿,或者超级性能模式。
随着新模型在更多游戏中完成测试,有有越来越多的游戏加入DLSS优化设置支持列表。
- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...