游戏硬件实验室:DLSS NIS FSR三大超级采样PK 谁的游戏优化最佳?
随着NVIDIA在2018年9月推出第一代图灵架构RTX系列显卡,正式掀开了光追游戏时代的帷幕,同时为了迎合光追游戏对算力的需求,NVIDIA同时推出了深度学习超极采样技术,即我们现在所熟知的DLSS技术,大幅度降低了光追游戏的显卡门槛,让普通主流玩家也能有机会体验到光追游戏的魅力。
在光追游戏显卡领域,AMD要比NVIDIA整整落后了一代,在时隔2年之后的2020年10月才推出自家的第一代光追显卡RX 6000系列。虽然显卡支持光追了,但由于缺乏类似DLSS的辅助技术,单凭显卡自身的性能难以支持光追游戏的庞大算力需求,这让AMD显卡在这个光追游戏时代的市场竞争中非常被动,虽然AMD在肾上腺素驱动中加入了“超极分辨率”功能,但依然无法改变自己在技术方面的弱势地位。
而此时,NVIDIA已经推出第二代安培架构RTX系列显卡,以及已经经过两年打磨的DLSS2.0技术,更加成熟的算法能让玩家用更少的画面损失换取更多的游戏帧数提升,进一步巩固了NVIDIA在光追游戏领域的统治地位。
不甘落后的AMD在经过半年的研发之后,终于在2021年6月推出了属于自己的新一代超极采样技术——FSR。相比DLSS技术依赖RTX显卡独有的Tensor Core核心单元,FSR是一种完全开源的技术,不仅自家的AMD显卡能用,对手NVIDIA的显卡也能使用,甚至包括次世代主机、手机都可以使用,这让FSR在很短时间内就受到了多方关注。
NVIDIA可能也感受到了压力,毕竟RTX 30系列显卡发售一年以来,能买到新显卡的玩家只是少数派,绝大多数游戏玩家依然在使用GTX系列显卡,而GTX系列显卡无法使用DLSS技术,加上近期各家游戏厂商在游戏优化方面明显划水摸鱼,越来越多使用GTX系列显卡的玩家开始感觉力不从心。也是出于对广大仍在使用GTX系列显卡玩家的现状考虑,NVIDIA在最新的显卡驱动和GFE软件中加入了全新的NVIDIA Image Scaling(简称NIS)技术。
接下来就让我们一起来深入了解一下,DLSS、NIS和FSR三种超极采样技术究竟能为游戏玩家们带来多少改变。
原理科普:DLSS与空间缩放有何不同
在我们开始用游戏实测对比之前,为了让大家能大致理解几种游戏画面/性能优化技术之间的区别,这里我们简单介绍一下它们的原理。
NIS,即NVIDIA IMAGE SCALING,它本质上也是一种空间图像缩放技术,跟FSR的基本原理相同。它的基础原理并不复杂:根据输入画面中每个采样像素点的坐标,在输出分辨率的对应坐标中填入该采样的像素值,最终得到这一帧输出的画面。
以上就是空间缩放技术的基本工作流程,叫做“单点采样”。由于采样以及填充的像素值精度不高,输出的画面会出现颜色过渡生硬,物体边缘呈现很不清晰的马赛克。
为进一步提高输出画面的清晰度,单点采样又衍生出多线采样,用采样坐标点周围四个像素值进行加权平均值来填充到输出分辨率的坐标中,加权平均值通过双线性插值的方式计算,得到精确度更高的输出值。同时由于像素坐标是一个浮点坐标,通过浮点计算得来,用一个或许不那么恰当的比喻形容——多线采样也相当于一种提高浮点精度的方式。
多线采样原理示意图
目前无论是显卡驱动还是游戏中的SDK,采用跟空间缩放有关的优化技术都是基于上述原理,所不同的是后续的一些动作。
比如NIS的在进行空间缩放操作之后还加入了Sharpening Algorithm环节来锐化输出的帧画面,尽可能将因缩放而模糊的画面恢复清晰度,同时锐化的程度可以由用户手动调节,以适应不同喜好需求。FSR也有类似的算法,只是不单独开放这一项调节,有时可能锐化过渡,有时不足。
NIS控制界面,原生分辨率为4K,不同级别的优化档位供选择
与FSR不同的是,NIS并不是由游戏厂商在游戏中集成SDK来实现其功能,而是根植于驱动层面。NVIDIA在今日更新的496.70开始支持这项功能,需要通过GFE来调用。就像Shadow play界面一样,可以在游戏画面中用快捷键调出控制面板设置NIS。
由于NIS完全是基于驱动层面的后期处理,意味着无论是玩什么游戏,只要是NVIDIA GeForce 900及以后的显卡产品都支持该功能,因而适用面要比FSR大许多。
如上图所示,渲染分辨率的百分比即相当于FSR的性能、质量等不同优化档位,而锐化可让你手动调整对画质损失的补偿。不过锐化只是一种简单的算法,并不能让缩放渲染后的画面还原到跟原生画质一模一样。
DLSS还是永远的神
天上没有掉下的馅饼,如果仅仅靠降低渲染分辨率的空间缩放就能使画质和帧率兼得,那芯片巨头还要呕心沥血地研发新GPU干嘛。要想让优化后的画质无限趋近于原生,就必须做更多的工作,加入更复杂的算法,这就是NVIDIA花大力气开发DLSS的原因所在。
基础原理还是那个原理:在一定像素范围内,采样的数量越多,输出到大分辨率对应坐标的像素值就越精确。但像素值精确只是机械的理论精确,不代表画面准确,结果是物体边缘马赛克没了,却变的朦胧,如果继续扩大采样范围还会变得更模糊,乃至画面失真。所以光靠这条路是走不通的。
如何加大采样数量又能限制采样范围呢,DLSS在空间采样的基础上增加了一个时间维度——如上图所示,用1080P渲染输出到1440的屏幕上,DLSS会同时采样当前帧和之前几帧的画面,采样的帧画面范围会凭借帧生成时间和像素值的比对由AI判断,确保该帧适合被纳入采样范围,其中要用到张量计算。
假如输出一帧1440p画面要对三帧1080p做采样,代表一共输入了6M以上的像素数据计算最终得到了一个3.5M的1440p画面。而相对简陋的空间缩放技术要得到同样一张画面仅依靠2M左右一帧1080P像素数据。输出质量孰优孰劣,不言自明。
完成这些工作所需的张量计算本质上是大量半精度浮点计算,所以DLSS需要具有强大半精度浮点算力的Tensor核心支持,从而成为RTX系列显卡的专属福利。想要更好的就得付出额外的代价,这是亘古不变的规律。事实上NVIDIA两年前就已经开发出了NIS,当时由于更强大的DLSS即将问世,FSR又尚在娘胎之中,就没有将这项技术开放给用户。
测试平台简介
测试平台简介
测试平台方面我们选择了微星的MEG系列Z590 ACE战神主板,搭载一颗Intel 的11代Core处理器i9-11900K处理器,内存则为芝奇的皇家戟DDR4内存组成32GB双通道,内存频率为3600MHz;散热器为NZXT的Kraken海妖Z73 360mm一体式水冷散热器。
测试过程中使用的显卡为微星提供的超龙RTX 3090显卡。
微星MEG Z590 ACE战神主板
NZXT Kraken海妖Z73 360mm一体式水冷散热器
NIS vs FSR
虽然NIS和DLSS都属于NVIDIA的技术,但其工作原理完全不同,NIS的本质和FSR类似,都是一种空间分辨率缩放采样技术:根据输入画面中的采样像素点坐标,对周围像素值进行加权平均值计算,获得一个更精确的输出值填充到输出分辨率的坐标中。这和DLSS所采用的时间采样技术完全不同,所以我们首先来看看同为空间分辨率缩放采样技术的NIS和FSR之间有多少差异。
测试游戏我们选择了《生化危机8:村庄》,这是由CAPCOM制作发行的一款恐怖类动作冒险游戏,是经典僵尸题材游戏《生化危机》系列的正统续作,游戏支持FSR技术,能够方便我们进行NIS和FSR的对比。
从这组对比可以看出,开启FSR之后,游戏画面有明显的细节丢失,视觉上非常模糊,而开启NIS的画面则是过于“清晰”,这是由于锐化过度所造成的。
从游戏帧数表现上,无论是开启NIS还是FSR都能显著提升游戏帧数,在FSR性能和NIS-50%模式下,游戏帧数甚至可以翻倍,而NIS和FSR之间的游戏帧数表现则几乎没有差异。
DLSS vs NIS
前面我们已经讲过,NIS和FSR都属于空间分辨率缩放采样技术,而DLSS则是时间分辨率缩放采样技术,简单来讲,DLSS是以当前渲染生成的帧画面为坐标,对已生成的前几帧画面进行采样,档连续多帧数据混合后就相当于对每个像素进行了多次采样,而不需要对每一帧每一个像素进行多线采样,利用AI算法提高输出像素的精确度,进而达到提升游戏帧数的效果。同时由于采样过程属于动态,当画面快速运动时,渲染的准入分辨率采样坐标与输出填充的坐标位移差增大,导致了运动画面模糊的现象。
接下来让我们来看看DLSS和NIS这对同门之争究竟有多少差异,测试游戏为《控制》,一款由《量子破碎》工作室Remedy制作的一款第三人称视角射击冒险游戏,是最早一批支持DLSS的游戏,同时也是少见的以分辨率来划分DLSS等级的游戏,方便我们进行对比。
通过这组对比我们可以发现,开启DLSS之后,游戏画面依然能够保持足够的清晰度,2K分辨率等级的DLSS效果非常接近原生4K画面,即便是1080P分辨率等级的DLSS也能确保游戏画面呈现出足够多的细节,玩家依然能够模糊识别出纸上的字母,而开启NIS之后,游戏画面细节丢失非常明显,字母已经几乎不可识别。
DLSS和NIS采用的是完全不同的分辨率缩放采样技术,但DLSS凭借着强大的AI算法节约了大量显卡算力,在最大程度保留游戏画面细节的同时,为玩家提供了直逼NIS的游戏帧数提升效果。
DLSS vs NIS vs FSR(实测对比视频)
从前2场对比的结果可以看出,DLSS和NIS、FSR对于游戏帧数的提升效果非常接近,但在维持原生画面细节方面,NIS要强于FSR,而DLSS则要比NIS更加出色。
不过我们还是没有直接证据能够表明DLSS全面优于FSR,所以在最后,我们挑选了两款同时支持DLSS和FSR的游戏《涅克罗蒙达:赏金猎人》和《使命召唤18:先锋》,让DLSS和FSR来一次面对面的PK。
从视觉效果上来看,DLSS完胜FSR和NIS,即便是超性能模式的DLSS依然能保证游戏中字体的清晰度,而性能模式的FSR和50%的NIS则几乎让游戏中的文字变成了一片斑驳,难以正确识别。
从游戏帧数表现上来看,DLSS平衡模式基本持平FSR质量模式和NIS-67%,DLSS超性能模式则紧跟FSR性能和NIS-50%之后,彼此差距很小,而且DLSS能最大程度的保留原生游戏画面的细节,让玩家流畅游戏的同时获得最好的游戏视觉享受。
DLSS vs NIS vs FSR游戏效果帧数对比
至此,我们可以肯定的说,在这场光追游戏时代的超极采样技术大战中,DLSS技术以绝对的优势完胜对手FSR和自家小弟NIS。
结语:通过这次对比,我们可以清晰的认识到DLSS技术的优秀,毫无疑问的是目前最好的超极采样技术,借助AI算力能让玩家在最大程度保留原生游戏画面细节的同时,获得更流畅的游戏帧数体验。
这并不意味NIS和FSR毫无可取之处,DLSS技术需要RTX系列显卡独有的Tensor Core核心单元支持才能运行,很大程度上局限了DLSS技术的推广应用,而NIS和FSR作为开源技术,很好的弥补了市场空缺,让那些还没有升级RTX系列显卡的游戏玩家能够有机会流畅游戏最新的游戏大作。
但想要获得最佳游戏体验,我们还是强烈建议大家升级最新的RTX系列显卡,借助DLSS的强大表现来爽快游戏。