【IT之家评测室】索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡评测:DLSS 4 超级加倍,游戏性能 Ti 给力了
现如今随着 4K 显示外设的普及,无论显示器还是游戏,4K 分辨率几乎成 PC 玩家标配。而想要拥有出色的 4K 游戏体验,一张高性能显卡是必不可少的。然而现如今,全景光追技术的加入,让游戏的性能要求达到了非常恐怖的高度,显卡的图形性能在 4K 分辨率下很难驾驭这类游戏,因此 DLSS 技术就成了一条另辟蹊径的赛道。
相信大家已经通过 RTX 5090 D / 5080 显卡的各种评测中了解到全新 DLSS 4 技术对光追游戏体验的巨大提升。今天我们的主角是,它可以让我们了解 DLSS 4 对定位 4K 甜品卡的 RTX 5070 Ti 到底有多大帮助。
为了发挥显卡的全部性能,本次我们搭建了如上图所示的硬件测试平台。
一、外观设计
索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡采用淡雅的复古灰配色外壳,四角均采用斜切处理,设计风格由之前的圆润时尚风改为了硬朗工业风。显卡装甲表面并无其它装饰,显得十分简洁。
三风扇同样扇叶部分同样采用浅灰设计,视觉上一体性强。风扇轴柱做了同心圆亮银色处理,印有索泰的图标和字母 Logo。
显卡背板上则通过大量规整切割线组成的多边形图案,统一视觉基调,同样充满了工业风的感觉。右侧密密麻麻的栅条进风口融入了 ZOTAC GAMING 系列标志,边缘部分与外壳保持一致,都做了斜切倒角。除了背板采用铝合金加固处理外,显卡中框上下都做了一圈金色的金属加固设计的合金中框。
尺寸方面,索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡的三围分别是 329.7mm x 137.8mm x 67.8mm,重量大约是 2.1kg。
虽然走的是沉稳路线,但其经典的无限镜设计被放在了显卡右侧,配合前侧的镂空 RGB 字母灯,可以说是 720° 无立柱海景房机箱的完美拍档。
前侧上方配备了独立 6pin 灯光同步接口,双 BIOS 开关以及反向设计的 12V-2*6 显卡供电接口,便于拆装供电线。
散热部分除了前面提到的 3 个环刃风扇外,内部还集成了超大面积的 VC 均热板和散热格栅,7 根 6mm 加厚的高导热纯铜热管以及贯穿式散热设计,共同提升显卡散热效率。
接口部分,索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡提供了 3 个 DP2.1b 接口和 + 1 个 HDMI2.1b 接口,同时 I/O 挡板上印有一个白色的索泰图标。
二、技术解析
Blackwell 架构
之前我们在 RTX 5090 D 和 RTX 5080 显卡的评测中已经详细分析了新显卡的 Blackwell 架构和技术优势,简单来说加入了神经网络渲染的特性,让 Blackwell 的流式多处理器 (SM) 具有更高的处理吞吐量;而为了满足 DLSS 多帧生成的稳定性需求,Blackwell 也支持了 Flip Metering 来代替 CPU Pacing,让 GPU 更精准管理显示时间,尽可能达到每帧的画面生成时间保持一致,从而提升游戏的流畅性。
第五代 Tensor 核心
第五代 Tensor 核心能够加速重新排序,并新增了对 FP4 精度模型的支持,相较于第四代 Tensor 核心上所支持的 FP8 精度模型,吞吐量提升 2 倍;相比 FP16 精度模型,FP4 的显存使用不到一半,GPU 性能的提升却高达 2 倍。正是由于第五代 Tensor 核心的加入,才让 DLSS 4 技术能够顺利支持多帧生成功能。
第四代 RT 核心
在 RT Core 方面,提升了检测光线、路径与三角形相交的效能,可以对大量几何图形细节进行光线追踪。在新一代 Blackwell 架构下光线、路径与三角形相交的检测效率为上一代的 2 倍,是初代 Turing 架构(使用 RT Core)的 8 倍,并增强了压缩以减少内存占用,相比上代的显存使用率节省了 25%,光线追踪效果也得到了前所未有的细节提升。
配备 GDDR7 显存
除了技术上的提升,Blackwell 架构的 GPU 还搭载了 GDDR7 显存,其采用 PAM3 信号编码机制,与 GDDR6 和 GDDR6X 有所区别。PAM3 每两周期的数据传输为 3 位,相比 GDDR6 和 GDDR6X 更省电,带宽也进一步提升,速度高达 30Gbps。
RTX 5070 Ti 规格
具体到产品规格上,索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡基于最新一代 GB203-300 核心和 TSMC 4N 架构制程工艺打造,包含 8960 个 CUDA 核心、1406 个 Tensor 核心、133 个光追核心。
索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡的核心频率工作范围是 2295MHz-2512MHz,显存方面升级为 256-bit 显存位宽的 16GB GDDR7 规格,带宽来到了 896GB/s。TDP 为 300W,相比上代 RTX 4070 Ti 增加了 15W。
三、理论跑分
先通过烤机验证一下显卡高负载下的工作状态,单烤 20 分钟甜甜圈后,显卡的功耗稳定在 300W,GPU 核心温度 65.3℃,工作频率温度在 2617MHz 左右,相比 RTX 4070 Ti SUPER 主要区别还是在烤机功耗上相差了 15W。
在 3DMark Time Spy DX12 测试中,索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡分达到了 27949 分,对比锐龙 7 9800X3D + RTX 4070 Ti SUPER 的 23715 分,提升幅度约 17.8%。
在 3D Mark Time Spy Extreme DX12 测试中,索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡得分达到了 13665 分,对比锐龙 7 9800X3D + RTX 4070 Ti SUPER 的 11776 分,提升幅度约 16%。
在 3DMark Portal Royal 实时光追测试中,索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡的综合分为 18983 分,对比锐龙 7 9800X3D + RTX 4070 Ti SUPER 的 15697 分,提升幅度达到了 20.9%。
从理论性能测试来看,GeForce RTX 5070 Ti 显卡相比 GeForce RTX 4070 Ti SUPER 显卡的图形性能提升幅度在 16%-20%,相比 GeForce RTX 4070 Ti 显卡的提升至少有 20%。
四、游戏实测
由于 DLSS 4 技术是 RTX 50 系显卡的独占,所以游戏测试部分依旧分未支持 DLSS 4 的游戏和支持 DLSS 4 的游戏两部分。
1、《CS2》
首先是 2 款在线竞技游戏,在《CS2》中:
RTX 5070 Ti 在 4K 分辨率 + 高画质下,游戏平均帧数为 255 帧,1% Low 帧 96 帧,平均延迟 11ms;
RTX 4070 Ti SUPER 在 4K 分辨率 + 高画质下,游戏平均帧数为 217 帧,1% Low 帧 89 帧,平均延迟 13ms;
索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡相比 RTX 4070 Ti SUPER 显卡(默频)的平均帧数提升约 17.5%,1% Low 帧提升 7.8%,平均延迟降低 18.2%。
RTX 5070 Ti 在 2K 分辨率 + 高画质下,游戏平均帧数为 426 帧,1% Low 帧 158 帧,平均延迟 8ms;
RTX 4070 Ti SUPER 在 2K 分辨率 + 高画质下,游戏平均帧数为 404 帧,1% Low 帧 151 帧,平均延迟 10ms;
索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡相比 RTX 4070 Ti SUPER 显卡(默频)的平均帧数提升约 5.4%,1% Low 帧提升 4.6%,平均延迟降低 25%。
2、《永劫无间》
《永劫无间》这款游戏一直都非常积极于 DLSS 技术的适配,NVIDIA 官方还透露后续将与这款游戏合作,推出 NVIDIA ACE 技术的 AI 队友更新,经过实测:
RTX 5070 Ti 在 4K 分辨率 + 最高画质 + DLSS 质量模式下,游戏平均帧数为 134 帧,1% Low 帧 85 帧,平均延迟 32ms;
RTX 4070 Ti SUPER 在 4K 分辨率 + 最高画质 + DLSS 质量模式下,游戏平均帧数为 108 帧,1% Low 帧 51 帧,平均延迟 41ms;
索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡相比 RTX 4070 Ti SUPER 显卡(默频)的平均帧数提升约 24%,1% Low 帧提升 74.5%,平均延迟降低 22%。
RTX 5070 Ti 在 2K 分辨率 + 最高画质 + DLSS 质量模式下,游戏平均帧数为 206 帧,1% Low 帧 127 帧,平均延迟 23ms;
RTX 4070 Ti SUPER 在 2K 分辨率 + 最高画质 + DLSS 质量模式下,游戏平均帧数为 168 帧,1% Low 帧 108 帧,平均延迟 29ms;
索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡相比 RTX 4070 Ti SUPER 显卡(默频)的平均帧数提升约 22.6%,1% Low 帧提升 17.5%,平均延迟降低 21%。
3、《无限暖暖》
《无限暖暖》作为一款上市不到半年的端游,目前在游戏性能上可优化的空间还很大,这款游戏目前也支持了光线追踪和 DLSS,经过实测:
RTX 5070 Ti 在 4K 分辨率 + 极致画质 + 开启光追 + DLSS 抗锯齿下,游戏平均帧数为 96 帧,1% Low 帧 80 帧;
RTX 4070 Ti SUPER 在 4K 分辨率 + 极致画质 + 开启光追 + DLSS 抗锯齿下,游戏平均帧数为 87 帧,1% Low 帧 75 帧;
索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡相比 RTX 4070 Ti SUPER 显卡(默频)的平均帧数提升约 10.3%,1% Low 帧提升 6.6%。
RTX 5070 Ti 在 2K 分辨率 + 极致画质 + 开启光追 + DLSS 抗锯齿下,游戏平均帧数为 140 帧,1% Low 帧 108 帧;
RTX 4070 Ti SUPER 在 2K 分辨率 + 极致画质 + 开启光追 + DLSS 抗锯齿下,游戏平均帧数为 129 帧,1% Low 帧 101 帧;
索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡相比 RTX 4070 Ti SUPER 显卡(默频)的平均帧数提升约 10.8%,1% Low 帧提升 6.9%。
4、《古墓丽影:暗影》
《古墓丽影:暗影》只支持初版 DLSS,可以看作是传统光栅游戏的代表,经过实测:
RTX 5070 Ti 在 4K 分辨率 + 最高画质下,游戏平均帧数为 129 帧,1% Low 帧 105 帧;
RTX 4070 Ti SUPER 在 4K 分辨率 + 最高画质下,游戏平均帧数为 111 帧,1% Low 帧 98 帧;
索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡相比 RTX 4070 Ti SUPER 显卡(默频)的平均帧数提升约 16.3%,1% Low 帧提升 7.1%。
RTX 5070 Ti 在 2K 分辨率 + 最高画质下,游戏平均帧数为 232 帧,1% Low 帧 170 帧;
RTX 4070 Ti SUPER 在 2K 分辨率 + 最高画质下,游戏平均帧数为 204 帧,1% Low 帧 152 帧;
索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡相比 RTX 4070 Ti SUPER 显卡(默频)的平均帧数提升约 13.7%,1% Low 帧提升 11.8%。
5、《极限竞速:地平线 5》
《极限竞速:地平线 5》也是游戏测试的常客了,游戏的优化较为出色,经过实测:
RTX 5070 Ti 在 4K 分辨率 + 极端画质下,游戏平均帧数为 140 帧,1% Low 帧 111 帧;
RTX 4070 Ti SUPER 在 4K 分辨率 + 极端画质下,游戏平均帧数为 122 帧,1% Low 帧 101 帧;
索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡相比 RTX 4070 Ti SUPER 显卡(默频)的平均帧数提升约 14.7%,1% Low 帧提升 9.9%。
RTX 5070 Ti 在 2K 分辨率 + 极端画质下,游戏平均帧数为 188 帧,1% Low 帧 131 帧;
RTX 4070 Ti SUPER 在 2K 分辨率 + 极端画质下,游戏平均帧数为 153 帧,1% Low 帧 130 帧;
索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡相比 RTX 4070 Ti SUPER 显卡(默频)的平均帧数提升约 22.8%,1% Low 帧提升 0.7%。
6、《鸣潮》
开放世界冒险游戏《鸣潮》最近也支持了 DLSS 帧生成功能,原本锁 60 帧的游戏只需在设置菜单中开启 NVIDIA DLSS、插帧和超级分辨率的选项,即可解锁 4K 分辨率 + 高帧游戏体验。
我们分别测试了关闭与开启光追下的帧数表现:
在 4K 分辨率 + 最高画质 + DLSS 3 质量档下,游戏平均帧数为 207 帧,1% Low 帧 82 帧;
在 4K 分辨率 + 最高画质 + DLSS 3 质量档 + 高档光追下,游戏平均帧数为 171 帧,1% Low 帧 70 帧;
可以看到,无论是否开启光追,《鸣潮》在 4K 分辨率 + 最高画质下都能达到平均 160 帧以上的帧数表现,平均延迟也被控制在 15ms 左右,游戏体验非常舒适。虽然开启光追后游戏平均帧数下降了 36 帧,但 1% Low 帧反而控制得更好。
7、《黑神话:悟空》
在“众生平等”代表之作《黑神话:悟空》中,开启全景光追后的显卡压力非常大。经过实测:
RTX 5070 Ti 在 4K 分辨率 + 影视级画质 + 50% 超采样分辨率 + 高全景光追 + 帧生成下,游戏平均帧数为 76 帧,1% Low 帧 49 帧;
RTX 4070 Ti SUPER 在 4K 分辨率 + 影视级画质 + 50% 超采样分辨率 + 高全景光追 + 帧生成下,游戏平均帧数为 66 帧,1% Low 帧 42 帧;
索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡相比 RTX 4070 Ti SUPER 显卡(默频)的平均帧数提升约 15.1%,1% Low 帧提升 16.6%。
RTX 5070 Ti 在 2K 分辨率 + 影视级画质 + 50% 超采样分辨率 + 高全景光追 + 帧生成下,游戏平均帧数为 114 帧,1% Low 帧 55 帧;
RTX 4070 Ti SUPER 在 2K 分辨率 + 影视级画质 + 50% 超采样分辨率 + 高全景光追 + 帧生成下,游戏平均帧数为 102 帧,1% Low 帧 59 帧;
索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡相较 RTX 4070 Ti SUPER 显卡(默频)的平均帧数提升约 11.7%,1% Low 帧下降了 0.7%。
在以上测试的游戏中,索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡相比 RTX 4070 Ti SUPER 显卡的游戏性能基本都有 10%-20% 的提升,相比 RTX 4070 Ti 显卡的优势更加明显,基本都能达到 16% 以上的提升。
五、DLSS 4 游戏体验
RTX 50 系显卡新增的 DLSS 4 技术在 DLSS 3 的技术上,新增了全新的多帧生成技术,结合第五代 Tensor 核心的强大性能,利用 AI 为每个渲染帧生成至多 3 个额外帧,从而大幅提升游戏的 FPS 水平。
DLSS 4 配合全套 DLSS 技术,包括光线重建、超分辨率以及 DLAA 等功能,最多可实现传统图像渲染的 8 倍帧率。
多帧生成技术还可配合 NVIDIA Reflex 低延迟技术保持较低的游戏延迟,让游戏的操作和响应影响很小。Blackwell 显示引擎也在 DLSS 4 技术发挥了重要作用,通过提升其像素处理能力,让游戏在更高分辨率和刷新率下满足 DLSS 4 技术的要求,最高可提升 1 倍的像素处理能力。
DLSS 4 技术还带来了模型架构的重大升级,DLSS 光线重建、DLSS 超分辨率和 DLAA 特性均由首个实时 Transformer 模型驱动,并用来提升生成像素的质量,它支持通过自注意力操作评估整个帧几多个帧中每个像素的重要程度,更好理解场景关系,让生成的像素具有更好稳定性、更少的伪影、更丰富的运动细节和平滑边缘。
官方表示,目前已有超过 75 款支持 DLSS 帧生成技术的游戏和应用可在 GeForce RTX 50 系列 GPU 上升级至 DLSS 多帧生成技术,不少主流 3A 大作也已于 50 系显卡正式发售后更新了 DLSS 4 多帧生成功能的支持,包括《心灵杀手 2》、《夺宝奇兵:古老之圈》、《黑神话:悟空》、《星球大战:亡命之徒》《寂静岭 2:重制版》等热门作品。
《赛博朋克:2077》作为首批支持 DLSS 4 技术最完善的游戏之一,如果在 4K 分辨率下开启光追,但不开启 DLSS 和帧生成选项,那么:
在 4K 分辨率超级光追画质下,游戏平均帧数为 30 帧;
在 4K 分辨率超速光追画质下,游戏平均帧数为 15 帧;
这样的表现基本就告别游戏体验了,可见这款游戏在 4K 分辨率 + 光线追踪设置下,对于显卡物理图形性能的压力非常大。
即使选择 4K 分辨率 + 超级画质,不开光追和 DLSS,游戏平均帧数也才 59 帧,属于勉强及格的水平。
不过,当我们开启 DLSS Multi Frame Generation(DLSS 多帧生成)选项后,游戏帧数的表现瞬间就不一样了。我们依次在 4K 分辨率 + 超速光追画质 + DLSS 性能设置下,选择 2x、3x 和 4x 多帧生成,运行游戏基准测试,分别得到了 89 帧、127 帧和 159 帧的游戏平均帧数,相比不开 DLSS 时的 15 帧,提升幅度分别达到了 5.9 倍,8.4 倍和 10.6 倍,真的相当恐怖,顶着 4K 分辨率 + 最高画质,几乎可以跑满 4K / 160Hz 显示器规格的《赛博朋克:2077》,便是 DLSS 4 技术的实力。
接着,我们再来看下另一款支持 DLSS 4 的游戏《心灵杀手 2》表现如何。游戏在 4K 分辨率 + 原生最高画质下,平均帧数也只有 39 帧,相比《赛博朋克:2077》的压力可谓是更胜一筹。另外,大家注意此时的游戏平均延迟是 66ms。
而在开启了 Ultra 等级的光追和路径光追下,除了帧数表现非常不给力外,高达 123ms 和 203ms 的游戏平均延迟,游戏体验注定好不了。
而在游戏中开启 DLSS 4 的多帧生成选项后,4K 分辨率 + 路径光追下,2x、3x 和 4x 多帧生成时的游戏平均帧数分别提升到了 73 帧、104 帧和 133 帧,相比不开启 DLSS 时的游戏平均帧数提升幅度分别为 5.2 倍,7.4 倍和 9.5 倍,1% Low 帧也都过了 60 帧的及格线,足见 DLSS 4 的强悍实力。
与此同时,虽然在开启 DLSS 4 后,游戏延迟没有恢复到原生最高画质的 66ms 左右,依旧要高出至少 14ms,但每级多帧生成倍数下游戏平均延迟只增加了 4ms。
六、创意生产
生产力方面,IT之家实测了 UL Procyon 的图像视频剪辑、以及 AI 文本撰写等性能。
在 UL Procyon 的视频剪辑性能测试项目中,GPU 加速,得益于 Blackwell 架构升级的第九代 NVENC 编码器和 NVDEC 解码器,其在 H.264/ H.265 4:2:2 编码的 8 位和 10 位视频上有着非常大的优势,经过实测:
索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡得分 57017 分;
GeForce RTX 4070 Ti SUPER 显卡得分 55763 分;
索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡视频编辑性能相较 RTX 4070 Ti SUPER 提升约 2.3%。
在 UL Procyon AI 推理性能测试项目中的 Microsoft Windows ML 版本测试中:
索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡得分 1342 分;
GeForce RTX 4070 Ti SUPER 显卡得分 1230 分;
索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡的 Microsoft Windows ML 版本 AI 推理性能提升相较 RTX 4070 Ti SUPER 约 9.1%。
在侧重建模和渲染性能的 blender Benchmark 4.3.0 版本基准测试中:
索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡的 3 个场景分别拿到了 3611 分、1959 分、1911 分;
GeForce RTX 4070 Ti SUPER 显卡的 3 个场景分别拿到了 3503 分,1712 分、1800 分;
在 Blender 基准测试的 3 场景渲染中,索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡的渲染性能相较 RTX 4070 Ti SUPER 提升分别约为 3%、14.4%、6.1%。
七、总结
很显然,在各个项目的图形性能上索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡相较于 RTX 4070 Ti SUPER 显卡的提升幅度约 10%-30%,这个提升还是比较可观的。RTX 5070 Ti 作为新一代的 4K 甜品卡,依旧是 PC 玩家的最佳选择。
同时,DLSS 4 技术的成功也奠定了未来显卡性能的升级方向,即只渲染关键帧,过渡帧可通过 AI 补帧来填充,以最佳的性能表现呈现给玩家。
另一方面,全新设计的显卡外观风格大改,虽然没有上一代圆润独特的造型,但金色系的涂装 + 硬朗线条 + 工业风装饰让它显得更加沉稳大气。无限镜设计的侧面灯光效果也更契合当下流行的无立柱海景房,应该说索泰 GEFORCE RTX 5070 Ti 16GB AMP EXTREME INFINITY 显卡在设计上还是很有想法的,对上电波的朋友应该会很喜欢。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。