NVIDIA RTX 4070 SUPER发布:高性能AI与游戏创作的革命性进步
GeForce RTX 40 SUPER GPU是AI PC的核心,可以为游戏提供超强算力,是目前在PC上体验AI的最佳方式。 GeForce RTX 4070 SUPER的AI Tensor Core可提供高达568个AI TOPS,以及高达36个SHADER TFLOPS和82个RT TFLOP,在游戏、创作和日常生活中取得革命性进步。
这次我们还收到了七彩虹的iGame GeForce RTX 4070 SUPER Ultra W OC 12GB显卡,并组装了iGame Ultra全家桶进行评测。一般来说,我们先看一下外观。
外貌:
iGame GeForce RTX 4070 SUPER Ultra W OC 12GB 显卡采用全新波普(POP)视觉艺术风格。它起源于20世纪50年代的英国,这种风格至今仍很流行。色彩的大胆运用和随意的线条勾勒,营造出强烈的物质主义和乐观主义的独特艺术风格。
正面采用大渐变设计,可以随着光线的变化呈现出不同的色彩效果。以ULTRA为背景,采用iGame标志和圆形圆点元素作为图案底纹,让显卡更具视觉表现力。
顶部采用多个尖角形成的喜剧效果。光线透过几个整齐排列的不同大小的圆点元素照射进来,呈现出独特的波普灯光效果。彩虹电镀面板具有非凡的视觉外观。
流行金属背板采用开孔设计,方便风道流通。粉色Ultra字体与侧灯板相呼应,展现出年轻群体独特的一面。
在iGame中心,所有设备都可以控制。在左侧项目栏中选择硬件控制,选择机箱、显卡、主板和内存模块。您可以控制灯光、编辑自定义灯光效果、灯光颜色和超频控制。
测试环境:
我们构建了 iGame Ultra Family Bucket 作为测试环境。让我们一一简单地看一下它们。
iGame C23A Ultra W支持ATX/Micro-ATX/Mini-ITX主板和ATX电源。前置iGame“深渊镜”特效灯板,标准ARGB接口,支持二代神光同步。背面接线仓预设1~5个,ARGB、PWM可轻松存储,轻松控制整机灯光。 “超图腾”理线罩直接遮盖杂乱电线,并预留扎线带。即使机箱背面采用透明玻璃材质,依然可以保持干净整洁。您可以在外壳内看到多个 iGame 和 Ultra 印刷压花。
iGame Z790D5 Ultra主板采用18+1+1相供电设计,搭配超旗舰90A规格DrMOS、8层2盎司铜高电性能PCB板。一体式“超图腾”流行式合金散热铠甲覆盖电源DrMOS,CNC精密切割复合凹槽,内置6mm真空热管均衡散热,增强散热效率,保证长久使用系统稳定运行。
四个合金强化DDR5插槽,厚镀金防电击,支持XMP一键超频。
4个无冲突的M.2固态接口,布局合理,安全可靠,在丰富扩展的前提下保证稳定性。
iGame DDR5 16GB 6800 Ultra W内存模组,内存频率可达到6800MT/s的高效规格,时序低至CL34。无论是电竞游戏还是渲染设计,都能高效处理海量信息,帮助PC实现更强的性能。顶部搭配相得益彰的漫画RGB灯效,可实现多色共光谱,为用户打造沉浸式灯光效果。
iGame P850G Ultra W电源模块采用Intel ATX3.0规格打造。单个16pin口瞬时峰值输出可达3倍,解决了显卡供电被烧断的问题。 PCIe5.0 12VHPWR原生接口大电流合金铜段,线材直接连接电源和显卡,无需外接显卡适配器,安装边界方便。定制的纯白色压花模组线比传统模组线更容易弯曲,走线更方便。同时标配理线梳和魔术贴,使安装更加美观。
iGame LQ360 Ultra W水冷头采用9极高速电机方案,可提供3000R的澎湃动力。同时配备改进的仿生叶轮,保证水的高效循环,快速带走热量。冷头内部采用高密度铲齿微通道,有效提高热交换效率。底座外侧经过精心打磨,使处理器表面更加特别。高密度低水阻散热器在不增加水阻的情况下仍能获得高质量的换热面积。同时具有标准细排的优点,风扇可以低速吹过,兼容性有保证。双层水管由高分子聚合物编织而成。其硬度和柔软度适中,韧性较高。可自由弯曲,适应各种安装方向。它还具有高耐用性,有效防止水管老化和液体蒸发。
机箱内还安装了四个iGame F12025 Ultra W风扇。作为iGame系列首款磨砂机箱风扇,它秉承性能至上的原则,采用真正的FOB轴承,即使在高转速下也能有效抑制风扇噪音。 。平衡扇叶兼顾风量和风压指标,适应各种使用场景。风扇框背面预装减震垫,可有效消除紧配合时与金属的共振,降低噪音。
表现:
从参数来看,iGame GeForce RTX 4070 SUPER Ultra W OC 12GB,7168个流处理器,224个光栅单元,80个纹理单元,位宽192bit,带宽504GB/s,基础频率1980MHz,加速频率2475MHz,TDP220W。与RTX4070 12GB相比,拥有5888个流处理器、64个光栅单元、184个纹理单元,TDP功耗为200W。 RTX 4070 SUPER增加1280个CUDA核心,功耗增加20W,整体规格提升21.7%。
iGame GeForce RTX 4070 SUPER Ultra W OC 12GB 采用 NVIDIA Ada Lovelace 架构,涵盖以下创新技术:
(1) 新型流媒体单元处理器 (SM) 可提供高达 2 倍的性能和功效。
(2)第四代Tensor Core可以实现并加速变革性的AI技术,我们熟悉的DLSS 3的帧生成技术就受益于它。
(3)第三代光线追踪核心(RT Core)拥有高达2倍的光线追踪性能,提供令人难以置信的细节,带玩家进入前所未有的虚拟世界。
(4) 着色器执行重新排序 (SER) 将光线追踪操作提高了 2 倍。
(5)创新的Ada内存子系统显着增加了L2缓存,提供更好的性能、减少内存总线流量和更高的能效。
(6)DLSS 3.5,AI驱动图形的革命性突破,可大幅提升性能,通过神经渲染提高光线追踪质量,带来极其逼真的画面。
(7)全新第八代NVENC双硬件编码器,可对AV1格式进行编解码,有效提升生产力,对于创意用户、游戏主播等群体来说如虎添翼。
我们使用 3DMark 进行了多项常规测试,并将其与 RTX 3070 进行了比较。
在与RTX 3070的对比中,不难发现iGame GeForce RTX 4070 SUPER Ultra W OC 12GB在每次测试中都被碾压。从整体数据来看,平均提升40%。光是数据上就存在如此大的差距。如果我们在游戏中进行实测,开启DLSS 3等黑科技,我们可能会落后3070好几英里。
散热方面,iGame GeForce RTX 4070 SUPER Ultra W OC 12GB 采用三个环形 90mm 风扇,升级加固的叶片连接成环,坚不可摧。双滚珠轴承,平稳顺畅,坚固耐用,使用寿命长。散热模块采用更大面积的散热鳍片,加速导热效率。四根6mm热管提高散热效率。回流焊工艺使热管与鳍片紧密接触,优化散热效率,达到优异的散热效果。
我们用Furmark烘烤机器大约十五分钟。显卡平均温度61度,功率维持在220W。功能强大且节能。
NVIDIA DLSS技术的本质是利用深度学习算法将单帧的低分辨率升级为高分辨率,大幅提升游戏帧率。 DLSS 3增加了基于超分辨率和DLAA的帧生成技术:它利用AI技术生成更多帧,进一步提高性能。当我们在游戏中开启DLSS 3时,游戏渲染分辨率降低,计算压力变小。 AI会根据当前图像和之前渲染的图像,智能计算并构建高分辨率图像。图片。
目前,超过 500 款游戏和应用程序支持 DLSS 和 AI 驱动技术。 RTX游戏玩家每周花费8700万小时玩光追游戏,其中97%是在玩《赛博朋克2077》。我们也期待未来有越来越多的游戏支持这项技术。
我们选择了一些游戏在1440p 2K分辨率下进行测试,即使在最高画质下,很多游戏也超过了100帧。开启DLSS3后,与RTX 3070相比,iGame GeForce RTX 4070 SUPER Ultra W OC 12GB增加了一倍,有些游戏甚至更多。
目前DLSS已经升级到3.5,主要针对光线追踪游戏,增加了光线重建技术。该AI模型可以进一步改善密集型光线追踪游戏和应用程序的光线追踪图像。光线重建用在 NVIDIA 超级计算机上训练的 AI 网络取代了之前手动设计的图形降噪器。光重建可以从训练数据中识别照明模式,例如来自全局照明或环境光遮挡的照明模式,最终结果比需要手动设计的降噪器更好。
《赛博朋克2077》是一款支持DLSS 3.5的游戏。我们打开和关闭灯光重建进行比较。这是一个池塘,只映出一个霓虹灯广告牌。 DLSS3.5未开启时,水面非常模糊,广告上的文字几乎看不清。开启后非常清晰,游戏体验感十足。
《艾伦杀手2》也支持DLSS 3.5。在阳光照射到地面建筑物上的反射中,我们可以用肉眼清晰地看到光重建开关的差异。未开启时,地面上的阴影只是黑色,但开启后,可以清晰地区分建筑物的轮廓和边缘。
NVIDIA Reflex 技术常用于 FPS 游戏。该技术主要实现GPU和CPU的同步,通过删除CPU和GPU之间的渲染队列来优化响应速度并降低系统延迟。它包含两项技术:一是Reflex低延迟模式,用于缩短游戏中的系统延迟,帮助玩家提高竞技成绩;二是Reflex低延迟模式,用于缩短游戏中的系统延迟,帮助玩家提高竞技成绩。另一个是Reflex分析仪,用于轻松快速地测量系统延迟。
我们可以在FPS游戏中将NVIDIA Reflex设置为On+Enhance。我们还挑选了《APEX》、《无畏契约》等几款热门FPS游戏进行测试。
1%低帧是将帧数从大到小排序,取最后1%范围内的平均值。可以发现,这款显卡上的1%低帧比较接近平均帧,说明跳帧范围很小。 PC性能延迟也在20ms左右,可以更好地展现竞技游戏中的水平。
除了游戏之外,在STUDIO创作上,SUPER系列也得到了重大改进。 NVIDIA STUDIO 可以加速 110 多种应用程序。 iGame GeForce RTX 4070 SUPER Ultra W OC 12GB 可以缩短 3D 渲染中的渲染时间。 DLSS功能的加入还可以增加画面帧数;导出视频片段的时间也将大大缩短;此外还增加了新的医学生成人工智能软件,例如超分辨率图像。
使用 Blender 开放数据基准测试进行测试,该基准测试会自动渲染官方支持的 Blender 基准场景并显示其渲染时间。他有三个测试,怪物、垃圾店和教室,得分分别为每分钟 3159、1520 和 1590 个样本。
OctaneRender是一款公平、准确的GPU渲染引擎,可以使用NVIDIA的CUDA和RTX系列GPU为创作者提供快速、高质量的渲染输出。 OctaneRender 可用于所有创意 3D 软件。该基准测试将测量 4 个独立场景的渲染性能,每个场景使用 OctaneRender、信息通道、直接照明和路径跟踪中的 3 个不同渲染选项。
GeForce RTX 40 系列 GPU 使用 NVIDIA NVENC 为 AV1 视频编解码器提供硬件加速编码。 AV1和H.265/H.264可以在相同的比特率下提供更好的视觉质量。在同等画质下使用AV1时,比特率会更低,文件大小会更小,视频上传速度会更快。除了添加 AV1 编码支持之外,40 系列 GPU 还针对 H.265 (HEVC) 编码进行了 NVENC 生成改进。
在 DaVinci 版本 18.6 上,您可以选择 AV1 作为编解码器。我们尝试使用 iGame GeForce RTX 4070 SUPER Ultra W OC 12GB 渲染并导出 8k30 帧和 4k30 帧、44 秒长的视频,以比较 AV1 和 H.265 两种编解码器的速度。在 4k30fps 下,AV1 比 H.265 快 7 秒,在 8k30fps 下快 10 秒。
在 YouTube 上观看直播还有两种编解码器:AV1 和 H.364。体验 4k 60fps 和 10 Mbps 的视觉质量。不难看出,在AV1下观看直播时,视频会非常高清,而H.264则会比较模糊。
ON1 Resize A是一款无损图像放大软件,配备了最先进的神经网络和领先的AI人工智能技术以及全新的超分辨率技术。原来6M的照片放大后变成了30M。下图是我们将两张图片放大3倍。直观的图像没有任何失真,颜色过渡自然。无法看出这是放大的图片。 。
D5渲染器是一款基于实时光线追踪技术的3D渲染软件,支持多种模型、材质和光源。它还融合了最新的 NVIDIA DLSS 3.5 技术,例如 DLSS 光线重建,以及现有的 DLSS 技术,例如 DLSS 超分辨率和 DLSS 帧生成。
我们渲染了一段视频,并通过打开或关闭 DLSS 来观察帧速率的变化。开启DLSS后,平均帧率翻了三倍,1%低帧与平均帧的差距也缩小了。
接下来我们看看打开或关闭灯光来重建画面会发生什么变化。在第一张椅子腿照片中,您可以看到灯已关闭,并且肉眼可见噪音。第二张图是窗外风景从桌子上的倒影。在不开启光重建的情况下,噪点依然非常明显,画面模糊。另一方面,两幅图像开启光重建后,噪点大大减少,图像变得更加清晰。
RTX VSR是一项用于提高视频播放质量的AI技术。在NVIDIA控制面板中,我们可以打开RTX视频增强,有1、2、3、4四个档位可以调节。 1 是最低的,4 是最高的。
我们还打开 YouTube 观看了视频。开启RTX VSR后,画面的变化相当明显,清晰度有了质的变化。
稳定扩散是一种潜在扩散模型,能够从文本描述生成详细图像。它还可以用于图像修复、图像绘画、文本到图像和图像到图像等任务。首先我们在标准Automatic1111中测试Tensor RT SDXL,生成尺寸为1024×1024的图像。耗时2分钟,按每分钟5张图片计算。
测试在标准Automatic1111中进行,TensorRT图像大小为512x512,使用Stable Diffusion SDv1.5,耗时23秒,每分钟计算26张图像。
对比标准Automatic1111,1024×1024 SDXL耗时4分6秒,每分钟2.43张图片,而512×512 SDv1.5,耗时43.8秒,每分钟13.69张图片。
SD v1.5 仅使用更高的批量大小(512×512 大小)测试 TensorRT 性能,但将批量大小从 1 更改为 2,耗时 1 分 20 秒,每分钟 12 张图像。
仅使用SD v1.5来测试TensorRT在标准Automatic1111中的性能。图像尺寸为 768x768。其他与上面相同。耗时4分13秒,每分钟4.74张图像。
iGame GeForce RTX 4070 SUPER Ultra W OC 12GB 在 SD 测试中,我们比较了使用和关闭 TensorRT 加速时的情况。无论是1024×1024还是512×512尺寸的照片,每分钟生成的照片都增加了一倍。 NVIDIA为RTX 4070 SUPER带来了全新的生成式AI,推动了AI应用走向PC的浪潮,也将iGame GeForce RTX 4070 SUPER Ultra W OC 12GB显卡的受众拓展到了更广阔的领域,建模师、编辑等职业都在非常合适。
总结:
总的来说,用一句话来形容iGame GeForce RTX 4070 SUPER Ultra W OC 12GB就是在体积增大的情况下并没有提高价格,带来高性能和更低的能耗,但价格却和RTX 4070一样。而且在AI的帮助下,RTX 4070 Ti SUPER显得非常平衡。 2K分辨率玩高性能游戏就足够了。其性能已经超越3090,开启DLSS后是3090的1.5倍,关键功耗仅为3090的一半。作为创作和生产力工具,它可以缩短渲染和导出时间,使其成为高性价比的首选。
我们的整套测试平台均采用七彩虹iGame Ultra系列。如果有喜欢海景房、注重牌桌设置的玩家可以考虑购买这套全套装备。
目前,iGame GeForce RTX 4070 SUPER Ultra W OC 12GB在七彩虹官网商城以及京东、天猫、拼多多、抖音等电商平台以及全国授权零售分销渠道同步发售。除了本次评测机型之外,七彩虹还准备了iGame Vulcan、Neptune、Advanced、Tomahawk、COLOFIRE MEOW等多个不同系列的GeForce RTX 4070 SUPER显卡供玩家选择,售价4899元起。