视频介绍
RTX 4060 Ti 8G显卡的发布,让6000元主流攒机的用户终于也能用上RTX 40系显卡了。
今天带来的评测是耕升GeForce RTX 4060 Ti 追风EX3显卡的评测。
距离RTX 4060 Ti 8G发布也已经有一段时间,想必大家也清楚其性能定位,这张显卡虽然光栅化性能提升相对较小,但在光追线追踪和AI加速计算方面想必RTX 30系提升较大。
另外我们也测试了近期爆火的《暗黑破坏神4》游戏,这张显卡可以完美驾驭2K分辨率下的高帧率游戏,下面先简单来看一下外观。
1 耕升GeForce RTX 4060 Ti 追风EX3显卡概览
耕升GeForce RTX 4060 Ti 追风EX3显卡主打实用至上,也是耕升旗下的平价显卡。
与不带“EX3”后缀的追风相比,采用三风扇散热。
耕升GeForce RTX 4060 Ti 追风EX3整体尺寸为278×113×40mm,作为一张甜品卡,长度和厚度有所缩减,兼容性好的ITX机箱也可装下。
耕升GeForce RTX 4060 Ti 追风EX3采用该系列经典的红黑设计,正面导流罩采用三个82mm的9叶炫风之刃风扇。
内部为2根6mm复合式热管,搭配大面积散热鳍片,对于这张RTX 4060 Ti来说绰绰有余。
耕升GeForce RTX 4060 Ti 追风EX3采用一体成型金属背板,经典的黑白配色。
这个角度可以看到尾部大量裸露的散热鳍片,而PCB板只有整卡一半左右的长度,其余部分均为散热模组。
耕升GeForce RTX 4060 Ti 追风EX3采用单8pin供电接口,TDP 160W,建议电源450W及以上。
可以说任何玩家都可以毫无顾虑的升级。
视频输出接口上,依旧采用了HDMI 2.1 + DP 1.4a*3的四接口设计。
HDMI 2.1可支持4K 120Hz HDR、8K 60Hz HDR。
2 NVIDIA GeForce RTX 4060 Ti 8GB架构浅析
本次发布的GeForce RTX 40系显卡由全新的NVIDIA Ada Lovelace架构打造,采用TSMC 4N NVIDIA定制工艺,旗舰核心AD102达到了恐怖的760亿个晶体管,而在RTX 30系显卡中为280亿个。
与上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升,最高可达到90-TFLOPS的着色器数据吞吐量。
本次发布的RTX 4060 Ti 8GB共有4352个CUDA核心,提供了22-TFLOPS算力;34个第三代Ada RT Core拥有51 RT-TFLOPS;136个第四代Tensor Core可提供353 Tensor-TFLOPS。
另外在本次的规格说明上,NVIDIA官方也特别表明了L2 Cache容量以及最终的等效带宽,这是RTX 40在架构中变化比较大的地方,同时也是玩家对位宽减小有争议的“罪魁祸首”。
我们以两张图来简单说明L2缓存的作用。
如果把GPU内核比作网店店主,那么L1缓存就是在日常工作的屋子中堆放的可发货产品,但由于所有工作都要在这间屋子进行,堆放产品的空间有限;所以大部分产品就需要到L2缓存中,它就好比在工作室隔壁的仓库,虽然需要走出去,但仍然是很近的路程。
如果这个仓库还是放不下,那么只能到更远的显存中去调取产品。
当然如果有爆显存的情况,那么这位“店主”可能还要打车去更远的系统内存区调取数据。
这中间的路程和耗费时间就好比GPU额外的工作量,如果绝大部分数据只存放在L2缓存就可以拿到,那么将极大节省功耗。
并且由于不再需要频繁调取显存中的数据,所以显存位宽适当降低,对于运行效率也是没有影响的。
在真正的GPU中,内核是所有计算发生的地方,而这就是L1数据缓存的作用所在。
每个SM都有一个超低延迟的L1数据缓存,紧挨其处理内核,使L1成为GPU寻找信息的首选。
然而,由于L1缓存需要离内核非常近,不可能非常大。
如果在L1缓存中找不到内核计算所需的数据,GPU将在L2数据缓存中寻找。
这个显存系统位于GPU芯片上,并通过一个非常高速的横梁系统连接到所有的GPC(图形处理集群),每个GPC包括多个SM。
如果在L2缓存中找到了信息,那么GPU就挑出这些数据并将其放入内核。
如果在L2缓存中找不到信息(被称为缓存缺失),那么GPU将通过显存接口在VRAM中寻找。
这在整个GPU存储子系统中产生了很多额外的工作量,并降低了性能和功耗效率。
其实如果只对比传统的光栅性能,RTX 4060 Ti 8GB的进步并没有很大,但在AI逐渐发展的今天,需要大量逻辑推理运算,所以可以看到相比30系的Tensor算力,几乎达到1.7倍的提升。
完整的AD102核心
完整的AD106核心
RTX 4060 Ti 8GB使用的AD106核心
本次RTX 4060 Ti 8GB使用了AD106芯片,采用了3组GPC,其中1组少了1组TPC,并且NVENC单元变为2个。
这张RTX 4060 Ti 8GB的L2缓存为32MB,而上一代RTX 3060 Ti为4MB,达到了8倍的差距。
增加L2缓存的大小可以提高性能,降低延迟,并提高续航时长,数据访问在GPU上即可完成(否则GPU就要频繁从显存读取数据,过分依赖显存带宽)。
所以,这也是为什么在RTX 40系显卡中,位宽带宽普遍偏小的原因。
3 测试平台简介
首先介绍一下测试平台,为了保障耕升GeForce RTX 4060 Ti 追风EX3的性能发挥,我们的平台也进行了全面更新。
目前GPU-Z版本尚未更新,部分信息无法识别,简单参考即可。
耕升GeForce RTX 4060 Ti 追风EX3采用AD106核心,拥有4352个CUDA,Boost频率为2580MHz,与公版相同,相比RTX 3060 Ti的1665MHz,有很大提升。
采用8GB GDDR6显存,位宽为128bit,显存带宽288 GB/s(最终等效带宽554 GB/s),光栅单元和纹理单元为48和136。
4 理论性能测试
下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:
在针对显卡DX11性能的3DMARKFS套装测试中,耕升GeForce RTX 4060 Ti 追风EX3主要对比上一代RTX 3060 Ti,其中FS提升了18%;FSE提升了15%;FSU提升了2%,综合来看相比RTX 3060 Ti的性能提升约为12%。
而对比刚刚发布的RTX 4070,综合成绩相差24%左右。
而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,耕升GeForce RTX 4060 Ti 追风EX3相较RTX 3060 Ti的提升分别为:TS提升13%;TSE提升7%,综合约为10%。
PortRoyal是3DMARK中专门针对光追性能的测试项,耕升GeForce RTX 4060 Ti 追风EX3相较RTX 3060 Ti的提升约为16%。
综合来看,耕升GeForce RTX 4060 Ti 追风EX3的传统理论性能相较RTX 3060 Ti的提升约为13%。
Speed Way测试是3DMARK最新更新的用于测试DirectX12 Ultimate 性能的显卡基准测试。
要运行此测试,显卡必须支持 DirectX 12 Ultimate 并包含 6GB 及以上显存。
这项测试结合了实时光线追踪和传统渲染技术来测量显卡性能。
场景含有光线追踪反射、实时全局光照、网格着色器、体积照明、粒子和后处理效果。
简单来说,该项测试是对近年来新技术,及未来游戏的综合测试。
对比RTX 3060 Ti显卡,从1080p分辨率到4K提升依次为:12%/10%/6%。
另外我们使用3DMARK刚刚更新的DLSS 3进行了相关性能测试。
不过由于RTX 3060 Ti无法开启,这里使用DLSS2进行对比测试。
在2K分辨率下DLSS开关相比RTX 3060 Ti的提升为23%/16%;4K分辨率由于关闭情况下显卡几乎无法正常运行,仅看开启状态,提升约为51%。
5 游戏 性能测试
下面我们对这款显卡分别进行了不同类别的游戏测试,其中包含传统光栅化游戏,也有纯光追+DLSS的benchmark跑分测试。
在《极限竞速:地平线5》中,耕升GeForce RTX 4060 Ti 追风EX3相比RTX 3060 Ti的提升分别为:1080p提升12%;2K提升9%;4K提升8%,综合提升10%。
由于RTX 4060 Ti 8GB这张显卡本身定位1080p分辨率,在部分2K游戏中会爆显存,所以在越高的分辨率下其实对比RTX 3060 Ti的优势不大。
在新游《暗黑破坏神4》中,耕升GeForce RTX 4060 Ti 追风EX3表现亮眼,由于这款游戏面向的是更多主流配置玩家,在配置上相当亲民,不过本代暗黑中的画质提升却非常大,堪称优化典范。
这里我们仅使用RTX 4060 Ti做了测试,在2K分辨率下开启DLSS后能够达到180帧的完美体验。
不过目前DLSS 3的优化似乎尚有问题,在4K分辨率下并没有提升,反而降了不少。
在《刺客信条:英灵殿》中,耕升GeForce RTX 4060 Ti 追风EX3相比RTX 3060 Ti的提升分别为:1080p提升12%;2K提升9%;4K提升4%,综合提升8%。
在《无主之地3》中,耕升GeForce RTX 4060 Ti 追风EX3相比RTX 3060 Ti的提升分别为:1080p提升13%;2K提升13%;4K提升3%,综合提升10%。
《光明记忆:无限》的光追测试软件是独立于游戏的测试工具,比游戏中用到的光线追踪技术更多,测试条件为“RTX最高/DLSS质量”。
所以测试帧数相对较低,但实际游戏配置相当亲民。
性能方面,耕升GeForce RTX 4060 Ti 追风EX3相比RTX 3060 Ti的提升分别为:1080p提升25%;2K提升23%;4K提升5%,综合提升18%。
在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。
在《边境》中,耕升GeForce RTX 4060 Ti 追风EX3相比RTX 3060 Ti的提升分别为:1080p提升33%;2K提升25%;4K提升17%,综合提升25%。
在《赛博朋克2077》中,游戏新增了光追过载画质,我们分别进行了测试。
在超级画质中,耕升GeForce RTX 4060 Ti 追风EX3相比RTX 3060 Ti的提升分别为,1080p提升14%;2K提升6%;4K提升6%,综合提升9%。
在光追超级画质中,提升分别为,1080p提升19%;2K提升19%;4K提升15%,综合提升18%。
在光追过载画质中,由于对性能需求实在变态,所以仅测试1080p及2K分辨率,提升分别为,1080p提升26%;2K提升41%。
这里分别为大家展示一下三种不同画质,从上至下依次为超级画质/光追超级/光追过载。
可以看到光追过载相比光追超级更贴近于真实效果。
它模拟了真实的光线路径,其实相比之前的光线追踪模拟了更多光线在不同表面的反射,完整的计算出了场景的真实光照,避免了上一代光追中出现“死黑”的情况。
这也是NVIDIA致力于打造的下一代光追场景,但是截止目前它对硬件计算的需求太过庞大,即便是旗舰显卡,也无法在4K分辨率下流畅运行。
6 Stable Diffusion AI绘画测试
除了游戏之外,AI也是目前大火的领域,尤其以Stable Diffusion为最,现在很多AI生成的图片完全能够以假乱真,下面我们也来测试一下RTX 4060 Ti 8GB在这方面的表现。
Stable Diffusion可以说几乎没有门槛,但本地部署的繁琐程度劝退了很多用户。
上图为操作界面用户可根据自己想要生成的图片细节丰富关键词。
按照NVIDIA提供的关键词,我们生成了10批,共20张图片。
并对比了刚刚发布的RTX 4070和上一代RTX 3060 Ti显卡。
RTX 4070运算时间 2m24.79s 约合 7.2秒一张图
RTX 4060 Ti 8GB运算时间3m18.26s 约合 9.9秒一张图
RTX 3060 Ti运算时间3m40.86s 约合 11秒一张图
Stable Diffusion对于显卡的要求比较高,这就需要显卡拥有较强的CUDA算力。
另外它对于显存的要求非常高,此次RTX 4060 Ti 8GB显存使用率已达到97%,如果有条件的话尽量选择大容量显存的显卡。
我们对比了RTX 4060 Ti 8GB和RTX 3060 Ti在相同设置下的运算时间,两款显卡在生成20张图片的时间差距为22秒,差距还是比较大的。
另外我们也测试了使用CPU,在相同设置下生成图片,但如图片所示,保守估计需要3小时30分左右。
7 AV1编码测试
本次AV1编码测试选择了剪映专业版,它可以输出H.264/HEVC/AV1三种编码格式的视频。
剪映专业版目前自带AV1编码输出,在实际测试中,我们导出一段1分钟左右的视频。
可以看到两个文件容量相差103MB。
由于AV1编码特性,生成文件的比特率更低,但视频清晰度则完全相同。
所以如果生成同比特率,同容量的文件,AV1将会更清晰。
我们通过NVIDIA ICAT来进行两段视频的画面对比,图中左侧为H.264编码,右侧为AV1编码,几乎看不出任何区别。
8 RTX VSR(RTX Video Super Resolution)测试
目前RTX VSR(RTX Video Super Resolution)已经在部分浏览器中进行测试,首先玩家需要更新到NVIDIA最新驱动,在NVIDIA控制面板中的【调整视频图像设置】可以看到最新的RTX 视频增强超分辨率。
RTX VSR是 AI 图像处理的突破,它超越了传统的边缘检测和特征锐化技术,极大地提升直播视频内容的质量。
开启RTX VSR不仅需要最新版驱动,还需要使用RTX 40或30系列GPU,并且几乎适用于Google Chrome和Microsoft Edge浏览器中的所有视频内容(浏览器也需要更新到最新版本)。
开启后,目前已知的打开YouTube或者B站,都可以享受到RTX VSR效果的加成。
如果不确定,在全屏播放视频时,可以打开任务管理器,看到GPU负载增加,即为开启成功。
(点击放大查看原图)
我们打开YouTube随意观看视频,在打开RTX VSR后,可以清晰明显的看到水下珊瑚的质量明显提高,边缘更为清晰,并且极大减少了失真现象。
9 温度及功耗测试
功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。
可以看到耕升GeForce RTX 4060 Ti 追风EX3这张显卡但通过20分钟左右的拷机测试,温度控制在63℃左右,热点温度在73℃左右。
游戏动态功耗测试
耕升GeForce RTX 4060 Ti 追风EX3 3A游戏平均功耗
RTX 3060 Ti 3A游戏平均功耗
在实际的游戏功耗测试中,我们选择《赛博朋克2077》自带benchmark,画面设置为光追超级、2K分辨率,来拉满两张显卡的性能极限,检测我们实际应用场景的功耗。
可以看到两款显卡虽然均为60级别,但这款耕升GeForce RTX 4060 Ti 追风EX3平均功耗为150W,而RTX 3060 Ti则是219W,低了69W。
10 入门首选 实用至上
耕升的追风系列一直秉承着实用至上的原则,在近几代的外观中变化不大。
这张耕升GeForce RTX 4060 Ti 追风EX3在理论测试的成绩基本与公版相当,虽然与一些旗舰系列相比有一定差距。
不过在实际游戏测试中,这些也只有1-2帧的区别。
而且相对双风扇显卡,EX3在散热上更出色,无愧于主打实用系列的产品。
RTX 4060 Ti相比RTX 3060 Ti的传统性能提升13%左右,说实在这一点提升确实称不上迭代,但在RTX 40系显卡中光追和AI算力才是主要发力的地方。
如加入了光追和DLSS的测试中,《光明记忆无限》、《边境》、《赛博朋克2077》中,相比RTX 3060 Ti的提升就达到了25-35%左右。
如果你想在1080p分辨率下体验光线追踪带来的极致画面,那么这张RTX 4060 Ti则非常适合。
另外目前火热的SD画图中,两代甜品卡在单张图片的差距为1.1秒左右,看似不大,但在批量生成时,仍能节省不少时间。
功耗上也是RTX 40系显卡进步非常大的地方,这张耕升GeForce RTX 4060 Ti 追风EX3的TDP仅有140W,采用单8pin供电,推荐电源450W,任何用户都能轻松升级,无需更换电源。
目前耕升GeForce RTX 4060 Ti 追风EX3售价3299元,有兴趣的朋友不妨
(8222908)
复制本文链接攻略资讯文章为拓城游所有,未经允许不得转载。