Nvidia RTX4090显卡发布–16384内核,24 GB GDDR6X,比RTX 3090快4倍_GeForce_时钟_游戏

NVIDIA GeForce RTX 4090是新一代BFGPU,提供了惊天动地的性能,推向了一个新的高度。GeForce RTX 4090不仅是一款GPU,也是一款旗舰绿色团队产品,性能比其前身高出四倍。 NVIDIA的GeForce

NVIDIA GeForce RTX 4090是新一代BFGPU,提供了惊天动地的性能,推向了一个新的高度。GeForce RTX 4090不仅是一款GPU,也是一款旗舰绿色团队产品,性能比其前身高出四倍。

NVIDIA的GeForce RTX 4090已经等了很久,现在它终于上市了。这款显卡专为希望获得最佳视觉保真度的发烧友和游戏玩家而设计。为了实现这一点,考虑到下一代AAA游戏的要求,你需要一个强大的GPU。请记住这一点,NVIDIA并没有将其下一代芯片的速度提高到上一代芯片的百分之几或百分之五十。相反,它在使用DLSS时将速度提高了4倍,将本地分辨率提高了2倍,以确保他们的显卡不仅可以用于即将到来的游戏,还可以用于增强的功能,如光线追踪等。

AD102 GPU是NVIDIA GeForce RTX 4090显卡的核心。GPU尺寸为608.4mm2,将采用TSMC 4N工艺节点,是TSMC为绿队设计的5nm(N5)节点优化版。GPU有763亿个疯狂的晶体管。

AD103 GPU预计将配备多达7个GPC(图形处理集群)。这与Ampere GA102 GPU和GA103 GPU上的额外GPC计数相同。每个GPU将由6个TPC和2个SM组成,配置与现有芯片相同。每个SM(流多处理器)将包含四个子核心,这与GA102 GPU相同。改变的是FP32和INT32的核心配置。每个子核心将包括128个FP32单元,但是组合的FP32+INT32单元将达到192个。这是因为FP32单元和IN32单元不共享同一个子核。28fp32内核与64 INT32内核分离。

因此,总的来说,每个子内核将由32个FP32加上16个INT32单元组成,总共48个单元。每个SM总共有128个FP32单元,加上64个INT32单元,总共有192个单元。由于总共有84个SM单元(每个GPC 12个),我们预计总共有12,288个FP32单元和6,144个INT32单元,总共有18,432个内核。每个SM还将包括两个包装计划(32线程/CLK ),每个SM 64个包装。相比GA102 GPU,核心(FP32+INT32)提升50%,包/线程提升33%。

转到缓存,这是NVIDIA在现有Ampere GPU基础上大幅提升的另一个细分市场。阿达·洛芙莱斯GPU每条SM可容纳192 KB L1缓存,比ampere多50%。顶级AD102 GPU上共有4.5 MB L1缓存。正如泄漏中提到的,L2缓存将增加到96 MB。这是Ampere GPU的16倍,后者只携带6 MB L2缓存。缓存将在GPU之间共享。

最后,我们的ROP也提高到了每GPC 32,你会在下一代旗舰上看到最多384个ROP,而在最快的GPU RTX 3090 Ti上只有112个ROP。还有最新的第四代张量和第三代RT(光线跟踪)核心将被注入阿达·洛芙莱斯GPU,这将有助于将DLSS和光线跟踪性能提高到一个新的水平。总体而言,阿达·洛芙莱斯AD102 GPU将提供:

2x GPC

增加50%的铁芯

一级缓存增加50%

16倍的L2高速缓存

双倍ROP

第四代张紧器和第三代RT核心

NVIDIA GeForce RTX 4090将使用144个SMs中的128个,共有16,384个CUDA核心。GPU将配备96 MB L2缓存和总共384个ROP,这很疯狂,但考虑到RTX 4090是一个紧凑的设计,它可能会有略低的L2和ROP计数。时钟速度尚未确定,但考虑到正在使用TSMC 4N工艺。时钟速度最高可达2.6 GHz,英伟达宣称其超频速度超过3 GHz。

至于这些巨型GPU的性能,英伟达分享了计算和游戏性能的数据。看起来GeForce RTX 4090将是第一款达到100 TFLOP计算能力极限的游戏卡。

为了便于比较:

NVIDIA GeForce RTX 4090:90 TFLOP(FP32)(假设2.8 GHz时钟)

NVIDIA GeForce RTX 3090 ti:40t flop(FP32)(1.86 GHz升压时钟)

NVIDIA GeForce RTX 3090:36 TFLOP(FP32)(1.69 GHz加速时钟)

基于2.8 GHz的理论时钟速度,计算性能可达103 TFLOP。传言推荐更高的升压时钟。现在,这些听起来确实像峰值时钟,类似于AMD的峰值频率,高于平均“游戏”时钟。100+TFLOP的计算性能意味着马力是3090 Ti旗舰的两倍以上。但要记住,计算性能不一定代表游戏的整体性能,尽管如此,它将是游戏PC的巨大升级,比目前最快的Xbox X系列游戏机多8.5倍。

虽然我们早些时候看到了RTX 4090 Ti泄露的散热案例,但英伟达可能还是会先发布非Ti版本,RTX 4080 Ti版本会晚些上市。但这并不是NVIDIA第一次在下一代产品的早期发布高端SKU。RTX 2080 Ti旗舰产品与其他产品线一起推出,尽管其前身GTX 1080 Ti是在最初的产品线推出几个月后推出的。RTX 3090最初推出RTX 30系列卡,但3090 Ti晚了一年多。这一次,英伟达可以从头开始推出整个系列的产品,后期进行中期更新,不过这个还有待观察。

本文来自投稿,不代表长河网立场,转载请注明出处: http://www.changhe99.com/a/XRw1P0AGrJ.html

(0)

相关推荐