Nvidia看起来将把性能和功耗推向新的高度
Nvidia 的 Ada 架构和推定的 GeForce RTX 40 系列显卡预计将于今年年底上市,并且可能在 9 月至 10 月的时间范围内。那是在Nvidia Ampere 架构之后的两年,考虑到摩尔"定律"的放缓(或者如果你愿意,死亡),基本上是按计划进行的。随着今年早些时候的Nvidia 黑客攻击,我们获得了关于预期结果的大量信息。我们已将所有内容收集到这个中央集线器中,详细介绍了我们对 Nvidia 的 Ada 架构和 RTX 40 系列家族的了解和期望。
现在有很多谣言在流传,英伟达几乎没有透露其对 Ada 的计划,有些人将其称为 Lovelace。我们所知道的是,Nvidia 已经详细介绍了其数据中心Hopper H100 GPU,我们怀疑,就像Volta V100和Ampere A100一样,消费产品将在不久的将来跟进。
最后一个可能是预期的最佳样本。A100 于 2020 年 5 月正式发布,消费级 Ampere GPU 以RTX 3080和RTX 3090的形式推出大约四个月后。如果 Nvidia 遵循与 Ada Lovelace GPU 类似的发布时间表,我们可以预期 RTX 40 系列将在 8 月或 9 月的某个时候到货。让我们从 Ada 系列 GPU 的传闻规格的高级概述开始。
图形处理器 | AD102 | AD103 | AD104 | AD106 | AD107 |
---|---|---|---|---|---|
工艺技术 | 台积电 4N | 台积电 4N | 台积电 4N | 台积电 4N | 台积电 4N |
晶体管数量 | 60B? | 40B? | 30B? | 20B? | 15B? |
SM / CU | 144 | 84 | 60 | 36 | 24 |
GPU 核心 | 18432 | 10752 | 7680 | 4608 | 3072 |
张量核心 | 576 | 336 | 240 | 144 | 96 |
RT 核心 | 144 | 84 | 60 | 36 | 24 |
升压时钟 (MHz) | 1600-2000 | 1600-2000 | 1600-2000 | 1600-2000 | 1600-2000 |
总二级缓存 (MB) | 96 | 64 | 48 | 32 | 32 |
显存速度 (Gbps) | 21-24 | 21-24 | 16-21 | 16-21 | 14-21 |
VRAM 总线宽度 | 384 | 256 | 192 | 128 | 128 |
ROPs | 128-196? | 112? | 96? | 64? | 48? |
TMU | 576 | 336 | 240 | 144 | 96 |
TFLOPS FP32(升压) | 59-73.7 | 34.4-43 | 24.6-30.7 | 14.7-18.4 | 9.8-12.3 |
TFLOPS FP16(张量) | 472-590 | 275-344 | 197-246 | 118-147 | 79-98 |
带宽 (GBps) | 1008-1152 | 672-768 | 384-504 | 256-336 | 224-336 |
TDP(瓦) | <600 | <450 | <300 | <225 | <150 |
估价 | $1,000+ | $600-$1,000 | 450-600 美元 | 300-450 美元 | 200-300 美元 |
首先,大量的盐需要应用于上述信息。我们已经为 GPU 提供了 1.6 到 2.0 GHz 的暂定时钟速度估计值,这与 Nvidia 之前的 Ampere、Turing 甚至 Pascal 架构一致。Nvidia 完全有可能超过这些时钟,因此我们认为这是一个保守的估计。
我们假设 Nvidia 将在所有 Ada GPU 上使用 TSMC 的 4N 工艺--"4nm Nvidia",这在技术上可能又是不正确的。我们知道 Hopper H100 使用台积电的 4N 节点,这似乎主要是对台积电 N5 节点的调整变体,该节点已广泛用于苹果的智能手机和笔记本电脑芯片,并且传闻是 Nvidia 将用于 Ada 的节点,
坦率地说,节点名称并不像实际的 GPU 规格和性能那么重要。换句话说,"任何其他名字的玫瑰都会闻起来很香"。我们早就过了工艺节点名称与芯片上的物理特性有任何实际联系的地步。在 250nm(或 0.25 微米)芯片实际上具有可以指向并以 0.25um 宽度进行测量的元素时,芯片的物理缩放在过去的几个工艺节点上已经放缓,它们现在只是营销名称。