Gestern präsentierte NVIDIA seine neueste Blackwell GPU-Architektur, die speziell für Rechenzentren und KI-Beschleunigung entwickelt wurde und den ersten Schritt in ihrer neuen Architekturstrategie darstellt. Berichten zufolge plant das Unternehmen später in diesem Jahr die Einführung einer neuen Serie von Gaming-GPUs, die auf der Blackwell-Grundlage aufbauen. Interessanterweise wird die neue B100-GPU, was die Prozessknoten betrifft, nicht weit von ihrem Vorgänger abweichen, sondern auf 4NP setzen. Das entspricht einer verbesserten Version von 4N, einem maßgeschneiderten TSMC-Knoten, der ursprünglich für die Hopper-Serie entwickelt wurde.
Kopite7kimi zufolge wird NVIDIA keine Änderungen an der Gaming-GPU-Serie vornehmen, die ebenfalls auf diesem Knoten basiert. Dieser neue Knoten soll immer noch eine 30%ige Steigerung der Transistorendichte bieten. Das bedeutet, dass sowohl Ada als auch Blackwell eine Variante des 5-nm-Knotens verwenden werden. Der Leaker fügte hinzu, dass die Gaming-GPU Blackwell GB202 eine Änderung im L1-Cache (nicht zu verwechseln mit dem L2-Cache) erfahren wird, was laut dem Leaker eine signifikante Verbesserung für AD102 und GA102 bedeuten sollte, die beide eine Größe von 128 KB haben. Eine solche Änderung könnte die Leistungsfähigkeit eines einzelnen Streaming-Multiprozessors erhöhen.
Bildquelle: videocardz
Man erwartet, dass die GPU GB202 das Flaggschiff für die RTX 50-Serie sein wird. Spekulationen deuten darauf hin, dass sie möglicherweise über 192 Streaming-Multiprozessoren (SMs) und einen potenziell robusten 512-Bit-Speicherbus verfügen wird. Angesichts der Dual-Die-Struktur der B100 ist es plausibel, dass ein ähnlicher Ansatz auch bei dem kleineren Gaming-Prozessor GB202 angewendet wird.
GB202 will use the same process node as GB100. I must clarify once again that TSMC 4N(vidia) is based on TSMC 5, not 4nm.
— kopite7kimi (@kopite7kimi) March 19, 2024
I'm sorry I cannot match Jensen's naming with TSMC's naming. We need professional chip analysis to determine.
At least, there is a 30% increase in density.
Just look at the L1 Cache of one SM, GB202 definitely has a significant improvement compared to AD102 and GA102(128 KB). It means the throughout of a single SM will increase.
— kopite7kimi (@kopite7kimi) March 19, 2024
Weitere Gerüchte besagen, dass die Spezifikationen von GB203 etwa die Hälfte von dem sein könnten, was GB202 zu bieten hat, was bedeutet, dass es etwa 96 SMs und halb so breite Speicherbusse im Vergleich zum GB202-Modell haben könnte.
Die Spezifikationen für die übrigen Blackwell-Gaming-GPUs bleiben unklar, jedoch wurde angegeben, dass alle RTX 50-Serien PCIe Gen5 und DisplayPort 2.1 unterstützen und über GDDR7-Speicher verfügen werden.
Erwartete NVIDIA GeForce RTX 50 GPUs | |||||
---|---|---|---|---|---|
SMs | Memory Bus Width | L2 Cache | TDP | SKU | |
BLACKWELL (TSMC 4NP) | |||||
GB202 | 192 | 512-bit | TBC | TBC | RTX 5090 |
GB203 | 96 | 256-bit | TBC | TBC | RTX 5080 |
GB205 | TBC | 192-bit | TBC | TBC | RTX 5070 |
GB206 | TBC | 128-bit? | TBC | TBC | RTX 5060Ti |
GB207 | TBC | 128-bit? | TBC | TBC | RTX 5060 |
ADA LOVELACE (TSMC 4N) | |||||
AD102 | 144 | 384-bit | 96 MB | 450W | RTX 4090(D) |
AD103 | 84 | 256-bit | 64 MB | 320W | RTX 4080(S)/4070TiS |
AD104 | 60 | 192-bit | 48 MB | 285W | RTX 4070(S)/Ti |
AD106 | 36 | 128-bit | 32 MB | 165W | RTX 4060Ti |
AD107 | 24 | 128-bit | 32 MB | 115W | RTX 4060 |