NVIDIA: Die Gaming-GPU GB202 "Blackwell" nutzt gleichen Knoten wie die B100 für Rechenzentren

Gestern präsentierte NVIDIA seine neueste Blackwell GPU-Architektur, die speziell für Rechenzentren und KI-Beschleunigung entwickelt wurde und den ersten Schritt in ihrer neuen Architekturstrategie darstellt. Berichten zufolge plant das Unternehmen später in diesem Jahr die Einführung einer neuen Serie von Gaming-GPUs, die auf der Blackwell-Grundlage aufbauen. Interessanterweise wird die neue B100-GPU, was die Prozessknoten betrifft, nicht weit von ihrem Vorgänger abweichen, sondern auf 4NP setzen. Das entspricht einer verbesserten Version von 4N, einem maßgeschneiderten TSMC-Knoten, der ursprünglich für die Hopper-Serie entwickelt wurde.

Kopite7kimi zufolge wird NVIDIA keine Änderungen an der Gaming-GPU-Serie vornehmen, die ebenfalls auf diesem Knoten basiert. Dieser neue Knoten soll immer noch eine 30%ige Steigerung der Transistorendichte bieten. Das bedeutet, dass sowohl Ada als auch Blackwell eine Variante des 5-nm-Knotens verwenden werden. Der Leaker fügte hinzu, dass die Gaming-GPU Blackwell GB202 eine Änderung im L1-Cache (nicht zu verwechseln mit dem L2-Cache) erfahren wird, was laut dem Leaker eine signifikante Verbesserung für AD102 und GA102 bedeuten sollte, die beide eine Größe von 128 KB haben. Eine solche Änderung könnte die Leistungsfähigkeit eines einzelnen Streaming-Multiprozessors erhöhen.

Bildquelle: videocardz

Man erwartet, dass die GPU GB202 das Flaggschiff für die RTX 50-Serie sein wird. Spekulationen deuten darauf hin, dass sie möglicherweise über 192 Streaming-Multiprozessoren (SMs) und einen potenziell robusten 512-Bit-Speicherbus verfügen wird. Angesichts der Dual-Die-Struktur der B100 ist es plausibel, dass ein ähnlicher Ansatz auch bei dem kleineren Gaming-Prozessor GB202 angewendet wird.

GB202 will use the same process node as GB100. I must clarify once again that TSMC 4N(vidia) is based on TSMC 5, not 4nm.
I'm sorry I cannot match Jensen's naming with TSMC's naming. We need professional chip analysis to determine.
At least, there is a 30% increase in density.
— kopite7kimi (@kopite7kimi) March 19, 2024

Just look at the L1 Cache of one SM, GB202 definitely has a significant improvement compared to AD102 and GA102(128 KB). It means the throughout of a single SM will increase.
— kopite7kimi (@kopite7kimi) March 19, 2024

Weitere Gerüchte besagen, dass die Spezifikationen von GB203 etwa die Hälfte von dem sein könnten, was GB202 zu bieten hat, was bedeutet, dass es etwa 96 SMs und halb so breite Speicherbusse im Vergleich zum GB202-Modell haben könnte.

Die Spezifikationen für die übrigen Blackwell-Gaming-GPUs bleiben unklar, jedoch wurde angegeben, dass alle RTX 50-Serien PCIe Gen5 und DisplayPort 2.1 unterstützen und über GDDR7-Speicher verfügen werden.

Erwartete NVIDIA GeForce RTX 50 GPUs
	SMs	Memory Bus Width	L2 Cache	TDP	SKU
BLACKWELL (TSMC 4NP)
GB202	192	512-bit	TBC	TBC	RTX 5090
GB203	96	256-bit	TBC	TBC	RTX 5080
GB205	TBC	192-bit	TBC	TBC	RTX 5070
GB206	TBC	128-bit?	TBC	TBC	RTX 5060Ti
GB207	TBC	128-bit?	TBC	TBC	RTX 5060
ADA LOVELACE (TSMC 4N)
AD102	144	384-bit	96 MB	450W	RTX 4090(D)
AD103	84	256-bit	64 MB	320W	RTX 4080(S)/4070TiS
AD104	60	192-bit	48 MB	285W	RTX 4070(S)/Ti
AD106	36	128-bit	32 MB	165W	RTX 4060Ti
AD107	24	128-bit	32 MB	115W	RTX 4060