Primate Labs hat die erste Version eines Benchmarks namens Geekbench AI veröffentlicht. Obwohl der Name neu ist, basiert die Software auf Geekbench ML, das schon seit einiger Zeit verfügbar ist und für die neuere KI-Version verwendet wurde. Die Entwickler sind sich bewusst, dass der Begriff ML (Machine Learning) etwas in den Hintergrund geraten ist, während der marketingfreundlichere Begriff KI (Künstliche Intelligenz) zunehmend an Bedeutung gewinnt. Geekbench folgt mit der Änderung des Namens jetzt diesem Trend.
KI-Algorithmen können auf verschiedenen Plattformen sehr unterschiedlich arbeiten. Da Geekbench AI plattformübergreifend ist, werden Benutzer stark unterschiedliche Ergebnisse in den Tests sehen. Aus diesem Grund wird die Rangliste des KI-Benchmarks in drei Gruppen unterteilt: CPUs, GPUs und NPUs (Neural Processing Units). Letztere stehen im Fokus aller Prozessorhersteller, da sie auf moderne Systeme ausgelegt sind und hohe Inferenzgeschwindigkeiten bei geringem Stromverbrauch gewährleisten sollen. Eine schnelle NPU ist auch eine Voraussetzung für Microsofts Copilot+PC-Zertifizierungen. Der Geekbench AI Benchmark überprüft keine Zertifizierungen, sondern verwendet eigene Algorithmen, um die Geschwindigkeit neuer Prozessoren zu überprüfen und wie gewohnt eine Punktzahl anzuzeigen. Diese Punktzahl kann zwischen den Geräten in jeder Gruppe verglichen werden, obwohl nichts jemanden daran hindert, ein Telefon mit einer 450-Watt-Grafikkarte zu vergleichen.
Primate Labs erklärt, dass KI-Benchmarks weitaus komplexer sind als GPU-Tests, wie in einem Beispiel veranschaulicht wird. Es geht nicht nur darum, die reine Rechenleistung zu messen. Im Laufe der Zeit haben Grafikhersteller neue Frameworks und API-Unterstützung hinzugefügt, die ebenfalls in die Benchmarking-Prozesse einfließen müssen. Der Geekbench-GPU-Test konzentriert sich auf verschiedene Subtests, die jedoch kaum mit Gaming-Benchmarks vergleichbar sind, welche durch die Verfügbarkeit von Upscaling und Frame-Generierung noch stärker segmentiert wurden. Das Teilen einer einzigen Leistungskennzahl am Ende des Tests wird niemals die ganze Geschichte erzählen. Der Entwickler sagt, dass dieses Problem bei KI-Benchmarks noch komplexer ist. Am Ende werden die Geekbench-KI-Ergebnisse in drei Unterwertungen aufgeteilt: volle Präzision, halbe Präzision und quantisierte Werte. Diese Entscheidung zielt darauf ab, bessere Einblicke zu geben, wie Entwickler oder Hardwarehersteller Benchmarks interpretieren, und bietet mehr Dimensionen, ähnlich wie CPU-Tests, die sich auf Single- und Multi-Thread-Werte konzentrieren. Es scheint sehr wahrscheinlich, dass sich das KI-Benchmarking weiterentwickeln wird, wenn die Algorithmen komplexer werden.
Abbildung: Ergebnis RTX 4090, Bildquelle: videocardz
In der Zwischenzeit können Benutzer die schnellste KI-Hardware überprüfen, indem sie das offizielle Ranking durchsuchen. Das offizielle Ranking kann etwas langsam sein, wenn es darum geht, neue Geräte hinzuzufügen. Deshalb kann man auch den Browser mit durchsuchbaren Funktionen nutzen, der mehr Details und neuere Tests bietet. Der Geekbench-KI-Benchmark ist als kostenlose Testversion verfügbar.
Weitere interessante Artikel:
Acer Next@-Event: zeigen sich die neuen Intel Core Ultra 200 Notebooks?
Intel: Chiphersteller und Mainboard-Partner stellen Microcode-Update 0x129 bereit