Zum Hauptinhalt Zur Navigation

AGX und Jetson Thor: Nvidias Blackwell-Systeme für Roboter und Autos sind da

Thor steigert die Rechenleistung deutlich und bringt FP4-Unterstützung. Damit sollen Roboter und Autos ohne Cloud bessere KI -Funktionen bekommen.
/ Johannes Hiltscher
2 Kommentare News folgen (öffnet im neuen Fenster)
Bei Jetson Thor sitzt das T5000-Modul auf einem verhältnismäßig einfachen Mainboard. (Bild: Nvidia)
Bei Jetson Thor sitzt das T5000-Modul auf einem verhältnismäßig einfachen Mainboard. Bild: Nvidia

Er ist vermutlich das Produkt, das Nvidia am längsten angekündigt hat: der 2-Petaflops-Chip für autonome Fahrzeuge. Mit dem System-on-Module (SoM) T5000 ist er nun als Entwickler-Kit allgemein verfügbar - auch wenn die 2 PFlops nur beim neu unterstützten 4-Bit-Gleitkommadatentyp FP4 und mit Structured Sparsity (g+) erreicht werden.

Angeboten wird das T5000 in zwei Systemen, als Jetson Thor(öffnet im neuen Fenster) für Roboter sowie als Drive AGX Thor(öffnet im neuen Fenster) für Fahrzeuge.

Sie unterscheiden sich rein äußerlich beim Gehäuse sowie dem verwendeten Mainboard. Während Jetson Thor wie ein etwas größerer Mini-PC aussieht, sind bei der AGX-Variante Buchsen für im Automobilbereich genutzte Mate-AX-Steckverbinder vorgesehen. Darüber können 16 GMSL-2-Kameras ( Gigabit Multimedia Serial Link(öffnet im neuen Fenster) Version 2, max. 6 GBit/s) sowie zwei GMSL-3-Kameras (max. 12 GBit/s) angeschlossen werden.

Ebenfalls über zwei Mate-X-Buchsen finden bis zu 6 Displays Anschluss. Bis zu 100 GBit Ethernet gibt es bei beiden Varianten, bei Jetson Thor per QSFP, bei AGX Thor per H-MTD-Stecker. Beim Drive AGX ist eine 1-TByte-NVMe-SSD installiert, beim Jetson muss der Massenspeicher extra gekauft werden. Nvidia weist darauf hin, dass das Drive AGX den für den Einsatz in Fahrzeugen relevanten ISO-Normen 26262 (funktionale Sicherheit) und 21434 (Risikomanagement Cybersicherheit) entspricht.

Deutlich leistungsfähigere GPU

Gegenüber dem Vorgänger, Orin, markiert Thor einen deutlichen Leistungssprung: Die GPU rechnet mit 1.035 TFlops bei 8-Bit-Datentypen mit Sparsity 3,75-mal so schnell wie der Vorgänger. Nvidia spricht sogar von 7,5-facher KI-Leistung, da Thor im Gegensatz zu Orin FP4 (und FP8) unterstützt.

Beim Jetson ist der Leistungssprung sogar noch größer, da Nvidia hier bei der Orin-Generation weniger Cuda-Kerne verbaute als beim AGX. Mit Int8 und Sparsity kam Jetson Orin auf maximal 157 TOPS .

Mit 128 GByte hat Nvidia die Speichergröße verdoppelt, um größere Modelle zu unterstützen. Verbaut ist mit 256 Bit angebundener LPDDR5X-Speicher mit einer Bandbreite von 273 GByte/s.

Auch bei den Prozessorkernen hat Nvidia aufgerüstet: Mit 14 Kernen gibt es zwei (AGX) oder sogar sechs (Jetson) mehr als bei den Orin-Pendants, mit Neoverse V3AE (Automobilvariante) sind sie auf dem neuesten Stand. Ihnen stehen deutlich größere Caches zur Seite: Der L2 fasst 1 MByte pro Kern, der geteilte L3 16 MByte.

Mit maximal 2,6 GHz können die Kerne zudem mindestens 20 Prozent höher takten, der GPU-Takt steigt in gleichem Maß. Das gibt es allerdings nicht umsonst: Die Thor-Systeme können bis zu 130 W elektrische Leistung aufnehmen, beim Vorgänger waren es maximal 60 W(öffnet im neuen Fenster) .

Auch beim Preis legt Nvidia zu

Während Jetson Thor direkt bestellt werden kann, müssen Interessenten sich für die AGX-Variante von Nvidia bis mindestens September auf die Warteliste setzen lassen. Der Preis für die Thor-Kits ist allerdings recht üppig: Das Jetson Thor Entwickler-Kit kostet 3.499 US-Dollar, für ein T5000-SoM allein verlangt Nvidia 2.999 US-Dollar bei Abnahme von 1.000 Stück. Für das Drive AGX Thor wird kein Preis genannt, Interessenten bekommen hier ein Angebot.

Neben dem T5000-SoM hat Nvidia auch eine kleinere Variante namens T4000(öffnet im neuen Fenster) angekündigt, bislang allerdings ohne Termin und Preis. Statt 2.560 Cuda- und 96 Tensor-Kernen gibt es hier nur 1.536 sowie 64, die Rechenleistung wird mit maximal 1.200 TFlops (Sparse FP4) angegeben.

Zudem sind nur zwölf Prozessorkerne verfügbar, der RAM ist mit 64 GByte nur halb so groß, die Leistungsaufnahme liegt bei maximal 70 W. Die restlichen Parameter sind identisch.


Relevante Themen