Abo
  • IT-Karriere:

Tegra Parker: Nvidia spricht über den doppelten Spiderman

Weg von Tablets und Konsolen: Der Tegra (Peter) Parker sei voll für autonome Autos ausgelegt. Daher setzt Nvidia auf die eigene Pascal-GPU-Architektur und erneut auf ungewöhnliche CPU-Kerne.

Artikel veröffentlicht am ,
Zwei Tegra Parker auf dem Drive PX2
Zwei Tegra Parker auf dem Drive PX2 (Bild: Engadget)

Nvidia hat auf der Hot Chips weitere Einzelheiten zum Parker-Chip bekanntgegeben, der vor einigen Monaten im Januar 2016 erstmals angekündigt wurde. Der Codename ist abgeleitet von Peter Parker (Spiderman). Der Vorgänger - Tegra X1 - heißt intern Erista, wie der Sohn von Logan. Den dürften die meisten als Wolverine kennen, was der Codename des Tegra K1 ist.

  • Parker besteht u. a. aus Denver-v2-Kernen und 256 Pascal-ALUs. (Bild: Nvidia)
  • Der CPU-Komplex nutzt 2x Denver v2 und 4x Cortex A57. (Bild: Nvidia)
  • Das Speicherinterface ist doppelt so breit wie beim TX1. (Bild: Nvidia)
  • Parker unterstützt eine Hardwarevirtualisierung. (Bild: Nvidia)
  • Ebenfalls an Board: eine Kohärenz für den CPU-Komplex (Bild: Nvidia)
  • Details zur Hardwarevirtualisierung (Bild: Nvidia)
  • Blockdiagramm des Drive PX2 (Bild: Nvidia)
  • Drive PX2 nutzt 2x Parker und 2x Pascal. (Bild: Nvidia)
Der CPU-Komplex nutzt 2x Denver v2 und 4x Cortex A57. (Bild: Nvidia)
Stellenmarkt
  1. über experteer GmbH, Freiburg (Home-Office)
  2. Landesbetrieb Mobilität Rheinland-Pfalz, Koblenz

Beim Tegra Parker legte Nvidia Wert auf eine hohe Singlethread-Leistung und viele Kerne. Daher besteht der Chip aus zwei Denver v2 und vier Cortex A57, also insgesamt sechs Kernen. Die beiden Denver v2 basieren auf einem In-Order-Design mit relativ engem Frontend, können aber per dynamischer Befehlsübersetzung aus ARM- einen eigenen, nativen Nvidia-Code generieren. Einmal decodiert, landen die Daten in einem µOp-Cache im lokalen RAM, aus dem Denver den Code lädt, sollte er erneut benötigt werden.

Generell fallen die L1I- und L1D-Caches (128 KByte + 64 KByte) sowie der L2-Puffer (2.048 KByte) für zwei Kerne ziemlich groß aus. Die vier Cortex A57 sind mit 48+32 sowie 2.048 KByte 'klassisch' ausgestattet. Die beiden Cluster sind kohärent, was Nvidia durch einen proprietären Interconnect bewerkstelligt. Zumindest in SpecInt soll der CPU-Komplex von Parker mehr als doppelt so schnell rechnen wie ein Snapdragon 820 - bei wohl höherer TDP.

Schnellere iGPU und mehr Bandbreite

Mit im Chip stecken 256 Shader-Einheiten auf Basis der Pascal-Architektur. Damit diese und der CPU-Komplex genug Daten erhalten, fällt das Speichersubsystem umfangreich aus. Parker wird als Doppel im Drive PX2 eingesetzt, so nennt Nvidia seine aktuelle Automotive-Plattform. Der neue Tegra verfügt über ein 128-Bit-Interface, was mit LPDDR4-3200 arbeitet und eine Fehlerkorrektur (ECC) seitens des Speichercontrollers unterstützt.

Parker kann ein Dutzend Kameras und drei Displays mit 4K bei 60 Hz ansteuern, Videoinhalte werden in 2160p60 decodiert wie encodiert. Hinzu kommen Punkte wie eine Hardwarevirtualisierung, eine Unterstützung für Ethernet-AVB und ein doppelter CAN-Bus, was für Automotive von Relevanz ist. Wie ein Blockdiagramm zeigt, lässt Nvidia beim Drive PX2 zwei Parker und zwei Pascal-GPUs per je vier PCIe-3.0-Lanes via Switch kommunizieren.

  • Parker besteht u. a. aus Denver-v2-Kernen und 256 Pascal-ALUs. (Bild: Nvidia)
  • Der CPU-Komplex nutzt 2x Denver v2 und 4x Cortex A57. (Bild: Nvidia)
  • Das Speicherinterface ist doppelt so breit wie beim TX1. (Bild: Nvidia)
  • Parker unterstützt eine Hardwarevirtualisierung. (Bild: Nvidia)
  • Ebenfalls an Board: eine Kohärenz für den CPU-Komplex (Bild: Nvidia)
  • Details zur Hardwarevirtualisierung (Bild: Nvidia)
  • Blockdiagramm des Drive PX2 (Bild: Nvidia)
  • Drive PX2 nutzt 2x Parker und 2x Pascal. (Bild: Nvidia)
Blockdiagramm des Drive PX2 (Bild: Nvidia)

Da jeder Tegra auf 1,5 Teraflops bei halber Genauigkeit (FP16) und das komplette Drive PX2 auf 8 Teraflops kommen soll, müssen die beiden GPUs zusammen etwa 5 Teraflops liefern. Da sie überdies je ein 128 Bit breites Interface nutzen, sind zwei der bisher nicht angekündigten GP107-Chips denkbar. Die sollen im 14LPP-Verfahren bei Samsung produziert werden, wohingegen die Parker-Tegras bei der TSMC in einem 16FF-Prozess (16FFC?) hergestellt werden.

Auf die Frage, ob Parker abseits von Automotive für AR/VR eingesetzt werde, antwortete Nvidia mit einem knappen Ja. Nintendos NX war kein Thema.



Anzeige
Hardware-Angebote
  1. 49,70€
  2. 339,00€ (Bestpreis!)

Bill S. Preston 24. Aug 2016

Scheint leider zu stimmen. Allerdings gibt es eventuell das K1 nochmal zu kaufen wenn...

ms (Golem.de) 23. Aug 2016

2016, u.a. Volvo.


Folgen Sie uns
       


Xiaomi Mi 9T Pro - Fazit

Das Mi 9T Pro von Xiaomi ist eines der ersten Smartphones, das der chinesische Hersteller offiziell in Deutschland anbietet. Im Test überzeugt das Gerät durch sehr gute Hardware zu einem verhältnismäßig geringen Preis.

Xiaomi Mi 9T Pro - Fazit Video aufrufen
Programmiersprache: Java 13 bringt mehrzeilige Strings mit Textblöcken
Programmiersprache
Java 13 bringt mehrzeilige Strings mit Textblöcken

Die Sprache Java steht im Ruf, eher umständlich zu sein. Die Entwickler versuchen aber, viel daran zu ändern. Mit der nun verfügbaren Version Java 13 gibt es etwa Textblöcke, mit denen sich endlich angenehm und ohne unnötige Umstände mehrzeilige Strings definieren lassen.
Von Nicolai Parlog

  1. Java Offenes Enterprise-Java Jakarta EE 8 erschienen
  2. Microsoft SQL-Server 2019 bringt kostenlosen Java-Support
  3. Paketmanagement Java-Dependencies über unsichere HTTP-Downloads

Ryzen 7 3800X im Test: Der schluckt zu viel
Ryzen 7 3800X im Test
"Der schluckt zu viel"

Minimal mehr Takt, vor allem aber ein höheres Power-Budget für gestiegene Frequenzen unter Last: Das war unsere Vorstellung vor dem Test des Ryzen 7 3800X. Doch die Achtkern-CPU überrascht negativ, weil AMD es beim günstigeren 3700X bereits ziemlich gut meinte.
Ein Test von Marc Sauter

  1. Agesa 1003abba Microcode-Update taktet Ryzen 3000 um 50 MHz höher
  2. Agesa 1003abb Viele ältere Platinen erhalten aktuelles UEFI für Ryzen 3000
  3. Ryzen 5 3400G und Ryzen 3 3200G im Test Picasso passt

Verkehrssicherheit: Die Lehren aus dem tödlichen SUV-Unfall
Verkehrssicherheit
Die Lehren aus dem tödlichen SUV-Unfall

Soll man tonnenschwere SUV aus den Innenstädten verbannen? Oder sollten technische Systeme schärfer in die Fahrzeugsteuerung eingreifen? Nach einem Unfall mit vier Toten in Berlin mangelt es nicht an radikalen Vorschlägen.
Eine Analyse von Friedhelm Greis

  1. Torc Robotics Daimler-Tochter testet selbstfahrende Lkw
  2. Edag Citybot Wandelbares Auto mit Rucksackmodulen gegen Verkehrsprobleme
  3. Tusimple UPS testet automatisiert fahrende Lkw

    •  /