Abo
  • IT-Karriere:

Project Denver: Nvidias K1 mit 64 Bit optimiert ARM-Programme selbst

Noch immer ist er nicht verfügbar - aber immerhin hat Nvidia nun erklärt, wie sein erster 64-Bit-Chip besonders schnell rechnen soll. In einem eigenen Speicherbereich soll er häufig benötigten Code in native Instruktionen des ARM-Cores umwandeln und neu sortieren.

Artikel veröffentlicht am ,
Der Tegra K1 mit Denver-64-Bit-Dualcore
Der Tegra K1 mit Denver-64-Bit-Dualcore (Bild: Nvidia)

Nicht nur mittels Hardware, sondern auch per Software will Nvidia seine 64-Bit-Version des ARM-SoCs Tegra K1 mit dem Codenamen Denver beschleunigen. Dies geht aus einem Blogeintrag des Chipherstellers hervor, der sich auf einen nichtöffentlichen Vortrag auf der Konferenz Hotchips bezieht.

Stellenmarkt
  1. Dataport, verschiedene Standorte
  2. Universitätsmedizin Göttingen, Göttingen

Mit Denver steht Nvidia wie andere Unternehmen vor dem Problem, dass bisherige Software von den 64-Bit-Fähigkeiten nicht automatisch profitiert. Wie in einer ausführlichen Analyse von Golem.de bereits beschrieben, müssen Programme vom Betriebssystem bis zur App an die neuen Architekturen angepasst werden, um durch 64 Bit nicht nur mehr Speicher, sondern auch mehr Tempo zu erreichen.

  • Nvidia schlägt in eigenen Benchmarks manchmal sogar einen kleinen Haswell. (Bild: Nvidia)
  • Die Optimierung ist Software, der Cache rechts liegt im Hauptspeicher. (Bild: Nvidia)
Die Optimierung ist Software, der Cache rechts liegt im Hauptspeicher. (Bild: Nvidia)

Daher soll es bei Systemen mit dem K1-Denver einen 128 MByte großen Bereich des Hauptspeichers geben, in dem das SoC optimierte Versionen des bereits einmal ausgeführten Codes speichert. Die Programme darin werden für eine erneute Verwendung laut Nvidia in die Micro-Ops der beiden ARM-Kerne übersetzt. Zudem werden die Befehle neu sortiert und nicht benötigte entfernt. Wird der so optimierte Code erneut gebraucht, so wird er zunächst wieder in den 128 KByte großen L1-Cache für Instruktionen geladen. Nvidia gibt in seinem Blogpost offen zu, dass das etwas mehr Overhead erzeugt als ein direktes Laden des originales Codes aus dem Hauptspeicher. Nvidia nennt die Methode Dynamic Code Optimization.

Das Verfahren klingt sehr nach dem, was moderne Prozessoren mit Out-of-Order-Technik ohnehin schon tun - nur wird das in der Regel allein in den Caches und Buffern der CPU selbst abgewickelt, und nicht über eine Art zusätzlichen Cache, der im viel langsameren Hauptspeicher liegt. Nvidia verspricht sich dennoch eine bis zu doppelte Leistung gegenüber reinen ARMv8-Kernen ohne diese Optimierungen.

Dies will Nvidia mit eigenen Benchmarks belegen, bei denen der erste 64-Bit-ARM für Smartphones, Apples A7 aus dem iPhone 5s, durchweg geschlagen wird. Die Leistung des Denver-K1 ist den Messungen zufolge sogar so groß, dass in einigen Tests ein Celeron 2955U von Intel mit Haswell-Architektur das Nachsehen hat. Allerdings ist diese CPU mit 1,4 GHz, nur 2 MByte großem Cache und ohne Turbo der langsamste aktuelle mobile Celeron. Immerhin darf er noch 15 Watt elektrischer Leistung aufnehmen, was beim Denver-K1 für lüfterlose Geräte kaum möglich ist - zum tatsächlichen Energiebedarf hat sich Nvidia aber noch nicht geäußert.

  • Nvidia schlägt in eigenen Benchmarks manchmal sogar einen kleinen Haswell. (Bild: Nvidia)
  • Die Optimierung ist Software, der Cache rechts liegt im Hauptspeicher. (Bild: Nvidia)
Nvidia schlägt in eigenen Benchmarks manchmal sogar einen kleinen Haswell. (Bild: Nvidia)

Die dynamische Optimierung soll für die Software völlig transparent sein, offenbar hat Nvidia also dafür Funktionen im K1 vorgesehen, die nicht eigens angesteuert werden müssen. Dazu könnte vor allem die Reservierung von 128 MByte im RAM gehören, bei entsprechenden Geräten dürfte dann die vom Betriebssystem gemeldete Menge an Hauptspeicher statt etwa 4 GByte nur rund 3,9 GByte betragen.

Noch im Jahr 2014 will Nvidia erste Geräte mit dem 64-Bit-K1 präsentieren, die 32-Bit-Version konnte Golem.de im Shield-Tablet bereits testen. Anders als bisher vorgesehen ist der Denver-K1 nun zuerst ebenfalls in Mobilgeräten zu erwarten, nicht wie Nvidia früher plante, in Servern.



Anzeige
Hardware-Angebote
  1. (u. a. beide Spiele zu Ryzen 9 3000 oder 7 3800X Series, eines davon zu Ryzen 7 3700X/5 3600X/7...
  2. 99,00€

bummelbär 12. Aug 2014

Mit 64 Bit bin ich persönlich vermutlich sogar sehr langsam, oder habe einen...


Folgen Sie uns
       


FX Tec Pro 1 - Hands on

Das Pro 1 von FX Tec ist ein Smartphone mit eingebauter Hardware-Tastatur. Der Slide-Mechanismus macht im ersten Kurztest von Golem.de einen sehr guten Eindruck.

FX Tec Pro 1 - Hands on Video aufrufen
Change-Management: Die Zeiten, sie, äh, ändern sich
Change-Management
Die Zeiten, sie, äh, ändern sich

Einen Change zu wollen, gehört heute zum guten Ton in der Unternehmensführung. Doch ein erzwungener Wandel in der Firmenkultur löst oft keine Probleme und schafft sogar neue.
Ein Erfahrungsbericht von Marvin Engel

  1. IT-Jobs Der Amtsschimmel wiehert jetzt agil
  2. MINT Werden Frauen überfördert?
  3. Recruiting Wenn das eigene Wachstum zur Herausforderung wird

Rohstoffe: Lithium aus dem heißen Untergrund
Rohstoffe
Lithium aus dem heißen Untergrund

Liefern Geothermiekraftwerke in Südwestdeutschland bald nicht nur Strom und Wärme, sondern auch einen wichtigen Rohstoff für die Akkus von Smartphones, Tablets und Elektroautos? Das Thermalwasser hat einen so hohen Gehalt an Lithium, dass sich ein Abbau lohnen könnte. Doch es gibt auch Gegner.
Ein Bericht von Werner Pluta

  1. Wasserkraft Strom aus dem Strom
  2. Energie Wie Mikroben Methan mit Windstrom produzieren
  3. Erneuerbare Energien Die Energiewende braucht Wasserstoff

SSD-Kompendium: AHCI, M.2, NVMe, PCIe, Sata, U.2 - ein Überblick
SSD-Kompendium
AHCI, M.2, NVMe, PCIe, Sata, U.2 - ein Überblick

Heutige SSDs gibt es in allerhand Formfaktoren mit diversen Anbindungen und Protokollen, selbst der verwendete Speicher ist längst nicht mehr zwingend NAND-Flash. Wir erläutern die Unterschiede und Gemeinsamkeiten der Solid State Drives.
Von Marc Sauter

  1. PM1733 Samsungs PCIe-Gen4-SSD macht die 8 GByte/s voll
  2. PS5018-E18 Phisons PCIe-Gen4-SSD-Controller liefert 7 GByte/s
  3. Ultrastar SN640 Western Digital bringt SSD mit 31 TByte im E1.L-Ruler-Format

    •  /