Abo
  • IT-Karriere:

Project Denver: Nvidias K1 mit 64 Bit optimiert ARM-Programme selbst

Noch immer ist er nicht verfügbar - aber immerhin hat Nvidia nun erklärt, wie sein erster 64-Bit-Chip besonders schnell rechnen soll. In einem eigenen Speicherbereich soll er häufig benötigten Code in native Instruktionen des ARM-Cores umwandeln und neu sortieren.

Artikel veröffentlicht am ,
Der Tegra K1 mit Denver-64-Bit-Dualcore
Der Tegra K1 mit Denver-64-Bit-Dualcore (Bild: Nvidia)

Nicht nur mittels Hardware, sondern auch per Software will Nvidia seine 64-Bit-Version des ARM-SoCs Tegra K1 mit dem Codenamen Denver beschleunigen. Dies geht aus einem Blogeintrag des Chipherstellers hervor, der sich auf einen nichtöffentlichen Vortrag auf der Konferenz Hotchips bezieht.

Stellenmarkt
  1. DATAGROUP Köln GmbH, Köln
  2. DATAGROUP Köln GmbH, Frankfurt

Mit Denver steht Nvidia wie andere Unternehmen vor dem Problem, dass bisherige Software von den 64-Bit-Fähigkeiten nicht automatisch profitiert. Wie in einer ausführlichen Analyse von Golem.de bereits beschrieben, müssen Programme vom Betriebssystem bis zur App an die neuen Architekturen angepasst werden, um durch 64 Bit nicht nur mehr Speicher, sondern auch mehr Tempo zu erreichen.

  • Nvidia schlägt in eigenen Benchmarks manchmal sogar einen kleinen Haswell. (Bild: Nvidia)
  • Die Optimierung ist Software, der Cache rechts liegt im Hauptspeicher. (Bild: Nvidia)
Die Optimierung ist Software, der Cache rechts liegt im Hauptspeicher. (Bild: Nvidia)

Daher soll es bei Systemen mit dem K1-Denver einen 128 MByte großen Bereich des Hauptspeichers geben, in dem das SoC optimierte Versionen des bereits einmal ausgeführten Codes speichert. Die Programme darin werden für eine erneute Verwendung laut Nvidia in die Micro-Ops der beiden ARM-Kerne übersetzt. Zudem werden die Befehle neu sortiert und nicht benötigte entfernt. Wird der so optimierte Code erneut gebraucht, so wird er zunächst wieder in den 128 KByte großen L1-Cache für Instruktionen geladen. Nvidia gibt in seinem Blogpost offen zu, dass das etwas mehr Overhead erzeugt als ein direktes Laden des originales Codes aus dem Hauptspeicher. Nvidia nennt die Methode Dynamic Code Optimization.

Das Verfahren klingt sehr nach dem, was moderne Prozessoren mit Out-of-Order-Technik ohnehin schon tun - nur wird das in der Regel allein in den Caches und Buffern der CPU selbst abgewickelt, und nicht über eine Art zusätzlichen Cache, der im viel langsameren Hauptspeicher liegt. Nvidia verspricht sich dennoch eine bis zu doppelte Leistung gegenüber reinen ARMv8-Kernen ohne diese Optimierungen.

Dies will Nvidia mit eigenen Benchmarks belegen, bei denen der erste 64-Bit-ARM für Smartphones, Apples A7 aus dem iPhone 5s, durchweg geschlagen wird. Die Leistung des Denver-K1 ist den Messungen zufolge sogar so groß, dass in einigen Tests ein Celeron 2955U von Intel mit Haswell-Architektur das Nachsehen hat. Allerdings ist diese CPU mit 1,4 GHz, nur 2 MByte großem Cache und ohne Turbo der langsamste aktuelle mobile Celeron. Immerhin darf er noch 15 Watt elektrischer Leistung aufnehmen, was beim Denver-K1 für lüfterlose Geräte kaum möglich ist - zum tatsächlichen Energiebedarf hat sich Nvidia aber noch nicht geäußert.

  • Nvidia schlägt in eigenen Benchmarks manchmal sogar einen kleinen Haswell. (Bild: Nvidia)
  • Die Optimierung ist Software, der Cache rechts liegt im Hauptspeicher. (Bild: Nvidia)
Nvidia schlägt in eigenen Benchmarks manchmal sogar einen kleinen Haswell. (Bild: Nvidia)

Die dynamische Optimierung soll für die Software völlig transparent sein, offenbar hat Nvidia also dafür Funktionen im K1 vorgesehen, die nicht eigens angesteuert werden müssen. Dazu könnte vor allem die Reservierung von 128 MByte im RAM gehören, bei entsprechenden Geräten dürfte dann die vom Betriebssystem gemeldete Menge an Hauptspeicher statt etwa 4 GByte nur rund 3,9 GByte betragen.

Noch im Jahr 2014 will Nvidia erste Geräte mit dem 64-Bit-K1 präsentieren, die 32-Bit-Version konnte Golem.de im Shield-Tablet bereits testen. Anders als bisher vorgesehen ist der Denver-K1 nun zuerst ebenfalls in Mobilgeräten zu erwarten, nicht wie Nvidia früher plante, in Servern.



Anzeige
Hardware-Angebote
  1. 239,00€
  2. ab 369€ + Versand
  3. 349,00€
  4. 72,99€ (Release am 19. September)

bummelbär 12. Aug 2014

Mit 64 Bit bin ich persönlich vermutlich sogar sehr langsam, oder habe einen...


Folgen Sie uns
       


Wasserstoff-Mercedes GLC F-Cell im Test

Der Mercedes GLC F-Cell ist eines der wenigen Serienfahrzeuge mit Brennstoffzellenantrieb. Wir haben das Auto getestet.

Wasserstoff-Mercedes GLC F-Cell im Test Video aufrufen
FPM-Sicherheitslücke: Daten exfiltrieren mit Facebooks HHVM
FPM-Sicherheitslücke
Daten exfiltrieren mit Facebooks HHVM

Server für den sogenannten FastCGI Process Manager (FPM) können, wenn sie übers Internet erreichbar sind, unbefugten Zugriff auf Dateien eines Systems geben. Das betrifft vor allem HHVM von Facebook, bei PHP sind die Risiken geringer.
Eine Exklusivmeldung von Hanno Böck

  1. HHVM Facebooks PHP-Alternative erscheint ohne PHP

Endpoint Security: IT-Sicherheit ist ein Cocktail mit vielen Zutaten
Endpoint Security
IT-Sicherheit ist ein Cocktail mit vielen Zutaten

Tausende Geräte in hundert verschiedenen Modellen mit Dutzenden unterschiedlichen Betriebssystemen. Das ist in großen Unternehmen Alltag und stellt alle, die für die IT-Sicherheit zuständig sind, vor Herausforderungen.
Von Anna Biselli

  1. Datendiebstahl Kundendaten zahlreicher deutscher Firmen offen im Netz
  2. Metro & Dish Tisch-Reservierung auf Google übernehmen
  3. Identitätsdiebstahl SIM-Dieb kommt zehn Jahre in Haft

Transport Fever 2 angespielt: Wachstum ist doch nicht alles
Transport Fever 2 angespielt
Wachstum ist doch nicht alles

Wesentlich mehr Umfang, bessere Übersicht dank neuer Benutzerführung und eine Kampagne mit 18 Missionen: Das Schweizer Entwicklerstudio Urban Games hat Golem.de das Aufbauspiel Transport Fever 2 vorgestellt - bei einer Bahnfahrt.
Von Achim Fehrenbach

  1. Mordhau angespielt Die mit dem Schwertknauf zuschlagen
  2. Bus Simulator angespielt Zwischen Bodenschwelle und Haltestelle
  3. Bright Memory angespielt Brachialer PC-Shooter aus China

    •  /