• IT-Karriere:
  • Services:

Project Denver: Nvidias K1 mit 64 Bit optimiert ARM-Programme selbst

Noch immer ist er nicht verfügbar - aber immerhin hat Nvidia nun erklärt, wie sein erster 64-Bit-Chip besonders schnell rechnen soll. In einem eigenen Speicherbereich soll er häufig benötigten Code in native Instruktionen des ARM-Cores umwandeln und neu sortieren.

Artikel veröffentlicht am ,
Der Tegra K1 mit Denver-64-Bit-Dualcore
Der Tegra K1 mit Denver-64-Bit-Dualcore (Bild: Nvidia)

Nicht nur mittels Hardware, sondern auch per Software will Nvidia seine 64-Bit-Version des ARM-SoCs Tegra K1 mit dem Codenamen Denver beschleunigen. Dies geht aus einem Blogeintrag des Chipherstellers hervor, der sich auf einen nichtöffentlichen Vortrag auf der Konferenz Hotchips bezieht.

Stellenmarkt
  1. RIEDEL Communications GmbH & Co. KG, Wuppertal
  2. Hays AG, Köln

Mit Denver steht Nvidia wie andere Unternehmen vor dem Problem, dass bisherige Software von den 64-Bit-Fähigkeiten nicht automatisch profitiert. Wie in einer ausführlichen Analyse von Golem.de bereits beschrieben, müssen Programme vom Betriebssystem bis zur App an die neuen Architekturen angepasst werden, um durch 64 Bit nicht nur mehr Speicher, sondern auch mehr Tempo zu erreichen.

  • Nvidia schlägt in eigenen Benchmarks manchmal sogar einen kleinen Haswell. (Bild: Nvidia)
  • Die Optimierung ist Software, der Cache rechts liegt im Hauptspeicher. (Bild: Nvidia)
Die Optimierung ist Software, der Cache rechts liegt im Hauptspeicher. (Bild: Nvidia)

Daher soll es bei Systemen mit dem K1-Denver einen 128 MByte großen Bereich des Hauptspeichers geben, in dem das SoC optimierte Versionen des bereits einmal ausgeführten Codes speichert. Die Programme darin werden für eine erneute Verwendung laut Nvidia in die Micro-Ops der beiden ARM-Kerne übersetzt. Zudem werden die Befehle neu sortiert und nicht benötigte entfernt. Wird der so optimierte Code erneut gebraucht, so wird er zunächst wieder in den 128 KByte großen L1-Cache für Instruktionen geladen. Nvidia gibt in seinem Blogpost offen zu, dass das etwas mehr Overhead erzeugt als ein direktes Laden des originales Codes aus dem Hauptspeicher. Nvidia nennt die Methode Dynamic Code Optimization.

Das Verfahren klingt sehr nach dem, was moderne Prozessoren mit Out-of-Order-Technik ohnehin schon tun - nur wird das in der Regel allein in den Caches und Buffern der CPU selbst abgewickelt, und nicht über eine Art zusätzlichen Cache, der im viel langsameren Hauptspeicher liegt. Nvidia verspricht sich dennoch eine bis zu doppelte Leistung gegenüber reinen ARMv8-Kernen ohne diese Optimierungen.

Dies will Nvidia mit eigenen Benchmarks belegen, bei denen der erste 64-Bit-ARM für Smartphones, Apples A7 aus dem iPhone 5s, durchweg geschlagen wird. Die Leistung des Denver-K1 ist den Messungen zufolge sogar so groß, dass in einigen Tests ein Celeron 2955U von Intel mit Haswell-Architektur das Nachsehen hat. Allerdings ist diese CPU mit 1,4 GHz, nur 2 MByte großem Cache und ohne Turbo der langsamste aktuelle mobile Celeron. Immerhin darf er noch 15 Watt elektrischer Leistung aufnehmen, was beim Denver-K1 für lüfterlose Geräte kaum möglich ist - zum tatsächlichen Energiebedarf hat sich Nvidia aber noch nicht geäußert.

  • Nvidia schlägt in eigenen Benchmarks manchmal sogar einen kleinen Haswell. (Bild: Nvidia)
  • Die Optimierung ist Software, der Cache rechts liegt im Hauptspeicher. (Bild: Nvidia)
Nvidia schlägt in eigenen Benchmarks manchmal sogar einen kleinen Haswell. (Bild: Nvidia)

Die dynamische Optimierung soll für die Software völlig transparent sein, offenbar hat Nvidia also dafür Funktionen im K1 vorgesehen, die nicht eigens angesteuert werden müssen. Dazu könnte vor allem die Reservierung von 128 MByte im RAM gehören, bei entsprechenden Geräten dürfte dann die vom Betriebssystem gemeldete Menge an Hauptspeicher statt etwa 4 GByte nur rund 3,9 GByte betragen.

Noch im Jahr 2014 will Nvidia erste Geräte mit dem 64-Bit-K1 präsentieren, die 32-Bit-Version konnte Golem.de im Shield-Tablet bereits testen. Anders als bisher vorgesehen ist der Denver-K1 nun zuerst ebenfalls in Mobilgeräten zu erwarten, nicht wie Nvidia früher plante, in Servern.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Hardware-Angebote

bummelbär 12. Aug 2014

Mit 64 Bit bin ich persönlich vermutlich sogar sehr langsam, oder habe einen...


Folgen Sie uns
       


Mercedes EQA Probe gefahren

Wir sind mit dem EQA von Mercedes-Benz für ein paar Stunden unterwegs gewesen.

Mercedes EQA Probe gefahren Video aufrufen
Programm für IT-Jobeinstieg: Hoffen auf den Klebeeffekt
Programm für IT-Jobeinstieg
Hoffen auf den Klebeeffekt

Aktuell ist der Jobeinstieg für junge Ingenieure und Informatiker schwer. Um ihnen zu helfen, hat das Land Baden-Württemberg eine interessante Idee: Es macht sich selbst zur Zeitarbeitsfirma.
Ein Bericht von Peter Ilg

  1. Arbeitszeit Das Sechs-Stunden-Experiment bei Sipgate
  2. Neuorientierung im IT-Job Endlich mal machen!
  3. IT-Unternehmen Die richtige Software für ein Projekt finden

Weclapp-CTO Ertan Özdil: Wir dürfen nicht in Schönheit und Perfektion untergehen!
Weclapp-CTO Ertan Özdil
"Wir dürfen nicht in Schönheit und Perfektion untergehen!"

Der CTO von Weclapp träumt von smarter Software, die menschliches Eingreifen in der nächsten ERP-Generation reduziert. Deutschen Perfektionismus hält Ertan Özdil aber für gefährlich.
Ein Interview von Maja Hoock


    Fiat 500 als E-Auto im Test: Kleinstwagen mit großem Potenzial
    Fiat 500 als E-Auto im Test
    Kleinstwagen mit großem Potenzial

    Fiat hat einen neuen 500er entwickelt. Der Kleine fährt elektrisch - und zwar richtig gut.
    Ein Test von Peter Ilg

    1. Vierradlenkung Elektrischer GMC Hummer SUV fährt im Krabbengang seitwärts
    2. MG Cyberster MG B Roadster mit Lasergürtel und Union Jack
    3. Elektroauto E-Auto-Prämie übersteigt in 2021 schon Vorjahressumme

      •  /