Abo
  • IT-Karriere:

Project Denver: Nvidias K1 mit 64 Bit optimiert ARM-Programme selbst

Noch immer ist er nicht verfügbar - aber immerhin hat Nvidia nun erklärt, wie sein erster 64-Bit-Chip besonders schnell rechnen soll. In einem eigenen Speicherbereich soll er häufig benötigten Code in native Instruktionen des ARM-Cores umwandeln und neu sortieren.

Artikel veröffentlicht am ,
Der Tegra K1 mit Denver-64-Bit-Dualcore
Der Tegra K1 mit Denver-64-Bit-Dualcore (Bild: Nvidia)

Nicht nur mittels Hardware, sondern auch per Software will Nvidia seine 64-Bit-Version des ARM-SoCs Tegra K1 mit dem Codenamen Denver beschleunigen. Dies geht aus einem Blogeintrag des Chipherstellers hervor, der sich auf einen nichtöffentlichen Vortrag auf der Konferenz Hotchips bezieht.

Stellenmarkt
  1. SEW-EURODRIVE GmbH & Co KG, Bruchsal
  2. Technische Universität Darmstadt Hochschulrechenzentrum, Darmstadt

Mit Denver steht Nvidia wie andere Unternehmen vor dem Problem, dass bisherige Software von den 64-Bit-Fähigkeiten nicht automatisch profitiert. Wie in einer ausführlichen Analyse von Golem.de bereits beschrieben, müssen Programme vom Betriebssystem bis zur App an die neuen Architekturen angepasst werden, um durch 64 Bit nicht nur mehr Speicher, sondern auch mehr Tempo zu erreichen.

  • Nvidia schlägt in eigenen Benchmarks manchmal sogar einen kleinen Haswell. (Bild: Nvidia)
  • Die Optimierung ist Software, der Cache rechts liegt im Hauptspeicher. (Bild: Nvidia)
Die Optimierung ist Software, der Cache rechts liegt im Hauptspeicher. (Bild: Nvidia)

Daher soll es bei Systemen mit dem K1-Denver einen 128 MByte großen Bereich des Hauptspeichers geben, in dem das SoC optimierte Versionen des bereits einmal ausgeführten Codes speichert. Die Programme darin werden für eine erneute Verwendung laut Nvidia in die Micro-Ops der beiden ARM-Kerne übersetzt. Zudem werden die Befehle neu sortiert und nicht benötigte entfernt. Wird der so optimierte Code erneut gebraucht, so wird er zunächst wieder in den 128 KByte großen L1-Cache für Instruktionen geladen. Nvidia gibt in seinem Blogpost offen zu, dass das etwas mehr Overhead erzeugt als ein direktes Laden des originales Codes aus dem Hauptspeicher. Nvidia nennt die Methode Dynamic Code Optimization.

Das Verfahren klingt sehr nach dem, was moderne Prozessoren mit Out-of-Order-Technik ohnehin schon tun - nur wird das in der Regel allein in den Caches und Buffern der CPU selbst abgewickelt, und nicht über eine Art zusätzlichen Cache, der im viel langsameren Hauptspeicher liegt. Nvidia verspricht sich dennoch eine bis zu doppelte Leistung gegenüber reinen ARMv8-Kernen ohne diese Optimierungen.

Dies will Nvidia mit eigenen Benchmarks belegen, bei denen der erste 64-Bit-ARM für Smartphones, Apples A7 aus dem iPhone 5s, durchweg geschlagen wird. Die Leistung des Denver-K1 ist den Messungen zufolge sogar so groß, dass in einigen Tests ein Celeron 2955U von Intel mit Haswell-Architektur das Nachsehen hat. Allerdings ist diese CPU mit 1,4 GHz, nur 2 MByte großem Cache und ohne Turbo der langsamste aktuelle mobile Celeron. Immerhin darf er noch 15 Watt elektrischer Leistung aufnehmen, was beim Denver-K1 für lüfterlose Geräte kaum möglich ist - zum tatsächlichen Energiebedarf hat sich Nvidia aber noch nicht geäußert.

  • Nvidia schlägt in eigenen Benchmarks manchmal sogar einen kleinen Haswell. (Bild: Nvidia)
  • Die Optimierung ist Software, der Cache rechts liegt im Hauptspeicher. (Bild: Nvidia)
Nvidia schlägt in eigenen Benchmarks manchmal sogar einen kleinen Haswell. (Bild: Nvidia)

Die dynamische Optimierung soll für die Software völlig transparent sein, offenbar hat Nvidia also dafür Funktionen im K1 vorgesehen, die nicht eigens angesteuert werden müssen. Dazu könnte vor allem die Reservierung von 128 MByte im RAM gehören, bei entsprechenden Geräten dürfte dann die vom Betriebssystem gemeldete Menge an Hauptspeicher statt etwa 4 GByte nur rund 3,9 GByte betragen.

Noch im Jahr 2014 will Nvidia erste Geräte mit dem 64-Bit-K1 präsentieren, die 32-Bit-Version konnte Golem.de im Shield-Tablet bereits testen. Anders als bisher vorgesehen ist der Denver-K1 nun zuerst ebenfalls in Mobilgeräten zu erwarten, nicht wie Nvidia früher plante, in Servern.



Anzeige
Spiele-Angebote
  1. 59,99€ für PC/69,99€ für PS4, Xbox (Release am 4. Oktober)
  2. 14,95€
  3. (-78%) 1,11€
  4. 2,99€

bummelbär 12. Aug 2014

Mit 64 Bit bin ich persönlich vermutlich sogar sehr langsam, oder habe einen...


Folgen Sie uns
       


Openbook erklärt (englisch)

Openbook ist ein neues soziales Netzwerk, das sich durch Crowdfunding finanziert hat. Golem.de hat sich mit dem Gründer Joel Hernández über das Projekt unterhalten.

Openbook erklärt (englisch) Video aufrufen
IT-Headhunter: ReactJS- und PHP-Experten verzweifelt gesucht
IT-Headhunter
ReactJS- und PHP-Experten verzweifelt gesucht

Marco Nadol vermittelt für Hays selbstständige Informatiker, Programmierer und Ingenieure in Unternehmen. Aus langjähriger Erfahrung als IT-Headhunter weiß er mittlerweile sehr gut, was ihre Chancen auf dem Markt erhöht und was sie verschlechtert.
Von Maja Hoock

  1. Jobporträt Wenn die Software für den Anwalt kurzen Prozess macht
  2. Struktrurwandel IT soll jetzt die Kohle nach Cottbus bringen
  3. IT-Jobporträt Spieleprogrammierer "Ich habe mehr Code gelöscht als geschrieben"

Homeoffice: Wenn der Arbeitsplatz so anonym ist wie das Internet selbst
Homeoffice
Wenn der Arbeitsplatz so anonym ist wie das Internet selbst

Homeoffice verspricht Freiheit und Flexibilität für die Mitarbeiter und Effizienzsteigerung fürs Unternehmen - und die IT-Branche ist dafür bestens geeignet. Doch der reine Online-Kontakt bringt auch Probleme mit sich.
Ein Erfahrungsbericht von Marvin Engel

  1. Bundesagentur für Arbeit Informatikjobs bleiben 132 Tage unbesetzt
  2. IT-Berufe Bin ich Freiberufler oder Gewerbetreibender?
  3. Milla Bund sagt Pläne für KI-gesteuerte Weiterbildungsplattform ab

Sicherheitslücken: Zombieload in Intel-Prozessoren
Sicherheitslücken
Zombieload in Intel-Prozessoren

Forscher haben weitere Seitenkanalangriffe auf Intel-Prozessoren entdeckt, die sie Microarchitectural Data Sampling alias Zombieload nennen. Der Hersteller wusste davon und reagiert mit CPU-Revisionen. Apple rät dazu, Hyperthreading abzuschalten - was 40 Prozent Performance kosten kann.
Ein Bericht von Marc Sauter und Sebastian Grüner

  1. Open-Source Technology Summit Intel will moderne Firmware und Rust-VMM für Server
  2. Ice Lake plus Xe-GPGPU Intel erläutert 10-nm- und 7-nm-Zukunft
  3. GPU-Architektur Intels Xe beschleunigt Raytracing in Hardware

    •  /