Programmierschnittstelle: Nvidias Cuda 6.5 für mehr Tempo und ARM64

Nur vier Monate nach Cuda 6.0 hat Nvidia Version 6.5 veröffentlicht. Die Schnittstelle läuft nun auch in Entwicklungsumgebungen für 64-bittige ARM-SoCs wie dem Tegra K1 Denver und soll auf allen Plattformen mehr Leistung bei doppelter Genauigkeit bringen.

Artikel veröffentlicht am ,
Der Tegra K1 Denver mit zwei 64-Bit-Kernen
Der Tegra K1 Denver mit zwei 64-Bit-Kernen (Bild: Nvidia)

In seinem Entwicklerblog hat Nvidia Cuda 6.5 angekündigt. Die neue Version der Programmierschnittstelle ist nicht nur für GPUs und x86-Prozessoren vorgesehen, sie unterstützt nun auch ARM-SoCs mit 64-Bit-Fähigkeiten. Ein Beispiel ist der Tegra K1 Denver mit zwei Kernen, der nicht mit dem K1 des Shield Tablet verwechselt werden sollte. Dieser Quad-Core arbeitet noch mit den Cortex-A15-Kernen, die nur 32 Bit beherrschen. Sie lassen sich schon seit Cuda 5 mit der Nvidia-Schnittstelle programmieren.

Vor allem eine neue Funktion soll für mehr Leistung bei Berechnungen mit doppelter Genauigkeit sorgen, Nvidia nennt sie "device callback". Damit können beispielsweise bei einer FFT-Berechnung Daten vor oder nach der eigentlichen Transformation ohne neue Speicherzugriffe verändert werden. Das erlaubt die Behandlung mehrerer Schritte ohne zeitraubendes neues Laden und Speichern. Insbesondere bei GPUs ist der nicht aufrüstbare Speicher oft der Flaschenhals bei Rechenanwendungen.

Weiterhin gibt es nun mehr Unterstützung für Fortran-Umgebungen in Form eines Debuggers und eines Profilers. Ebenso kann Microsofts Visual Studio 13 als Host-Compiler für den eigentlichen Cuda-Compiler verwendet werden. Durch Änderungen an diesem Compiler sollen manche Funktionen bis zu 15 Prozent schneller werden, ohne dass der Quelltext angepasst werden muss.

Die Cuda-Komponenten können auf den Entwicklerseiten von Nvidia heruntergeladen werden, weitere Informationen gibt es in den Release Notes sowie der Online-Dokumentation, in der auch viele Codebeispiele zu finden sind.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Neue Apple-Chips
Das steckt hinter M2 Ultra und dem R1 der Vision Pro

Zwei Chips, aber nur einer ist wirklich neu: Wir werfen einen Blick auf die Technik hinter Apples M2 Ultra und analysieren, was der mysteriöse R1 kann.
Eine Analyse von Johannes Hiltscher

Neue Apple-Chips: Das steckt hinter M2 Ultra und dem R1 der Vision Pro
Artikel
  1. Vorstellung Vision Pro: Apple interessiert sich nicht fürs Metaverse
    Vorstellung Vision Pro
    Apple interessiert sich nicht fürs Metaverse

    Das Vision Pro erfindet das Headset-Rad nicht neu, Apple legt aber einen deutlich anderen Fokus auf die Nutzung. Das kann funktionieren, wenn der Markt mitspielt.
    Eine Analyse von Tobias Költzsch

  2. Zume: Das Aus für den mobilen Pizzaroboter
    Zume
    Das Aus für den mobilen Pizzaroboter

    Ein Start-up wollte einen Roboter bauen, der Pizza zubereitet. Investoren waren begeistert, doch die Umsetzung hat nie geklappt. Nun gibt das Unternehmen auf.

  3. SAN: Zweites Leben für ausrangierte Firmenhardware
    SAN
    Zweites Leben für ausrangierte Firmenhardware

    Wenn die lokale Festplatte randvoll ist, können Speicherlösungen aus professioneller Umgebung die Antwort sein. Wir zeigen, wie.
    Eine Anleitung von Nico Ruch

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • PS5-Spiele & Zubehör bis -75% • Samsung 990 Pro 1TB (PS5) 94€ • AirPods 2 125€ • Crucial SSD 1TB 41,99€ • Thrustmaster T300 RS 299,99€ • Bis 50 % auf Gaming-Produkte bei NBB • PS5 inkl. Spiel 549€ • MSI RTX 4070 Ti 999€ • MindStar: AMD Ryzen 7 5800X3D 285€, RX 7900 XTX 989€ [Werbung]
    •  /