Zum Hauptinhalt Zur Navigation

Programmierschnittstelle: Nvidias Cuda 6.5 für mehr Tempo und ARM64

Nur vier Monate nach Cuda 6.0 hat Nvidia Version 6.5 veröffentlicht. Die Schnittstelle läuft nun auch in Entwicklungsumgebungen für 64-bittige ARM -SoCs wie dem Tegra K1 Denver und soll auf allen Plattformen mehr Leistung bei doppelter Genauigkeit bringen.
/ Nico Ernst
1 Kommentare News folgen (öffnet im neuen Fenster)
Der Tegra K1 Denver mit zwei 64-Bit-Kernen (Bild: Nvidia)
Der Tegra K1 Denver mit zwei 64-Bit-Kernen Bild: Nvidia

In seinem Entwicklerblog hat Nvidia(öffnet im neuen Fenster) Cuda 6.5 angekündigt. Die neue Version der Programmierschnittstelle ist nicht nur für GPUs und x86-Prozessoren vorgesehen, sie unterstützt nun auch ARM-SoCs mit 64-Bit-Fähigkeiten. Ein Beispiel ist der Tegra K1 Denver mit zwei Kernen, der nicht mit dem K1 des Shield Tablet verwechselt werden sollte. Dieser Quad-Core arbeitet noch mit den Cortex-A15-Kernen, die nur 32 Bit beherrschen. Sie lassen sich schon seit Cuda 5 mit der Nvidia-Schnittstelle programmieren.

Vor allem eine neue Funktion soll für mehr Leistung bei Berechnungen mit doppelter Genauigkeit sorgen, Nvidia nennt sie "device callback" . Damit können beispielsweise bei einer FFT(öffnet im neuen Fenster) -Berechnung Daten vor oder nach der eigentlichen Transformation ohne neue Speicherzugriffe verändert werden. Das erlaubt die Behandlung mehrerer Schritte ohne zeitraubendes neues Laden und Speichern. Insbesondere bei GPUs ist der nicht aufrüstbare Speicher oft der Flaschenhals bei Rechenanwendungen.

Weiterhin gibt es nun mehr Unterstützung für Fortran-Umgebungen in Form eines Debuggers und eines Profilers. Ebenso kann Microsofts Visual Studio 13 als Host-Compiler für den eigentlichen Cuda-Compiler verwendet werden. Durch Änderungen an diesem Compiler sollen manche Funktionen bis zu 15 Prozent schneller werden, ohne dass der Quelltext angepasst werden muss.

Die Cuda-Komponenten können auf den Entwicklerseiten von Nvidia heruntergeladen werden, weitere Informationen gibt es in den Release Notes(öffnet im neuen Fenster) sowie der Online-Dokumentation(öffnet im neuen Fenster) , in der auch viele Codebeispiele zu finden sind.


Relevante Themen