Original-URL des Artikels: https://www.golem.de/news/programmierschnittstelle-nvidias-cuda-6-5-fuer-mehr-tempo-und-arm64-1408-108745.html    Veröffentlicht: 21.08.2014 17:02    Kurz-URL: https://glm.io/108745

Programmierschnittstelle

Nvidias Cuda 6.5 für mehr Tempo und ARM64

Nur vier Monate nach Cuda 6.0 hat Nvidia Version 6.5 veröffentlicht. Die Schnittstelle läuft nun auch in Entwicklungsumgebungen für 64-bittige ARM-SoCs wie dem Tegra K1 Denver und soll auf allen Plattformen mehr Leistung bei doppelter Genauigkeit bringen.

In seinem Entwicklerblog hat Nvidia Cuda 6.5 angekündigt. Die neue Version der Programmierschnittstelle ist nicht nur für GPUs und x86-Prozessoren vorgesehen, sie unterstützt nun auch ARM-SoCs mit 64-Bit-Fähigkeiten. Ein Beispiel ist der Tegra K1 Denver mit zwei Kernen, der nicht mit dem K1 des Shield Tablet verwechselt werden sollte. Dieser Quad-Core arbeitet noch mit den Cortex-A15-Kernen, die nur 32 Bit beherrschen. Sie lassen sich schon seit Cuda 5 mit der Nvidia-Schnittstelle programmieren.

Vor allem eine neue Funktion soll für mehr Leistung bei Berechnungen mit doppelter Genauigkeit sorgen, Nvidia nennt sie "device callback". Damit können beispielsweise bei einer FFT-Berechnung Daten vor oder nach der eigentlichen Transformation ohne neue Speicherzugriffe verändert werden. Das erlaubt die Behandlung mehrerer Schritte ohne zeitraubendes neues Laden und Speichern. Insbesondere bei GPUs ist der nicht aufrüstbare Speicher oft der Flaschenhals bei Rechenanwendungen.

Weiterhin gibt es nun mehr Unterstützung für Fortran-Umgebungen in Form eines Debuggers und eines Profilers. Ebenso kann Microsofts Visual Studio 13 als Host-Compiler für den eigentlichen Cuda-Compiler verwendet werden. Durch Änderungen an diesem Compiler sollen manche Funktionen bis zu 15 Prozent schneller werden, ohne dass der Quelltext angepasst werden muss.

Die Cuda-Komponenten können auf den Entwicklerseiten von Nvidia heruntergeladen werden, weitere Informationen gibt es in den Release Notes sowie der Online-Dokumentation, in der auch viele Codebeispiele zu finden sind.  (nie)


Verwandte Artikel:
Inno3D P104-100: Hybrid aus GTX 1070 und GTX 1080 berechnet Kryptowährungen   
(14.12.2017, https://glm.io/131666 )
Nvidia Iray VCA: Acht Kepler-GPU-Karten in einem Gehäuse   
(28.03.2014, https://glm.io/105425 )
Mali-G52/V52: ARM bringt neue GPU/VPU für AI-Smartphones   
(06.03.2018, https://glm.io/133174 )
Nvidia Drive PX Pegasus: 500-Watt-Board für autonome Taxis   
(11.10.2017, https://glm.io/130556 )
Firepro S9150 und S9050: 16 GByte ECC-Speicher und 5 Teraflops für AMDs Beschleuniger   
(07.08.2014, https://glm.io/108409 )

© 1997–2020 Golem.de, https://www.golem.de/