Abo
  • Services:
Anzeige
Der Tegra K1 Denver mit zwei 64-Bit-Kernen
Der Tegra K1 Denver mit zwei 64-Bit-Kernen (Bild: Nvidia)

Programmierschnittstelle: Nvidias Cuda 6.5 für mehr Tempo und ARM64

Nur vier Monate nach Cuda 6.0 hat Nvidia Version 6.5 veröffentlicht. Die Schnittstelle läuft nun auch in Entwicklungsumgebungen für 64-bittige ARM-SoCs wie dem Tegra K1 Denver und soll auf allen Plattformen mehr Leistung bei doppelter Genauigkeit bringen.

Anzeige

In seinem Entwicklerblog hat Nvidia Cuda 6.5 angekündigt. Die neue Version der Programmierschnittstelle ist nicht nur für GPUs und x86-Prozessoren vorgesehen, sie unterstützt nun auch ARM-SoCs mit 64-Bit-Fähigkeiten. Ein Beispiel ist der Tegra K1 Denver mit zwei Kernen, der nicht mit dem K1 des Shield Tablet verwechselt werden sollte. Dieser Quad-Core arbeitet noch mit den Cortex-A15-Kernen, die nur 32 Bit beherrschen. Sie lassen sich schon seit Cuda 5 mit der Nvidia-Schnittstelle programmieren.

Vor allem eine neue Funktion soll für mehr Leistung bei Berechnungen mit doppelter Genauigkeit sorgen, Nvidia nennt sie "device callback". Damit können beispielsweise bei einer FFT-Berechnung Daten vor oder nach der eigentlichen Transformation ohne neue Speicherzugriffe verändert werden. Das erlaubt die Behandlung mehrerer Schritte ohne zeitraubendes neues Laden und Speichern. Insbesondere bei GPUs ist der nicht aufrüstbare Speicher oft der Flaschenhals bei Rechenanwendungen.

Weiterhin gibt es nun mehr Unterstützung für Fortran-Umgebungen in Form eines Debuggers und eines Profilers. Ebenso kann Microsofts Visual Studio 13 als Host-Compiler für den eigentlichen Cuda-Compiler verwendet werden. Durch Änderungen an diesem Compiler sollen manche Funktionen bis zu 15 Prozent schneller werden, ohne dass der Quelltext angepasst werden muss.

Die Cuda-Komponenten können auf den Entwicklerseiten von Nvidia heruntergeladen werden, weitere Informationen gibt es in den Release Notes sowie der Online-Dokumentation, in der auch viele Codebeispiele zu finden sind.


eye home zur Startseite



Anzeige

Stellenmarkt
  1. operational services GmbH & Co. KG, Berlin
  2. operational services GmbH & Co. KG, Frankfurt am Main, München, Nürnberg, Wolfsburg
  3. Neoperl GmbH, Müllheim
  4. MBtech Group GmbH & Co. KGaA, Stuttgart, Sindelfingen, Neu-Ulm, Ulm


Anzeige
Hardware-Angebote
  1. (reduzierte Überstände, Restposten & Co.)
  2. ab 219,90€

Folgen Sie uns
       


  1. Teilzeitarbeit

    Amazon probiert 30-Stunden-Woche aus

  2. Archos

    Neues Smartphone mit Fingerabdrucksensor für 150 Euro

  3. Sicherheit

    Operas Server wurden angegriffen

  4. Maru

    Quellcode von Desktop-Android als Open Source verfügbar

  5. Linux

    Kernel-Sicherheitsinitiative wächst "langsam aber stetig"

  6. VR-Handschuh

    Dexta Robotics' Exoskelett für Motion Capturing

  7. Dragonfly 44

    Eine Galaxie fast ganz aus dunkler Materie

  8. Gigabit-Breitband

    Google Fiber soll Alphabet zu teuer sein

  9. Google-Steuer

    EU-Kommission plädiert für europäisches Leistungsschutzrecht

  10. Code-Gründer Thomas Bachem

    "Wir wollen weg vom Frontalunterricht"



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
­Cybersyn: Chiles Traum von der computergesteuerten Planwirtschaft
­Cybersyn
Chiles Traum von der computergesteuerten Planwirtschaft
  1. Power9 IBMs 24-Kern-Chip kann 8 TByte RAM pro Sockel nutzen
  2. Princeton Piton Open-Source-Chip soll System mit 200.000 Kernen ermöglichen
  3. Adecco IBM will Helpdesk-Geschäft in Erfurt und Leipzig loswerden

Thinkpad X1 Carbon 2013 vs 2016: Drei Jahre, zwei Ultrabooks, eine Erkenntnis
Thinkpad X1 Carbon 2013 vs 2016
Drei Jahre, zwei Ultrabooks, eine Erkenntnis
  1. Huawei Matebook im Test Guter Laptop-Ersatz mit zu starker Konkurrenz
  2. iPad Pro Case Razer zeigt flache mechanische Switches
  3. Thinkpwn Lenovo warnt vor mysteriöser Bios-Schwachstelle

Asus PG248Q im Test: 180 Hertz erkannt, 180 Hertz gebannt
Asus PG248Q im Test
180 Hertz erkannt, 180 Hertz gebannt
  1. Raspberry Pi 3 Booten über USB oder per Ethernet
  2. Autonomes Fahren Mercedes stoppt Werbespot wegen überzogener Versprechen
  3. Radeon RX 480 Dank DX12 und Vulkan reicht auch eine Mittelklasse-CPU

  1. Re: 30 Stunden auf Abruf ?!?

    picaschaf | 10:41

  2. Re: Dann lieber Redmi 3s für ~100¤ (kwt)

    Stainless | 10:40

  3. Re: Gibt es einen Lagerarbeitsplatz, wo es einem...

    Stainless | 10:39

  4. Re: Golem vergleicht Äpfel mit Birnen

    GeneralWest | 10:30

  5. Re: PC von der Stange vs Selbstbau

    lottikarotti | 10:29


  1. 15:59

  2. 15:18

  3. 13:51

  4. 12:59

  5. 15:33

  6. 15:17

  7. 14:29

  8. 12:57


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel