Abo
  • Services:
Anzeige
CUDA 4.0: Nvidia will parallele Programmierung vereinfachen

CUDA 4.0

Nvidia will parallele Programmierung vereinfachen

Nvidia erweitert sein Entwicklerpaket CUDA in der Version 4.0 um Funktionen wie Unified Virtual Addressing, GPU-zu-GPU-Kommunikation und erweiterte C++-Template-Libraries, um Entwicklern den Umgang mit GPU-Computing zu erleichtern.

Mit GPUDirect 2.0 unterstützt Nvidias CUDA 4.0 Peer-to-Peer-Kommunikation zwischen GPUs, die in einem einzelnen Server oder einer Workstation verbaut sind. Dadurch soll die GPU-Programmierung einfacher werden. Dazu soll auch Unified Virtual Adressing (UVA) beitragen, so dass der Hauptspeicher des Systems und die GPU-Speicher in einem gemeinsamen Adressraum zur Verfügung stehen.

Anzeige

Mit den Thrust genannten C++-Template-Performance-Primitives-Libraries integriert Nvidia eine Sammlung von Open-Source-Algorithmen und Datenstrukturen für die Parallele Programmierung mit C++, was die Entwicklung in C++ vereinfachen soll. Laut Nvidia arbeiten die Thrust-Routinen wie das Parallele Sortieren fünf- bis hundertmal schneller als die Methoden aus SGIs Standard Template Library (STL) und Intels Threading Building Blocks (TBB).

Darüber hinaus enthält CUDA 4.0 modifizierte MPI-Implementierungen (Message Passing Interface) wie OpenMPI, um Daten über Infiniband automatisch von und in den GPU-Speicher zu laden, wenn von einer Anwendung ein MPI-Send- oder Receive-Aufruf kommt.

Zudem können sich mehrere CPU-Host-Threads Kontexte auf einer einzelnen GPU teilen. Dadurch soll die Aufteilung auf eine einzelne GPU durch Multi-Threaded-Anwendungen vereinfacht werden. Ein einzelner CPU-Host-Thread kann zudem auf alle GPUs eines Systems zugreifen, damit Entwickler Aufgaben leicht über mehrere GPUs verteilen können.

CUDA 4.0 soll am 4. März 2011 als Release Candidate für registrierte Entwickler zum Download bereitstehen.


eye home zur Startseite



Anzeige

Stellenmarkt
  1. Worldline GmbH, Aachen
  2. CCV Deutschland GmbH, Au i.d. Hallertau
  3. Daimler AG, Sindelfingen
  4. Wassermann AG, München


Anzeige
Spiele-Angebote
  1. ab 59,00€ (Vorbesteller-Preisgarantie)
  2. 1,49€
  3. 57,99€/69,99€ (Vorbesteller-Preisgarantie)

Folgen Sie uns
       


  1. 3D-Drucker

    Neues Verfahren erkennt Manipulationen beim 3D-Druck

  2. AVS Device SDK

    Amazon bringt Alexa auf Raspberry Pi und andere Boards

  3. Adblock Plus

    OLG München erklärt Werbeblocker für zulässig

  4. Streaming

    Netflix plant 7 Milliarden US-Dollar für eigenen Content ein

  5. Coffee Lake

    Core i3 als Quadcores und Core i5 als Hexacores

  6. Starcraft Remastered im Test

    Klick, klick, klick, klick, klick als wär es 1998

  7. KB4034658

    Anniversary-Update-Update macht Probleme mit WSUS

  8. Container

    Githubs Kubernetes-Cluster überlebt regelmäßige Kernel-Panic

  9. Radeon RX Vega

    Mining-Treiber steigert MH/s deutlich

  10. Voyager 8200 UC

    Plantronics stellt Business-Headset mit Noise Cancelling vor



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Threadripper 1950X und 1920X im Test: AMD hat die schnellste Desktop-CPU
Threadripper 1950X und 1920X im Test
AMD hat die schnellste Desktop-CPU
  1. Ryzen AMD bestätigt Compiler-Fehler unter Linux
  2. CPU Achtkerniger Threadripper erscheint Ende August
  3. Ryzen 3 1300X und 1200 im Test Harte Gegner für Intels Core i3

Sysadmin Day 2017: Zum Admin-Sein fehlen mir die Superkräfte
Sysadmin Day 2017
Zum Admin-Sein fehlen mir die Superkräfte

Orange Pi 2G IoT ausprobiert: Wir bauen uns ein 20-Euro-Smartphone
Orange Pi 2G IoT ausprobiert
Wir bauen uns ein 20-Euro-Smartphone
  1. Odroid HC-1 Bastelrechner besser stapeln im NAS
  2. Bastelrechner Nano Pi im Test Klein, aber nicht unbedingt oho

  1. Re: 1,50 ¤ / Spiel - bei Sky 0,90 ¤ / Spiel

    Flyman | 15:56

  2. Re: Was nicht alles geht wenn konkurrenz da ist.

    medium_quelle | 15:55

  3. Re: Warum ich die Golem Werbung blocke ..

    nille02 | 15:55

  4. Re: 200 km umgerechnet = maximal 2h fahrt mit 100Kmh

    ChMu | 15:54

  5. Re: USP: möglichst lange Updates

    x64 | 15:54


  1. 15:55

  2. 15:41

  3. 15:16

  4. 14:57

  5. 14:40

  6. 14:26

  7. 13:31

  8. 13:14


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel