CUDA 4.0: Nvidia will parallele Programmierung vereinfachen

CUDA 4.0

Nvidia will parallele Programmierung vereinfachen

Nvidia erweitert sein Entwicklerpaket CUDA in der Version 4.0 um Funktionen wie Unified Virtual Addressing, GPU-zu-GPU-Kommunikation und erweiterte C++-Template-Libraries, um Entwicklern den Umgang mit GPU-Computing zu erleichtern.

Anzeige

Mit GPUDirect 2.0 unterstützt Nvidias CUDA 4.0 Peer-to-Peer-Kommunikation zwischen GPUs, die in einem einzelnen Server oder einer Workstation verbaut sind. Dadurch soll die GPU-Programmierung einfacher werden. Dazu soll auch Unified Virtual Adressing (UVA) beitragen, so dass der Hauptspeicher des Systems und die GPU-Speicher in einem gemeinsamen Adressraum zur Verfügung stehen.

Mit den Thrust genannten C++-Template-Performance-Primitives-Libraries integriert Nvidia eine Sammlung von Open-Source-Algorithmen und Datenstrukturen für die Parallele Programmierung mit C++, was die Entwicklung in C++ vereinfachen soll. Laut Nvidia arbeiten die Thrust-Routinen wie das Parallele Sortieren fünf- bis hundertmal schneller als die Methoden aus SGIs Standard Template Library (STL) und Intels Threading Building Blocks (TBB).

Darüber hinaus enthält CUDA 4.0 modifizierte MPI-Implementierungen (Message Passing Interface) wie OpenMPI, um Daten über Infiniband automatisch von und in den GPU-Speicher zu laden, wenn von einer Anwendung ein MPI-Send- oder Receive-Aufruf kommt.

Zudem können sich mehrere CPU-Host-Threads Kontexte auf einer einzelnen GPU teilen. Dadurch soll die Aufteilung auf eine einzelne GPU durch Multi-Threaded-Anwendungen vereinfacht werden. Ein einzelner CPU-Host-Thread kann zudem auf alle GPUs eines Systems zugreifen, damit Entwickler Aufgaben leicht über mehrere GPUs verteilen können.

CUDA 4.0 soll am 4. März 2011 als Release Candidate für registrierte Entwickler zum Download bereitstehen.


Kommentieren



Anzeige

  1. Re­quire­ments-In­ge­nieur (m/w)
    S1nn GmbH & Co. KG, Stutt­gart
  2. Facharchitektin / Facharchitekt
    Landeshauptstadt München, München
  3. Software Engineer (m/w)
    con terra GmbH, Münster
  4. Webentwickler (m/w)
    Kienbaum Management Service GmbH, Gummersbach, Düsseldorf

 

Detailsuche


Folgen Sie uns
       


  1. Internetsuche

    EU-Parlamentarier erwägen Google-Aufspaltung

  2. 15 Jahre Unreal Tournament

    Spiel, Bot und Sieg

  3. Inmarsat und Alcatel Lucent

    Internetzugang im Flugzeug mit 75 MBit/s

  4. Managed Apps

    Unternehmen können App-Store von Windows 10 anpassen

  5. Elektronikdiscounter

    Wie Preisvergleichsdienste ausgehebelt werden

  6. Open Data

    Cern befreit LHC-Kollisionsdaten

  7. Multimediabibliothek

    FFmpeg dank Debian wieder in Ubuntu

  8. Valve Software

    Neue Richtlinien für Early Access

  9. US-Musiker

    Nikki Sixx kritisiert Labels für magere Streaming-Profite

  10. Telemonitoring

    Generali will Fitnessdaten von Versicherten



Haben wir etwas übersehen?

E-Mail an news@golem.de



Chaos Computer Club: Der ungeklärte Btx-Hack
Chaos Computer Club
Der ungeklärte Btx-Hack
  1. Geheimdienst BND möchte sich vor Gesichtserkennung schützen
  2. Sicherheitstechnik Wie der BND Verschlüsselung knacken will
  3. BND-Kauf von Zero Days CCC warnt vor "Mitmischen im Schwachstellen-Schwarzmarkt"

Test GTA 5 Next Gen: Schöner leben und sterben in Los Santos
Test GTA 5 Next Gen
Schöner leben und sterben in Los Santos
  1. Rockstar Games Sehr bald Raubüberfälle in GTA Online
  2. GTA 5 Altes und neues Los Santos im Vergleich
  3. GTA 5 neue Version angespielt Vollwertige Ich-Perspektive für Los Santos

Core M-5Y70 im Test: Vom Turbo zur Vollbremsung
Core M-5Y70 im Test
Vom Turbo zur Vollbremsung
  1. Prozessor Schnellster Core M erreicht bis zu 2,9 GHz
  2. Die-Analyse Intels Core M besteht aus 13 Schichten
  3. Yoga 3 Pro Lenovos erstes Convertible mit Core M wiegt 1,2 Kilogramm

    •  / 
    Zum Artikel