CUDA 4.0

Nvidia will parallele Programmierung vereinfachen

Nvidia erweitert sein Entwicklerpaket CUDA in der Version 4.0 um Funktionen wie Unified Virtual Addressing, GPU-zu-GPU-Kommunikation und erweiterte C++-Template-Libraries, um Entwicklern den Umgang mit GPU-Computing zu erleichtern.

Artikel veröffentlicht am ,
CUDA 4.0: Nvidia will parallele Programmierung vereinfachen

Mit GPUDirect 2.0 unterstützt Nvidias CUDA 4.0 Peer-to-Peer-Kommunikation zwischen GPUs, die in einem einzelnen Server oder einer Workstation verbaut sind. Dadurch soll die GPU-Programmierung einfacher werden. Dazu soll auch Unified Virtual Adressing (UVA) beitragen, so dass der Hauptspeicher des Systems und die GPU-Speicher in einem gemeinsamen Adressraum zur Verfügung stehen.

Stellenmarkt
  1. SQL- / Java-/C# Softwareentwickler / Software Ingenieure / Technische Informatiker (m/w/d) ... (m/w/d)
    Crane Payment Innovations GmbH, Buxtehude
  2. SAP Basis Administrator (w/m/d)
    Dataport, Altenholz bei Kiel, Bremen, Hamburg, Magdeburg, Rostock
Detailsuche

Mit den Thrust genannten C++-Template-Performance-Primitives-Libraries integriert Nvidia eine Sammlung von Open-Source-Algorithmen und Datenstrukturen für die Parallele Programmierung mit C++, was die Entwicklung in C++ vereinfachen soll. Laut Nvidia arbeiten die Thrust-Routinen wie das Parallele Sortieren fünf- bis hundertmal schneller als die Methoden aus SGIs Standard Template Library (STL) und Intels Threading Building Blocks (TBB).

Darüber hinaus enthält CUDA 4.0 modifizierte MPI-Implementierungen (Message Passing Interface) wie OpenMPI, um Daten über Infiniband automatisch von und in den GPU-Speicher zu laden, wenn von einer Anwendung ein MPI-Send- oder Receive-Aufruf kommt.

Zudem können sich mehrere CPU-Host-Threads Kontexte auf einer einzelnen GPU teilen. Dadurch soll die Aufteilung auf eine einzelne GPU durch Multi-Threaded-Anwendungen vereinfacht werden. Ein einzelner CPU-Host-Thread kann zudem auf alle GPUs eines Systems zugreifen, damit Entwickler Aufgaben leicht über mehrere GPUs verteilen können.

Golem Karrierewelt
  1. Kotlin für Java-Entwickler: virtueller Zwei-Tage-Workshop
    13./14.10.2022, Virtuell
  2. Adobe Photoshop Grundkurs: virtueller Drei-Tage-Workshop
    31.08.-02.09.2022, Virtuell
Weitere IT-Trainings

CUDA 4.0 soll am 4. März 2011 als Release Candidate für registrierte Entwickler zum Download bereitstehen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
James Webb Space Telescope
Das Weltraumteleskop wird mit Javascript betrieben

Die in der Raumfahrt verwendete Software ist manchmal kurios. Im Fall des JWST wird das ISIM mit Javascript kontrolliert und betrieben.

James Webb Space Telescope: Das Weltraumteleskop wird mit Javascript betrieben
Artikel
  1. ADAC-Test: Elektroautos als Zugmaschinen - was bringt's?
    ADAC-Test
    Elektroautos als Zugmaschinen - was bringt's?

    Der ADAC hat den Stromverbrauch von Elektroautos mit Anhängern und Fahrradgepäckträgern gemessen. Gute Noten gibt es dabei keine.

  2. Macbook Air M2 im Test: Das Macbook ohne Lüfter, aber mit Notch und Magsafe
    Macbook Air M2 im Test  
    Das Macbook ohne Lüfter, aber mit Notch und Magsafe

    Im Vergleich zum Apple Macbook Pro ist das Air mit M2-Chip eine Generation weiter. Auch ohne Lüfter ist es ein leistungsstarkes Notebook.
    Ein Test von Oliver Nickel

  3. DDR5: Samsung plant 1-TByte-Speichermodul
    DDR5
    Samsung plant 1-TByte-Speichermodul

    2022 sollen 512-GByte-Riegel verfügbar sein, später die doppelte Kapazität. Davon profitieren Server-CPUs wie AMDs Epyc mit zwölf Kanälen.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • MindStar (MSI RTX 3090 Gaming 1.269€, Seagate Festplatte ext. 18 TB 295€) • PS5-Deals (Uncharted Legacy of Thieves 15,38€, Horzizon FW 39,99€) • HP HyperX Gaming-Maus -51% • Alternate (Kingston Fury DDR5-6000 32GB 219,90€ statt 246€) • Samsung Galaxy S22+ 5G 128 GB 839,99€ [Werbung]
    •  /