CUDA 4.0: Nvidia will parallele Programmierung vereinfachen

CUDA 4.0

Nvidia will parallele Programmierung vereinfachen

Nvidia erweitert sein Entwicklerpaket CUDA in der Version 4.0 um Funktionen wie Unified Virtual Addressing, GPU-zu-GPU-Kommunikation und erweiterte C++-Template-Libraries, um Entwicklern den Umgang mit GPU-Computing zu erleichtern.

Anzeige

Mit GPUDirect 2.0 unterstützt Nvidias CUDA 4.0 Peer-to-Peer-Kommunikation zwischen GPUs, die in einem einzelnen Server oder einer Workstation verbaut sind. Dadurch soll die GPU-Programmierung einfacher werden. Dazu soll auch Unified Virtual Adressing (UVA) beitragen, so dass der Hauptspeicher des Systems und die GPU-Speicher in einem gemeinsamen Adressraum zur Verfügung stehen.

Mit den Thrust genannten C++-Template-Performance-Primitives-Libraries integriert Nvidia eine Sammlung von Open-Source-Algorithmen und Datenstrukturen für die Parallele Programmierung mit C++, was die Entwicklung in C++ vereinfachen soll. Laut Nvidia arbeiten die Thrust-Routinen wie das Parallele Sortieren fünf- bis hundertmal schneller als die Methoden aus SGIs Standard Template Library (STL) und Intels Threading Building Blocks (TBB).

Darüber hinaus enthält CUDA 4.0 modifizierte MPI-Implementierungen (Message Passing Interface) wie OpenMPI, um Daten über Infiniband automatisch von und in den GPU-Speicher zu laden, wenn von einer Anwendung ein MPI-Send- oder Receive-Aufruf kommt.

Zudem können sich mehrere CPU-Host-Threads Kontexte auf einer einzelnen GPU teilen. Dadurch soll die Aufteilung auf eine einzelne GPU durch Multi-Threaded-Anwendungen vereinfacht werden. Ein einzelner CPU-Host-Thread kann zudem auf alle GPUs eines Systems zugreifen, damit Entwickler Aufgaben leicht über mehrere GPUs verteilen können.

CUDA 4.0 soll am 4. März 2011 als Release Candidate für registrierte Entwickler zum Download bereitstehen.


Kommentieren



Anzeige

  1. Projektleiter/in Produktentwicklung
    Robert Bosch GmbH, Leonberg
  2. IT Business Analyst (m/w)
    FLOCERT, Bonn
  3. Leiter (m/w) Elektronik- / Embedded Software-Entwicklung
    invenio GmbH Engineering Services, Rüsselsheim, Mannheim, Karlsruhe oder Stuttgart
  4. Fachbereichsleiter (m/w) Architekturmanagement
    gkv informatik, Wuppertal

 

Detailsuche


Hardware-Angebote
  1. Raspberry Pi 2 Modell B / Quad-Core Prozessor / 1GB RAM - inkl. Kühlkörper
    ab 36,44€
  2. Samsung Galaxy S6 und S6 Edge im Preisvergleich
    ab 699,00€
  3. Seagate 8-TB-Festplatte vorbestellbar
    264,00€

 

Weitere Angebote


Folgen Sie uns
       


  1. Deutsche Telekom

    All-IP-Anschlüsse sind auch ohne DSL möglich

  2. Internetversorgung in Zügen

    Empfangsqualität des Bahn-WLAN ist geheim

  3. Zweites Hearthstone-Adventure

    Der Preis ist heiß - nicht!

  4. Freifunker

    "WLAN-Gesetzentwurf bewirkt Gegenteil von öffentlichem WLAN"

  5. Wiko

    Neue LTE-Smartphones sollen um die 300 Euro kosten

  6. Near Field Magnetic Induction Hands on

    Drahtlos-Ohrhörer noch drahtloser

  7. LG

    Neue Android-Smartphones kosten ab 100 Euro

  8. Browserhersteller

    Firefox und Chrome erzwingen HTTP/2-Verschlüsselung

  9. Powerspy

    Stalking über den Akkuverbrauch

  10. LTE + Super Vectoring

    Hybridrouter der Telekom soll künftig 550 MBit/s bringen



Haben wir etwas übersehen?

E-Mail an news@golem.de



OxygenOS von Oneplus: "Wir wollen keine Funktionen entwickeln, die nerven"
OxygenOS von Oneplus
"Wir wollen keine Funktionen entwickeln, die nerven"
  1. Oneplus One-Smartphone bekommt Lollipop erst im März
  2. Alternatives ROM Paranoid Android schließt sich Oneplus an
  3. OxygenOS Oneplus greift auf Paranoid-Android-Entwickler zurück

MIPS Creator CI20 angetestet: Die Platine zum Pausemachen
MIPS Creator CI20 angetestet
Die Platine zum Pausemachen
  1. Raspberry Pi 2 Fotografieren nur ohne Blitz
  2. Raspberry Pi 2 ausprobiert Schnell rechnen, langsam speichern
  3. Internet der Dinge Windows 10 läuft kostenlos auf dem Raspberry Pi 2

Raspberry Pi 2: Die Feierabend-Maschine
Raspberry Pi 2
Die Feierabend-Maschine
  1. Bastelrechner Das Raspberry Pi 2 hat viermal mehr Wumms
  2. Dual-Monitor-Betrieb VGA-Anschluss für Plus-Modelle des Raspberry Pi
  3. Bitscope Micro im Test Oszilloskop und Logic Analyzer für den Bastelrechner

  1. Re: OT: Rootanleitung für Xover 2 ?

    Catwiesel.318d | 02:14

  2. Re: Warum überhaupt WLAN

    Eheran | 02:08

  3. Re: Selberbau-PC

    Tzven | 01:46

  4. Re: Mittel-, Ring- und kleiner -Finger...

    jojololo | 01:37

  5. Re: Frage an Spieler

    Daemoneyes | 01:32


  1. 19:50

  2. 18:41

  3. 18:34

  4. 17:16

  5. 16:45

  6. 16:19

  7. 15:11

  8. 15:09


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel