Cuda 3.2

Nvidia beschleunigt GPGPU-Computing

Nvidia hat seine GPGPU-Bibliothek Cuda in der Version 3.2 veröffentlicht. Einzelne Berechnungsmethoden hat Nvidia dabei um ein Vielfaches beschleunigt.

Artikel veröffentlicht am ,
Cuda 3.2: Nvidia beschleunigt GPGPU-Computing

Cuda erlaubt es, beliebige Berechnungen auf einer Nvidia-GPU auszuführen. Die Version 3.2 der Bibliothek soll dabei deutlich schneller sein als ihr Vorgänger. So soll Nividias Blas-Implementierung (Basic Linear Algebra Subprograms) namens Cublas auf Fermi-Chips Matrixmultiplikationen aller Datentypen 50 bis 300 Prozent schneller durchführen. Die Bibliothek Cufft für schnelle Fourier-Transformationen soll bei einzelnen Berechnungen sogar zwei- bis zehnmal schneller sein als ihr Vorgänger.

Mit Cusparse gebe es zudem eine neue Bibliothek zum Umgang mit dünnbesetzten Matrizen (Sparse Matrix), mit der dank GPU-Beschleunigung einige Operationen 5- bis 30-mal schneller abgewickelt werden könnten als mit Intels Math Kernel Library (MKL), so Nvidia. Ähnliches gelte für Curand, eine Bibliothek zur Erzeugung von Pseudo-Zufallszahlen. Hier gibt Nvidia an, dass Berechnungen zehn- bis 20-mal schneller abliefen als mit MKL.

Darüber hinaus hat Nvidia Encoder und Decoder für H.264 in das Cuda-Toolkit integriert, unterstützt Quadro- und Tesla-Produkte mit 6 GByte Speicher und den Modus Tesla Compute Cluster (TCC) auf Windows-Desktops.

Die Entwicklerwerkzeuge wurden um Multi-GPU-Debugging, einen erweiterten Cuda-Memcheck für alle Fermi-Architekturen und NVCC um Unterstützung für Intels C Compiler (ICC) in der Version 11.1 auf 64-Bit-Linux-Systemen erweitert. Mit Nvidia-SMI gibt es eine neue Schnittstelle zur Überwachung von Leistungswerten der GPU.

Cuda 3.2 steht unter developer.nvidia.com für Windows, Linux und Mac OS X zum Download bereit.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Der Kaiser! 29. Nov 2010

Warum denn nicht?

kuh da 27. Nov 2010

Freemake unterstützt auch nur Cuda bei sehr sehr sehr wenigen Profilen, z.B. IPod Touch...

Lena das Luder 26. Nov 2010

Schon komisch. Einerseits hat AMD ewig lange gebraucht um einen einigermassen stabilen...

jojojo 26. Nov 2010

hallo, nutzlose Information. A ist 10x schneller als B sagt nichts aus. Bei welcher...



Aktuell auf der Startseite von Golem.de
Zbox Pico PI430AJ
Flotter Mini-PC mit Solid-State-Kühlung

Die fast lautlosen Kühler von Frore Systems funktionieren gut. Mehr Leistung auf so kleinem Raum ist kaum möglich. Eine ARM-CPU wäre aber spannend.
Ein Test von Martin Böckmann

Zbox Pico PI430AJ: Flotter Mini-PC mit Solid-State-Kühlung
Artikel
  1. Kernfusion: US-Fusionslabor erreicht konsistent Zündungen
    Kernfusion
    US-Fusionslabor erreicht konsistent Zündungen

    Vor einem Jahr gelang der US-Forschungseinrichtung NIF ein wichtiger Fortschritt bei der Kernfusion. Der wurde inzwischen mehrfach wiederholt.

  2. Zu einfach: Sony patentiert dynamisch angepasste Schwierigkeitsgrade
    Zu einfach
    Sony patentiert dynamisch angepasste Schwierigkeitsgrade

    Geschwindigkeit, Spawn-Rate und mehr: Sony hat eine besonders komplexe Anpassung von Schwierigkeitsgraden patentiert.

  3. Energiewende: Deutsche Stromnetze im Dornröschenschlaf
    Energiewende
    Deutsche Stromnetze im Dornröschenschlaf

    IT ist der Game Changer der Energiewende - nur nicht in Deutschland.
    Eine Analyse von Gerd Mischler

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Last-Minute-Angebote bei Amazon • Avatar & The Crew Motorfest bis -50% • Xbox Series X 399€ • Cherry MX Board 3.0 S 49,95€ • Crucial MX500 2 TB 110,90€ • AVM FRITZ!Box 7590 AX + FRITZ!DECT 500 219€ [Werbung]
    •  /