Kepler für Grafik und Rechenanwendungen
Kepler für Grafik und Rechenanwendungen (Bild: Nico Ernst/Golem.de)

GPU-Programme parallelisieren sich selbst

Anzeige

Als zweite Neuerung gibt es "Dynamic Parallelism". Damit kann die GPU mehr eigene Kernels und Threads in ihrem Speicher starten, um Verschachtelungen aufzulösen. Diese "nested loops" machten bisher immer wieder die Mithilfe der CPU nötig, zum Beispiel durch die Cuda-Treiber. Nested Loops lassen sich nicht immer vermeiden, etwa wenn gezielt mehrere Berechnungen von ihren Ergebnissen untereinander abhängig sind.

Die GPU kann das nun ohne Zutun der CPU erledigen und die Verschachtelungen selbst auflösen. Dabei muss sich aber, wie Nvidia später erklärte, der Programmierer selbst um den immer knappen GPU-Speicher kümmern. Die neuen Kernels und Threads, die dynamisch gestartet werden, können so weit anwachsen, dass die GPU Daten in den Hauptspeicher per PCIe auslagern muss - das System wird langsamer. Das gilt es zu erkennen und einzugreifen, von sich aus soll Cuda dabei keine Fehler melden, sondern weiterrechnen.

  • Nvidia-Chef Jen-Hsun Huang eröffnet die GTC.
  • Der Kepler GK110 mit drei neuen Funktionen
  • Dichter gepackte Rechenwerke
  • Die Tesla K20 wird die erste Karte mit den neuen Funktionen. (Fotos: Nico Ernst)
  • Die klassischen Anwendungen für GPU-Computing
  • Die ungleichmäßige Auslastung (l.) soll Hyper-Q verhindern.
  • Auslastung der GPU ohne Hyper-Q....
  • ... und mit Hyper-Q. Mehr rechnen in weniger Zeit spart Energie.
  • Nested Loops kann die GPU nun wie rechts zu sehen selbst auflösen.
  • Nicht immer ist es sinnvoll, besonders fein zu parallelisieren.
Nested Loops kann die GPU nun wie rechts zu sehen selbst auflösen.

Als dritten, besonders wichtigen Baustein für GK110 nannte Jen-Hsun Huang die Streaming Multiprocessor, SM, wie Nvidia seine SIMD-Einheiten aus mehreren Cuda-Cores nennt. Bisher war ein SM bei Fermi aus 32 Rechenwerken aufgebaut, nun sind es 192. Das war dem Unternehmen gleich die neue Bezeichnung SMX wert. Im Endeffekt ist das aber auch schon bei den Spiele-Keplers so, hier sind ebenfalls mehr Rechenwerke unter einem Kontrollprozessor zusammengefasst, was den Verwaltungsaufwand der SMs untereinander reduziert.

Bis zu 15 SMX-Einheiten soll GK110 besitzen, wie Nvidias Supercomputerexperte Sumit Gupta nach der Vorstellung der Architektur in einem Roundtablegespräch sagte. Das ergibt 2.880 Rechenwerke, fast doppelt so viele wie die 1.536 Cuda-Cores des aktuellen GK104. Das gilt aber noch nicht für die Karte Tesla K20, die Jen-Hsun Huang zuvor auf einem Bild zeigte. Hier sollen es Gupta zufolge nur 13 oder 14 SMX sein, also 2.496 oder 2.688 Rechenwerke.

Genau wollten sich mehrere Nvidia-Mitarbeiter nicht festlegen, was auch für die Leistungsaufnahme der Beschleunigerkarten gilt. Für den kleineren Tesla K10, der noch im Mai 2011 ausgeliefert werden soll, gelten 225 bis 250 Watt TDP. Den genauen Wert, so betonte Sumit Gupta, legen die Hersteller der Geräte fest.

Auch zum Speicherausbau ist noch nicht das letzte Wort gesprochen. "Wir werden so viel Speicher hinter den 384-Bit-Bus klemmen, wie uns die DRAM-Industrie bereitstellen kann. Wie viel das sein wird? Wenn es 8 GByte sind, wird auch das schnell zu klein sein. Es gibt einfach nie genug Speicher", sagte Huang.

In einem Punkt ist sich der Nvidia-Chef aber bereits sicher: "Ich habe gestern Abend nochmal nachgesehen: Das ist der komplexeste Chip, der in Serie hergestellt wird. Auf Platz zwei kommt dann ein FPGA von Xilinx mit 6,8 Milliarden Transistoren. Dann folgen viele GPUs, und die komplexeste CPU ist ein Westmere von Intel mit 2,5 Milliarden Transistoren." Dafür hatte sich Huang vermutlich am Eintrag 'Transistor Count' der englischen Wikipedia orientiert.

Wieder einmal sind die Pläne des Unternehmens, das schon oft sehr große Chips mit entsprechenden Problemen bei der Fertigungsausbeute entwickelt hat, sehr ehrgeizig. Ob sie aufgehen, soll sich im vierten Quartal 2012 zeigen, dann wird der GK110 auf der Karte Tesla K20 ausgeliefert. Nur damit gibt es die hier beschriebenen neuen Funktionen, die früher verfügbare K10 kann damit noch nicht aufwarten.

 Kepler GK110: Größter Chip der Welt mit 7 Mrd. Transistoren und Hyper-Q

Lala Satalin... 15. Feb 2013

Immer wieder interessant wie viele Leute absolut gar nichts verstehen! Diese GPU ist...

Kommentieren



Anzeige

  1. Modul Manager (m/w) SAP/MM & SAP/PP
    MBDA Deutschland, Schrobenhausen
  2. Mitarbeiter Qualitätsmanagement (m/w)
    MicroNova AG, Vierkirchen
  3. Head of IT (m/w)
    Picanova GmbH über Dr. Falk Graf von Westarp, Köln
  4. System Engineer (m/w)
    TEXAS INSTRUMENTS Deutschland GmbH, Freising near Munich

 

Detailsuche


Top-Angebote
  1. TIPP DES TAGES: Crucial MX100 SSD 512 GB
    154,90€ inkl. Versand (laut Geizhals sonst ab 185,47€)
  2. TIPP: Xbox One Wired Controller für Windows
    43,99€
  3. TV-Serien und Boxen reduziert
    (u. a. Breaking Bad komplette Serie Blu-ray 79,97€, House of Cards zweite Season Blu-ray 19...

 

Weitere Angebote


Folgen Sie uns
       


  1. Test The Book of Unwritten Tales 2

    Fantasywelt in rosa Plüschgefahr

  2. 3D-Drucker im Lieferwagen

    Amazon will Waren auf dem Weg zum Kunden produzieren

  3. Play Store

    Google integriert Werbung in die App-Suche

  4. Abenteuer erneuerbare Energie

    Solar Impulse startet zum Weltflug mit Sonnenergie

  5. Geheimdienstchef Clapper

    Cyber-Armageddeon ist nicht zu befürchten

  6. LTE-Nachfolger

    Huawei baut mit M-net in München Testnetz für 5G-Mobilfunk

  7. Top-Level-Domain

    Google kauft .app für 25 Millionen US-Dollar

  8. Umstieg auf Bitcoin

    Paypal kündigt Dotcoms Mega wegen Verschlüsselung

  9. Easter Egg

    Tesla Model S wird zu Bonds Tauch-Lotus

  10. Elon Musk

    Acht Kilometer Hyperloop für Kalifornien



Haben wir etwas übersehen?

E-Mail an news@golem.de



Lenovo Tab S8-50F im Test: Uns stinkt's!
Lenovo Tab S8-50F im Test
Uns stinkt's!
  1. Adware Lenovo-Laptops durch Superfish-Adware angreifbar
  2. Lenovo Anypen Auf dem Touchscreen mit beliebigem Stift schreiben
  3. Yoga Tablet 2 mit Windows 8.1 im Test Wie die Android-Variante, aber ein winziges bisschen besser

Die Woche im Video: Ein Spionagering, Marskandidaten und Linux für den Desktop
Die Woche im Video
Ein Spionagering, Marskandidaten und Linux für den Desktop
  1. Die Woche im Video New 3DS, Stromzähler und der schnellste Smartphone-Chip
  2. Die Woche im Video Raspberry Pi 2, die Telekom am DE-CIX und Alienware Alpha
  3. Die Woche im Video Autonome Autos, Spionageprogramme und Werbelügen

Zigbee und Z-Wave: So funkt's im Smarthome
Zigbee und Z-Wave
So funkt's im Smarthome
  1. Luna Sleep Smartbed soll erholsamen Schlaf garantieren
  2. Harmony Logitech öffnet API von Fernbedienungen für Heimautomation
  3. Security Smarthomes, offen wie Scheunentore

  1. Re: Themaverfehlung

    PiranhA | 14:02

  2. Re: Liebe Karteninstute, Banken und sonstige...

    morningstar | 14:02

  3. Re: "Schmuddel" versus "Schmuddel"

    ArneBab | 14:00

  4. Re: Hat ein 3D-Drucker jemals...

    PiranhA | 13:59

  5. Good

    zeshanbilal | 13:58


  1. 14:01

  2. 12:37

  3. 12:21

  4. 12:08

  5. 12:07

  6. 11:58

  7. 11:44

  8. 11:26


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel