Abo
  • Services:

Kepler GK110: Größter Chip der Welt mit 7 Mrd. Transistoren und Hyper-Q

Zur Eröffnung der Konferenz GTC hat Nvidia-Chef Jen-Hsun Huang mit dem GK110 seine neue GPU vorgestellt. Der riesige Chip soll Supercomputer und Workstations mit bis zu 2.880 Rechenwerken beschleunigen - aber erst Ende 2012 als Tesla K20.

Artikel veröffentlicht am ,
Kepler für Grafik und Rechenanwendungen
Kepler für Grafik und Rechenanwendungen (Bild: Nico Ernst/Golem.de)

Eigentlich war sie mit besonderer Spannung erwartet worden: die Keynote-Ansprache von Nvidia-Mitbegründer und -Chef Jen-Hsun Huang. Schon im Vorfeld sickerte dann aber durch, dass Huang zur Eröffnung der dritten Ausgabe der GPU Technology Conference (GTC) den neuen Chip Kepler GK110 vorstellen werde, und dass dieser aus etwa 7 Milliarden Transistoren bestehe. Auch Nvidia selbst nannte die Zahl eher beiläufig in den vorab an Journalisten verteilten Unterlagen.

Inhalt:
  1. Kepler GK110: Größter Chip der Welt mit 7 Mrd. Transistoren und Hyper-Q
  2. GPU-Programme parallelisieren sich selbst

Was Huang dann aber auf der Bühne des San Jose Convention Center zeigte, hatte so kaum jemand erwartet - vor allem, weil die zahlreichen neuen Funktionen nicht für die nun erhältlichen Kepler-GPUs und die erste für Rechenanwendungen vorgesehene Karte Tesla K10 gelten, sondern nur für die GPU GK110, die erst im vierten Quartal 2012 auf den Markt kommen soll. GK110 basiert zwar auf der Kepler-Architektur, die auch für die Spielegrafikkarten verwendeten GK104 (Geforce GTX-670, 680, 690) haben mit der neuen GPU aber nur wenig zu tun.

  • Nvidia-Chef Jen-Hsun Huang eröffnet die GTC.
  • Der Kepler GK110 mit drei neuen Funktionen
  • Dichter gepackte Rechenwerke
  • Die Tesla K20 wird die erste Karte mit den neuen Funktionen. (Fotos: Nico Ernst)
  • Die klassischen Anwendungen für GPU-Computing
  • Die ungleichmäßige Auslastung (l.) soll Hyper-Q verhindern.
  • Auslastung der GPU ohne Hyper-Q....
  • ... und mit Hyper-Q. Mehr rechnen in weniger Zeit spart Energie.
  • Nested Loops kann die GPU nun wie rechts zu sehen selbst auflösen.
  • Nicht immer ist es sinnvoll, besonders fein zu parallelisieren.
Die Tesla K20 wird die erste Karte mit den neuen Funktionen. (Fotos: Nico Ernst)

GK110 ist nicht, wie bei früheren Nvidia-Chips, nur ein Ableger der Spiele-GPU mit mehr Rechenwerken, die bei Nvidia Cuda-Cores heißen. Vielmehr gibt es zwar mehr von diesen Einheiten - wie viele hat Nvidia noch nicht verraten -, aber vor allem drei neue Funktionen, die einige der größten Probleme bei GPU-Computing lösen sollen.

Die erste ist "Hyper-Q". So nennt Nvidia die Tatsache, dass der neue Kepler nun von 32 Threads der CPU gefüttert werden kann. Bisher waren GPUs immer dadurch limitiert, dass sie nur über einen Thread mit Befehlen und Daten versorgt werden konnten. Nun, so sagte Huang, könnten auch 32 physikalische Kerne einer CPU gleichzeitig eine einzelne Kepler-GPU ansteuern.

Stellenmarkt
  1. BGV / Badische Versicherungen, Karlsruhe
  2. Diamant Software GmbH & Co. KG, Bielefeld

Zwar beherrschten die verschiedenen Schnittstellen, auch DirectX, schon die Verarbeitung von GPU-Befehlen mit mehreren Threads, die GPU selbst war aber immer auf die serielle Übergabe der parallel zu bearbeitenden Daten angewiesen. Diese Beschränkung wird nun aufgehoben, was dafür sorgen soll, dass die GPU immer so weit wie möglich ausgelastet werden kann.

Das klappt auch anders herum: Über eine Cuda-Schnittstelle kann eine CPU mehrere GPUs mit nur einem Thread ansprechen. Das funktioniert unter anderem durch "GPU Direct". Über das Netzwerk - Tesla-Karten stecken in der Regel in Servern - haben die GPUs direkten Zugriff auf den Speicher ihrer Kollegen. Bisher war dafür immer das Kopieren in den Hauptspeicher über die CPU nötig, was viel Zeit gekostet hat.

GPU-Programme parallelisieren sich selbst 
  1. 1
  2. 2
  3.  


Anzeige
Top-Angebote
  1. (u. a. Canon EOS 2000D + Objektiv 18-55 mm für 299€ statt 394€ im Vergleich)
  2. ab 119,99€
  3. 263,99€
  4. 44,98€ + USK-18-Versand

Lala Satalin... 15. Feb 2013

Immer wieder interessant wie viele Leute absolut gar nichts verstehen! Diese GPU ist...


Folgen Sie uns
       


Assassin's Creed Odyssey - Test

Wir hätten nicht gedacht, dass wir erneut so gerne so viel Zeit in Ubisofts Antike verbringen.

Assassin's Creed Odyssey - Test Video aufrufen
Xilinx-CEO Victor Peng im Interview: Wir sind überall
Xilinx-CEO Victor Peng im Interview
"Wir sind überall"

Programmierbare Schaltungen, kurz FPGAs, sind mehr als nur Werkzeuge, um Chips zu entwickeln: Im Interview spricht Xilinx-CEO Victor Peng über überholte Vorurteile, den Erfolg des Interposers, die 7-nm-Fertigung und darüber, dass nach dem Tape-out der Spaß erst beginnt.
Ein Interview von Marc Sauter

  1. Versal-FPGAs Xilinx macht Nvidia das AI-Geschäft streitig
  2. Project Everest Xilinx bringt ersten FPGA mit 7-nm-Technik

Apple Watch im Test: Auch ohne EKG die beste Smartwatch
Apple Watch im Test
Auch ohne EKG die beste Smartwatch

Apples vierte Watch verändert das Display-Design leicht - zum Wohle des Nutzers. Die Uhr bietet immer noch mit die beste Smartwatch-Erfahrung, auch wenn eine der neuen Funktionen in Deutschland noch nicht funktioniert.
Ein Test von Tobias Költzsch

  1. Smartwatch Apple Watch Series 4 mit EKG und Sturzerkennung
  2. Smartwatch Apple Watch Series 4 nur mit sechs Modellen
  3. Handelskrieg Apple Watch und anderen Gadgets drohen Strafzölle

Passwörter: Eine vernünftige Maßnahme gegen den IoT-Irrsinn
Passwörter
Eine vernünftige Maßnahme gegen den IoT-Irrsinn

Kalifornien verabschiedet ein Gesetz, das Standardpasswörter verbietet. Das ist ein Schritt in die richtige Richtung, denn es setzt beim größten Problem von IoT-Geräten an und ist leicht umsetzbar.
Ein IMHO von Hanno Böck

  1. Retrogaming Maximal unnötige Minis
  2. Streaming Heilloses Durcheinander bei Netflix und Amazon Prime
  3. Sicherheit Ein Lob für Twitter und Github

    •  /