Kepler GK110: Größter Chip der Welt mit 7 Mrd. Transistoren und Hyper-Q

Zur Eröffnung der Konferenz GTC hat Nvidia-Chef Jen-Hsun Huang mit dem GK110 seine neue GPU vorgestellt. Der riesige Chip soll Supercomputer und Workstations mit bis zu 2.880 Rechenwerken beschleunigen - aber erst Ende 2012 als Tesla K20.

Artikel veröffentlicht am ,
Kepler für Grafik und Rechenanwendungen
Kepler für Grafik und Rechenanwendungen (Bild: Nico Ernst/Golem.de)

Eigentlich war sie mit besonderer Spannung erwartet worden: die Keynote-Ansprache von Nvidia-Mitbegründer und -Chef Jen-Hsun Huang. Schon im Vorfeld sickerte dann aber durch, dass Huang zur Eröffnung der dritten Ausgabe der GPU Technology Conference (GTC) den neuen Chip Kepler GK110 vorstellen werde, und dass dieser aus etwa 7 Milliarden Transistoren bestehe. Auch Nvidia selbst nannte die Zahl eher beiläufig in den vorab an Journalisten verteilten Unterlagen.

Inhalt:
  1. Kepler GK110: Größter Chip der Welt mit 7 Mrd. Transistoren und Hyper-Q
  2. GPU-Programme parallelisieren sich selbst

Was Huang dann aber auf der Bühne des San Jose Convention Center zeigte, hatte so kaum jemand erwartet - vor allem, weil die zahlreichen neuen Funktionen nicht für die nun erhältlichen Kepler-GPUs und die erste für Rechenanwendungen vorgesehene Karte Tesla K10 gelten, sondern nur für die GPU GK110, die erst im vierten Quartal 2012 auf den Markt kommen soll. GK110 basiert zwar auf der Kepler-Architektur, die auch für die Spielegrafikkarten verwendeten GK104 (Geforce GTX-670, 680, 690) haben mit der neuen GPU aber nur wenig zu tun.

  • Nvidia-Chef Jen-Hsun Huang eröffnet die GTC.
  • Der Kepler GK110 mit drei neuen Funktionen
  • Dichter gepackte Rechenwerke
  • Die Tesla K20 wird die erste Karte mit den neuen Funktionen. (Fotos: Nico Ernst)
  • Die klassischen Anwendungen für GPU-Computing
  • Die ungleichmäßige Auslastung (l.) soll Hyper-Q verhindern.
  • Auslastung der GPU ohne Hyper-Q....
  • ... und mit Hyper-Q. Mehr rechnen in weniger Zeit spart Energie.
  • Nested Loops kann die GPU nun wie rechts zu sehen selbst auflösen.
  • Nicht immer ist es sinnvoll, besonders fein zu parallelisieren.
Die Tesla K20 wird die erste Karte mit den neuen Funktionen. (Fotos: Nico Ernst)

GK110 ist nicht, wie bei früheren Nvidia-Chips, nur ein Ableger der Spiele-GPU mit mehr Rechenwerken, die bei Nvidia Cuda-Cores heißen. Vielmehr gibt es zwar mehr von diesen Einheiten - wie viele hat Nvidia noch nicht verraten -, aber vor allem drei neue Funktionen, die einige der größten Probleme bei GPU-Computing lösen sollen.

Die erste ist "Hyper-Q". So nennt Nvidia die Tatsache, dass der neue Kepler nun von 32 Threads der CPU gefüttert werden kann. Bisher waren GPUs immer dadurch limitiert, dass sie nur über einen Thread mit Befehlen und Daten versorgt werden konnten. Nun, so sagte Huang, könnten auch 32 physikalische Kerne einer CPU gleichzeitig eine einzelne Kepler-GPU ansteuern.

Stellenmarkt
  1. (Senior) IT Professional Client Systems (m/w/d)
    ALDI International Services SE & Co. oHG, Mülheim an der Ruhr
  2. Softwareentwickler (m/w/d) für Tools und Toolketten
    Elektronische Fahrwerksysteme GmbH, Wolfsburg
Detailsuche

Zwar beherrschten die verschiedenen Schnittstellen, auch DirectX, schon die Verarbeitung von GPU-Befehlen mit mehreren Threads, die GPU selbst war aber immer auf die serielle Übergabe der parallel zu bearbeitenden Daten angewiesen. Diese Beschränkung wird nun aufgehoben, was dafür sorgen soll, dass die GPU immer so weit wie möglich ausgelastet werden kann.

Das klappt auch anders herum: Über eine Cuda-Schnittstelle kann eine CPU mehrere GPUs mit nur einem Thread ansprechen. Das funktioniert unter anderem durch "GPU Direct". Über das Netzwerk - Tesla-Karten stecken in der Regel in Servern - haben die GPUs direkten Zugriff auf den Speicher ihrer Kollegen. Bisher war dafür immer das Kopieren in den Hauptspeicher über die CPU nötig, was viel Zeit gekostet hat.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
GPU-Programme parallelisieren sich selbst 
  1. 1
  2. 2
  3.  


Aktuell auf der Startseite von Golem.de
Unix-Nachfolger
Plan 9 sollte bessere Audio-Kompression bekommen als MP3

Die Entwicklung der Audio-Kompression und die schwierige MP3-Patentsituation hätte ohne das Nein eines Anwalts wohl anders ausgesehen.

Unix-Nachfolger: Plan 9 sollte bessere Audio-Kompression bekommen als MP3
Artikel
  1. Probefahrt mit Toyota bZ4X: Starker Auftritt mit kleinen Schwächen
    Probefahrt mit Toyota bZ4X
    Starker Auftritt mit kleinen Schwächen

    Das erste Elektroauto von Toyota kommt spät - und weist trotzdem noch Schwachpunkte auf. Der Hersteller verspricht immerhin schnelle Abhilfe.
    Ein Bericht von Franz W. Rother

  2. Hermit: Google analysiert italienischen Staatstrojaner
    Hermit
    Google analysiert italienischen Staatstrojaner

    Der Staatstrojaner einer italienische Firma funktioniert sogar in Zusammenarbeit mit dem ISP. Dafür braucht es nicht zwingend ausgefallene Exploits.

  3. Vision, Disruption, Transformation: Populäre Denkfehler in der Digitalisierung
    Vision, Disruption, Transformation
    Populäre Denkfehler in der Digitalisierung

    Der Essay Träge Transformation hinterfragt Schlagwörter des IT-Managements und räumt mit gängigen Vorstellungen auf. Die Lektüre ist aufschlussreich und sogar lustig.
    Eine Rezension von Ulrich Hottelet

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Prime Video: Filme leihen 0,99€ • Alternate: Gehäuse & Co. von Fractal Design • Nur noch heute: 16.000 Artikel günstiger bei MediaMarkt • MindStar (Samsung 970 EVO Plus 250GB 39€) • Hori RWA 87,39€ • Honor X7 128GB 150,42€ • Phanteks Eclipse P200A + Glacier One 280 157,89€ [Werbung]
    •  /