Abo
  • Services:

Lake Crest: Intels Terminator-Chip mit Terabyte-Bandbreite

Auf dem ersten europäischen AI-Day in München hat Intel Details zu Lake Crest genannt. Der Beschleuniger für künstliche Intelligenz soll bei solchen Anwendungen auch Highend-GPUs schlagen. Dafür ist viel neue Technik nötig.

Ein Bericht von veröffentlicht am
Blockdiagramm von Intels Lake Crest
Blockdiagramm von Intels Lake Crest (Bild: Nico Ernst)

Interposer, HBM2, ein neuartiges Netz direkt im Chip: Intel steckt im Moment viel Knowhow in Lake Crest. Es ist der erste von Grund auf neu entwickelte Beschleuniger für künstliche Intelligenz (AI) des Unternehmens. Lake Crest hatte Intel auf seinem ersten AI-Day in San Francisco angekündigt, nun durfte sein Entwickler Naveen Rao in München erste Details zum Aufbau und zur Architektur verraten. Rao hatte nach zehn Jahren als Chipentwickler und einer darauf folgenden Promotion in Neurowissenschaften das Unternehmen Nervana gegründet, das Intel im August 2016 übernahm.

Intels Lake Crest erinnert an Camerons Terminator

Inhalt:
  1. Lake Crest: Intels Terminator-Chip mit Terabyte-Bandbreite
  2. Vier Stacks schaffen 1 TByte pro Sekunde

Folglich ist Lake Crest die Hardware, auf der die von Nervana entwickelten neuronalen Netze laufen sollen. Bisher werden für solche Anwendungen meist FPGAs genutzt, auch solche von Intel - denn den FPGA-Hersteller Altera hatte Intel ebenfalls aufgekauft, und zwar noch vor Nervana. Der Vorteil der Hardware-Netze gegenüber den programmierbaren FPGAs soll vor allem darin liegen, dass sich ein Chip wie Lake Crest zur Laufzeit an den Code anpasst. Er lernt also auf Hardwareebene dazu und wird immer schneller.

Diesen lernenden Computer hatte James Cameron seinen Terminator im zweiten Teil der Filmserie bereits 1991 beschreiben lassen. Eine weitere Parallele zur Science-Fiction: Intel wählt als Symbolgrafik eine dem Terminator-Chip verblüffend ähnliche Darstellung mit Würfeln, die die Rechenknoten (Nodes) darstellen sollen, die an allen Innenseiten untereinander verbunden sind.

Diese Verbindung ist auch eine der größten Neuerungen von Lake Crest, denn die zwölf Rechenwerke sind direkt an alle anderen über bidirektionale Links mit 100 Gigabit pro Sekunde verbunden. Noch höher ist die Speicherbandbreite, denn mit vier 8-GByte-Modulen aus je einem HBM2-Speicherstapel ist insgesamt ein Terabyte pro Sekunde möglich. Folglich kommt Lake Crest auf 32 GByte eigenen Speicher, den sich die Recheneinheiten teilen müssen.

  • Links der vermeintliche Die-Shot von Lake Crest, es handelt sich aber um einen Haswell-EP (Foto: Nico Ernst)
  • Die 8 Terabit pro Sekunde ergeben sich durch vier HBM2-Stapel (Foto: Nico Ernst)
  • Ein Speicherkanal für jede Recheneinheit (Foto: Nico Ernst)
  • Blockdiagramm von Lake Crest mit zwölf Rechenwerken (Foto: Nico Ernst)
  • Intels Roadmap für AI-Beschleuniger (Foto: Nico Ernst)
Links der vermeintliche Die-Shot von Lake Crest, es handelt sich aber um einen Haswell-EP (Foto: Nico Ernst)
Stellenmarkt
  1. über experteer GmbH, München
  2. UnternehmerTUM GmbH, Garching bei München

Diese Rechenwerke bezeichnet Intel nicht als Cores, sondern als Processing Cluster, zwölf davon sind vorhanden. Der Begriff Cluster deutet darauf hin, dass wie bei einer GPU einer der Cluster aus mehreren kleineren Einheiten besteht. Im Fall von GPUs sind das Arithmetik-Einheiten (ALUs), die Zahl dieser wiederum wird bei Grafikkarten als Marketing-Argument oft Shader genannt. Den Rekord hält hier bisher AMD mit 4.096 ALUs auf dem Fiji-Chip der Radeon Fury X.

Vier Stacks schaffen 1 TByte pro Sekunde 
  1. 1
  2. 2
  3.  


Anzeige
Top-Angebote
  1. (u. a. DOOM 7,99€, Lords of the Fallen - Game of the Year Edition 3,99€, Dawn of War III 16...
  2. 864,99€ mit Gutschein: Z650 (Vergleichspreis 964,98€)
  3. 199€ für Prime-Mitglieder
  4. 399€ (Vergleichspreis 469€)

Neuro-Chef 04. Feb 2017

Nein, aber des Golems Forum kürzt Links und eingebundene Bilder auf eine IMHO ziemlich...

xmaniac 03. Feb 2017

...aber die letzten Versuche etwas mit den Hochleistungs GPUs gleichzusetzen endeten...

m.lettrich 03. Feb 2017

Also was ich hier sehe ist eine Konsequente Entwicklung eines Produkts für hohen...

Anonymer Nutzer 03. Feb 2017

Dann schick mir bitte einen anatomisch korrekten TX. Danke :-p

Grisu__ 02. Feb 2017

Im ersten Bild links (Bildunterschrift "WORKLOAD OPTIMIZED HARDWARE"). Da sieht man sehr...


Folgen Sie uns
       


Cue Roboter - Test

Wir hatten Spaß mit dem frechen Cue.

Cue Roboter - Test Video aufrufen
Ryzen 5 2600X im Test: AMDs Desktop-Allrounder
Ryzen 5 2600X im Test
AMDs Desktop-Allrounder

Der Ryzen 5 2600X ist eine der besten sechskernigen CPUs am Markt. Für gut 200 Euro liefert er die gleiche Leistung wie der Core i5-8600K. Der AMD-Chip hat klare Vorteile bei Anwendungen, das Intel-Modell in Spielen.
Ein Test von Marc Sauter

  1. Golem.de-Livestream Wie gut ist AMDs Ryzen 2000?
  2. RAM-Overclocking getestet Auch Ryzen 2000 profitiert von schnellem Speicher
  3. Ryzen 2400GE/2200GE AMD veröffentlicht sparsame 35-Watt-APUs

Wonder Workshop Cue im Test: Der Spielzeugroboter kommt ins Flegelalter
Wonder Workshop Cue im Test
Der Spielzeugroboter kommt ins Flegelalter

Bislang herrschte vor allem ein Niedlichkeitswettbewerb zwischen populären Spiel- und Lernrobotern für Kinder, jetzt durchbricht ein Roboter für jüngere Teenager das Schema nicht nur optisch: Cue fällt auch durch ein eher loseres Mundwerk auf.
Ein Test von Alexander Merz


    SpaceX: Rundum verbesserte Falcon 9 fliegt zum ersten Mal
    SpaceX
    Rundum verbesserte Falcon 9 fliegt zum ersten Mal

    Landen, Auftanken und 24 Stunden später wieder starten. Das will SpaceX mit der neusten und endgültigen Version der Falcon-9-Rakete erreichen. In der letzten Nacht hat sie erfolgreich einen Satelliten für Bangladesch in den Orbit gebracht.
    Von Frank Wunderlich-Pfeiffer


        •  /