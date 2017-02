Interposer, HBM2, ein neuartiges Netz direkt im Chip: Intel steckt im Moment viel Knowhow in Lake Crest. Es ist der erste von Grund auf neu entwickelte Beschleuniger für künstliche Intelligenz (AI) des Unternehmens. Lake Crest hatte Intel auf seinem ersten AI-Day in San Francisco angekündigt, nun durfte sein Entwickler Naveen Rao in München erste Details zum Aufbau und zur Architektur verraten. Rao hatte nach zehn Jahren als Chipentwickler und einer darauf folgenden Promotion in Neurowissenschaften das Unternehmen Nervana gegründet, das Intel im August 2016 übernahm.

Anzeige

Intels Lake Crest erinnert an Camerons Terminator

Folglich ist Lake Crest die Hardware, auf der die von Nervana entwickelten neuronalen Netze laufen sollen. Bisher werden für solche Anwendungen meist FPGAs genutzt, auch solche von Intel - denn den FPGA-Hersteller Altera hatte Intel ebenfalls aufgekauft, und zwar noch vor Nervana. Der Vorteil der Hardware-Netze gegenüber den programmierbaren FPGAs soll vor allem darin liegen, dass sich ein Chip wie Lake Crest zur Laufzeit an den Code anpasst. Er lernt also auf Hardwareebene dazu und wird immer schneller.

Diesen lernenden Computer hatte James Cameron seinen Terminator im zweiten Teil der Filmserie bereits 1991 beschreiben lassen. Eine weitere Parallele zur Science-Fiction: Intel wählt als Symbolgrafik eine dem Terminator-Chip verblüffend ähnliche Darstellung mit Würfeln, die die Rechenknoten (Nodes) darstellen sollen, die an allen Innenseiten untereinander verbunden sind.

Diese Verbindung ist auch eine der größten Neuerungen von Lake Crest, denn die zwölf Rechenwerke sind direkt an alle anderen über bidirektionale Links mit 100 Gigabit pro Sekunde verbunden. Noch höher ist die Speicherbandbreite, denn mit vier 8-GByte-Modulen aus je einem HBM2-Speicherstapel ist insgesamt ein Terabyte pro Sekunde möglich. Folglich kommt Lake Crest auf 32 GByte eigenen Speicher, den sich die Recheneinheiten teilen müssen.











Diese Rechenwerke bezeichnet Intel nicht als Cores, sondern als Processing Cluster, zwölf davon sind vorhanden. Der Begriff Cluster deutet darauf hin, dass wie bei einer GPU einer der Cluster aus mehreren kleineren Einheiten besteht. Im Fall von GPUs sind das Arithmetik-Einheiten (ALUs), die Zahl dieser wiederum wird bei Grafikkarten als Marketing-Argument oft Shader genannt. Den Rekord hält hier bisher AMD mit 4.096 ALUs auf dem Fiji-Chip der Radeon Fury X.