Abo
  • IT-Karriere:

Knights Mill: Intel hat drei Xeon Phi für Deep Learning

Die Xeon Phi Knights Mill sind speziell für Deep Learning ausgelegt: Die gesockelten Prozessoren haben bis zu 72 Kerne und spezielle Instruktionen, die VNNI. Die hohe Geschwindigkeit geht mit einer Verlustleistung von bis zu 320 Watt einher.

Artikel veröffentlicht am ,
Xeon Phi Knights Mill
Xeon Phi Knights Mill (Bild: Intel)

Intel hat ohne vorherige Bekanntgabe drei neue Xeon Phi - 7295, 7285, 7235 - vorgestellt. Die Modelle wurden unter dem Codenamen Knights Mill entwickelt und stellen eine überarbeitete Version von Knights Landing alias Xeon Phi 7200 dar. Erneut handelt es sich um gesockelte Prozessoren für die Fassung LGA 3647, die eigenen HBM2-Speicher aufweisen und zusätzlich noch DDR4 über sechs Kanäle ansprechen können.

  • Knights Mill nutzt MCRAM und DDR4. (Bild: Intel)
  • Der Chip besteht erneut aus 36 Tiles und 72 Cores. (Bild: Intel)
  • Blockdiagamm eines KNM-Kerns (Bild: Intel)
  • Knights Mill erreicht doppelte FP32- und halbe FP64-Leistung, beherrscht aber auch INT16 mit vierfacher Geschwindigkeit. (Bild: Intel)
  • Möglich wird das durch vier FMAs pro Takt, ... (Bild: Intel)
  • ... die mit den passenden INT16-Instruktionen ... (Bild: Intel)
  • ... ideal für Training sind. (Bild: Intel)
  • KNL und KNM im Vergleich (Bild: Intel)
Knights Mill nutzt MCRAM und DDR4. (Bild: Intel)
Stellenmarkt
  1. Impactory GmbH, Darmstadt (Home-Office)
  2. Deloitte, verschiedene Standorte

Der Xeon Phi 7295 hat 72 Kerne bei bis zu 1,6 GHz und weist eine thermische Verlustleistung von 320 Watt auf. Darunter ist der Xeon Phi 7285 mit 68 Kernen bei bis zu 1,4 GHz und 250 Watt angesiedelt. Der Xeon Phi 7235 rechnet mit ebenfalls bis zu 1,4 GHz und 250 Watt - hat aber nur 64 Kerne. Allen CPUs gemein sind die 16 GByte HMB2-Speicher mit 500 GByte die Sekunde an Datentransferrate und die Option, bis zu 384 GByte an DDR4-2400/-2122 adressieren zu können.

Von Knights Landing auf Knights Mill hat Intel die Ausführungseinheiten umgebaut: Die FP32-Leistung (Single Precision) pro Kern und Takt ist verdoppelt, die FP64-Geschwindigkeit (Double Precision) nur noch halb so hoch. Obendrein gibt es vier der neuen VNNI-Einheiten (Virtual Neural Network Instructions), die per Flexpoint-Format arbeiten und sich für Deep Learning eignen.

Larrabee ist tot, es leben dedizierte Grafikkarten

Nach den Knights Mill ist jedoch vorerst Schluss mit Xeon Phi und damit dem Larrabee-Projekt: Der Nachfolger Knights Peak mit 10-nm- statt 14-nm-Technik wurde eingestampft, stattdessen soll Knights Cove (ICX-H) erscheinen. Dahinter verbirgt sich ein Multi-Chip-Modul aus zwei 22-Kern-Prozessoren der Ice Lake Scalable Processors (ICX-SP), also der übernächsten Xeon-Generation.

Allerdings hat Intel mit Raja Koduri einen bekannten GPU-Architekten angestellt, der dedizierte Grafikkarten entwickeln soll.



Anzeige
Spiele-Angebote
  1. (-70%) 5,99€
  2. 39,99€ (Release am 3. Dezember)
  3. (-12%) 52,99€

Folgen Sie uns
       


Golem.de hackt Wi-Fi-Kameras per Deauth

WLAN-Überwachungskameras lassen sich ganz einfach ausknipsen - Golem.de zeigt, wie.

Golem.de hackt Wi-Fi-Kameras per Deauth Video aufrufen
Atari Portfolio im Retrotest: Endlich können wir unterwegs arbeiten!
Atari Portfolio im Retrotest
Endlich können wir unterwegs arbeiten!

Ende der 1980er Jahre waren tragbare PCs nicht gerade handlich, der Portfolio von Atari war eine willkommene Ausnahme: Der erste Palmtop-Computer der Welt war klein, leicht und weitestgehend DOS-kompatibel - ideal für Geschäftsreisende aus dem Jahr 1989 und Nerds aus dem Jahr 2019.
Ein Test von Tobias Költzsch

  1. Retrokonsole Hauptverantwortlicher des Atari VCS schmeißt hin

SSD-Kompendium: AHCI, M.2, NVMe, PCIe, Sata, U.2 - ein Überblick
SSD-Kompendium
AHCI, M.2, NVMe, PCIe, Sata, U.2 - ein Überblick

Heutige SSDs gibt es in allerhand Formfaktoren mit diversen Anbindungen und Protokollen, selbst der verwendete Speicher ist längst nicht mehr zwingend NAND-Flash. Wir erläutern die Unterschiede und Gemeinsamkeiten der Solid State Drives.
Von Marc Sauter

  1. PM1733 Samsungs PCIe-Gen4-SSD macht die 8 GByte/s voll
  2. PS5018-E18 Phisons PCIe-Gen4-SSD-Controller liefert 7 GByte/s
  3. Ultrastar SN640 Western Digital bringt SSD mit 31 TByte im E1.L-Ruler-Format

Gemini Man: Überflüssiges Klonexperiment
Gemini Man
Überflüssiges Klonexperiment

Am 3. Oktober kommt mit Gemini Man ein ambitioniertes Projekt in die deutschen Kinos: Mit HFR-Projektion in 60 Bildern pro Sekunde und Will Smith, der gegen sein digital verjüngtes Ebenbild kämpft, betreibt der Actionfilm technisch viel Aufwand. Das Seherlebnis ist jedoch bestenfalls komisch.
Von Daniel Pook

  1. Filmkritik Apollo 11 Echte Mondlandung als packende Kinozeitreise

    •  /