• IT-Karriere:
  • Services:

Via Technologies: Centaur zeigt x86-Chip mit AI-Block

Acht CPU-Kerne und ein integrierter Coprozessor für künstliche Intelligenz: Centaur meldet sich nach Jahren mit einem x86-System-on-a-Chip zurück. Das Server-Design unterstützt AVX-512 und ist sehr schnell bei Inferencing.

Artikel veröffentlicht am ,
Block des NCORE für künstliche Intelligenz
Block des NCORE für künstliche Intelligenz (Bild: Centaur)

Centaur hat erstmals seit dem Isaiah alias Nano einen neuen x86-Prozessor vorgestellt (PDF): Das CHA-Design hat acht Kerne, die mit Blick auf den Servereinsatz entwickelt wurden, und enthält einen Coprozessor für Inferencing, also das Ausführen bereits trainierter neuronaler Netze für künstliche Intelligenz.

Stellenmarkt
  1. Stadtwerke München GmbH, München
  2. Damovo Deutschland GmbH & Co. KG, Düsseldorf

Der Chip misst laut Centaur weniger als 195 mm², er wird im 16FFC-Verfahren (FinFet Compact) beim weltgrößten Auftragsfertiger TSMC produziert. Er hat 44 PCIe-Lanes unbekannter Geschwindigkeit und bezieht Daten über vier DDR4-3200-Kanäle. Im SoC stecken acht x86-Kerne namens CNS, sie sollen eine hohe Leistung pro Takt (Instructions per Cycle, IPC) aufweisen und derzeit mit 2,5 GHz laufen. Die Cores beherrschen die AVX-512- und die Bfloat16-Befehle, teilen sich 16 MByte L3-Cache und sind per Ringbus verknüpft.

Ebenfalls am Ringbus als eigener Block hängt der AI-Coprozessor, er heißt NCORE. Mit 16FCC kommt der Beschleuniger auf 34,4 mm² der unter 195 mm². Der Block soll immerhin 20 Teraops und 20 TByte/s erreichen: Hier teilt Centaur den NCORE in zwei 8er-Segmente auf, zusammen haben sie satte 16 MByte lokalen Speicher und sind extreme 32.768 Bit breit. Damit lassen sich 4.096 Berechnungen in einem Takt erledigen, was in einer sehr kurzen Latenz für Inferencing resultiert, wichtig etwa für Sprache.

  • Präsentation zum CHA-Design (Bild: Centaur)
  • Präsentation zum CHA-Design (Bild: Centaur)
  • Präsentation zum CHA-Design (Bild: Centaur)
  • Präsentation zum CHA-Design (Bild: Centaur)
  • Präsentation zum CHA-Design (Bild: Centaur)
  • Präsentation zum CHA-Design (Bild: Centaur)
  • Präsentation zum CHA-Design (Bild: Centaur)
  • Präsentation zum CHA-Design (Bild: Centaur)
  • Präsentation zum CHA-Design (Bild: Centaur)
Präsentation zum CHA-Design (Bild: Centaur)

Mit einem frühen Software-Stack, der kaum einen Monat als ist, hat Centaur mit dem CHA-Design den MLPerf-Benchmark durchgeführt: Ein Bild wird in weniger als 330 ms klassifiziert (MobileNet-v1 Stream), was einen Rekord darstellt - der Durchsatz entspricht grob 23 aktuellen Intel-CLX-SP-Kernen (MobileNet-v1 Offline). Die meisten anderen Systeme benötigen dafür eine Host-CPU, an die per PCIe externe Beschleuniger wie Intels NNP-T1000 oder Googles TPU v3 angeschlossen sind. Wann der CHA erscheinen soll, sagte Centaur nicht - ein System gibt es auf der ISC East 2019 in New York City zu sehen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Spiele-Angebote
  1. (-28%) 17,99€
  2. (-79%) 5,99€
  3. (-72%) 8,50€
  4. 52,99€

abufrejoval 19. Nov 2019 / Themenstart

Das sieht nach einer wirklich überzeugenden Kombination von Energieeffizienz und...

hansenhawk 19. Nov 2019 / Themenstart

...mit etwas tatsächlich konkurrenzfähigem um die Ecke kommen. Auch wenne s sein...

Kommentieren


Folgen Sie uns
       


Apple TV Plus ausprobiert

Wir haben uns Apple TV+ auf einem Apple TV angeschaut. Apples eigener Abostreamingdienst lässt viele Komfortfunktionen vermissen.

Apple TV Plus ausprobiert Video aufrufen
Videoüberwachung: Kameras sind überall, aber nicht überall erlaubt
Videoüberwachung
Kameras sind überall, aber nicht überall erlaubt

Dass Überwachungskameras nicht legal eingesetzt werden, ist keine Seltenheit. Ob aus Nichtwissen oder mit Absicht: Werden Privatsphäre oder Datenschutz verletzt, gehören die Kameras weg. Doch dazu müssen sie erst mal entdeckt, als legal oder illegal ausgemacht und gemeldet werden.
Von Harald Büring

  1. Nach Attentat Datenschutzbeauftragter kritisiert Hintertüren in Messengern
  2. Australien IT-Sicherheitskonferenz Cybercon lädt Sprecher aus
  3. Spionagesoftware Staatsanwaltschaft ermittelt nach Anzeige gegen Finfisher

Radeon RX 5500 (4GB) im Test: AMDs beste 200-Euro-Karte seit Jahren
Radeon RX 5500 (4GB) im Test
AMDs beste 200-Euro-Karte seit Jahren

Mit der Radeon RX 5500 hat AMD endlich wieder eine sparsame und moderne Mittelklasse-Grafikkarte im Angebot. Verglichen mit Nvidias Geforce GTX 1650 Super reicht es zum Patt - aber nicht in allen Bereichen.
Ein Test von Marc Sauter

  1. Workstation-Grafikkarte AMDs Radeon Pro W5700 hat USB-C-Anschluss
  2. Navi-Grafikeinheit Apple bekommt Vollausbau und AMD bringt RX 5300M
  3. Navi-14-Grafikkarte AMD stellt Radeon RX 5500 vor

Mikrocontroller: Sensordaten mit Micro Python und ESP8266 auslesen
Mikrocontroller
Sensordaten mit Micro Python und ESP8266 auslesen

Python gilt als relativ einfach und ist die Sprache der Wahl in der Data Science und beim maschinellen Lernen. Aber die Sprache kann auch anders. Mithilfe von Micro Python können zum Beispiel Sensordaten ausgelesen werden. Ein kleines Elektronikprojekt ganz ohne Löten.
Eine Anleitung von Dirk Koller

  1. Python Trojanisierte Bibliotheken stehlen SSH- und GPG-Schlüssel
  2. Programmiersprache Python verkürzt Release-Zyklus auf ein Jahr
  3. Programmiersprache Anfang 2020 ist endgültig Schluss für Python 2

    •  /