Original-URL des Artikels: https://www.golem.de/news/tachyum-prodigy-kleiner-supercomputer-chip-soll-intels-xeons-schlagen-1808-136124.html    Veröffentlicht: 22.08.2018 13:55    Kurz-URL: https://glm.io/136124

Tachyum Prodigy

Kleiner Supercomputer-Chip soll Intels Xeons schlagen

Der Prodigy von Tachyum ist ein In-Order-Design mit 64 Kernen und acht Speicherkanälen für Datacenter. Der 7-nm-Chip eignet sich für Cloud-Server und kann in Ruhephasen zudem künstliche Intelligenz berechnen.

Tachyum hat mit dem Prodigy einen Chip vorgestellt, der für große Datacenter gedacht ist und dort Intels Xeon in praktisch allen relevanten Metriken wie Effizienz oder Performance überlegen sein soll. Das Prodigy-Design gibt es in zwei Ausführungen, beide werden im 7-nm-Node bei der TSMC gefertigt. Das Tape-out ist für 2019 angesetzt, die Chips dürften also frühestens 2020 mit Intels Cooper Lake und Ice Lake konkurrieren. Sie sollen eine sehr hohe Single- und Multithreading-Leistung mit guter AI-Geschwindigkeit kombinieren.

Der Prodigy ist ein 290 mm² großes Die mit zwölf Metal-Layern und einer TDP von 180 Watt bei 4 GHz. Es integriert 64 CPU-Kerne, acht Speicherkanäle mit ECC für DDR4 und DDR5 sowie zwei weitere für High Bandwidth Memory v3. Hinzu kommen gleich 72 PCIe-Gen5-Lanes und zwei 400-GBit-Ethernet-Ports. Das Design mit eigener ISA ist als In-Order ausgelegt und benötigt Unterstützung durch den Compiler, um eine Out-of-Order-Ausführung umzusetzen. Tachyum betont, dass zuerst der Compiler entwickelt wurde und dann die Hardware - anders als bei Intels geflopptem Itanium, welcher extrem abhängig von Optimierungen auf VLIW ist.

Ein Blick auf die einzelnen Chip-Bestandteile zeigt ein recht typisches Frontend, welches unter anderem acht RISC-ähnliche Befehle an die Ausführungseinheiten schickt. Die bestehen aus drei Integer-ALUs und fünf Vector-Units für zwei 512-Bit-MADDs oder drei 512-Bit-Integer-Operationen. Tachyum spricht bei 64 Kernen und 4 GHz folglich von 128 Teraflops bei FP16-Genauigkeit. Der Chip unterstützt zudem INT8 und Matrix-Multiplikationen für Machine Learning.

Tachyum spricht von einer höheren Leistung pro Core, welche der Prodigy verglichen mit einem Xeon E5-2687W v5 in SpecFP 2006 und SpecInt 2006 erreicht. Werte der 2017er-Version mit händisch optimiertem GCC 7.2 möchte der Hersteller nächstes Jahr liefern, eventuell reicht es dann auch für einen schnelleren Skylake-SP von Intel. Als Vorteil des Prodigy sieht Tachyum dessen AI-Fähigkeiten an, weil beispielsweise Amazons CPU-basierte EC2-Instanzen ohne Beschleuniger zu weniger als 40 Prozent ausgelastet sind. In den Ruhephasen könnten die Systeme als AI-Instanzen konfiguriert werden.

Wir sind skeptisch, Tachyums Prodigy-Chip das liefern kann, was das Startup verspricht. Zumindest der 7-nm-Prozess bei der TSMC läuft, allerdings ist ein knapp 300 mm² großes Server-Die eben kein 100-mm²-SoC für Millionen von iPhones.  (ms)


© 1997–2019 Golem.de, https://www.golem.de/