Tachyum Prodigy T16128: Der Wunderkind-Prozessor

Effizienter und schneller als die Konkurrenz: Tachyum verspricht bei der Prodigy-CPU sehr viel, im Interview legt der CEO noch einmal nach.

Ein Bericht von veröffentlicht am
Rado Danilak, CEO von Tachyum, mit zwei Prodigy-FPGA-Systemen
Rado Danilak, CEO von Tachyum, mit zwei Prodigy-FPGA-Systemen (Bild: Tachyum)

Ein Chip, der die drei- bis vierfache Geschwindigkeit eines 40-kernigen Intel Xeon oder 64-kernigen AMD Epyc erreichen und obendrein das Sechsfache von Nvidias noch nicht einmal verfügbarem H100-Hopper-Beschleuniger leisten soll? Der Prodigy (Wunderkind) ist genau dieses Design, das alle anderen schlägt, wenn man Tachyum glauben will - mehr noch: Es soll sich gar um den weltweit ersten universalen Prozessor handeln.

Wir haben mit Rado Danilak gesprochen, dem CEO von Tachyum. Wenn es um Prozessoren geht, kennt er sich aus: Danilak hat sie bei Nvidia und Toshiba entworfen und Sandforce und Skyera mitgegründet und verkauft. Mit im Team sind erfahrene Leute wie Rodney Mullendore als Chief Architect und Igor Shevlyakov als Software-VP, beratend tätig sind unter anderen Fred Weber (AMD64) und Steve Furber (ARM1).

Neu ist der Prodigy-Prozessor nicht, er wurde bereits auf der Hot Chips 2018 (PDF) vorgestellt und war mit seinen 64 Kernen sowie hohen Performance-Angaben schon damals beeindruckend. Im Laufe der Jahre verdoppelte sich vermeintlich die Anzahl der Cores und die Breite der Vectoreinheiten. "Tatsächlich haben wir vom ersten Tag an mit 128 Kernen geplant, es aber nicht vorab öffentlich kommuniziert", sagt Danilak.

128 Kerne und zwölf DDR5-Kanäle schon vor Prodigy

Das hatte mehrere nachvollziehbare Aspekte: "Einerseits wollten wir bei einer Verzögerung weiterhin vor der Konkurrenz liegen, andererseits sollte es nicht heißen: 'Ihr seid doch verrückt', zumal wir das Design auch von Beginn an für 16 DDR5-Speichercontroller ausgelegt haben", ergänzt er. Das frühzeitig mitzuteilen, hätte eventuell für Kontroversen gesorgt, etwa, was das durchaus komplexe Routing auf dem Mainboard betrifft.

  • Prodigy soll das Beste aus CPU, GPU und TPU vereinen. (Bild: Tachyum)
  • Überblick zum Prodigy mit bis zu 128 Kernen (Bild: Tachyum)
  • Geplant sind 2U-Blades mit vier CPUs und DDR5. (Bild: Tachyum)
  • Die Software muss für den Prodigy angepasst werden. (Bild: Tachyum)
  • Die Integer-Leistung des T16128 soll weit über der anderer CPUs liegen. (Bild: Tachyum)
  • Nvidias H100 soll bei FP64 und FP8 geschlagen werden. (Bild: Tachyum)
  • Googles TPU v4 soll selbst mit BF16 chancenlos sein. (Bild: Tachyum)
  • Auch auf Rack-Ebene soll der T16128 weit vor dem H100 liegen. (Bild: Tachyum)
  • Leistung pro Dollar und Leistung pro Watt sehen stark aus. (Bild: Tachyum)
  • Der Prodigy 2 steht bereits auf der Roadmap. (Bild: Tachyum)
Prodigy soll das Beste aus CPU, GPU und TPU vereinen. (Bild: Tachyum)
KerneTaktSpeicherPCIeTDPWorkloads
Prodigy T16128-AIX1285,7 GHz16x DDR5-7200Gen5 x64950WHighend AI/HPC
Prodigy T16128-AIM1284,5 GHz16x DDR5-7200Gen5 x64700WMidrange AI/HPC
Prodigy T16128-AIE1284,0 GHz16x DDR5-7200Gen5 x64600WEntry AI/HPC
Prodigy T16128-HT1284,5 GHz16x DDR5-6400Gen5 x64300WThroughput
Prodigy T864-HS645,7 GHz8x DDR5-6400Gen5 x32300WSpeed
Prodigy T864-HT644,5 GHz8x DDR5-6400Gen5 x32300WEfficiency
Prodigy T832-HS325,7 GHz8x DDR5-6400Gen5 x32300WEntry Level
Prodigy T832-LP323,2 GHz8x DDR5-4800Gen5 x32180WLow Power
Spezifikationen des Tachyum Prodigy
Stellenmarkt
  1. Junior Data Analyst (w/m/d) für Gewerbeimmobilien
    Avison Young - Germany GmbH, Frankfurt am Main, Hamburg, Berlin
  2. Softwareentwickler C# für Laborgeräte - Partikelmesstechnik (m/w/d)
    Microtrac Retsch GmbH, Haan (Home-Office möglich)
Detailsuche

Praktisch sind mittlerweile 128 CPU-Kerne verfügbar, konkret bei Alibabas Yitian 710 und bei Amperes Altra Max. Zwölf DDR5-Kanäle werden in Bälde als Standard verfügbar sein, wenn AMD die Epyc 7004 (Genoa) veröffentlicht. 2023 folgen ARM-basierte Prozessoren mit mindestens 144 Kernen, die Grace-CPU von Nvidia etwa. Hier befindet sich allerdings LPDDR5X mit auf dem Package, keine DDR5-Module wie bei AMD.

Die besten Prozessoren

Bei den Cores an sich geht Tachyum ohnehin einen Sonderweg, da weder ARM noch x86, sondern gleich eine eigene Befehlssatzarchitektur (ISA) verwendet wird. Besonders wichtig ist dem Team dabei, sehr hohe Frequenzen zu erreichen und gleichzeitig möglichst viele Daten lokal vorhalten zu können. Seit dem Pentium 4 (Netburst) mit 3,8 GHz sind die Taktraten in den vergangenen 20 Jahren bei signifikant besserer Leistung pro Zyklus (IPC) zwar auf derzeit immerhin 5,5 GHz gestiegen - aber eben nicht mehr.

Laut Danilak ist einer der Hauptgründe dafür die Verschaltung der Transistoren, also die Interconnects/Wires in den Metall-Layern unterhalb der Finfets. Durch neuere Materialien wie Low-k-Dielektrikum und später Kobalt wurde die Geschwindigkeit signifikant verbessert, dennoch kostet die Kommunikation zwischen den einzelnen Funktionseinheiten sehr viel mehr Zeit als die eigentlichen Berechnungen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
Mit äußerst breiten Einheiten zum Erfolg 
  1. 1
  2. 2
  3. 3
  4. 4
  5.  


rtlgrmpf 10. Jun 2022 / Themenstart

VLIW ist nicht das Problem. EPIC ist das Problem. Beim Lesen des Artikels hab ich nur...

KlugKacka 10. Jun 2022 / Themenstart

ügbar sein soll, ziemlich unglaubwürdig. Und? Muss denn eine andere Architektur emuliert...

Sharra 10. Jun 2022 / Themenstart

Bis zu dem Punkt an dem klar wird, dass die größte Kiste Wasserkühlung braucht und 1KW...

Morons MORONS 10. Jun 2022 / Themenstart

Keine Ahnung. Aber Skyrim wurde garantiert schon portiert.

Kommentieren



Aktuell auf der Startseite von Golem.de
Klima-Ticket
Bund plant Nachfolger für Neun-Euro-Ticket

Das Neun-Euro-Ticket könnte als Klimaticket weiterlaufen. Das geht aus einem Vorschlag für ein neues Klimaschutzsofortprogramm hervor.

Klima-Ticket: Bund plant Nachfolger für Neun-Euro-Ticket
Artikel
  1. Vitali Klitschko: Zweifel an Giffeys Deepfake-These
    Vitali Klitschko
    Zweifel an Giffeys Deepfake-These

    Die Berliner Staatskanzlei spricht von einem Deepfake beim Gespräch zwischen Bürgermeisterin Franziska Giffey und dem falschen Klitschko. Nun gibt es eine neue These.

  2. Feuerwehr: E-Auto-Brand zerstört Haus - Photovoltaik erschwert Löschen
    Feuerwehr
    E-Auto-Brand zerstört Haus - Photovoltaik erschwert Löschen

    Feuerwehrleute in Hessen hatten Probleme, einen Elektroauto-Brand, der auf ein Wohngebäude übergriff, zu löschen. Auf dem Dach befand sich Photovoltaik.

  3. Studie VW ID.Aero vorgestellt: Elektrischer Passat soll 620 km weit kommen
    Studie VW ID.Aero vorgestellt
    Elektrischer Passat soll 620 km weit kommen

    Nach der elektrischen Kompaktklasse und SUVs legt VW nun mit einer Limousine nach. Die Studie ID.Aero erinnert sehr stark an ein Verbrennermodell.
    Ein Bericht von Friedhelm Greis

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • MSI 32" WQHD 165 Hz günstig wie nie: 399€ • Saturn-Fundgrube: Restposten zu Top-Preisen • MindStar (AMD Ryzen 9 5900X 375€, Gigabyte RX 6900 XT 895€) • Samsung Galaxy Watch 4 Classic 46 mm 205€ [Werbung]
    •  /