Der lang gesuchte Schlüssel zum Erfolg?
Bislang sind hochparallele Architekturen, mit Ausnahme von GPUs und Spezialprozessoren etwa für KI, ausnahmslos gescheitert. Den Anspruch, CPUs, GPUs, oft auch DSPs (Digitale Signaprozessoren) und FPGAs (Field Programmable Gate Arrays) zu vereinheitlichen, konnte keine erfüllen. Ubitiums Ansatz sieht hier vielversprechend aus, erkauft seine Flexibilität aber mit ineffizienterer Flächennutzung. Ob die Rechnung dennoch aufgeht, wird der erste Chip zeigen.
Für dessen Entwicklung konnte das Start-up bislang 3,7 Millionen Euro einsammeln, mit weiterem Geld soll im Laufe des Jahres das Tape-out eines weiteren Chips erfolgen. Die Serienfertigung soll dann 2027 starten.
Laut Ubitium gebe es großes Interesse, insbesondere für die Verarbeitung von Radar- und Lidar-Daten. Hier würden aktuell hauptsächlich GPUs genutzt, allerdings recht ineffizient, so CEO Cho zu Embedded.com. Ubitium könne die erforderliche Parallelität für die digitale Signalverarbeitung bieten und gleichzeitig effizient KI-Modelle abbilden. Dabei wird nur ein Software-Stack genutzt, verschiedene Entwicklungsteams entfallen.
Die erste Generation ist ein kleiner Chip
Der Chip UB410 soll auf eine KI-Rechenleistung von 25 bis 30 TOPS bei ungenanntem Datentyp kommen. Die Gleitkommarechenleistung soll bei mindestens 12 TFlops, mutmaßlich 32 Bit (FP32), liegen. Die Leistungsaufnahme soll dabei unter 5 Watt liegen, bis zu 64 GByte LPDDR5-Speicher sollen sich anbinden lassen.
Durch die Nutzung von RISC-V-Kernen kann bestehende Software leicht portiert werden. Die entscheidende Frage ist, wie gut Ubitiums Parallelitätsmodi funktionieren. Laut CEO Cho lege das Start-up seinen Fokus daher stark auf Software.
Aufbau auf altem Konzept
Ubitium greift mit seinem Design Konzepte von Pact XPP auf, dessen gleichnamige Architektur 2000 vorgestellt wurde. Dabei handelt es sich ebenfalls um ein rekonfigurierbares Prozessor-Design mit Datenflussarchitektur, das allerdings eher an das Konzept von Flow Computing erinnert. Eine ältere Präsentation (PDF)(öffnet im neuen Fenster) zeigt, dass Pact XPP zwei verschiedene Arten von Kernen für sequenziellen und parallelen Code nutzte.
Die Kerne für parallele Verarbeitung, als XPP-Array bezeichnet, nutzten VLIW (Very Long Instruction Word). VLIW-Architekturen erwiesen sich als problematisch, da der Compiler die Arbeit übernehmen muss, welche die OoO-Logik zur Laufzeit erledigt. Praktisch funktionierte das in vielen Anwendungsfällen nicht gut, woran etwa Intels Itanium scheiterte.
Martin Vorbach, der Gründer von Pact XPP, ist CTO bei Ubitium – er ist einer von drei Gründern. Der dritte neben Vorbach und CEO Cho, Peter Weber, ist ein alter Weggefährte von Vorbach – der einst wegen ausstehender Honorare gegen Pact XPP klagte ( Unterlagen zum Berufungsverfahren, PDF(öffnet im neuen Fenster) ).