Project Brainwave: Microsoft beschleunigt KI-Technik mit Cloud-FPGAs

Statt auf fest verdrahtete ASICs, wie Googles TPU, setzt Microsoft für sein Azure-Cloud-Geschäft auf flexiblere FPGAs. Mit diesen sollen künftig Machine-Learning-Modelle beschleunigt werden, um "Echtzeit-KI" bereitzustellen.

Artikel veröffentlicht am ,
Eines der FPGA-Boards von Microsofts Project Brainwave
Eines der FPGA-Boards von Microsofts Project Brainwave (Bild: Microsoft)

Die wohl am weitesten verbreitete Möglichkeit, maschinelles Lernen zu beschleunigen, ist die Verwendung von Grafikkarten. Einige Hersteller setzen inzwischen aber fest verdrahtete ASICs, wie etwa Google mit seinen TPU, zum Anwenden und Trainieren von Modellen. Microsoft will unter dem Projektnamen Brainwave künftig für derartige Einsatzgebiete auf FPGAs in seiner Azure Cloud zurückgreifen.

Stellenmarkt
  1. SAP-Inhouse-ABAP-Entwickler (Logistik) (m/w/d)
    Hays AG, München
  2. Referent (m/w/d) HR-Systeme und Prozesse
    WITRON Gruppe, Parkstein
Detailsuche

In der Ankündigung heißt es, dass damit "Echtzeit-KI" ermöglicht werden soll, wobei entsprechende Daten möglichst schnell von dem System verarbeitet werden. Microsoft setzt hierfür auf drei verschiedene Bestandteile: eine leistungsfähige Cloud-Architektur, eine in den FPGAs synthetisierte Engine für neuronale Netze sowie einen Compiler und eine Laufzeitumgebung, um trainierte Modelle auszurollen.

Direkt ans Netzwerk angebunden

Die FPGAs werden als PCIe-Karten in den Servern untergebracht, werden aber über eigene Schnittstellen direkt mit dem Netzwerk des Rechenzentrums verbunden, so dass die CPU der Server umgangen werden kann. Ebenso lassen sich die so verfügbaren FPGAs leicht zu Pools zusammenschließen. Google verfolgt für die Anbindung seiner TPUs eine ähnliche Strategie.

Zur Umsetzung der neuronalen Netze in den FPGAs greift Microsoft auf das Konzept des sogenannten Soft-Prozessors zurück. Diese DPU (Deep Neural Network Processing Unit) seien im Vergleich zu ASICs flexibler, da zum Zeitpunkt der DPU-Synthese zwischen verschiedenen Datentypen gewählt werden kann. Darüber hinaus können dank der FPGAs Neuerungen im Bereich des maschinellen Lernens innerhalb von nur wenigen Wochen in den Rechenzentren ausgerollt werden.

Breite Unterstützung für Software und Modelle

Golem Akademie
  1. Cloud Computing mit Amazon Web Services (AWS)
    29. November-1. Dezember 2021, Online
  2. Linux-Shellprogrammierung
    2.-5. November 2021, online
  3. PostgreSQL Fundamentals
    6.-9. Dezember 2021, online
Weitere IT-Trainings

Brainwave könne bisher für Machine-Learning-Anwendungen genutzt werden, die mit Microsofts Cognitive Toolkit umgesetzt worden sind oder mit Googles Tensorflow. Die Unterstützung für weitere Frameworks soll folgen. Die Modelle werden dann zunächst in eine Graph-Repräsentation überführt und anschließend für die Brainwave-Infrastruktur kompiliert.

Microsoft hebt außerdem hervor, dass sich das FPGA-System nicht nur für die leicht parallelisierbaren Convolutional Neural Networks (CNN) einsetzen lasse, sondern insbesondere auch für die Beschleunigung von rekurrenten neuronalen Netzen (RNN) wie LSTMs oder jenen mit GRUs. RNNs enthalten eine Art Rückkanal und werden etwa zur Verarbeitung natürlicher Sprache verwendet.

Fast 40 TOPS dank Altera-FPGAs

Als FPGA-Hardware verwendet Microsoft die Stratix 10 der Intel-Tochter Altera. Laut Hersteller bieten die Chips eine Rechengeschwindigkeit von 10 Teraflops bei einfacher Genauigkeit (FP32). Den Tests von Microsoft zufolge erreicht das Brainwave-System beim Ausführen eines GRU-Modells gar fast 40 Teraflops bei reduzierter Genauigkeit von 8-Bit (FP8), die im Machine-Learning teilweise üblich ist.

Zum Vergleich: Die zweite Generation von Googles TPU, die auch über die Google-Cloud genutzt werden können, bietet pro Board 180 Teraops (INT8) und damit pro ASIC theoretisch rund 45 Teraops.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Datenleck
Daten von 106 Millionen Thailand-Reisenden geleakt

In einer ungeschützten Datenbank fanden sich die Daten der Thailand-Reisenden aus den letzten zehn Jahren - inklusive Reisepassnummern.

Datenleck: Daten von 106 Millionen Thailand-Reisenden geleakt
Artikel
  1. Laserbeamer: Xiaomis Kurzdistanzprojektor kostet unter 1.500 Euro
    Laserbeamer
    Xiaomis Kurzdistanzprojektor kostet unter 1.500 Euro

    Der Fengmi R1 kann aus der Nähe Bilder von 50 bis 200 Zoll aufspannen und kostet relativ wenig. Dafür macht er bei der Auflösung Abstriche.

  2. Unter 100 MBit/s: Bundesland fürchtet Graue-Flecken-Förderung zu verpassen
    Unter 100 MBit/s
    Bundesland fürchtet Graue-Flecken-Förderung zu verpassen

    Sachsen will mehr FTTH, gerade für ländliche Regionen. Doch der Wirtschaftsminister befürchtet, dass andere Bundesländer schneller sind.

  3. WLAN und 6 GHz: Was bringt Wi-Fi 6E?
    WLAN und 6 GHz
    Was bringt Wi-Fi 6E?

    Der Standard Wi-Fi 6E erweitert WLAN das erste Mal seit Jahren um ein neues Frequenzband. Das hat viele Vorteile und ein paar Nachteile.
    Von Oliver Nickel

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Asus 23,8" FHD 144Hz 166,90€ • PS5 bei Amazon zu gewinnen • Gaming-PC mit Ryzen 5 & RTX 3060 999€ • Corsair MP600 Pro 1TB mit Heatspreader PS5-kompatibel 162,90€ • Alternate (u. a. Asus WLAN-Adapter PCIe 24,90€) • MM-Prospekt (u. a. Asus TUF 17" i5 RTX 3050 1.099€) [Werbung]
    •  /