Zum Hauptinhalt Zur Navigation

X.AI Grok-1: Das KI-Modell von Elon Musks Startup steht quelloffen

Grok-1 von X.AI hat 314 Milliarden Parameter und ist damit sehr groß. Allerdings müssen User das Large Language Model noch selbst anpassen.
/ Oliver Nickel
16 Kommentare News folgen (öffnet im neuen Fenster)
Grok-1 wird teilweise öffentlich zur Verfügung gestellt. (Bild: Pixabay.com)
Grok-1 wird teilweise öffentlich zur Verfügung gestellt. Bild: Pixabay.com / Pixabay License

Das von Elon Musk gegründete Unternehmen X.AI arbeitet seit einiger Zeit an einem eigenen allgemeinen Large Language Model. Grok-1 spezialisiert sich nicht auf eine Aufgabe und soll stattdessen als Mixture-of-Experts-Model diverse Aufgaben erfüllen können. Das Startup stellt Grok-1 nun quelloffen. Das Modell kann auf 314 Milliarden Parameter zugreifen und ist entsprechend sehr groß.

Die quelloffene Version von Grok-1 wird als Rohmodell ausgeliefert und muss deshalb von Usern auf entsprechende Tasks trainiert werden. Die Gewichte und Architektur des veröffentlichten Repositorys werden unter der Apache-2.0-Lizenz zur Verfügung gestellt. Andere Aspekte sind allerdings nicht Open Source.

Für das Training wurden vor allem Textdaten verwendet. Das Modell kann also wie etwa GPT-4 größtenteils Text generieren und interpretieren. Das Training wurde zudem auf Basis von Jax und Rust durchgeführt und schon im Oktober 2023 beendet. Möglicherweise hat das Unternehmen eine Version 2 des Modells bereits in Arbeit.

Leistungsfähiger Computer erforderlich

Die Assets des Modells können auf Github heruntergeladen(öffnet im neuen Fenster) werden. Im Repository ist auch ein Jax-Codebeispiel enthalten, das den Code für das Ausführen und Laden von Grok-1 enthält und erklärt. Die Gewichte des Modells können zudem über einen Magnet-Link per Torrent-Client heruntergeladen werden. Der Link wird zusammen mit der Dokumentation ebenfalls auf Github veröffentlicht.

Laut Hersteller ist es sinnvoll, einen Computer mit ausreichend GPU-Speicher für die Nutzung von Grok-1 mit 314 Milliarden Parametern zu verwenden - allein, um das Demo-Programm laufen zu lassen. So wird nicht jede Person in der Lage sein, mit dem Modell zu experimentieren.


Relevante Themen