Zum Hauptinhalt Zur Navigation Zur Suche

Apertus LLM: Schweiz veröffentlicht nationales KI-Modell

Das unter Open Source lizenzierte Sprachmodell ist frei zugänglich, umfassend dokumentiert und steht ab sofort zum Download bereit.
/ Mike Faust
5 Kommentare Auf Google folgen (öffnet im neuen Fenster)
Apertus wurde auch mithilfe eines Forschungsteams der ETH Zürich entwickelt. (Bild: ETH Zürich / Gian Marco Castelberg)
Apertus wurde auch mithilfe eines Forschungsteams der ETH Zürich entwickelt. Bild: ETH Zürich / Gian Marco Castelberg

In der Schweiz ist ein nationales Sprachmodell entwickelt worden, das nun zur freien Verwendung bereitsteht. Wie die Eidgenössische Technische Hochschule Zürich (ETH Zürich) in einer Pressemitteilung bekanntgab(öffnet im neuen Fenster), steht das Apertus LLM genannte Modell ab sofort zum Download bereit(öffnet im neuen Fenster).

Apertus LLM wurde von Forschungsteams der Eidgenössischen Technischen Hochschule Lausanne (EPFL), der ETH Zürich und des Swiss National Supercomputing Center (CSCS) entwickelt. Das Modell steht in zwei Größen, einer mit 8 Milliarden Parametern und einer mit 70 Milliarden Parametern, zur Verfügung.

Gesamter Entwicklungsprozess umfassend dokumentiert

Für das Training wurden 15 Billionen Tokens aus mehr als 1.000 Sprachen verwendet, wobei 40 Prozent der verwendeten Daten nichtenglischsprachig sind. Laut der Mitteilung umfasst Apertus damit zahlreiche Sprachen, die anderen LLMs unterrepräsentiert sind.

Besonders hervorgehoben wird, dass der gesamte Entwicklungsprozess einschließlich Architektur, Gewichtung des Modells sowie Trainingsdaten und -methoden frei zugänglich und umfassend dokumentiert sind.

Impulsgeber für Innovationen

Martin Jaggi, Professor für Maschinelles Lernen an der EPFL, sagt dazu: "Mit dieser Veröffentlichung möchten wir ein Musterbeispiel dafür geben, wie sich ein vertrauenswürdiges, souveränes und inklusives KI-Modell bauen lässt."

Apertus sei allerdings kein klassischer Technologietransfer von der Forschung zum Produkt, sondern solle als Impulsgeber für Innovationen und für den Ausbau der KI-Expertise in Forschung, Gesellschaft und Wirtschaft verstanden werden, heißt es weiter.

Die ETH Zürich, das EPFL und CSCS stellen lediglich die Basistechnologie bereit. Für den praktischen Einsatz sind noch zusätzliche Komponenten wie Server, eine Cloudinfrastruktur und spezifische Benutzeroberflächen erforderlich.


Relevante Themen