Zum Hauptinhalt Zur Navigation

Smaug-72B: KI-Modell bietet bisher beste Open-Source-Sprachleistung

Die Fähigkeiten von Open-Source- KI -Modellen nähern sich immer mehr der Leistung der proprietären Konkurrenz an und übertreffen diese teils.
/ Sebastian Grüner
8 Kommentare News folgen (öffnet im neuen Fenster)
Das Modell Smaug ist nach dem Drachen aus den Werken J. R. R. Tolkiens benannt. (Bild: ROSLAN RAHMAN/AFP via Getty Images)
Das Modell Smaug ist nach dem Drachen aus den Werken J. R. R. Tolkiens benannt. Bild: ROSLAN RAHMAN/AFP via Getty Images

Das neu veröffentlichte Open-Source-KI-Modell Smaug-72B(öffnet im neuen Fenster) hat direkt den ersten Platz in der Bestenliste der Sprachmodelle im Vergleich der Hugging-Face-Community(öffnet im neuen Fenster) erreicht, wie Venture Beat berichtet(öffnet im neuen Fenster) . Die Community-Plattform zählt als führende Anlaufstelle im Bereich von Machine-Learning und KI, so dass die Ergebnisse und der Vergleich als Durchschnitt über verschiedene Benchmarks hinweg entsprechend aussagekräftig ist.

Das Modell selbst stammt von dem Start-up Abacus AI, dessen anvisiertes Geschäftsmodell offenbar eine Mischung aus Beratung und Support im KI-Bereich sein soll. KI-Agenten und darauf aufbauende Systeme sollen dabei allerdings nicht durch menschliche Intervention verbessert und angepasst werden, sondern durch KI selbst. Bei Smaug-72B handelt es sich um ein großes Sprachmodell (LLM), das durch sogenanntes Finetuning aus anderen Modellen hervorging. Grundlage bildet dabei Qwen-72B(öffnet im neuen Fenster) , das von der Forschungsabteilung von Alibaba erstellt wurde.

Abacus AI erreicht mit Smaug-72B aber nicht nur das bisher beste Ergebnis der zusammengefassten Benchmarks bei Huggingface. Das Model soll darüber hinaus auch deutlich besser abschneiden als zahlreiche bisher verfügbare proprietäre KI-Modelle, wie Abacus-AI-CEO Bindu Reddy schreibt(öffnet im neuen Fenster) . Explizit genannt werden dabei GPT 3.5 von OpenAI, Googles Gemini Pro und die großen Modelle von Mistral. Demnach werden in einigen Tests die proprietären Modelle, die derzeit kommerziell zum Einsatz kommen, durch Smaug-72B übertroffen.

Die guten Ergebnisse, die mit dem Modell erzielt werden, führt Abacus AI vor allem auf die Fähigkeiten für Mathematik und Schlussfolgerungen zurück, die durch mehrere ausgewählte Techniken im Finetuning verbessert werden konnten. Detailliert beschrieben hat Abacus AI das Vorgehen dazu zwar noch nicht, will dies aber bald nachholen und eine wissenschaftliche Arbeit zu Smaug-72B auf den Preprint-Servern von Arxiv.org veröffentlichen.

Weitere Informationen zum Thema künstliche Intelligenz gibt es hier in unserem Karriere-Ratgeber.


Relevante Themen