Konkurrenz zu ChatGPT: Dolly 2.0 ist ein komplett quelloffener Sprachgenerator

Das KI-Team von Databricks hat für Dolly 2.0 viele Tausend Menschen beauftragt, das Modell manuell zu kalibrieren. Es ist zudem Open Source.

Artikel veröffentlicht am ,
Das Team von Databricks hat sich das Schaf für Dolly als Logo ausgesucht.
Das Team von Databricks hat sich das Schaf für Dolly als Logo ausgesucht. (Bild: Pixabay.com/Pixabay License)

Das KI-Team von Databricks hat den Sprachgenerator Dolly 2.0 veröffentlicht. Es soll wie ChatGPT und Llama für das Generieren und Verstehen von Sprachen in Textform genutzt werden können. Der Unterschied zu ChatGPT ist allerdings klar: Dolly 2.0 soll komplett Open Source gestellt werden und auch eine kommerzielle Nutzung erlauben. Es kann daher noch mehr als das geleakte Llama, welches nicht für die kommerzielle Nutzung freigegeben wurde, für diverse Projekte verwendet werden (via Ars Technica).

Konkret stehen die zwei Teile von Dolly 2.0 unter einer Creative-Commons-Lizenz (CC-BY-SA). Außerdem mussten die Entwickler einen komplett neuen Datensatz erschaffen, da die erste Version von Dolly teilweise auf ChatGPT-Antworten basierte und deshalb den Geschäftsbedingungen von OpenAI unterlag. Dazu wurden 5.000 Personen beschäftigt, die Daten generieren sollten. Die resultierende Databricks-Dolly-15k-Sammlung besteht aus mehr als 15.000 manuell angepassten Aufzeichnungen.

Ein besser zugängliches Modell

Das darauf aufbauende Sprachmodell Dolly-v2-12b kann aus 12 Milliarden Parametern Texte interpretieren und generieren. Das Modell ist also weit weniger komplex als etwa ChatGPT (175 Milliarden) oder die größeren Versionen von Llama (maximal 65 Milliarden). Vergangene Experimente mit Metas Llama-Modell mit 7 Milliarden Parametern haben aber gezeigt, dass auch damit zufriedenstellende, wenn auch manchmal nicht perfekte Resultate erzielt werden können.

Auch wenn Dolly 2.0 dadurch eventuell ungenauer arbeitet, könnte es bei diversen privaten und kommerziellen Projekten hilfreich sein. Das kann bereits innerhalb der AI-Community beobachtet werden, die mit dem geleakten Llama-Modell schon diverse eigene Projekte realisieren konnte. Das Modell von Databricks ist für den KI-Forscher Simon Willson auch interessant, da es von Menschen kalibriert wurde. Auf Mastodon nennt er das neue Modell deshalb eine große Sache.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Magnetohydrodynamischer Antrieb
US-Militär lässt lautlosen U-Boot-Antrieb entwickeln

Bislang war magnetohydrodynamischer Antrieb der Fiktion vorbehalten. Dank Fortschritten in der Akku- und Fusionstechnik soll sich das ändern.

Magnetohydrodynamischer Antrieb: US-Militär lässt lautlosen U-Boot-Antrieb entwickeln
Artikel
  1. KI-Bildgenerator: Diese Kamera generiert, statt zu fotografieren
    KI-Bildgenerator
    Diese Kamera generiert, statt zu fotografieren

    Ein Bastler hat eine KI-Kamera ohne Objektiv gebaut. Paragraphica erzeugt Schnappschüsse mit einem Raspberry Pi und Stable Diffusion.

  2. Disney und Videostreaming: Über 100 Eigenproduktionen aus Abo von Disney+ entfernt
    Disney und Videostreaming
    Über 100 Eigenproduktionen aus Abo von Disney+ entfernt

    Eigentlich wollte Disney nur etwas mehr als 50 Eigenproduktionen aus Disney+ verschwinden lassen. Nun fehlen deutlich mehr Filme und Serien.

  3. Seekabel: Colt bietet eine europäische Verbindung in die USA
    Seekabel
    Colt bietet eine europäische Verbindung in die USA

    Colt bringt eine neue Seekabelverbindung von Europa in die USA, die stärker in europäischer Hand ist. Statt in New York landet man in New Jersey. Doch Google und Facebook sind dabei.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Roccat bis -50% • AVM Modems & Repeater bis -36% • MindStar: 13 Grafikkarten im Sale • Logitech G Pro Wireless Maus 89€ • The A500 Mini 74,99€ • Logitech G213 Prodigy Tastatur 49,90€ • Crucial P5 Plus (PS5-komp.) 1TB 71,99€, 2TB 133,99€ [Werbung]
    •  /