Open Source: Definition von Open-Source-KI vorgestellt

Mit einer offiziellen Definition legt die Open Source Initiative (OSI) ihre Standards für KI-Systeme fest, wie aus einem Beitrag auf der OSI-Webseite(öffnet im neuen Fenster) hervorgeht. Dadurch sollen die Elemente von KI-Systemen mit einbezogen werden, die durch bisherige Lizenzen nicht abgedeckt sind.
Damit ein KI-System als quelloffen gilt, müssen demnach Details zu den Trainingsdaten so offengelegt werden, damit sie von Dritten verstanden und nachgebildet werden können. Zudem muss der vollständige Code, der für die Erstellung und Ausführung der KI verwendet wurde, öffentlich sein und die Gewichtung der Trainingsdaten, auf deren Grundlage die KI ihre Ergebnisse erzielt, müssen einsehbar sein.
Ein Open-Source-KI-System muss unter Bedingungen und auf einer Art und Weise bereitgestellt werden, mit der es für jeden Zweck und ohne um Erlaubnis fragen zu müssen, genutzt werden kann. Es muss möglich sein, zu studieren, wie das System funktioniert und seine Komponenten zu untersuchen. Außerdem muss es möglich sein, die KI für beliebige Zwecke zu modifizieren und seine Ausgabe zu ändern. Schließlich muss das System an andere weitergegeben werden können, damit diese es mit oder ohne Änderungen für beliebige Zwecke nutzen können.
Meta zeigt sich mit OSI-Definition nicht einverstanden
In einem Artikel bei The Verge(öffnet im neuen Fenster) wird diese Definition als direkte Herausforderung von Metas Llama gewertet, welches laut dem Beitrag als größtes quelloffenes KI-Modell angepriesen wird. Lllama kann öffentlich heruntergeladen und verwendet werden. Es unterliegt aber Beschränkungen für die kommerzielle Nutzung und bietet keinen Zugang zu den Trainingsdaten, wodurch es nicht den OSI-Standards entspricht.
Gegenüber The Verge erklärte die Meta-Sprecherin Faith Eischen, dass man zwar mit vielen Punkten der OSI übereinstimme, man aber mit dieser Definition nicht einverstanden sei. "Es gibt keine einheitliche Open-Source-KI-Definition und die Definition ist eine Herausforderung, weil frühere Open-Source-Definitionen die Komplexität der heutigen, sich schnell entwickelnden KI-Modelle nicht abdecken" , so Eischen.
Sie fügte hinzu: "Wir werden weiterhin mit OSI und anderen Industriegruppen zusammenarbeiten, um KI unabhängig von technischen Definitionen zugänglicher und freier zu machen."
Meta argumentiert wie Microsoft in den 90ern
Der unabhängige Forscher und Entwickler des Open-Source-Multi-Tools Datasette, Simon Willison, äußerte gegenüber The Verge: "Jetzt, wo wir eine solide Definition haben, können wir vielleicht aggressiver gegen Unternehmen vorgehen, die "Open-Washing" betreiben und ihre Arbeit als Open-Source deklarieren, obwohl sie es in Wirklichkeit nicht ist."
Der CEO von Hugging Face, Clément Delangue, bezeichnete die Definition der OSI als "eine große Hilfe bei der Gestaltung der Diskussion über Offenheit in der KI, insbesondere wenn es um die entscheidende Rolle von Trainingsdaten geht."
Während Meta Sicherheitsbedenken anführt, um den Zugang zu seinen Trainingsdaten einzuschränken, sehen Kritiker den Erhalt des Wettbewerbsvorteils und rechtliche Risiken als Gründe. Letzteres insbesondere deshalb, weil mit hoher Sicherheit urheberrechtlich geschütztes Material für das KI-Training verwendet wurde. Entsprechende Klagen laufen nicht nur gegen Meta, sondern unter anderem auch gegen OpenAI, Perplexitix und Anthropic.
OSI-Direktor Stefano Maffulli sieht eine Wiederholung der Open-Source-Geschichte. "Meta bringt dieselben Argumente vor wie Microsoft in den 1990er Jahren, als das Unternehmen Open Source als Bedrohung für sein Geschäftsmodell ansah" , so Maffulli gegenüber The Verge. Wie Microsoft, nutze auch Meta die Kosten und Komplexität seiner Technologie, um diese unter Verschluss zu halten.



