Zum Hauptinhalt Zur Navigation

Google, Meta und mehr: API-Tokens für Vollzugriff auf bekannte KI-Projekte entdeckt

Durch mehr als 1.500 auf Github und Hugging Face entdeckte API -Tokens haben sich Forscher Zugriff auf KI-Projekte von Hunderten von Unternehmen verschafft.
/ Marc Stöckel
8 Kommentare News folgen (öffnet im neuen Fenster)
Unzählige KI-Modelle waren durch frei zugängliche API-Tokens gefährdet. (Bild: pixabay.com/Seanbatty)
Unzählige KI-Modelle waren durch frei zugängliche API-Tokens gefährdet. Bild: pixabay.com/Seanbatty

Sicherheitsforschern von Lasso Security ist es gelungen, mehr als 1.500 ungeschützte API-Tokens für Hugging Face abzugreifen und sich dadurch einen Zugriff auf Projekte von insgesamt 723 Unternehmen zu verschaffen - darunter auch namhafte Vertreter wie Meta, Microsoft, Google und VMware. Die Forscher setzten reguläre Ausdrücke (Regex) ein und durchsuchten Repositories nach bestimmten Teilstrings, um die Tokens auf Github und Hugging Face ausfindig zu machen.

Im Anschluss überprüften sie die gesammelten Tokens anhand der Hugging-Face-API und ließen sich darüber unter anderem die zugehörigen Gültigkeitsdauer, Berechtigungen sowie Namen, E-Mail-Adressen und Organisationen der Nutzer ausgeben, denen die Tokens zugewiesen waren.

Hugging Face bietet Entwicklern von KI-Anwendungen eine Plattform, die mit Github vergleichbar ist und einen gemeinsamen Zugriff auf Sprachmodelle, Datensätze und Anwendungen ermöglicht. Mehr als 500.000 KI-Modelle und 250.000 Datensätze sind dort inzwischen zu finden. Erst kürzlich ging Hugging Face eine Partnerschaft mit Nvidia ein , um Nutzern das Training von Sprachmodellen auf DGX-Systemen zu ermöglichen.

Lese- und Schreibrechte auf bekannte KI-Modelle

Die Sicherheitsforscher geben in ihrem Bericht an(öffnet im neuen Fenster) , insgesamt 1.681 gültige API-Tokens aufgespürt zu haben, durch die sie Zugriff auf Projekte von 723 teils sehr prominenten Organisationen erhalten hätten. 655 Tokens waren den Forschern zufolge sogar mit Schreibrechten ausgestattet, 77 davon gleich für mehrere Organisationen. Dadurch konnten sie sich die volle Kontrolle über die Repositories mehrerer namhafter Unternehmen verschaffen.

Durch die Tokens sei es ihnen möglich gewesen, Lese- und Schreibrechte auf mehrere KI-Projekte wie Metas Llama2, Bigscience Workshop (Bloom) und Eleuther AI (Pythia) zu erhalten und obendrein über 10.000 private Sprachmodelle abzugreifen, hieß es weiter. Zugleich warnte das Team davor, dass sich ein derart weitreichender Zugriff auch von böswilligen Akteuren missbrauchen lasse, um die zugänglichen Modelle beispielsweise durch sogenanntes Training Data Poisoning gezielt zu manipulieren.

"Dies stellt eine ernste Bedrohung dar, da das Einschleusen von beschädigten Sprachmodellen Millionen von Nutzern beeinträchtigen könnte, die sich für ihre Anwendungen auf diese grundlegenden Modelle verlassen" , erklärten die Forscher diesbezüglich.

Die Tokens wurden wohl inzwischen entfernt

Die Lasso-Forscher informierten ihren Angaben zufolge alle betroffenen Nutzer, Organisationen und auch Hugging Face über ihre Funde. Viele davon hätten sehr schnell reagiert und die öffentlich verfügbaren Tokens noch am selben Tag widerrufen und aus den Repositories entfernt, erklärte das Team. Entwicklern empfehlen die Forscher, grundsätzlich darauf zu verzichten, sensible Informationen wie API-Tokens in ihrem Code zu hinterlegen.


Relevante Themen