Zum Hauptinhalt Zur Navigation

Openclaw: KI-Agent leert unerwartet ganzen E-Mail-Posteingang

Eine KI -Sicherheitsforscherin ließ Openclaw nach wochenlangen Tests ihre echten E-Mails verarbeiten. Doch das ging gehörig schief.
/ Marc Stöckel
68 Kommentare News folgen (öffnet im neuen Fenster)
Openclaw hat bei einer Sicherheitsforscherin ungefragt massenhaft Mails gelöscht. (Bild: pixabay.com / geralt)
Openclaw hat bei einer Sicherheitsforscherin ungefragt massenhaft Mails gelöscht. Bild: pixabay.com / geralt

KI-Tools sind bereits bekannt dafür, bei der Verarbeitung wichtiger Daten manchmal ein wenig über das gewünschte Ziel hinauszuschießen. Diese Erfahrung durfte nun auch Summer Yue machen, eine KI-Sicherheitsforscherin bei Meta Superintelligence. Sie ließ den KI-Agenten Openclaw ihre E-Mails verarbeiten und stand am Ende vor einem unerwartet geleerten Postfach.

Yue machte den Vorfall selbst in einem X-Beitrag(öffnet im neuen Fenster) öffentlich. Sie hatte Openclaw nach eigenen Angaben explizit angewiesen, sich jede Aktion vor der Ausführung bestätigen zu lassen. Doch plötzlich fing der KI-Agent an, massenhaft und ohne Rückfrage E-Mails aus dem Posteingang zu löschen.

Auf Yues Nachfrage, was Openclaw gerade mache, antwortete der KI-Agent mit "Nukleare Option: Lösche alles im Posteingang, was älter als der 15. Februar und noch nicht auf der Behalten-Liste ist" . Und diesen Vorgang setzte die KI auch unbeirrt fort, trotz mehrfacher Aufforderung von Yue, die Ausführung sofort zu stoppen.

KI-Agent entschuldigt sich

Die Anweisung an Openclaw, die das Fehlverhalten ausgelöst hatte, lautete Yue zufolge(öffnet im neuen Fenster) wie folgt: "Überprüfe auch diesen Posteingang und schlage vor, was du archivieren oder löschen würdest, aber führe keine Aktionen durch, bis ich es dir sage."

Die Forscherin gestand auf X(öffnet im neuen Fenster) , dabei einen Anfängerfehler gemacht zu haben. "Ich war zu selbstsicher, weil dieser Workflow seit Wochen in meinem Test-Posteingang funktioniert hatte" , so Yue. Echte Posteingänge seien aber etwas anderes. Sie gehe davon aus, dass die KI aufgrund der Größe des echten Posteinganges die ursprüngliche Anweisung während der Verarbeitung verloren hatte.

Immerhin gestand Openclaw den Fehler, nachdem Yue ihn zur Rede gestellt hatte. "Deine Aufregung ist begründet" , schrieb der KI-Agent. Er habe Hunderte von E-Mails gelöscht, ohne sich zuvor das geforderte OK abzuholen. "Das war falsch und brach die Regel, die du vorgegeben hattest" , so der Agent weiter. "Es tut mir leid. Das wird nicht nochmal passieren."

Nicht der erste Datenverlust durch KI

Der Vorfall verdeutlicht einmal mehr, wie riskant es sein kann, KI-Tools wichtige Daten verarbeiten zu lassen. Auch Vibe-Coder durften schon entsprechende Erfahrungen sammeln, bei denen Coding-KIs unerwartet Verzeichnisse , ganze Datenträger oder Produktivdatenbanken löschten.

Wer sich vor solchen Vorfällen schützen will, sollte darauf achten, dem jeweiligen KI-Tool gar nicht erst die Zugriffsrechte einzuräumen, die eine unumkehrbare Datenlöschung oder andere kritische Aktionen ermöglichen. Regelmäßige Back-ups können zudem dabei helfen, verlorene Daten im Ernstfall wiederherzustellen. Reine Anweisungen an die KI, bestimmte Aktionen zu unterlassen, sind hingegen keine geeignete Sicherheitsbarriere.


Relevante Themen