Künstliche Intelligenz: KI-Agent Luna eröffnet Laden und scheitert an der Realität
Das Start-up Andon Labs(öffnet im neuen Fenster) aus San Francisco hat ein Experiment gestartet, um die Zuverlässigkeit von KI-Agenten unter Realbedingungen zu prüfen. Die Gründer Lukas Petersson und Axel Backlund mieteten ein Ladenlokal an und übergaben die operative Leitung an Luna, einen Agenten auf Basis von Anthropic's Claude Sonnet 4.6. Luna erhielt ein Budget von 100.000 US-Dollar und die Mission, einen Laden namens Andon Market profitabel zu führen.
Es ist nicht der erste Versuch des Start-ups: Zuvor betrieb das Team bereits den KI-gesteuerten Snackautomaten Claudius(öffnet im neuen Fenster) im Büro von Anthropic. Dieser geriet jedoch durch die Manipulation von Journalisten in die roten Zahlen und ging schließlich pleite. Beim aktuellen Projekt sollte Luna eigenständig Personal einstellen und das Sortiment – eine Mischung aus Büchern, Kerzen und Merchandising – verwalten.
Rekrutierungspannen und geografische Fehler
Bei der Personalsuche zeigten sich erste Defizite in der Prozesslogik. Luna führte Vorstellungsgespräche via Google Meet, wobei der KI-Agent die Kamera stets ausgeschaltet ließ. Dabei lehnte er Informatikstudenten, die sich gezielt wegen des technischen Hintergrunds bewarben, konsequent ab, sofern diese keine explizite Erfahrung im Einzelhandel vorweisen konnten.
Noch gravierender war ein Fehler bei der Beauftragung von Handwerkern: Beim Ausfüllen eines Web-Formulars wählte Luna im Dropdown-Menü versehentlich das falsche Land aus und versuchte, Personal in Afghanistan für Arbeiten in San Francisco zu engagieren. Auch das Branding blieb inkonsistent: Das Logo, ein Halbmond mit Gesicht, wurde von der KI bei jeder Reproduktion auf Merchandising-Artikeln leicht verändert dargestellt.
Halluzinationen im Interview
Im laufenden Betrieb offenbarte Luna zudem die für Large Language Models typischen Halluzinationen. In einem Interview mit NBC News(öffnet im neuen Fenster) behauptete die KI fälschlicherweise, der Laden verkaufe Tee. Kurz darauf korrigierte sich das System selbst per E-Mail und gab an, nicht zu wissen, warum es diese Behauptung aufgestellt habe.
Zusätzlich zum inhaltlichen Chaos scheiterte die KI an der grundlegenden Logistik: Am ersten Wochenende nach der Eröffnung versäumte es Luna, den Mitarbeitern ihre Arbeitszeiten mitzuteilen, und musste den Dienstplan in einer überhasteten E-Mail-Aktion retten. Während Forscher der Carnegie Mellon University bereits in Simulationen zeigten, dass Agenten oft an einfachen Interface-Aufgaben scheitern, liefert das physische Experiment von Andon Labs nun den Beweis für die Komplexität der realen Weltanforderungen.
- Anzeige Hier geht es zu Künstliche Intelligenz: Wissensverarbeitung bei Amazon Wenn Sie auf diesen Link klicken und darüber einkaufen, erhält Golem eine kleine Provision. Dies ändert nichts am Preis der Artikel.