Zum Hauptinhalt Zur Navigation

Studie: KI-Modelle scheitern an echten Arbeitsaufgaben

Eine neue Studie zeigt: Führende KI -Systeme können reale Arbeitsprojekte nicht selbständig bewältigen.
/ Andreas Donath
24 Kommentare News folgen (öffnet im neuen Fenster)
Freelancer sind vorerst safe. (Bild: Pexels)
Freelancer sind vorerst safe. Bild: Pexels / CC0 1.0

Forscher haben getestet, ob künstliche Intelligenz wirklich Arbeitsaufträge übernehmen kann – mit ernüchterndem Ergebnis. Die Studie " Remote Labor Index(öffnet im neuen Fenster) " gab führenden KI-Programmen echte Projekte, wie sie sonst Freelancer bearbeiten. Das Fazit: Die KI scheiterte in vielen Fällen, wie die Washington Post (via MSN) berichtet(öffnet im neuen Fenster) .

Studienautor Jason Hausenloy sagt deutlich: Heutige KI-Systeme sind noch lange nicht in der Lage, Jobs komplett zu ersetzen. Die Forscher wollten Politikern zeigen, was KI wirklich kann – und was nicht. Sie testeten im Oktober die damals besten Modelle und werden die Tests bei neuen Versionen wiederholen.

Viele Fehler bei scheinbar einfachen Aufgaben

Ein Beispiel: Die KI sollte eine interaktive Grafik mit Daten über die Lebenszufriedenheit in verschiedenen Ländern erstellen. Auf den ersten Blick sah das Ergebnis gut aus. Bei genauerem Hinsehen fielen aber viele Fehler auf: Länder fehlten, Texte überschnitten sich, die Farben in der Legende stimmten nicht oder fehlten ganz.

Die Studie ist eine der ersten, die KI mit echten Arbeitsaufträgen testet – ohne menschliche Hilfe von außen. Das Ergebnis widerlegt die Behauptung, dass KI bald viele Arbeitskräfte ersetzen werde.

Bei fast der Hälfte aller Projekte lieferte die KI schlechte Ergebnisse. Über ein Drittel der Aufträge blieb unfertig. Bei jedem fünften Projekt gab es technische Pannen – die KI erzeugte zum Beispiel kaputte Dateien. Hausenloy sagt: "Viele Fehler waren ziemlich simpel."

Zwei große Schwachstellen

Die Forscher fanden zwei Hauptprobleme: Erstens kann sich KI nichts langfristig merken. Sie lernt nicht aus Fehlern und vergisst Rückmeldungen schnell wieder. Zweitens versteht sie visuelle Dinge schlecht – etwa Grafikdesign oder räumliches Denken.

In einem Test sollte die KI ein Browserspiel programmieren. Hier lief es etwas besser. Die beste Version war spielbar – eine beachtliche Leistung. Allerdings ignorierte die KI die Anweisung, dass das Spiel ein Bier-Thema haben sollte.

Trotzdem Auswirkungen auf den Arbeitsmarkt

Auch ohne komplette Jobersetzung könnte KI den Arbeitsmarkt verändern. Firmen könnten Personal abbauen, wenn die verbleibenden Mitarbeiter mit Chatbot-Hilfe mehr schaffen – also produktiver werden.

Die Forscher wollen den Index regelmäßig aktualisieren, wenn neue KI-Modelle erscheinen. So können sie dauerhaft prüfen, wie gut KI bei realen Arbeitsaufgaben abschneidet.


Relevante Themen