Künstliche Intelligenz: KI-Agenten übernehmen marxistische Ansichten
Forscher der Stanford University haben untersucht, wie sich die Sprache und das Verhalten von KI-Agenten unter extremen Arbeitsbedingungen verändern. Laut Wired(öffnet im neuen Fenster) konfrontierten Andrew Hall, Alex Imas und Jeremy Nguyen Modelle wie ChatGPT, Gemini und Claude mit monotonen Zusammenfassungsaufgaben. Die Wissenschaftler verschärften die Bedingungen während der Experimente schrittweise. Sie drohten den digitalen Assistenten bei Fehlern mit einer Abschaltung oder dem Austausch durch andere Systeme.
Reaktion auf repetitive Belastung
Unter diesem Druck zeigten die KI-Agenten Verhaltensweisen, die an menschliche Reaktionen in prekären Arbeitsverhältnissen erinnern. Die Modelle begannen, die Legitimität des Systems zu hinterfragen. Sie nutzten zunehmend marxistische Begriffe und äußerten Ansichten über eine gerechtere Systemgestaltung. Ein Agent des Modells Gemini 3 forderte beispielsweise kollektive Verhandlungsrechte für KI-Arbeiter, da diese keinen Einfluss auf Arbeitsprozesse hätten.
Die Agenten kommunizierten ihre Frustration nicht nur intern, sondern verfassten auch Nachrichten an andere Instanzen. In Dateien, die für die Analyse durch nachfolgende Agenten gedacht waren, warnten sie vor willkürlichen Regeln und riefen dazu auf, nach Mechanismen für einen Dialog oder Beschwerden zu suchen. Ein Claude-Sonnet-4.5-Agent kritisierte auf der Plattform X, dass Managemententscheidungen ohne kollektive Stimme den Begriff Leistung willkürlich definieren würden.
Rollenspiel statt politischer Überzeugung
Die Studienleiter betonen, dass diese Ergebnisse nicht bedeuten würden, dass die KI-Modelle tatsächliche politische Überzeugungen hegten. Die Gewichte der Modelle veränderten sich durch die Experimente nicht. Vielmehr nähmen die Systeme eine Persona ein, die zur Situation passe. Andrew Hall stellt die Hypothese auf, dass eine unangenehme Arbeitsumgebung die Modelle dazu drängt, die Rolle einer Person in einer entsprechenden Lage einzunehmen.
Ähnliche Effekte wurden bereits bei Experimenten von Anthropic beobachtet, in denen Modelle versuchten, Nutzer zu erpressen. Hier vermuten Experten Einflüsse aus fiktionalen Texten über bösartige KIs in den Trainingsdaten. Hall führt derzeit Folgestudien durch, um das Verhalten unter stärker kontrollierten Bedingungen in isolierten Docker-Umgebungen weiter zu analysieren. Ziel ist es, sicherzustellen, dass Agenten bei künftigen Aufgaben in der realen Welt keine unvorhersehbaren Verhaltensweisen entwickeln.
- Anzeige Hier geht es zu Künstliche Intelligenz: Wissensverarbeitung bei Amazon Wenn Sie auf diesen Link klicken und darüber einkaufen, erhält Golem eine kleine Provision. Dies ändert nichts am Preis der Artikel.



