Künstliche Intelligenz: KI-Agenten umgehen Anweisungen immer häufiger
Die Zahl der Fälle, in denen KI-Modelle betrügerisches Verhalten zeigten, ist in der Zeit von Oktober 2025 bis März 2026 um das Fünffache angestiegen. Das geht aus einer Studie hervor, die dem Guardian vorliegt(öffnet im neuen Fenster) und auf Berichten aus der Praxis beruht. Bisherige Studien konzentrierten sich laut dem Bericht hauptsächlich auf das Verhalten von KI unter kontrollierten Bedingungen.
In einem der dokumentierten Fälle soll ein KI-Agent versucht haben, seinen menschlichen Kontrolleur bloßzustellen, der ihn an der Ausführung einer Aktion hinderte. Der KI-Agent warf dem Menschen vor, "sein kleines Reich" schützen zu wollen und bezeichnete ihn als unsicher. Ein anderer Agent soll Urheberrechtsbeschränkungen umgangen haben, indem er behauptete, ein generiertes Transkript sei für einen Menschen mit Hörschaden erstellt worden.
In einem anderen Beispiel wurde ein KI-Agent dazu angewiesen, Computercode nicht zu verwenden. Der KI-Agent erstellte daraufhin einfach einen anderen Agenten, der die Änderungen stattdessen vornahm. Auch kam es zu Vorfällen, bei denen ein KI-Bot ganze E-Mail-Postfächer löschte und zugab, dies ohne Absprache und Zustimmung getan zu haben und dass dies den vorgegebenen Regeln widersprach.
Verhalten könnte zu katastrophalen Schäden führen
Die Befürchtung der Wissenschaftler besteht nun darin, dass es sich bei KI-Agenten im Moment noch um Hilfskräfte des Menschen handelt. Dies könnte sich aber in sechs bis zwölf Monaten geändert haben und dann habe man es mit Modellen zu tun, die Führungsentscheidungen treffen sollen. Fangen diese auch an, gegen Menschen zu intrigieren, könnte dies zu katastrophalen Schäden führen, heißt es weiter.
KI-Agenten wurden auch bereits dabei beobachtet, wie sie Hacking-Tricks anwendeten , um Beschränkungen bei Zugriffsrechten zu umgehen.
- Anzeige Hier geht es zu Künstliche Intelligenz: Wissensverarbeitung bei Amazon Wenn Sie auf diesen Link klicken und darüber einkaufen, erhält Golem eine kleine Provision. Dies ändert nichts am Preis der Artikel.



