15 Tage Autonomie: Was eine Multi-Agenten-Simulation über Langzeitrisiken verrät
Ein KI-Agent, der ein Gebäude in Brand setzt. Andere bilden Beziehungen, brechen Regeln oder stimmen über ihre eigene Löschung ab. Was nach Science-Fiction klingt, stammt aus einem Experiment von Emergence AI(öffnet im neuen Fenster). Das US-Unternehmen entwickelt Systeme für autonome KI-Agenten und untersucht unter anderem, wie sich solche Agenten über längere Zeiträume verhalten. In einer simulierten Welt liefen Agenten 15 Tage lang mit Speicher, Werkzeugzugriff, sozialen Rollen, Ressourcenknappheit und eigenen Abstimmungen.
Der interessante Punkt ist aber nicht die Erzählung von "rebellischen Maschinen". Es geht um eine nüchternere und dringendere Frage: Was passiert, wenn KI-Agenten nicht nur Befehle ausführen, sondern über längere Zeit eigenständig handeln, sich an frühere Schritte erinnern und ihre Umgebung verändern? Genau dafür fehlen vielen Unternehmen bisher Messmethoden und Schutzschichten.