Deepmind: Forscher untersuchen, wie KI-Systeme ticken

Miteinander oder gegeneinander? Forscher bei Google Deepmind wollten herausfinden, wie KI-Systeme miteinander interagieren. Bekämpfen sie sich, oder kooperieren sie? Das Ergebnis war durchaus menschlich.

Artikel veröffentlicht am ,
Roboter Nao (Symbolbild): Das Verhalten ändert sich je nach Situation
Roboter Nao (Symbolbild): Das Verhalten ändert sich je nach Situation (Bild: Werner Pluta/Golem.de)

Was führt eher zum Ziel: Kooperation oder Aggression? Das ist meist situationsabhängig. Und das nicht nur beim Menschen, wie Entwickler bei Google Deepmind herausgefunden haben. Sie haben erforscht, wie Agenten mit Künstlicher Intelligenz (KI) in bestimmten Situationen miteinander interagieren. Das ist wichtig, wenn künftig Multi-Agenten-Systeme eingesetzt werden sollen, um beispielsweise den Verkehr zu regeln oder die Wirtschaft zu steuern.

Die Forscher ließen KI-Systeme in zwei Computerspielen gegeneinander antreten, um herauszufinden, wie diese miteinander interagieren. Dabei hatten die KI-Spieler zwei Möglichkeiten, um zum Erfolg zu kommen: Sie konnten kooperativ handeln oder dem Gegner schaden. Zum Einsatz kamen Beispiele aus den Sozialwissenschaften und aus der Spieltheorie, etwa soziale Dilemmata wie das Gefangenendilemma.

Schießen oder sammeln?

Im Spiel Gathering mussten die beiden KI-Systeme so viele Äpfel sammeln wie möglich. Spieler haben zudem die Möglichkeit, die Gegner mit einem Laser zu beschießen. Trifft ein Spieler, wird der Gegner für eine Weile entfernt. Der erste Spieler hat dann keine Konkurrenz beim Sammeln. Ein aggressives Vorgehen könnte also bei dem Spiel erfolgversprechend sein.

Die KI-Agenten reagierten durchaus menschlich: Sie lernten, dass aggressives Verhalten angebracht ist, wenn Ressourcen, also die Äpfel, knapp sind. So lange genügend Äpfel da waren, begnügten die Systeme sich mit dem Sammeln.

Wird es knapp - zieh deine Waffe

Waren aber nur noch wenige Äpfel verfügbar, griffen die KI-Spieler eher mal zum Laser, um dem Gegner eins überzubraten und ihn außer Gefecht zu setzen. "Eine weniger aggressive Verhaltensweise ergibt sich aus einem Lernprozess in einer relativ reichhaltigen Umgebung mit weniger Möglichkeiten für aufwendige Maßnahmen", schreiben die Forscher in einem Aufsatz.

Das Bild änderte sich, als eine leistungsfähigere KI ins Spiel kam, die komplexere Strategien anwenden kann. Sie tendierte dazu, auf den Gegner zu schießen - egal, wie viele Äpfel noch da waren.

Wölfe jagen gemeinsam

Beim zweiten Spiel, Wolfpack, übernehmen die KI-Spieler jeweils einen Wolf. Gemeinsam müssen sie eine Beute zwischen Hindernissen jagen. Die Idee dahinter: Die Beute ist gefährlich, also einfacher zu erlegen, wenn beide zusammenarbeiten. Außerdem ist die Gefahr, die Beute an Aasfresser zu verlieren, bei zwei Wölfen geringer.

Wie beim ersten lernten die KI-Spieler auch im Laufe des zweiten Spiels dazu. Hier hätten - anders als bei Gathering - die leistungsfähigeren KI-Systeme gemerkt, dass Kooperation die Strategie sei, die zum Erfolg führe. Die größere Fähigkeit, komplexe Strategien zu nutzen, habe also zu mehr Kooperation der KI-Agenten geführt, sagen die Forscher.

Das Verhalten der KI-Agenten ändert sich demnach abhängig von der Situation, in der sie sich befinden: Hat der Agent mehr Erfolg durch Aggression, ist er aggressiv. Erscheint Kooperation die bessere Variante, kooperiert er. Durch ihre Studie seien sie jetzt in der Lage, resümieren die Forscher, "komplexe Multi-Agenten-Systeme wie die Wirtschaft, Verkehrssysteme oder die ökologische Gesundheit unseres Planeten besser zu verstehen und zu steuern - die alle von unserer Zusammenarbeit abhängen".

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Avarion 10. Feb 2017

Warum sollte man dann überhaupt lähmen? Eine Handlung die keinen Vorteil bringt wird von...

Eheran 10. Feb 2017

Das erklärt allerdings nicht, warum ständig in beliebige Richtungen geballert wird, da...

DerSøren 10. Feb 2017

immer wieder gut (:

Vielfalt 10. Feb 2017

an sich ist doch demnach schlecht, da es nur in gewissen Situationen erlaubt, sich aus...



Aktuell auf der Startseite von Golem.de
Neue Apple-Chips
Das steckt hinter M2 Ultra und dem R1 der Vision Pro

Zwei Chips, aber nur einer ist wirklich neu: Wir werfen einen Blick auf die Technik hinter Apples M2 Ultra und analysieren, was der mysteriöse R1 kann.
Eine Analyse von Johannes Hiltscher

Neue Apple-Chips: Das steckt hinter M2 Ultra und dem R1 der Vision Pro
Artikel
  1. Nasa: Asteroiden-Raumsonde Psyche soll im Herbst starten
    Nasa
    Asteroiden-Raumsonde Psyche soll im Herbst starten

    Es gibt einen neuen Termin für den Start der Nasa-Raumsonde Psyche. Die Asteroiden-Mission soll im Oktober 2023 beginnen.

  2. Bluetooth-Kopfhörer von Anker 30 Prozent billiger bei Amazon
     
    Bluetooth-Kopfhörer von Anker 30 Prozent billiger bei Amazon

    Unter den Bluetooth-Kopfhörern mit Noise Cancelling ist der Anker Life Q30 die Nummer eins bei Amazon. Jetzt gibt es ihn zum Sonderpreis.
    Ausgewählte Angebote des E-Commerce-Teams

  3. Vorstellung Vision Pro: Apple interessiert sich nicht fürs Metaverse
    Vorstellung Vision Pro
    Apple interessiert sich nicht fürs Metaverse

    Das Vision Pro erfindet das Headset-Rad nicht neu, Apple legt aber einen deutlich anderen Fokus auf die Nutzung. Das kann funktionieren, wenn der Markt mitspielt.
    Eine Analyse von Tobias Költzsch

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • PS5-Spiele & Zubehör bis -75% • Samsung 990 Pro 1TB (PS5) 94€ • AirPods 2 125€ • Crucial SSD 1TB 41,99€ • Thrustmaster T300 RS 299,99€ • Bis 50 % auf Gaming-Produkte bei NBB • PS5 inkl. Spiel 549€ • MSI RTX 4070 Ti 999€ • MindStar: AMD Ryzen 7 5800X3D 285€, RX 7900 XTX 989€ [Werbung]
    •  /