KI: Wie Reinforcement Learning funktioniert und was es bringt

Klassisches Training von neuronalen Netzen auf Eingabe-Ausgabe-Paaren kommt bei vielen Problemen an seine Grenzen. So werden etwa Sprachmodelle nach einer Phase des Auswendiglernens noch nachjustiert, um besonders natürlich klingende Antworten zu produzieren oder besser Anweisungen zu folgen.
Reinforcement Learning (RL) ist dabei die zentrale Technologie, durch die Modelle nicht nur stabiler und kontrollierbarer werden. Es verspricht zudem komplett neue Lösungsansätze für Probleme und könnte vielleicht der Schlüssel für die Zukunft in der KI sein. Wir analysieren, warum Reinforcement Learning so wichtig ist, wie es funktioniert, und warum vieles immer noch unklar ist.