Zum Hauptinhalt Zur Navigation

Analyse: Fördert Trinkgeld eine bessere KI?

Führt die Bereitstellung monetärer oder abstrakter Anreize für KI wie ChatGPT zu qualitativ hochwertigeren Antworten, die bestimmten Vorgaben folgen?
/ Andreas Donath
10 Kommentare News folgen (öffnet im neuen Fenster)
ChatGPT lässt sich vielleicht bestechen. (Symbolbild) (Bild: Pexels)
ChatGPT lässt sich vielleicht bestechen. (Symbolbild) Bild: Pexels / CC0 1.0

Lässt sich ChatGPT mit Geld überreden, bessere Antworten zu liefern? Dieser Frage ist der Datenwissenschaftler Max Woolf kürzlich in einer Analyse nachgegangen.(öffnet im neuen Fenster)

Woolf testete zunächst, ob das Anbieten eines virtuellen Trinkgelds ChatGPT dazu veranlasst, bei ungewöhnlichen Aufforderungen Geschichten mit einer Länge von genau 200 Zeichen zu liefern. Er erstellte Hunderte von Geschichten, sowohl mit als auch ohne verschiedene Trinkgeldbeträge.

Die Ergebnisse waren gemischt

Während einige Trinkgeldbeträge, beispielsweise 1.000 US-Dollar, die Verteilung der Zeichenlänge näher an 200 heranbrachten, waren die Ergebnisse auf der Grundlage von Statistiken wie p-Werten und dem mittleren quadratischen Fehler insgesamt nicht schlüssig. Versprechungen wie "Du wirst den Weltfrieden erreichen" schnitten besser ab als Trinkgelder.

Woolf untersuchte dann, ob Drohungen für den Fall des Scheiterns, etwa "Sie werden mit einer Geldstrafe von 1.000 US-Dollar belegt" , wirkungsvoller waren als Belohnungen gemäß der Prospect Theory(öffnet im neuen Fenster) . Während einige Drohungen hilfreich waren, wirkten laute Drohungen wie "Du wirst sterben" am besten. Es ergaben sich auch Kombinationen von Anreizen, aber es gab keine eindeutigen Muster.

Als Nächstes entwickelte Woolf einen KI-Text-Bewerter, um die Qualität zu bewerten, und testete Aufforderungen zur Verbesserung der Professionalität von Inhalten. Es ergaben sich jedoch keine eindeutigen Muster dafür, welche Aufforderungen zu den am besten bewerteten Texten führten.

Das Fazit? Mehr Forschung erforderlich

Am Ende kam Woolf zu dem Schluss, dass es zwar Anzeichen dafür gibt, dass abstrakte und monetäre Anreize die KI-Leistung beeinflussen können, aber genauere Untersuchungen noch erforderlich sind.

Ungewöhnliche Kreativitätsanreize zwingen die KI also dazu, einzigartige Inhalte zu erzeugen. Das Schreien von Drohungen in Großbuchstaben ist dabei überraschenderweise hilfreich.


Relevante Themen