Weitere Versuche

Ich habe es auch mit einigen anderen schwierigen Algorithmen ausprobiert, die ich geschrieben hatte, und es ist jedes Mal ähnlich. ChatGPT schlägt oft Lösungen für ähnliche Probleme vor, übersieht aber die Feinheiten, die das konkrete Problem anders machen, und nach ein paar Überarbeitungen funktioniert oft einfach gar nichts mehr.

In dem untenstehenden Fall (Wie löst Mew ein Rückstoßproblem) übersah es einfach alle Details des Problems. Zum Beispiel, dass es nicht zwei sich bewegende Objekte gleichzeitig bewegen darf. Dieses Problem war aber insofern interessant, dass GPT-3.5 (das ich versehentlich statt GPT-4 fragte) viel näher an eine echte Lösung herankam als GPT-4.

  • Über normale Kacheln geht es hier in fünf Schritten zum Ziel. (Bild: Tyler Glaiel)
  • Hier die Anweisung von mir für GPT-4 (Bild: Tyler Glaiel)
  • Die Sicheln berühren einander nicht. (Bild: Tyler Glaiel)
  • Eine neue Anfrage an GPT-4 (Bild: Tyler Glaiel)
  • GPT-4 ist von sich selbst beeindruckt. (Bild: Tyler Glaiel)
  • ... muss sie einfach mittendurch. (Bild: Tyler Glaiel)
  • Die Katze möchte Feuer meiden, versucht es links,...
  • ... dann rechts und muss schließlich feststellen: Mit ihren sechs Feldern Reichweite...
  • Hier bräuchte die Katze 14 Felder...
  • ... hier 10. (Bild: Tyler Glaiel)
  • Lieber durch als außenrum. (Bild: Tyler Glaiel)
  • Lösungsvorschlag von GPT-4 (Bild: Tyler Glaiel)
  • Lösungsvorschlag von GPT-3.5 (Bild: Tyler Glaiel)
  • Das Problem: Das Programm soll erkennen, wenn Sicheln kollidieren. (Bild: Tyler Glaiel)
Lösungsvorschlag von GPT-4 (Bild: Tyler Glaiel)

Das ist weit weg von der richtigen Lösung. Als ich jedoch GPT 3.5 fragte, gab es mir eine eigentlich funktionierende Lösung mit einigen Fehlern und Randfällen aus. Es kann nicht mit einem Zyklus von Objekten umgehen, die sich in einer Kette aufeinander zubewegen; trotzdem ist es besser als das absolute Nichts, das GPT4 ausgab. Seltsam.

  • Über normale Kacheln geht es hier in fünf Schritten zum Ziel. (Bild: Tyler Glaiel)
  • Hier die Anweisung von mir für GPT-4 (Bild: Tyler Glaiel)
  • Die Sicheln berühren einander nicht. (Bild: Tyler Glaiel)
  • Eine neue Anfrage an GPT-4 (Bild: Tyler Glaiel)
  • GPT-4 ist von sich selbst beeindruckt. (Bild: Tyler Glaiel)
  • ... muss sie einfach mittendurch. (Bild: Tyler Glaiel)
  • Die Katze möchte Feuer meiden, versucht es links,...
  • ... dann rechts und muss schließlich feststellen: Mit ihren sechs Feldern Reichweite...
  • Hier bräuchte die Katze 14 Felder...
  • ... hier 10. (Bild: Tyler Glaiel)
  • Lieber durch als außenrum. (Bild: Tyler Glaiel)
  • Lösungsvorschlag von GPT-4 (Bild: Tyler Glaiel)
  • Lösungsvorschlag von GPT-3.5 (Bild: Tyler Glaiel)
  • Das Problem: Das Programm soll erkennen, wenn Sicheln kollidieren. (Bild: Tyler Glaiel)
Lösungsvorschlag von GPT-3.5 (Bild: Tyler Glaiel)

Es ist möglich, dass ähnliche Probleme in seinem Trainingssatz auftauchen. Offenbar tut es sich aber schwer mit sehr seltenen Problemen, die es noch nicht kennt – zumindest mit solchen, die in einem oder zwei Absätzen beschrieben werden können.

Versuchen wir es mit einem etwas konstruierten Beispiel, lassen wir es einen Algorithmus zur Kollisionserkennung zwischen Mondsichelformen erstellen (ich konnte bei einer kurzen Google-Suche keinen Algorithmus dafür finden und das Problem scheint nicht trivial zu sein).

  • Über normale Kacheln geht es hier in fünf Schritten zum Ziel. (Bild: Tyler Glaiel)
  • Hier die Anweisung von mir für GPT-4 (Bild: Tyler Glaiel)
  • Die Sicheln berühren einander nicht. (Bild: Tyler Glaiel)
  • Eine neue Anfrage an GPT-4 (Bild: Tyler Glaiel)
  • GPT-4 ist von sich selbst beeindruckt. (Bild: Tyler Glaiel)
  • ... muss sie einfach mittendurch. (Bild: Tyler Glaiel)
  • Die Katze möchte Feuer meiden, versucht es links,...
  • ... dann rechts und muss schließlich feststellen: Mit ihren sechs Feldern Reichweite...
  • Hier bräuchte die Katze 14 Felder...
  • ... hier 10. (Bild: Tyler Glaiel)
  • Lieber durch als außenrum. (Bild: Tyler Glaiel)
  • Lösungsvorschlag von GPT-4 (Bild: Tyler Glaiel)
  • Lösungsvorschlag von GPT-3.5 (Bild: Tyler Glaiel)
  • Das Problem: Das Programm soll erkennen, wenn Sicheln kollidieren. (Bild: Tyler Glaiel)
Das Problem: Das Programm soll erkennen, wenn Sicheln kollidieren. (Bild: Tyler Glaiel)
  • Über normale Kacheln geht es hier in fünf Schritten zum Ziel. (Bild: Tyler Glaiel)
  • Hier die Anweisung von mir für GPT-4 (Bild: Tyler Glaiel)
  • Die Sicheln berühren einander nicht. (Bild: Tyler Glaiel)
  • Eine neue Anfrage an GPT-4 (Bild: Tyler Glaiel)
  • GPT-4 ist von sich selbst beeindruckt. (Bild: Tyler Glaiel)
  • ... muss sie einfach mittendurch. (Bild: Tyler Glaiel)
  • Die Katze möchte Feuer meiden, versucht es links,...
  • ... dann rechts und muss schließlich feststellen: Mit ihren sechs Feldern Reichweite...
  • Hier bräuchte die Katze 14 Felder...
  • ... hier 10. (Bild: Tyler Glaiel)
  • Lieber durch als außenrum. (Bild: Tyler Glaiel)
  • Lösungsvorschlag von GPT-4 (Bild: Tyler Glaiel)
  • Lösungsvorschlag von GPT-3.5 (Bild: Tyler Glaiel)
  • Das Problem: Das Programm soll erkennen, wenn Sicheln kollidieren. (Bild: Tyler Glaiel)
Hier die Anweisung von mir für GPT-4 (Bild: Tyler Glaiel)

Daraus machte es einen Code. Zu ChatGPTs Ehrenrettung sei gesagt, dass nicht direkt zu sehen ist, warum er falsch ist. Aber es ist auch nicht allzu schwer, ein Gegenbeispiel zu finden.

  • Über normale Kacheln geht es hier in fünf Schritten zum Ziel. (Bild: Tyler Glaiel)
  • Hier die Anweisung von mir für GPT-4 (Bild: Tyler Glaiel)
  • Die Sicheln berühren einander nicht. (Bild: Tyler Glaiel)
  • Eine neue Anfrage an GPT-4 (Bild: Tyler Glaiel)
  • GPT-4 ist von sich selbst beeindruckt. (Bild: Tyler Glaiel)
  • ... muss sie einfach mittendurch. (Bild: Tyler Glaiel)
  • Die Katze möchte Feuer meiden, versucht es links,...
  • ... dann rechts und muss schließlich feststellen: Mit ihren sechs Feldern Reichweite...
  • Hier bräuchte die Katze 14 Felder...
  • ... hier 10. (Bild: Tyler Glaiel)
  • Lieber durch als außenrum. (Bild: Tyler Glaiel)
  • Lösungsvorschlag von GPT-4 (Bild: Tyler Glaiel)
  • Lösungsvorschlag von GPT-3.5 (Bild: Tyler Glaiel)
  • Das Problem: Das Programm soll erkennen, wenn Sicheln kollidieren. (Bild: Tyler Glaiel)
Die Sicheln berühren einander nicht. (Bild: Tyler Glaiel)
  • Über normale Kacheln geht es hier in fünf Schritten zum Ziel. (Bild: Tyler Glaiel)
  • Hier die Anweisung von mir für GPT-4 (Bild: Tyler Glaiel)
  • Die Sicheln berühren einander nicht. (Bild: Tyler Glaiel)
  • Eine neue Anfrage an GPT-4 (Bild: Tyler Glaiel)
  • GPT-4 ist von sich selbst beeindruckt. (Bild: Tyler Glaiel)
  • ... muss sie einfach mittendurch. (Bild: Tyler Glaiel)
  • Die Katze möchte Feuer meiden, versucht es links,...
  • ... dann rechts und muss schließlich feststellen: Mit ihren sechs Feldern Reichweite...
  • Hier bräuchte die Katze 14 Felder...
  • ... hier 10. (Bild: Tyler Glaiel)
  • Lieber durch als außenrum. (Bild: Tyler Glaiel)
  • Lösungsvorschlag von GPT-4 (Bild: Tyler Glaiel)
  • Lösungsvorschlag von GPT-3.5 (Bild: Tyler Glaiel)
  • Das Problem: Das Programm soll erkennen, wenn Sicheln kollidieren. (Bild: Tyler Glaiel)
Eine neue Anfrage an GPT-4 (Bild: Tyler Glaiel)

Nächster Versuch: Auch hier ist es schwer, Gegenbeispiele zu finden, aber hier ist eines, das 2.a nicht erfüllt: Die äußeren Kreise kollidieren, jeder innere Kreis kollidiert mit dem äußeren Kreis des anderen, aber nicht miteinander – die Halbmonde kollidieren also nicht.

Offenbar macht ChatGPT an diesem Punkt einfach nur Mist. Es hat keine Antwort, also denkt es sich einfach irgendetwas aus.

Tatsächlich ist es gut darin, sich etwas auszudenken, wie diesen Algorithmus. Die Fälle, in denen es versagt, sind raffiniert. Man könnte den Algorithmus leicht in einem Buch veröffentlichen und Menschen damit verwirren, weil sie wahrscheinlich denken würden, sie hätten die Implementierung verpfuscht, wenn es Fehler in der Kollisionserkennung gibt. Denn GPTs Lösung wirkt wie ein Algorithmus, der das Problem lösen kann.

Kann ChatGPT nun Code schreiben oder nicht?

Wenn es eine Beschreibung eines Algorithmus oder ein bekanntes Problem mit vielen Beispielen im Internet gibt, kann GPT-4 durchaus Code schreiben. Meistens setzt es eben Dinge zusammen, die es schon gesehen hat. Und um ehrlich zu sein: Ein Großteil von Programmierungsaufgaben ist ja genau das.

Allerdings versagt es völlig, wenn es versucht, wirkliche Probleme zu lösen. Die Art von neuartigen Problemen, die noch nie gelöst wurden und auf die man beim Programmieren stoßen kann. Außerdem rät es gern, und mit diesem Raten kann man viel Zeit verschwenden, wenn es einen auf den falschen Weg führt.

Das Beispiel mit dem Halbmond ist ziemlich bedenklich. ChatGPT kennt die Antwort nicht, es gab kein Beispiel dafür in seinen Trainingsdaten und es kann nichts dazu in seinem Modell finden. Es wäre sinnvoll, wenn es einfach sagen würde: "Ich kenne keinen Algorithmus, der das kann."

Aber es ist zu sehr von seinen eigenen Fähigkeiten überzeugt und erfindet einfach etwas.

Oder, in seinen eigenen Worten:

  • Über normale Kacheln geht es hier in fünf Schritten zum Ziel. (Bild: Tyler Glaiel)
  • Hier die Anweisung von mir für GPT-4 (Bild: Tyler Glaiel)
  • Die Sicheln berühren einander nicht. (Bild: Tyler Glaiel)
  • Eine neue Anfrage an GPT-4 (Bild: Tyler Glaiel)
  • GPT-4 ist von sich selbst beeindruckt. (Bild: Tyler Glaiel)
  • ... muss sie einfach mittendurch. (Bild: Tyler Glaiel)
  • Die Katze möchte Feuer meiden, versucht es links,...
  • ... dann rechts und muss schließlich feststellen: Mit ihren sechs Feldern Reichweite...
  • Hier bräuchte die Katze 14 Felder...
  • ... hier 10. (Bild: Tyler Glaiel)
  • Lieber durch als außenrum. (Bild: Tyler Glaiel)
  • Lösungsvorschlag von GPT-4 (Bild: Tyler Glaiel)
  • Lösungsvorschlag von GPT-3.5 (Bild: Tyler Glaiel)
  • Das Problem: Das Programm soll erkennen, wenn Sicheln kollidieren. (Bild: Tyler Glaiel)
GPT-4 ist von sich selbst beeindruckt. (Bild: Tyler Glaiel)

Das gleiche Problem hat es in vielen anderen Bereichen, auch wenn seine Kompetenz beim Schreiben von einfachem Code das ein wenig überdeckt.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Wie gut schlägt sich GPT-4?
  1.  
  2. 1
  3. 2
  4. 3
  5. 4


Trollversteher 05. Apr 2023

Das trifft auf die konkrete Formulierung zu - im Gegensatz zu ChatGPT hat der Mensch...

Trollversteher 05. Apr 2023

Haha, also Ich würde im Job nicht auf eine solche Idee kommen, und kenne auch keinen...

Insomnia88 30. Mär 2023

Wenn ich 10 Jahre zurück gehe, fällt mir bis auf Ki nichts ein, was es nicht auch schon...

herding_cats 28. Mär 2023

Die Programmiersprachen sind deutlich exakter als natürliche Sprachen. Du hast auf jeden...



Aktuell auf der Startseite von Golem.de
Vermona
Zufall und Synthesizer

Wie aus einem großen DDR-Staatsbetrieb ein erfolgreicher kleiner Hersteller von analogen Synthies wurde.
Von Martin Wolf

Vermona: Zufall und Synthesizer
Artikel
  1. Neuer ISO-Standard 31700: Meilenstein für den Datenschutz oder DSGVO-Bluff?
    Neuer ISO-Standard 31700
    Meilenstein für den Datenschutz oder DSGVO-Bluff?

    Ein neuer ISO-Standard soll Firmen dazu bringen, sich mehr um Datenschutz zu kümmern. Kritiker zweifeln allerdings an seiner Wirksamkeit.
    Eine Analyse von Christiane Schulzki-Haddouti

  2. Blizzard: Konsolen-Abo für Solo in Diablo 4 doch nicht zwingend nötig
    Blizzard
    Konsolen-Abo für Solo in Diablo 4 doch nicht zwingend nötig

    Singleplayer benötigt in Diablo 4 auf Playstation und Xbox doch kein Abo. Wer bei seinen Abenteuern auch chatten möchte, muss aber zahlen.

  3. VW ID.Buzz XL: Längerer Elektrobus mit mehr PS und Reichweite
    VW ID.Buzz XL
    Längerer Elektrobus mit mehr PS und Reichweite

    Der ID.Buzz von VW kommt in einer XL-Version auf den Markt. Viele Neuerungen werden vom ID.7 übernommen.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • SanDisk Ultra NVMe 1 TB ab 39,99€ • Samsung 980 1 TB 44,99€ • MindStar: be quiet! Pure Base 500 69€, MSI MPG B550 Gaming Plus 99,90€, Palit RTX 4070 GamingPro 666€, AMD Ryzen 9 7950X3D 699€ • KFA2 RTX 3060 Ti 329,99€ • Kingston Fury SSD 2 TB PS5 129,91€ [Werbung]
    •  /