GPT-4: "Funken von allgemeiner künstlicher Intelligenz"
Microsoft Research enthüllt eine umfangreiche Sammlung von Fallbeispielen, die mit dem ChatGPT-Nachfolger GPT-4 erzeugt wurden. Die Ergebnisse sind beeindruckend.

Eine menschenähnliche künstliche Intelligenz wird immer greifbarer. Das zeigt die Vorabversion eines Artikels, den eine Gruppe von Microsoft-Forschern am 23. März veröffentlicht hat. In dem 156-seitigen Papier mit dem Titel Sparks of Artificial General Intelligence: Early experiments with GPT-4 präsentieren die Autoren die Resultate unterschiedlichster Tests, die sie mit dem Sprachmodell GPT-4 von OpenAI durchgeführt haben.
- GPT-4: "Funken von allgemeiner künstlicher Intelligenz"
- GPT-4 kann programmieren
- GPT-4 kann Werkzeuge einsetzen
- Ein bedenkliches Szenario
- Was es braucht, damit der Funken zündet
GPT-4 ist der Nachfolger des Sprachmodells ChatGPT, das in den vergangenen Monaten großes Aufsehen erregt hat. Die aktuelle Version von GPT-4 ist multimodal und kann damit beispielsweise auch Grafikdateien in ihren Prompts verarbeiten und Fragen zu Bildern beantworten. Für ihre Experimente verwendeten die Microsoft-Forscher jedoch eine frühere Version, bei der es sich noch um ein reines Sprachmodell handelte. Eingaben und Ausgaben der im Artikel beschriebenen Anwendungsfälle waren also ausschließlich Texte.
Das aktuelle Papier erschien nur wenige Tage nach dem Technical Report, mit dem OpenAI das neue Modell GPT-4 offiziell veröffentlicht hatte. Während dieser eher abstrakt gehalten ist und sich hauptsächlich auf Statistiken zu Benchmarks fokussiert, zeigt das Microsoft-Research-Papier viele konkrete Fallbeispiele und diskutiert im Detail die Fähigkeiten und Limitationen des Sprachmodells.
Nach der Lektüre der zahlreichen Fallbeispiele fällt es schwer, die Position aufrechtzuerhalten, dass die Entwicklung einer AGI noch viele Jahrzehnte entfernt liegen oder sogar technisch grundsätzlich unmöglich sein könne. Obwohl auch GPT-4 nicht immer einwandfrei arbeitet und ihm verschiedene Arten von Fehlern unterlaufen können, liefert es in allen übrigen Fällen äußerst beeindruckende Ergebnisse.
Der Titel des Artikels vermittelt genau diese Idee: Die Autoren betrachten GPT-4 als einen "Funken" von Intelligenz, aber noch nicht als vollständige AGI (Artificial General Intelligence). Im Folgenden werden die Ergebnisse des Papiers zusammengefasst:
Ein Sprachmodell mit visuellem Vorstellungsvermögen
In unterschiedlichen Tests zeigen die Autoren, dass GPT-4 Informationen aus unterschiedlichsten Domänen effektiv kombinieren kann. Dies umfasst nicht nur eine Vielzahl von Wissensgebieten, Sprachen und Stilen, sondern auch Programmiersprachen und sogar bildliche Darstellungen.
Besonders überraschend ist die Tatsache, dass GPT-4 trotz seines rein textbasierten Trainings eine Art visuelles Vorstellungsvermögen entwickelt hat. Die Autoren demonstrieren dies anhand mehrerer Beispiele, bei denen das Sprachmodell auf Anweisung Bilder zeichnet oder verändert, indem es die entsprechenden Befehlszeilen für die LaTex-Skriptsprache TiKZ ausgibt.
Dieser Code konnte anschließend von den Forschern zu Bildern kompiliert werden. Das Modell zeigt dabei eine erstaunliche Fähigkeit zur Abstraktion und Verallgemeinerung, zum Beispiel, indem es Strichmännchen aus drei vorgegebenen Buchstaben zusammensetzt.
In rein sprachlichen Aufgaben zeigt GPT-4 Kreativität, indem es Texte oder Gedichte aus verschiedenen Themen und Stilen kombiniert. Es kann sogar seine selbst generierten Texte mit analogen Ausgaben der Vorgängerversion ChatGPT vergleichen und dabei sehr differenziert auch feine Nuancen in Sprachstil und Inhalt bewerten.
Interessanterweise hat GPT-4 auch ein rudimentäres Verständnis für Musik entwickelt, wenngleich es in diesem Bereich noch weit hinter seinen sprachlichen und visuellen Fähigkeiten zurückbleibt.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
GPT-4 kann programmieren |
GPT-4 wurde nicht programmiert, sondern trainiert. Da laufen keine Algorithmen ab, die...
+1 Genau das denke ich auch. Und genau daher wird evtl die im Artikel beschriebene...
Habe gerade das hier gelesen https://www.br.de/nachrichten/netzwelt/microsoft-ki-bing...
Hier gibts aber viele naive Kommentare die an eine Debatte in der Oberstufe erinnern. Es...
Kommentieren