Zum Hauptinhalt Zur Navigation

Datenbanken: GPT-3 generiert SQL-Abfragen aus simplen Fragen

Die KI kann selbstständig Relationen zwischen Datensätzen herstellen. Das macht den Analystenjob einfacher, funktioniert aber nicht immer.
/ Oliver Nickel
5 Kommentare News folgen (öffnet im neuen Fenster)
GPT-3 kann diverse SQL-Abfragen aus Sätzen generieren. (Bild: Pixabay.com)
GPT-3 kann diverse SQL-Abfragen aus Sätzen generieren. Bild: Pixabay.com

Der Analyst und Entwickler Brian Kane der Firma Seekwell hat sich das KI-Modell GPT-3 zu Hilfe genommen, um SQL-Abfragen aus einfachen Sätzen zu generieren. So ergibt die Frage "Wie viele User haben sich im letzten Monat angemeldet?" eine dazu passende PostgreSQL-Abfrage, die fertig formatiert richtige Ergebnisse liefern würde. In einem längeren Blog-Post(öffnet im neuen Fenster) hat Kane viele solcher Beispiele angebracht und seine Faszination über die Genauigkeit des Modells ausgedrückt.

Interessant: Auch sehr allgemein gehaltene Instruktionen interpretiert GPT-3 anfangs richtig. So schätzt das Modell etwa korrekt, welche Datenbanknamen und Attribute im Unternehmen genutzt werden. Das funktioniert zunächst allerdings nur mit einfachen SQL-Abfragen. Es ist aber möglich, dem Modell auch zu erklären, welche Tabellen mit welchen Spalten angenommen werden sollen. Die Anweisungen erfolgen in Textform und nicht in SQL-Syntax.

Fehlerkorrektur durch weitere SQL-Beispiele

Für genauere Ergebnisse hat Kane dem Modell einige Beispiele gegeben. So wurde GPT-3 angewiesen, alle Spalten aus bestimmten Tabellen einmal auszuwählen. Das Modell kann sich so merken, welche Inhalte in den Datensätzen enthalten sind und selbstständig Zusammenhänge herstellen.

In den meisten Fällen funktioniert das bereits gut, wenn auch einige Annahmen des Modells falsch sind. Teils werden etwa falsche Identifier gesetzt oder Relationen nicht richtig erkannt. Mit Hilfe weiterführender Beispiele, etwa indem ein Join-Kommando in SQL vorgegeben wird, kann das Modell Fehler aber korrigieren und entsprechend richtige Abfragen ausgeben.

GPT-3 funktioniert derzeit fast ausschließlich für die englische Sprache, da ein Großteil der Trainingsdaten in Englisch vorliegen. Entsprechend wäre ein nutzerfreundlicher SQL-Abfrage-Generator derzeit nicht auf Deutsch möglich. Es zeigt aber, dass für logische Zusammenhänge und Programmiersprachen ein KI-Modell nicht mehr allzu weit davon entfernt ist, zeitaufwendige Aufgaben aus den Entwicklerhänden zu nehmen.

Möglicherweise werden sich Analystenjobs, wie ihn Brian Kane besetzt, in naher Zukunft stark verändern und irgendwann komplett überflüssig.


Relevante Themen