• IT-Karriere:
  • Services:

MIT: Programmieren mit natürlicher Sprache

Forscher am MIT haben zwei unterschiedliche Ansätze entwickelt, die es erlauben, in natürlicher Sprache zu programmieren. Nicht jede Art von Code lässt sich so schreiben, bei manchen Aufgaben funktioniert das System aber besser als ein Saal voller Informatiker.

Artikel veröffentlicht am ,
System erzeugt regulären Ausdruck aus natürlicher Sprache.
System erzeugt regulären Ausdruck aus natürlicher Sprache. (Bild: MIT)

Einige spezifische Programmieraufgaben lassen sich gut mit natürlicher Sprache abwickeln, das zeigen Forscher des Computer Science and Artificial Intelligence Laboratory am Massachusetts Institute of Technology (MIT). Ihre Arbeit könnte Programmierer bei der Arbeit unterstützen, aber auch Nichtprogrammierern Dinge ermöglichen, für die man bisher zumindest ein bisschen programmieren lernen musste. Die Forscher um Professor Regina Barzilay nutzen dabei zwei grundlegend unterschiedliche Ansätze.

Reguläre Ausdrücke

Stellenmarkt
  1. Haufe Group, Freiburg im Breisgau
  2. SCHOTT AG, Mainz

Beim ersten geht es darum, reguläre Ausdrücke mit natürlicher Sprache zu beschreiben. Da aufgrund der Syntax eine einfache Abbildung der natürlichen Sprache in Form eines regulären Ausdrucks nicht möglich ist, greifen Nate Kushman und Barzilay auf bereits existierende Übersetzungen zurück, die sich im Internet finden lassen.

Dabei fiel auf, dass praktisch jeder reguläre Ausdruck ein Äquivalent hat, das sich leicht in natürliche Sprache übersetzen lässt. Über einen Graph lassen sich alle Äquivalente eines regulären Ausdrucks gleichzeitig darstellen. So muss der Übersetzungsalgorithmus letztendlich die natürliche Sprache nur auf Symbole zurückführen und anschließend über den Graph eine kompaktere Version des regulären Ausdrucks finden.

Bei der Vorstellung ihrer Forschungsergebnisse bat Kushman die im Raum anwesenden Informatiker, einen regulären Ausdruck für eine recht einfache Textsuche aufzuschreiben. Nur ein kleiner Teil fand die korrekte Lösung. Den anderen hätte die automatische Übersetzung geholfen.

Computer schreibt Parser anhand der Spezifikation selbst

Zusammen mit Tao Lei, Professor Martin Rinard und Fan Long hat Regina Barzilay noch einen zweiten Ansatz entwickelt, nicht für reguläre Ausdrücke, sondern für Input-Parser, die Struktur von Dateiformaten erkennen. Mit dem von den MIT-Forschern entwickelten System lassen sich solche Input-Parser automatisch aus der jeweiligen Spezifikation des Dateiformats erzeugen.

Getestet wurde das Ganze mit mehr als 100 Beispielen. Dabei griffen die Forscher auf Aufgaben aus dem Programmierwettbewerb der Association for Computing Machinery's International Collegiate zurück. Für rund 80 Prozent der Aufgaben lieferte das System funktionierende Input-Parser, bei den restlichen 20 Prozent genügte es meist, ein oder zwei Wörter in der Spezifikation zu ändern, damit das System einen funktionieren Parser erzeugte.

Dabei kennt das System nur eine kleine Anzahl an Begriffen, die immer für die gleichen Datentypen verwendet werden, beispielsweise "Integer", und weiß zudem, dass die Spezifikation wahrscheinlich ineinander verschachtelte Datenstrukturen beschreibt. Damit ausgestattet, testet das System viele unterschiedliche Interpretationen der Spezifikation mit Beispieldateien aus. Funktioniert der Parser mit der Datei nicht, wird die Interpretation minimal verändert und erneut getestet, bis eine funktionierende Version gefunden ist.

Dabei lernt das System, wie Parser im Allgemeinen aufgebaut sind und wird mit der Zeit besser. Bei den Experimenten der Forscher dauerte es nur 10 Minuten, um 100 Parser zu erzeugen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Top-Angebote
  1. 119,90€ + 6,99€ Versand (Vergleichspreis 148,98€ inkl. Versand)
  2. 64,90€ inkl. Direktabzug (Vergleichspreis 81,90€)
  3. 59,99€ (Vergleichspreis 97,83€)
  4. 26,90€ (Bestpreis!)

Ry 23. Jul 2013

da musst du das Dokument wohl noch mal lesen zusammen mit 2119

YoungManKlaus 23. Jul 2013

du meinst wohl http://xkcd.com/323/

Anonymer Nutzer 22. Jul 2013

aber, es ist ja auch nicht so, dass in der Webentwicklung täglich das Rad neu erfunden...

monettenom 22. Jul 2013

Beim Erstellen von Regulären Ausdrücken und Parsen von Input-Daten von "Programmieren" zu...

Beazy 22. Jul 2013

Euere Diskussion geht am Thema vorbei. Ich stelle mir die Vorgehensweise eher so vor: Du...


Folgen Sie uns
       


Cyberpunk 2077 - Fazit

Im Test-Video stellen wir unser Fazit von Cyberpunk 2077 vor.

Cyberpunk 2077 - Fazit Video aufrufen
    •  /