Abo
  • Services:
Anzeige
System erzeugt regulären Ausdruck aus natürlicher Sprache.
System erzeugt regulären Ausdruck aus natürlicher Sprache. (Bild: MIT)

MIT Programmieren mit natürlicher Sprache

Forscher am MIT haben zwei unterschiedliche Ansätze entwickelt, die es erlauben, in natürlicher Sprache zu programmieren. Nicht jede Art von Code lässt sich so schreiben, bei manchen Aufgaben funktioniert das System aber besser als ein Saal voller Informatiker.

Anzeige

Einige spezifische Programmieraufgaben lassen sich gut mit natürlicher Sprache abwickeln, das zeigen Forscher des Computer Science and Artificial Intelligence Laboratory am Massachusetts Institute of Technology (MIT). Ihre Arbeit könnte Programmierer bei der Arbeit unterstützen, aber auch Nichtprogrammierern Dinge ermöglichen, für die man bisher zumindest ein bisschen programmieren lernen musste. Die Forscher um Professor Regina Barzilay nutzen dabei zwei grundlegend unterschiedliche Ansätze.

Reguläre Ausdrücke

Beim ersten geht es darum, reguläre Ausdrücke mit natürlicher Sprache zu beschreiben. Da aufgrund der Syntax eine einfache Abbildung der natürlichen Sprache in Form eines regulären Ausdrucks nicht möglich ist, greifen Nate Kushman und Barzilay auf bereits existierende Übersetzungen zurück, die sich im Internet finden lassen.

Dabei fiel auf, dass praktisch jeder reguläre Ausdruck ein Äquivalent hat, das sich leicht in natürliche Sprache übersetzen lässt. Über einen Graph lassen sich alle Äquivalente eines regulären Ausdrucks gleichzeitig darstellen. So muss der Übersetzungsalgorithmus letztendlich die natürliche Sprache nur auf Symbole zurückführen und anschließend über den Graph eine kompaktere Version des regulären Ausdrucks finden.

Bei der Vorstellung ihrer Forschungsergebnisse bat Kushman die im Raum anwesenden Informatiker, einen regulären Ausdruck für eine recht einfache Textsuche aufzuschreiben. Nur ein kleiner Teil fand die korrekte Lösung. Den anderen hätte die automatische Übersetzung geholfen.

Computer schreibt Parser anhand der Spezifikation selbst

Zusammen mit Tao Lei, Professor Martin Rinard und Fan Long hat Regina Barzilay noch einen zweiten Ansatz entwickelt, nicht für reguläre Ausdrücke, sondern für Input-Parser, die Struktur von Dateiformaten erkennen. Mit dem von den MIT-Forschern entwickelten System lassen sich solche Input-Parser automatisch aus der jeweiligen Spezifikation des Dateiformats erzeugen.

Getestet wurde das Ganze mit mehr als 100 Beispielen. Dabei griffen die Forscher auf Aufgaben aus dem Programmierwettbewerb der Association for Computing Machinery's International Collegiate zurück. Für rund 80 Prozent der Aufgaben lieferte das System funktionierende Input-Parser, bei den restlichen 20 Prozent genügte es meist, ein oder zwei Wörter in der Spezifikation zu ändern, damit das System einen funktionieren Parser erzeugte.

Dabei kennt das System nur eine kleine Anzahl an Begriffen, die immer für die gleichen Datentypen verwendet werden, beispielsweise "Integer", und weiß zudem, dass die Spezifikation wahrscheinlich ineinander verschachtelte Datenstrukturen beschreibt. Damit ausgestattet, testet das System viele unterschiedliche Interpretationen der Spezifikation mit Beispieldateien aus. Funktioniert der Parser mit der Datei nicht, wird die Interpretation minimal verändert und erneut getestet, bis eine funktionierende Version gefunden ist.

Dabei lernt das System, wie Parser im Allgemeinen aufgebaut sind und wird mit der Zeit besser. Bei den Experimenten der Forscher dauerte es nur 10 Minuten, um 100 Parser zu erzeugen.


eye home zur Startseite
Ry 23. Jul 2013

da musst du das Dokument wohl noch mal lesen zusammen mit 2119

YoungManKlaus 23. Jul 2013

du meinst wohl http://xkcd.com/323/

azeu 22. Jul 2013

aber, es ist ja auch nicht so, dass in der Webentwicklung täglich das Rad neu erfunden...

monettenom 22. Jul 2013

Beim Erstellen von Regulären Ausdrücken und Parsen von Input-Daten von "Programmieren" zu...

Beazy 22. Jul 2013

Euere Diskussion geht am Thema vorbei. Ich stelle mir die Vorgehensweise eher so vor: Du...



Anzeige

Stellenmarkt
  1. über Robert Half Technology Personalvermittlung, Oberhausen
  2. nobilia-Werke J. Stickling GmbH & Co. KG, Verl
  3. ESG Consulting GmbH, München/Fürstenfeldbruck, Berlin
  4. W. Gessmann GmbH, Leingarten


Anzeige
Hardware-Angebote
  1. (Core i5-6500 + Geforce GTX 1060)
  2. (täglich neue Deals)
  3. 114,90€

Folgen Sie uns
       


  1. Hilfe von Google

    Brian Krebs' Blog ist nach DDoS-Angriff wieder erreichbar

  2. Filmdatenbank

    Schauspieler lassen ihr Alter aus dem Internet entfernen

  3. Fortwo, Fortwo Cabrio und Forfour

    Ab 2017 gibt es alle Smarts als Elektroautos

  4. Megacams.me

    Porno-Webcam-Suchmaschine soll Doppelgänger-Videos finden

  5. Android 7.0 im Test

    Zwei Fenster für mehr Durchblick

  6. Riesenteleskop Fast

    China hält Ausschau nach Außerirdischen

  7. Schweiz

    Bürger stimmen für erweiterte Überwachungsbefugnisse

  8. Capcom

    PC-Version von Street Fighter 5 installierte Rootkit

  9. Mojang

    Noch mehr Möglichkeiten mit Addons für Minecraft

  10. App Preview Messaging

    Android soll Messenger-Nachrichten ohne App empfangen können



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Original und Fork im Vergleichstest: Nextcloud will das bessere Owncloud sein
Original und Fork im Vergleichstest
Nextcloud will das bessere Owncloud sein
  1. Koop mit Canonical und WDLabs Nextcloud Box soll eigenes Hosten ermöglichen
  2. Kollaborationsserver Nextcloud 10 verbessert Server-Administration
  3. Open Source Nextcloud setzt sich mit Enterprise-Support von Owncloud ab

Starship Technologies: Es wird immer nach Diebstahl und Vandalismus gefragt
Starship Technologies
Es wird immer nach Diebstahl und Vandalismus gefragt
  1. Recore Mein Buddy, der Roboter
  2. Weltraumforschung DFKI-Roboter soll auf dem Jupitermond Europa abtauchen
  3. Softrobotik Oktopus-Roboter wird mit Gas angetrieben

PES 2017 im Test: Vom Feeling her ein gutes Gefühl
PES 2017 im Test
Vom Feeling her ein gutes Gefühl

  1. Re: Für einen Dienst der nicht wächst und in den...

    ip_toux | 15:44

  2. Re: Zwang zur Weiternutzung

    CopyUndPaste | 15:43

  3. Re: Sind das jetzt Bilder ohne Filter?

    david_rieger | 15:42

  4. Re: Mal wieder halbherzig

    Steffo | 15:42

  5. Re: Telegram, Signal, Threema und Co keine...

    Shunator | 15:42


  1. 13:45

  2. 13:30

  3. 13:00

  4. 12:30

  5. 12:03

  6. 11:49

  7. 11:37

  8. 11:30


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel