Anzeige
System erzeugt regulären Ausdruck aus natürlicher Sprache.
System erzeugt regulären Ausdruck aus natürlicher Sprache. (Bild: MIT)

MIT Programmieren mit natürlicher Sprache

Forscher am MIT haben zwei unterschiedliche Ansätze entwickelt, die es erlauben, in natürlicher Sprache zu programmieren. Nicht jede Art von Code lässt sich so schreiben, bei manchen Aufgaben funktioniert das System aber besser als ein Saal voller Informatiker.

Anzeige

Einige spezifische Programmieraufgaben lassen sich gut mit natürlicher Sprache abwickeln, das zeigen Forscher des Computer Science and Artificial Intelligence Laboratory am Massachusetts Institute of Technology (MIT). Ihre Arbeit könnte Programmierer bei der Arbeit unterstützen, aber auch Nichtprogrammierern Dinge ermöglichen, für die man bisher zumindest ein bisschen programmieren lernen musste. Die Forscher um Professor Regina Barzilay nutzen dabei zwei grundlegend unterschiedliche Ansätze.

Reguläre Ausdrücke

Beim ersten geht es darum, reguläre Ausdrücke mit natürlicher Sprache zu beschreiben. Da aufgrund der Syntax eine einfache Abbildung der natürlichen Sprache in Form eines regulären Ausdrucks nicht möglich ist, greifen Nate Kushman und Barzilay auf bereits existierende Übersetzungen zurück, die sich im Internet finden lassen.

Dabei fiel auf, dass praktisch jeder reguläre Ausdruck ein Äquivalent hat, das sich leicht in natürliche Sprache übersetzen lässt. Über einen Graph lassen sich alle Äquivalente eines regulären Ausdrucks gleichzeitig darstellen. So muss der Übersetzungsalgorithmus letztendlich die natürliche Sprache nur auf Symbole zurückführen und anschließend über den Graph eine kompaktere Version des regulären Ausdrucks finden.

Bei der Vorstellung ihrer Forschungsergebnisse bat Kushman die im Raum anwesenden Informatiker, einen regulären Ausdruck für eine recht einfache Textsuche aufzuschreiben. Nur ein kleiner Teil fand die korrekte Lösung. Den anderen hätte die automatische Übersetzung geholfen.

Computer schreibt Parser anhand der Spezifikation selbst

Zusammen mit Tao Lei, Professor Martin Rinard und Fan Long hat Regina Barzilay noch einen zweiten Ansatz entwickelt, nicht für reguläre Ausdrücke, sondern für Input-Parser, die Struktur von Dateiformaten erkennen. Mit dem von den MIT-Forschern entwickelten System lassen sich solche Input-Parser automatisch aus der jeweiligen Spezifikation des Dateiformats erzeugen.

Getestet wurde das Ganze mit mehr als 100 Beispielen. Dabei griffen die Forscher auf Aufgaben aus dem Programmierwettbewerb der Association for Computing Machinery's International Collegiate zurück. Für rund 80 Prozent der Aufgaben lieferte das System funktionierende Input-Parser, bei den restlichen 20 Prozent genügte es meist, ein oder zwei Wörter in der Spezifikation zu ändern, damit das System einen funktionieren Parser erzeugte.

Dabei kennt das System nur eine kleine Anzahl an Begriffen, die immer für die gleichen Datentypen verwendet werden, beispielsweise "Integer", und weiß zudem, dass die Spezifikation wahrscheinlich ineinander verschachtelte Datenstrukturen beschreibt. Damit ausgestattet, testet das System viele unterschiedliche Interpretationen der Spezifikation mit Beispieldateien aus. Funktioniert der Parser mit der Datei nicht, wird die Interpretation minimal verändert und erneut getestet, bis eine funktionierende Version gefunden ist.

Dabei lernt das System, wie Parser im Allgemeinen aufgebaut sind und wird mit der Zeit besser. Bei den Experimenten der Forscher dauerte es nur 10 Minuten, um 100 Parser zu erzeugen.


eye home zur Startseite
Ry 23. Jul 2013

da musst du das Dokument wohl noch mal lesen zusammen mit 2119

YoungManKlaus 23. Jul 2013

du meinst wohl http://xkcd.com/323/

azeu 22. Jul 2013

aber, es ist ja auch nicht so, dass in der Webentwicklung täglich das Rad neu erfunden...

monettenom 22. Jul 2013

Beim Erstellen von Regulären Ausdrücken und Parsen von Input-Daten von "Programmieren" zu...

Beazy 22. Jul 2013

Euere Diskussion geht am Thema vorbei. Ich stelle mir die Vorgehensweise eher so vor: Du...

Kommentieren



Anzeige

  1. Trainee Requirements Engineer (m/w) Cloud Produkte
    Haufe Gruppe, Freiburg im Breisgau
  2. IT-Scrum Master Payment Solutions (m/w)
    Media-Saturn IT Services GmbH, Ingolstadt
  3. Professional IT Consultant Automotive Marketing und Sales (m/w)
    T-Systems International GmbH, Leinfelden-Echterdingen
  4. Senior Consultant SAP HCM (m/w)
    über Mentis International Human Resources GmbH, Nordbayern

Detailsuche



Anzeige

Folgen Sie uns
       


  1. Zcryptor

    Neue Ransomware verbreitet sich auch über USB-Sticks

  2. LTE-Nachfolger

    Huawei schließt praktische Tests für Zukunftsmobilfunk ab

  3. Beam

    Neues Modul für Raumstation klemmt

  4. IT-Sicherheit

    SWIFT-Hack vermutlich größer als bislang angenommen

  5. Windows 10

    Microsoft bringt verdoppelten Virenschutz

  6. Audience Network

    Facebook trackt auch Nichtnutzer für Werbezwecke

  7. Statt Fernsehen

    Ministerrat will europaweite 700-MHz-Freigabe für Breitband

  8. Gran Turismo Sport

    Ein Bündnis mit der Realität

  9. Fensens Parksensor

    Einparken mit dem Smartphone

  10. Telefónica

    Microsoft und Facebook bauen 160-TBit/s-Seekabel nach Europa



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Privacy-Boxen im Test: Trügerische Privatheit
Privacy-Boxen im Test
Trügerische Privatheit
  1. Hack von Rüstungskonzern Schweizer Cert gibt Security-Tipps für Unternehmen
  2. APT28 Hackergruppe soll CDU angegriffen haben
  3. Veröffentlichung privater Daten AfD sucht mit Kopfgeld nach "Datendieb"

Traceroute: Wann ist ein Nerd ein Nerd?
Traceroute
Wann ist ein Nerd ein Nerd?

Formel E: Monaco-Feeling beim E-Prix in Berlin-Mitte
Formel E
Monaco-Feeling beim E-Prix in Berlin-Mitte
  1. Hewlett Packard Enterprise "IT wird beim Autorennen immer wichtiger"
  2. Roborace Roboterrennwagen fahren mit Nvidia-Computer
  3. Elektromobilität BMW und Nissan wollen in die Formel E

  1. Re: Sauregurkenzeit..?

    Adra | 07:45

  2. Re: Adblocker sind die besseren Antiviren

    unbuntu | 07:42

  3. Re: Ein Betriebssystem...

    unbuntu | 07:39

  4. Re: Vegetarisch ernähren

    unbuntu | 07:35

  5. Re: Interessiert mich schon lange nicht mehr...

    Adra | 07:30


  1. 17:09

  2. 16:15

  3. 15:51

  4. 15:21

  5. 15:12

  6. 14:28

  7. 14:17

  8. 14:08


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel