Abo
  • Services:
Anzeige

Zwischentöne

Software erkennt Sarkasmus

Produktbesprechungen bei Amazon sind oft voller sarkastischer oder ironischer Anspielungen, die manche Leser nicht verstehen. Drei israelische Informatiker haben ein Programm entwickelt, das Sarkasmus erkennt - und das sogar ziemlich gut.

Rhetorische Stilformen wie Ironie oder Sarkasmus bleiben oft unerkannt - in geschriebener Sprache noch mehr als in gesprochener. Dennoch greifen viele Autoren, gerade im Internet, gern zum Sarkasmus. Damit Lesern dieses Stilmittel künftig nicht mehr verborgen bleibt, haben die Informatiker Oren Tsur, Dmitry Davidov und Ari Rappoport von der Hebräischen Universität in Jerusalem einen Sarkasmus-Detektor entwickelt.

Anzeige

Hohe Trefferquote

Semi-supervised Algorithm for Sarcasm Identification, kurz Sasi, haben die drei ihr Programm genannt. Es sei in der Lage, schreiben die Wissenschaftler, sarkastische Sätze mit einer Treffergenauigkeit von 77 Prozent zu erkennen.

Um Sasi nahezubringen, was Sarkasmus ist, arbeiteten sich die Entwickler zunächst durch 66.000 Produktrezensionen bei Amazon, in denen Sätze wie "Gute Idee - aber versucht es jetzt nochmal mit einem richtigen Produktentwicklerteam", "Für dieses Buch mussten Bäume sterben?" oder "Hat alle Merkmale, die man haben möchte. Nur schade, dass sie nicht funktionieren" vorkamen.

Sasi studiert Sarkasmus

Wenn drei der Tester einen Satz als sarkastisch einstuften, wurde er als Beispielsatz ausgewählt. Insgesamt 80 Trainingsmuster blieben am Schluss übrig, die dann noch auf einer fünfstufigen Skala klassifiziert wurden. Anschließend fütterten Tsur, Davidov und Rappoport ihr Programm mit den 80 Sätzen und brachten ihm so bei, welche Worte oder Satzmuster Sarkasmus ausmachen, etwa die Worte konträr zum Inhalt zu wählen.

Nach der Lernphase machten sie die Gegenprobe: Sie ließen Sasi die 66.000 Rezensionen - ohne die Sätze, die zum Training benutzt wurden - analysieren und auf sarkastische Äußerungen prüfen. Ein Team aus 15 Menschen mit unterschiedlichem kulturellem Hintergrund beurteilte dann die Ergebnisse. Danach lag Sasi in 77 Prozent der Fälle richtig. In Anbetracht der Tatsache, dass Humor sehr unterschiedlich ist und von vielen Faktoren abhängt, wie etwa dem kulturellen Hintergrund, ist das ein beachtliches Ergebnis.

Die Sarkasmuserkennung könne zur Verbesserung von Besprechungen und Bewertungssystemen beitragen, schreiben Tsur, Dmitry und Rappoport. Sie wollen ihre Erkenntnisse in der kommenden Woche auf einer Konferenz über Blogs und soziale Medien vorstellen, die von der Association for the Advancement of Artificial Intelligence veranstaltet wird. Dort präsentiert auch eine Gruppe von Wissenschaftlern aus den USA, wie sich der Microbloggingdienst Twitter für die Meinungsforschung nutzen lässt.


eye home zur Startseite
GodsBoss 09. Nov 2010

1. Es gibt keinen stichhaltigen Beweis, dass die Dvorak-Tastaturbelegung überlegen ist...

abc-man 24. Mai 2010

Endlich keine Schilder mehr malen. http://www.mormonmommywars.com/wp-content/uploads/2009...

M. Hofmann 24. Mai 2010

die gerne die Meinungsfreiheit im Internet einschränken wollen. Noch ist Sakraksmus ein...

sosohoho 23. Mai 2010

... brauchen wohl für alles einen Algoritmus. Ansonsten kommen Sie mit der Welt um sich...



Anzeige

Stellenmarkt
  1. T-Systems International GmbH, Bonn
  2. Detecon International GmbH, Köln, Frankfurt am Main
  3. Deutsche Telekom AG, Bonn
  4. operational services GmbH & Co. KG, Braunschweig


Anzeige
Blu-ray-Angebote
  1. 149,99€ (Vorbesteller-Preisgarantie)
  2. (u. a. Minions 11,97€, Game of Thrones, The Dark Knight Trilogy)

Folgen Sie uns
       


  1. Teilzeitarbeit

    Amazon probiert 30-Stunden-Woche aus

  2. Archos

    Neues Smartphone mit Fingerabdrucksensor für 150 Euro

  3. Sicherheit

    Operas Server wurden angegriffen

  4. Maru

    Quellcode von Desktop-Android als Open Source verfügbar

  5. Linux

    Kernel-Sicherheitsinitiative wächst "langsam aber stetig"

  6. VR-Handschuh

    Dexta Robotics' Exoskelett für Motion Capturing

  7. Dragonfly 44

    Eine Galaxie fast ganz aus dunkler Materie

  8. Gigabit-Breitband

    Google Fiber soll Alphabet zu teuer sein

  9. Google-Steuer

    EU-Kommission plädiert für europäisches Leistungsschutzrecht

  10. Code-Gründer Thomas Bachem

    "Wir wollen weg vom Frontalunterricht"



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
­Cybersyn: Chiles Traum von der computergesteuerten Planwirtschaft
­Cybersyn
Chiles Traum von der computergesteuerten Planwirtschaft
  1. Power9 IBMs 24-Kern-Chip kann 8 TByte RAM pro Sockel nutzen
  2. Princeton Piton Open-Source-Chip soll System mit 200.000 Kernen ermöglichen
  3. Adecco IBM will Helpdesk-Geschäft in Erfurt und Leipzig loswerden

Thinkpad X1 Carbon 2013 vs 2016: Drei Jahre, zwei Ultrabooks, eine Erkenntnis
Thinkpad X1 Carbon 2013 vs 2016
Drei Jahre, zwei Ultrabooks, eine Erkenntnis
  1. Huawei Matebook im Test Guter Laptop-Ersatz mit zu starker Konkurrenz
  2. iPad Pro Case Razer zeigt flache mechanische Switches
  3. Thinkpwn Lenovo warnt vor mysteriöser Bios-Schwachstelle

Asus PG248Q im Test: 180 Hertz erkannt, 180 Hertz gebannt
Asus PG248Q im Test
180 Hertz erkannt, 180 Hertz gebannt
  1. Raspberry Pi 3 Booten über USB oder per Ethernet
  2. Autonomes Fahren Mercedes stoppt Werbespot wegen überzogener Versprechen
  3. Radeon RX 480 Dank DX12 und Vulkan reicht auch eine Mittelklasse-CPU

  1. Re: Jetzt ist sie raus. Ich habe mehr erwartet.

    Pjörn | 06:32

  2. Re: Was ist eine Distribution...

    Pjörn | 06:17

  3. Re: Was? Kann doch gar nicht sein.

    Ovaron | 05:11

  4. Re: 30 Stunden auf Abruf ?!?

    Gromran | 04:18

  5. Re: Desktop-Android - Clickbait at it's best!

    ve2000 | 03:08


  1. 15:59

  2. 15:18

  3. 13:51

  4. 12:59

  5. 15:33

  6. 15:17

  7. 14:29

  8. 12:57


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel