Abo
  • Services:

Part-of-Speech Tagger klassifizieren Satzbestandteile

Als Ergebnis interessant ist die Polarität der Meinung. Die kleinste meinungstragende Einheit ist das einzelne Wort. Manche Wortarten haben dabei mehr Aussagekraft als andere. "Der", "wenn" oder "mein" verraten uns nichts, können also außen vor gelassen werden. Am aussagekräftigsten sind Adjektive und Adverben.

Stellenmarkt
  1. Beckhoff Automation GmbH & Co. KG, Verl
  2. Bosch Gruppe, Grasbrunn

Um Satzbestandteile zu klassifizieren, nutzt man Part-of-Speech Tagger, populäre Methoden sind statistische Modelle wie Hidden Markov Models, die durch die Häufigkeit bestimmter Satzkonstruktionen die wahrscheinlichste Wortart schätzen.

Auf ein Personalpronomen folgen oft Adjektive und Substantive, aber selten Verben, also liegt beim Ausdruck "Meine Rede" nahe, dass Rede ein Substantiv ist und kein Verb. Diese Verfahren erreichen Genauigkeiten von 95 bis 97 Prozent.

Weiß man, welche Wörter und Wortarten man vor sich hat, geht es darum herauszufinden, was die einzelnen Wörter ausdrücken. Ist "Juhu" Ausdruck einer positiven oder negativen Einstellung? Die simpelste, aber aufwendigste Methode ist es, die Klassifizierung Menschen zu überlassen und die Ergebnisse in einer Datenbank zu sammeln, auf deren Wissen man später zurückgreifen kann.

"Pointwise Mutual Information and Information Retrieval"-Algorithmus

Einer anderer Ansatz, der ohne menschliche Unterstützung, ist der "Pointwise Mutual Information and Information Retrieval"-Algorithmus, der die semantische Ähnlichkeit zweier Wörter ermittelt.

In diesem Fall heißt das: Man hat ein Wort, dessen Stimmung unbekannt ist, und startet eine Suchanfrage, wie oft es in der Nähe eines bekannten Wortes wie "gut" oder "schlecht" auftaucht. Das kann man mit Googles AROUND(n)-Operator durchführen, der alle Suchergebnisse liefert, bei denen zwei Suchwörter im maximalen Abstand von n vorkommen. "Juhu" AROUND(3) "gut" liefert rund 14 Millionen Treffer, "juhu" AROUND(3) "schlecht" 5,6 Millionen. Wiederholt man den Test mit mehreren Referenzwörtern, bekommt man durch die Anzahl der Treffer auf beiden Seiten eine brauchbare Einschätzung der Wortpolarität.

Ein weiterer Ansatz ist der von Sentiwordnet, hier wird eine kleine Ausgangsmenge eindeutig positiver und negativer Wörter als Ausgangsbasis benutzt. In der lexikalischen Datenbank Wordnet sind verwandte Wörter gespeichert, die sogenannte Synsets bilden.

Sentiwordnet ordnet jedem Synset drei Stimmungswerte für positiv, negativ und neutral zu. Von bekannten Synsets ausgehend, werden verwandte Synsets gesucht, deren semantischer Abstand zum Vergleichssynset ein Indikator für die Polarität der Stimmung der Einzelwörter ist.

 Quellen sind Microblogging-DiensteSprache besteht nicht nur aus einzelnen Wörtern 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6.  


Anzeige
Spiele-Angebote
  1. 13,49€
  2. (-70%) 8,99€
  3. 2,99€

Morpf 24. Feb 2014

Denken, eigene Meinung... beides erfordert eigenes Engagement. Viel bequemer ist es doch...

Sinnfrei 20. Feb 2014

Frag mal die Anwohner in der Grenzregion zwischen Afghanistan und Pakistan.

janpi3 20. Feb 2014

oder einfach Privat finanzieren wie vor 150 Jahren :D in dein Gesicht - Deutsche Bank XD

Ben Stan 20. Feb 2014

Nice, lustig zu lesen... http://www.kolobok.us/smiles/mini/biggrin_mini.gif

SelfEsteem 19. Feb 2014

Ich denke nicht, dass das hier ein Problem von Rechtsstaatlichkeit, Diktaturen, oder...


Folgen Sie uns
       


Lenovo Thinkpad A485 - Test

Wir testen Lenovos Thinkpad A485, ein Business-Notebook mit AMDs Ryzen. Das 14-Zoll-Gerät hat eine exzellente Tastatur und den sehr nützlichen Trackpoint als Mausersatz, auch die Anschlussvielfalt gefällt uns. Leider ist das Display recht dunkel und es gibt auch gegen Aufpreis kein helleres, zudem könnte die CPU schneller und die Akkulaufzeit länger sein.

Lenovo Thinkpad A485 - Test Video aufrufen
Red Dead Online angespielt: Schweigsam auf der Schindmähre
Red Dead Online angespielt
Schweigsam auf der Schindmähre

Der Multiplayermodus von Red Dead Redemption 2 schickt uns als ehemaligen Strafgefangenen in den offenen Wilden Westen. Golem.de hat den handlungsgetriebenen Einstieg angespielt - und einen ersten Onlineüberfall gemeinsam mit anderen Banditen unternommen.

  1. Spielbalance Updates für Red Dead Online und Battlefield 5 angekündigt
  2. Rockstar Games Red Dead Redemption 2 geht schrittweise online
  3. Games US-Spielemarkt erreicht Rekordumsätze

Machine Learning: Wie Technik jede Stimme stehlen kann
Machine Learning
Wie Technik jede Stimme stehlen kann

Ein Unternehmen aus Südkorea arbeitet daran, Stimmen reproduzierbar und neu generierbar zu machen. Was für viele Branchen enorme Kosteneinsparungen bedeutet, könnte auch eine neue Dimension von Fake News werden.
Ein Bericht von Felix Lill

  1. AWS Amazon bietet seine Machine-Learning-Tutorials kostenlos an
  2. Random Forest, k-Means, Genetik Machine Learning anhand von drei Algorithmen erklärt
  3. Machine Learning Amazon verwirft sexistisches KI-Tool für Bewerber

Sony-Kopfhörer WH-1000XM3 im Test: Eine Oase der Stille oder des puren Musikgenusses
Sony-Kopfhörer WH-1000XM3 im Test
Eine Oase der Stille oder des puren Musikgenusses

Wir haben die dritte Generation von Sonys Top-ANC-Kopfhörer getestet - vor allem bei der Geräuschreduktion hat sich einiges getan. Wer in lautem Getümmel seine Ruhe haben will, greift zum WH-1000XM3. Alle Nachteile der Vorgängermodelle hat Sony aber nicht behoben.
Ein Test von Ingo Pakalski


      •  /