Part-of-Speech Tagger klassifizieren Satzbestandteile

Als Ergebnis interessant ist die Polarität der Meinung. Die kleinste meinungstragende Einheit ist das einzelne Wort. Manche Wortarten haben dabei mehr Aussagekraft als andere. "Der", "wenn" oder "mein" verraten uns nichts, können also außen vor gelassen werden. Am aussagekräftigsten sind Adjektive und Adverben.

Stellenmarkt
  1. Junior Projektmanager (m/w/d)
    ADLATUS GmbH & Co. KG, Wentorf bei Hamburg
  2. IT-Systemadministratorin als Sachbearbeiterin Verfahrensadministration (w/m/d)
    Der Polizeipräsident in Berlin, Berlin
Detailsuche

Um Satzbestandteile zu klassifizieren, nutzt man Part-of-Speech Tagger, populäre Methoden sind statistische Modelle wie Hidden Markov Models, die durch die Häufigkeit bestimmter Satzkonstruktionen die wahrscheinlichste Wortart schätzen.

Auf ein Personalpronomen folgen oft Adjektive und Substantive, aber selten Verben, also liegt beim Ausdruck "Meine Rede" nahe, dass Rede ein Substantiv ist und kein Verb. Diese Verfahren erreichen Genauigkeiten von 95 bis 97 Prozent.

Weiß man, welche Wörter und Wortarten man vor sich hat, geht es darum herauszufinden, was die einzelnen Wörter ausdrücken. Ist "Juhu" Ausdruck einer positiven oder negativen Einstellung? Die simpelste, aber aufwendigste Methode ist es, die Klassifizierung Menschen zu überlassen und die Ergebnisse in einer Datenbank zu sammeln, auf deren Wissen man später zurückgreifen kann.

"Pointwise Mutual Information and Information Retrieval"-Algorithmus

Golem Akademie
  1. Advanced Python – Fortgeschrittene Programmierthemen: virtueller Drei-Tage-Workshop
    23.-25.01.2023, Virtuell
  2. Jira für Anwender: virtueller Ein-Tages-Workshop
    03.06.2022, virtuell
Weitere IT-Trainings

Einer anderer Ansatz, der ohne menschliche Unterstützung, ist der "Pointwise Mutual Information and Information Retrieval"-Algorithmus, der die semantische Ähnlichkeit zweier Wörter ermittelt.

In diesem Fall heißt das: Man hat ein Wort, dessen Stimmung unbekannt ist, und startet eine Suchanfrage, wie oft es in der Nähe eines bekannten Wortes wie "gut" oder "schlecht" auftaucht. Das kann man mit Googles AROUND(n)-Operator durchführen, der alle Suchergebnisse liefert, bei denen zwei Suchwörter im maximalen Abstand von n vorkommen. "Juhu" AROUND(3) "gut" liefert rund 14 Millionen Treffer, "juhu" AROUND(3) "schlecht" 5,6 Millionen. Wiederholt man den Test mit mehreren Referenzwörtern, bekommt man durch die Anzahl der Treffer auf beiden Seiten eine brauchbare Einschätzung der Wortpolarität.

Ein weiterer Ansatz ist der von Sentiwordnet, hier wird eine kleine Ausgangsmenge eindeutig positiver und negativer Wörter als Ausgangsbasis benutzt. In der lexikalischen Datenbank Wordnet sind verwandte Wörter gespeichert, die sogenannte Synsets bilden.

Sentiwordnet ordnet jedem Synset drei Stimmungswerte für positiv, negativ und neutral zu. Von bekannten Synsets ausgehend, werden verwandte Synsets gesucht, deren semantischer Abstand zum Vergleichssynset ein Indikator für die Polarität der Stimmung der Einzelwörter ist.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Quellen sind Microblogging-DiensteSprache besteht nicht nur aus einzelnen Wörtern 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6.  


Morpf 24. Feb 2014

Denken, eigene Meinung... beides erfordert eigenes Engagement. Viel bequemer ist es doch...

Sinnfrei 20. Feb 2014

Frag mal die Anwohner in der Grenzregion zwischen Afghanistan und Pakistan.

janpi3 20. Feb 2014

oder einfach Privat finanzieren wie vor 150 Jahren :D in dein Gesicht - Deutsche Bank XD

Ben Stan 20. Feb 2014

Nice, lustig zu lesen... http://www.kolobok.us/smiles/mini/biggrin_mini.gif



Aktuell auf der Startseite von Golem.de
Arclight Rumble
Wegen Warcraft Mobile sollte sich Blizzard selbst verklagen!

Golem.de hat es gespielt: Arclight Rumble entpuppt sich als gelungenes Mobile Game - aber wie ein echtes Warcraft fühlt es sich nicht an.
Von Peter Steinlechner

Arclight Rumble: Wegen Warcraft Mobile sollte sich Blizzard selbst verklagen!
Artikel
  1. Google: Russland will Youtube aus Selbstschutz nicht blockieren
    Google
    Russland will Youtube aus Selbstschutz nicht blockieren

    Die zahlreichen Drohungen der russischen Zensurbehörde zur Blockade von Youtube werden wohl nicht umgesetzt. Die Auswirkungen wären zu stark.

  2. Biontech: Mainz kann 365-Euro-ÖPNV-Ticket dank Corona einführen
    Biontech
    Mainz kann 365-Euro-ÖPNV-Ticket dank Corona einführen

    In Mainz ist Biontech beheimatet, was die Steuereinnahmen explodieren lässt. Mit dem Geld wird nun ein 365-Euro-Jahresticket für Schüler und Azubis finanziert.

  3. Nordvpn, Expressvpn, Mullvad & Co: Die Qual der VPN-Wahl
    Nordvpn, Expressvpn, Mullvad & Co
    Die Qual der VPN-Wahl

    Wer sicher im Internet unterwegs sein will, braucht ein VPN - oder doch nicht? Viele Anbieter kommen jedenfalls gar nicht erst in Frage.
    Von Moritz Tremmel

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • PS5 jetzt bestellbar • Cyber Week: Bis zu 900€ Rabatt auf E-Bikes • MindStar (u. a. Intel Core i9 529€, MSI RTX 3060 Ti 609€) • Gigabyte Waterforce Mainboard günstig wie nie: 480,95€ • Razer Ornata V2 Gaming-Tastatur günstig wie nie: 54,99€ • AOC G3 Gaming-Monitor 34" 165 Hz günstig wie nie: 404€ [Werbung]
    •  /