Abo
  • Services:
Anzeige
Die simpelste, aber aufwendigste Methode ist es, die Klassifizierung von Texten Menschen zu überlassen
Die simpelste, aber aufwendigste Methode ist es, die Klassifizierung von Texten Menschen zu überlassen (Bild: Golem.de)

Quellen sind Microblogging-Dienste

Anzeige

Eine populäre Quelle sind Microblogging-Dienste wie Twitter. Durch Hashtags hat Twitter auch den Vorteil, dass Nachrichten bereits thematisch zugeordnet sind. Im Beispiel des neuen Bundestagsausschusses für Digitale Agenda können wir also nach dessen Hashtag #btada suchen und bekommen eine bunte Auswahl an Nachrichten aufs Tablett.

Dabei sind positive wie "Chapeau! Inhalt + CGN Joke klasse! Meine Rede zu Demokratie im digitalen Zeitalter im Bundestag" und "Jetzt ist er da, der Ausschuss für dieses Internet. Juhu."

Und eher Skeptische wie "#btADA - Besser ein Potemkinsches Dorf als gar kein Zuhause für die Netzpolitiker?" und "Viel Wirtschaft & Infrastruktur, wenig Bürgerrechte. Stimmt nicht gerade optimistisch für den Internetausschuss".

Wo steckt die Meinung drin?

Zunächst ist wichtig, Äußerungen zu finden, die auch wirklich zu dem betrachteten Thema gehören. Auf Twitter ist das durch Hashtags einfach, ebenso bei gezielten Produktbewertungen. Nutzt man andere, unstrukturierte Internetquellen, muss zunächst das Thema festgestellt werden, mit dem sich ein Text befasst.

Beim Topic Mining wird ähnlich vorgegangen wie bei einer herkömmlichen Suchmaschine. Man crawlt die Menge eingehender Dokumente und sortiert, beispielsweise anhand von Keywords. Jedes Thema enthält außerdem Teilaspekte, die abhängig von der betrachteten Domäne sind. Deren Identifikation ist wichtig, denn sonst können Äußerungen falsch interpretiert werden. Dazu braucht man ein Modell der Einzelaspekte eines Themas.

Im Rahmen des Internetausschusses formen zum Beispiel die Abgeordneten eigene Aspekte - aber auch die einzelnen Fraktionen, der Vorsitzende, ein Beschluss oder eine Abstimmung können Teilaspekte darstellen. Abbilden kann man solche Zusammenhänge durch Ontologien - strukturierte Wissensmodelle.

Die enthalten zum Beispiel die Information, dass Lars Klingbeil ein Mitglied des Ausschusses ist. Wenn ein Tweet dann kritisiert, die Krawatte von Klingbeil sei hässlich, kann vermieden werden, das als Negativbeurteilung des gesamten Ausschusses zu klassifizieren.

 Textanalyse: Unter Generalverdacht durch AlgorithmenPart-of-Speech Tagger klassifizieren Satzbestandteile 

eye home zur Startseite
Morpf 24. Feb 2014

Denken, eigene Meinung... beides erfordert eigenes Engagement. Viel bequemer ist es doch...

Sinnfrei 20. Feb 2014

Frag mal die Anwohner in der Grenzregion zwischen Afghanistan und Pakistan.

janpi3 20. Feb 2014

oder einfach Privat finanzieren wie vor 150 Jahren :D in dein Gesicht - Deutsche Bank XD

Ben Stan 20. Feb 2014

Nice, lustig zu lesen... http://www.kolobok.us/smiles/mini/biggrin_mini.gif

SelfEsteem 19. Feb 2014

Ich denke nicht, dass das hier ein Problem von Rechtsstaatlichkeit, Diktaturen, oder...



Anzeige

Stellenmarkt
  1. BG-Phoenics GmbH, Hannover
  2. operational services GmbH & Co. KG, Frankfurt
  3. mobileX AG, München
  4. Leopold Kostal GmbH & Co. KG, Hagen


Anzeige
Blu-ray-Angebote
  1. 39,99€ (Vorbesteller-Preisgarantie)
  2. (u. a. The Big Bang Theory, The Vampire Diaries, True Detective)
  3. (u. a. Reign, Person of Interest, Gossip Girl, The Clone Wars)

Folgen Sie uns
       

  1. Electro Fluidic Technology

    Schnelles E-Paper-Display für Video-Anwendungen

  2. Heiko Maas

    "Kein Wunder, dass Facebook seine Vorgaben geheim hält"

  3. Virtual Reality

    Oculus Rift unterstützt offiziell Roomscale-VR

  4. FTP-Client

    Filezilla bekommt ein Master Password

  5. Künstliche Intelligenz

    Apple arbeitet offenbar an eigenem AI-Prozessor

  6. Die Woche im Video

    Verbogen, abgehoben und tiefergelegt

  7. ZTE

    Chinas großes 5G-Testprojekt läuft weiter

  8. Ubisoft

    Far Cry 5 bietet Kampf gegen Sekte in und über Montana

  9. Rockstar Games

    Waffenschiebereien in GTA 5

  10. Browser-Games

    Unreal Engine 4.16 unterstützt Wasm und WebGL 2.0



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Debatte nach Wanna Cry: Sicherheitslücken veröffentlichen oder zurückhacken?
Debatte nach Wanna Cry
Sicherheitslücken veröffentlichen oder zurückhacken?
  1. Sicherheitslücke Fehlerhaft konfiguriertes Git-Verzeichnis bei Redcoon
  2. Hotelketten Buchungssystem Sabre kompromittiert Zahlungsdaten
  3. Onlinebanking Betrüger tricksen das mTAN-Verfahren aus

Sphero Lightning McQueen: Erst macht es Brummbrumm, dann verdreht es die Augen
Sphero Lightning McQueen
Erst macht es Brummbrumm, dann verdreht es die Augen

Quantencomputer: Nano-Kühlung für Qubits
Quantencomputer
Nano-Kühlung für Qubits
  1. IBM Q Mehr Qubits von IBM
  2. Quantencomputer Was sind diese Qubits?
  3. Verschlüsselung Kryptographie im Quantenzeitalter

  1. Re: Performance ist mies

    Haxx | 10:37

  2. Re: Volumenbegrenzungen abschaffen

    Tet | 10:35

  3. Re: Siri und diktieren

    rabatz | 10:24

  4. Re: Mal ne dumme Gegenfrage:

    Apfelbrot | 10:13

  5. Re: Was habe ich von Netzneutralität als Kunde?

    sundown73 | 10:11


  1. 10:35

  2. 12:54

  3. 12:41

  4. 11:44

  5. 11:10

  6. 09:01

  7. 17:40

  8. 16:40


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel