Abo
  • Services:
Anzeige
Die simpelste, aber aufwendigste Methode ist es, die Klassifizierung von Texten Menschen zu überlassen
Die simpelste, aber aufwendigste Methode ist es, die Klassifizierung von Texten Menschen zu überlassen (Bild: Golem.de)

Quellen sind Microblogging-Dienste

Anzeige

Eine populäre Quelle sind Microblogging-Dienste wie Twitter. Durch Hashtags hat Twitter auch den Vorteil, dass Nachrichten bereits thematisch zugeordnet sind. Im Beispiel des neuen Bundestagsausschusses für Digitale Agenda können wir also nach dessen Hashtag #btada suchen und bekommen eine bunte Auswahl an Nachrichten aufs Tablett.

Dabei sind positive wie "Chapeau! Inhalt + CGN Joke klasse! Meine Rede zu Demokratie im digitalen Zeitalter im Bundestag" und "Jetzt ist er da, der Ausschuss für dieses Internet. Juhu."

Und eher Skeptische wie "#btADA - Besser ein Potemkinsches Dorf als gar kein Zuhause für die Netzpolitiker?" und "Viel Wirtschaft & Infrastruktur, wenig Bürgerrechte. Stimmt nicht gerade optimistisch für den Internetausschuss".

Wo steckt die Meinung drin?

Zunächst ist wichtig, Äußerungen zu finden, die auch wirklich zu dem betrachteten Thema gehören. Auf Twitter ist das durch Hashtags einfach, ebenso bei gezielten Produktbewertungen. Nutzt man andere, unstrukturierte Internetquellen, muss zunächst das Thema festgestellt werden, mit dem sich ein Text befasst.

Beim Topic Mining wird ähnlich vorgegangen wie bei einer herkömmlichen Suchmaschine. Man crawlt die Menge eingehender Dokumente und sortiert, beispielsweise anhand von Keywords. Jedes Thema enthält außerdem Teilaspekte, die abhängig von der betrachteten Domäne sind. Deren Identifikation ist wichtig, denn sonst können Äußerungen falsch interpretiert werden. Dazu braucht man ein Modell der Einzelaspekte eines Themas.

Im Rahmen des Internetausschusses formen zum Beispiel die Abgeordneten eigene Aspekte - aber auch die einzelnen Fraktionen, der Vorsitzende, ein Beschluss oder eine Abstimmung können Teilaspekte darstellen. Abbilden kann man solche Zusammenhänge durch Ontologien - strukturierte Wissensmodelle.

Die enthalten zum Beispiel die Information, dass Lars Klingbeil ein Mitglied des Ausschusses ist. Wenn ein Tweet dann kritisiert, die Krawatte von Klingbeil sei hässlich, kann vermieden werden, das als Negativbeurteilung des gesamten Ausschusses zu klassifizieren.

 Textanalyse: Unter Generalverdacht durch AlgorithmenPart-of-Speech Tagger klassifizieren Satzbestandteile 

eye home zur Startseite
Morpf 24. Feb 2014

Denken, eigene Meinung... beides erfordert eigenes Engagement. Viel bequemer ist es doch...

Sinnfrei 20. Feb 2014

Frag mal die Anwohner in der Grenzregion zwischen Afghanistan und Pakistan.

janpi3 20. Feb 2014

oder einfach Privat finanzieren wie vor 150 Jahren :D in dein Gesicht - Deutsche Bank XD

Ben Stan 20. Feb 2014

Nice, lustig zu lesen... http://www.kolobok.us/smiles/mini/biggrin_mini.gif

SelfEsteem 19. Feb 2014

Ich denke nicht, dass das hier ein Problem von Rechtsstaatlichkeit, Diktaturen, oder...



Anzeige

Stellenmarkt
  1. Voith Digital Solutions GmbH, Ulm
  2. Basler AG, Ahrensburg bei Hamburg
  3. über Hays AG, Mannheim
  4. Kassenzahnärztliche Vereinigung Baden-Württemberg, Freiburg


Anzeige
Spiele-Angebote
  1. (-85%) 1,49€
  2. (-33%) 9,99€
  3. (u. a. Anno 2205 Ultimate Edition für 10,99€, Anno 2070 Königsedition für 6,99€ und...

Folgen Sie uns
       

  1. Apple

    Messages-App kann mit Nachricht zum Absturz gebracht werden

  2. Analog

    Kabelnetzkunden in falscher Sorge wegen DVB-T-Abschaltung

  3. Partnerprogramm

    Geld verdienen auf Youtube wird schwieriger

  4. Nur beratendes Gremium

    Bundestag setzt wieder Digitalausschuss ein

  5. Eclipse Foundation

    Erster EE4J-Code leitet Java-EE-Migration ein

  6. Breitbandmessung

    Provider halten versprochene Geschwindigkeit fast nie ein

  7. Virtualisierung

    Linux-Gasttreiber für Virtualbox bekommt Mainline-Support

  8. DJI Copilot von Lacie

    Festplatte kopiert SD-Karten ohne separaten Rechner

  9. Swift 5

    Acers dünnes Notebook kommt ab 1.000 Euro in den Handel

  10. Vodafone

    Callya-Flex-Tarife bekommen mehr Datenvolumen



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Computerforschung: Quantencomputer aus Silizium werden realistisch
Computerforschung
Quantencomputer aus Silizium werden realistisch
  1. Tangle Lake Intel zeigt 49-Qubit-Chip
  2. Die Woche im Video Alles kaputt
  3. Q# und QDK Microsoft veröffentlicht Entwicklungskit für Quantenrechner

Netzsperren: Wie Katalonien die spanische Internetzensur austrickste
Netzsperren
Wie Katalonien die spanische Internetzensur austrickste

Spectre und Meltdown: All unsere moderne Technik ist kaputt
Spectre und Meltdown
All unsere moderne Technik ist kaputt
  1. Microsoft Fall Creators Update ist final für alle Geräte verfügbar
  2. BeA Noch mehr Sicherheitslücken im Anwaltspostfach
  3. VEP Charter Trump will etwas transparenter mit Sicherheitslücken umgehen

  1. Re: es gibt nur keine gute? :p

    Neuro-Chef | 23:14

  2. Re: Ich brauche kein Volumen

    Crunchy_Nuts | 23:12

  3. Re: 100 Mbit/s bei der Telekom

    Nebu2k | 23:11

  4. Re: Bitte selber recherchieren und nicht einfach...

    Yash | 23:11

  5. Re: Langweilig

    Bautz | 23:04


  1. 19:25

  2. 19:18

  3. 18:34

  4. 17:20

  5. 15:46

  6. 15:30

  7. 15:09

  8. 14:58


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel