Abo
  • Services:
Anzeige
Die simpelste, aber aufwendigste Methode ist es, die Klassifizierung von Texten Menschen zu überlassen
Die simpelste, aber aufwendigste Methode ist es, die Klassifizierung von Texten Menschen zu überlassen (Bild: Golem.de)

Quellen sind Microblogging-Dienste

Anzeige

Eine populäre Quelle sind Microblogging-Dienste wie Twitter. Durch Hashtags hat Twitter auch den Vorteil, dass Nachrichten bereits thematisch zugeordnet sind. Im Beispiel des neuen Bundestagsausschusses für Digitale Agenda können wir also nach dessen Hashtag #btada suchen und bekommen eine bunte Auswahl an Nachrichten aufs Tablett.

Dabei sind positive wie "Chapeau! Inhalt + CGN Joke klasse! Meine Rede zu Demokratie im digitalen Zeitalter im Bundestag" und "Jetzt ist er da, der Ausschuss für dieses Internet. Juhu."

Und eher Skeptische wie "#btADA - Besser ein Potemkinsches Dorf als gar kein Zuhause für die Netzpolitiker?" und "Viel Wirtschaft & Infrastruktur, wenig Bürgerrechte. Stimmt nicht gerade optimistisch für den Internetausschuss".

Wo steckt die Meinung drin?

Zunächst ist wichtig, Äußerungen zu finden, die auch wirklich zu dem betrachteten Thema gehören. Auf Twitter ist das durch Hashtags einfach, ebenso bei gezielten Produktbewertungen. Nutzt man andere, unstrukturierte Internetquellen, muss zunächst das Thema festgestellt werden, mit dem sich ein Text befasst.

Beim Topic Mining wird ähnlich vorgegangen wie bei einer herkömmlichen Suchmaschine. Man crawlt die Menge eingehender Dokumente und sortiert, beispielsweise anhand von Keywords. Jedes Thema enthält außerdem Teilaspekte, die abhängig von der betrachteten Domäne sind. Deren Identifikation ist wichtig, denn sonst können Äußerungen falsch interpretiert werden. Dazu braucht man ein Modell der Einzelaspekte eines Themas.

Im Rahmen des Internetausschusses formen zum Beispiel die Abgeordneten eigene Aspekte - aber auch die einzelnen Fraktionen, der Vorsitzende, ein Beschluss oder eine Abstimmung können Teilaspekte darstellen. Abbilden kann man solche Zusammenhänge durch Ontologien - strukturierte Wissensmodelle.

Die enthalten zum Beispiel die Information, dass Lars Klingbeil ein Mitglied des Ausschusses ist. Wenn ein Tweet dann kritisiert, die Krawatte von Klingbeil sei hässlich, kann vermieden werden, das als Negativbeurteilung des gesamten Ausschusses zu klassifizieren.

 Textanalyse: Unter Generalverdacht durch AlgorithmenPart-of-Speech Tagger klassifizieren Satzbestandteile 

eye home zur Startseite
Morpf 24. Feb 2014

Denken, eigene Meinung... beides erfordert eigenes Engagement. Viel bequemer ist es doch...

Sinnfrei 20. Feb 2014

Frag mal die Anwohner in der Grenzregion zwischen Afghanistan und Pakistan.

janpi3 20. Feb 2014

oder einfach Privat finanzieren wie vor 150 Jahren :D in dein Gesicht - Deutsche Bank XD

Ben Stan 20. Feb 2014

Nice, lustig zu lesen... http://www.kolobok.us/smiles/mini/biggrin_mini.gif

SelfEsteem 19. Feb 2014

Ich denke nicht, dass das hier ein Problem von Rechtsstaatlichkeit, Diktaturen, oder...



Anzeige

Stellenmarkt
  1. Hermle Maschinenbau GmbH, Ottobrunn bei München
  2. Deutsche Telekom AG, Bonn
  3. Dataport, Hamburg
  4. Bilfinger SE, Mannheim


Anzeige
Hardware-Angebote
  1. ab 649,90€
  2. ab 232,90€ bei Alternate gelistet
  3. 39,99€

Folgen Sie uns
       

  1. Analysepapier

    Facebook berichtet offiziell von staatlicher Desinformation

  2. Apple

    Qualcomm reduziert Prognose wegen zurückgehaltener Zahlungen

  3. Underground Actually Free

    Amazon beendet Programm mit komplett kostenlosen Apps

  4. Onlinelexikon

    Türkische Behörden sperren Zugang zu Wikipedia

  5. Straßenverkehr

    Elon Musk baut U-Bahn für Autos

  6. Die Woche im Video

    Mr. Robot und Mrs. MINT

  7. Spülbohrverfahren

    Deutsche Telekom "spült" ihre Glasfaserkabel in die Erde

  8. Privacy Phone

    John McAfee stellt fragwürdiges Smartphone vor

  9. Hacon

    Siemens übernimmt Software-Anbieter aus Hannover

  10. Quartalszahlen

    Intel bestätigt Skylake-Xeons für Sommer 2017



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
DLR-Projekt Eden ISS: Das Paradies ist ein Container
DLR-Projekt Eden ISS
Das Paradies ist ein Container
  1. Weltraumschrott "Der neue Aspekt sind die Megakonstellationen"
  2. Transport Der Güterzug der Zukunft ist ein schneller Roboter
  3. "Die Astronautin" Ich habe heute leider keinen Flug ins All für dich

Radeon RX 580 und RX 570 im Test: AMDs Grafikkarten sind schneller und sparsamer
Radeon RX 580 und RX 570 im Test
AMDs Grafikkarten sind schneller und sparsamer
  1. Grafikkarte Manche Radeon RX 400 lassen sich zu Radeon RX 500 flashen
  2. Radeon Pro Duo AMD bringt Profi-Grafikkarte mit zwei Polaris-Chips
  3. Grafikkarten AMD bringt vier neue alte Radeons für Komplett-PCs

Miniatur Wunderland: Schiffe versenken die schönsten Pläne
Miniatur Wunderland
Schiffe versenken die schönsten Pläne
  1. Transport Üo, der fahrbare Ball
  2. Transport Sea Bubbles testet foilendes Elektroboot
  3. Verkehr Eine Ampel mit Kamera und Gesichtserkennung

  1. Ich bin verwirrt

    Dragos | 19:30

  2. Konsequent gegen staatliche Desinformation

    Emulex | 19:25

  3. Re: 60m SOLD, nicht shipped

    elitezocker | 19:24

  4. Re: Abschaltung von DRM freien, kostenlosen Kanälen

    StefanBD | 19:23

  5. Re: Schaltet bitte DVB-S1 endlich ab

    StefanBD | 19:18


  1. 15:07

  2. 14:32

  3. 13:35

  4. 12:56

  5. 12:15

  6. 09:01

  7. 08:00

  8. 18:05


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel