Quellen sind Microblogging-Dienste
Eine populäre Quelle sind Microblogging-Dienste wie Twitter. Durch Hashtags hat Twitter auch den Vorteil, dass Nachrichten bereits thematisch zugeordnet sind. Im Beispiel des neuen Bundestagsausschusses für Digitale Agenda können wir also nach dessen Hashtag #btada suchen und bekommen eine bunte Auswahl an Nachrichten aufs Tablett.
Dabei sind positive wie "Chapeau! Inhalt + CGN Joke klasse! Meine Rede zu Demokratie im digitalen Zeitalter im Bundestag" und "Jetzt ist er da, der Ausschuss für dieses Internet. Juhu."
Und eher Skeptische wie "#btADA - Besser ein Potemkinsches Dorf als gar kein Zuhause für die Netzpolitiker?" und "Viel Wirtschaft & Infrastruktur, wenig Bürgerrechte. Stimmt nicht gerade optimistisch für den Internetausschuss".
Wo steckt die Meinung drin?
Zunächst ist wichtig, Äußerungen zu finden, die auch wirklich zu dem betrachteten Thema gehören. Auf Twitter ist das durch Hashtags einfach, ebenso bei gezielten Produktbewertungen. Nutzt man andere, unstrukturierte Internetquellen, muss zunächst das Thema festgestellt werden, mit dem sich ein Text befasst.
Beim Topic Mining wird ähnlich vorgegangen wie bei einer herkömmlichen Suchmaschine. Man crawlt die Menge eingehender Dokumente und sortiert, beispielsweise anhand von Keywords. Jedes Thema enthält außerdem Teilaspekte, die abhängig von der betrachteten Domäne sind. Deren Identifikation ist wichtig, denn sonst können Äußerungen falsch interpretiert werden. Dazu braucht man ein Modell der Einzelaspekte eines Themas.
Im Rahmen des Internetausschusses formen zum Beispiel die Abgeordneten eigene Aspekte - aber auch die einzelnen Fraktionen, der Vorsitzende, ein Beschluss oder eine Abstimmung können Teilaspekte darstellen. Abbilden kann man solche Zusammenhänge durch Ontologien - strukturierte Wissensmodelle.
Die enthalten zum Beispiel die Information, dass Lars Klingbeil ein Mitglied des Ausschusses ist. Wenn ein Tweet dann kritisiert, die Krawatte von Klingbeil sei hässlich, kann vermieden werden, das als Negativbeurteilung des gesamten Ausschusses zu klassifizieren.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Textanalyse: Unter Generalverdacht durch Algorithmen | Part-of-Speech Tagger klassifizieren Satzbestandteile |
Denken, eigene Meinung... beides erfordert eigenes Engagement. Viel bequemer ist es doch...
Frag mal die Anwohner in der Grenzregion zwischen Afghanistan und Pakistan.
oder einfach Privat finanzieren wie vor 150 Jahren :D in dein Gesicht - Deutsche Bank XD
Nice, lustig zu lesen... http://www.kolobok.us/smiles/mini/biggrin_mini.gif