Theseus-Projekt: Quote soll die erste Zitate-Suchmaschine Deutschlands werden
Mit der semantischen Suchmaschine "Quote" wird es möglich sein, deutschsprachige Zitate von Personen des öffentlichen Interesses automatisch zu recherchieren. Zudem lassen sich Steckbriefe bestimmter Personen wie beispielsweise Angela Merkel oder Joachim Löw abrufen.
Das Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS entwickelt eine mobile Zitate-Suchmaschine namens "Quote", der englische Begriff für Zitat. Quote ist ein Teil des deutschen Forschungsprogramms Theseus und dessen Anwendungsszenario "Contentus - Technologien für die Mediathek der Zukunft". Die semantische Zitate-Suchmaschine soll in den Bereichen Medien, Öffentlichkeitsarbeit, Sport-Sponsoring und Personalmanagement genutzt werden können.
Mit Quote sollen aktuelle Zitate zu bestimmten Themen automatisch aus Nachrichtentexten gefiltert werden können. Etwa um die Aussagen bestimmter Personen zu verfolgen oder um gezielt nach Themen zu suchen und die letzten Zitate von Personen dazu zu erhalten.
Semantische Suche
Quote vereint dabei verschiedene semantische Analysemethoden, die als Theseus-Basistechnologien entwickelt wurden. Ein "Named Entity Recognizer" stellt etwa fest, ob das Wort Becker etwa für Boris Becker oder für einen anderen Becker steht. Ein "Topic-Modeling"-Algorithmus ermöglicht es, einen Steckbrief für Personen zu erstellen, in dem aufgezeigt wird, zu welchen Themen die Person in letzter Zeit zitiert wurde.
Ein weiterer Algorithmus, "Quote Detector" genannt, erkennt die Muster typischer Zitate und extrahiert wahrscheinliche Zitate zu bestimmten Personen aus der bislang mit mehreren 10.000 Nachrichtenartikeln gefüllten Datenbank von Quote. Clustering-Algorithmen sollen dabei verhindern, dass überflüssige Duplikate entstehen.
Quote befindet sich derzeit noch am Fraunhofer IAIS in der abschließenden Entwicklung. Bis zur nächsten Cebit im März 2012 soll die Applikation mit weiteren Datenquellen und Analysemöglichkeiten ausgestattet werden und dann erstmals der Öffentlichkeit präsentiert werden.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed





