Abo
  • Services:

Echtzeitsuche: Mensch ersetzt Maschine

Meint ein Nutzer, der nach "Bayern" sucht, das Land, seine Bewohner oder den Fußballclub? Und wie können Suchanfragen eingeordnet werden, die erstmals oder in neuem Kontext auftauchen? Wenn Maschinen zu langsam lernen, können Menschen helfen.

Artikel veröffentlicht am ,
Echtzeitsuche: Mensch ersetzt Maschine
(Bild: Sherwin Crasto/Reuters)

Wie kann eine Suchmaschine erkennen, worum es bei einer Suchanfrage geht, die erstmals oder plötzlich in einem ganz anderen Kontext als üblich auftaucht? Wie beispielsweise die Suche nach "Big Bird", die im letzten US-Präsidentschaftswahlkampf plötzlich eine ganz neue Bedeutung bekam, oder der Hashtag "#bindersfullofwomen" (Ordner voller Frauen), der eine politische Bedeutung erhielt.

Stellenmarkt
  1. Waldorf Frommer Rechtsanwälte, München
  2. DAN Produkte GmbH, Siegen

Um Nutzern auf solche kurzfristig auftretende Suchanfragen bessere Antworten liefern und passende Werbung einblenden zu können, hat Twitter ein System entwickelt, bei dem Maschinen durch Menschen ersetzt werden. Maschinelles Lernen ist zu langsam, setzt es doch eine gewisse Datenmenge voraus, die anfangs noch gar nicht existiert. Twitter benötigt die Antworten aber sehr zeitnah, denn sie sind nur für wenige Stunden relevant.

In manchen Fällen kann eine bestimmte Suchanfrage nur für sehr kurze Zeit eine andere Bedeutung haben als sonst. So ist die Wahrscheinlichkeit groß, dass ein Nutzer mit der Suche nach "Bayern" während des Champions-League-Finales unter Beteiligung des FC Bayern München andere Ergebnisse als relevant betrachtet als zu anderen Zeiten. Beispielsweise können Tweets von @FCBayern relevanter sein als solche von @Bayern.

Die Technik

Da es unmöglich ist, jede Suchanfrage von einem Menschen beantworten zu lassen, schleust Twitter alle Suchanfragen durch einen Storm-Cluster. Dabei handelt es sich um ein von Twitter entwickeltes, verteiltes, verlässliches und fehlertolerantes System zur Verarbeitung von Datenströmen - eine Art Hadoop für Echtzeitdaten. Damit kann Twitter feststellen, wie populär eine Suchanfrage ist, und erkennt so auch, wenn eine Suchanfrage plötzlich besonders populär ist.

Stellt das System also fest, dass auf einmal ungewöhnlich häufig nach "Big Bird" gesucht wird, leitet es die Anfrage an einen Menschen weiter, der bei der Einordnung der Suchanfrage hilft. Dazu nutzt Twitter Amazons Crowdsourcing-Dienst Mechanical Turk, um Aufgaben automatisiert an vorab von Twitter ausgewählte Menschen weiterzugeben.

Laut Twitter hat sich dies als besser erwiesen, als eigene Mitarbeiter einzustellen. Zum einen sitzen die Auftragsnehmer, die über Mechanical Turk zu erreichen sind, auf der ganzen Welt verteilt, so dass Fragen rund um die Uhr beantwortet werden können, zum anderen kann so sehr schnell auf eine schwankende Zahl an Aufträgen reagiert werden.

Die Menschen ordnen die Suchanfragen thematisch ein, legen also fest, dass "Bayern" derzeit eher eine Sportthema ist. Sie beantworten zudem weitere Fragen und stellen mitunter Recherchen an, um zum Beispiel herauszufinden, dass "Big Bird" gerade in einer Wahlkampfdebatte von Präsidentschaftskandidat Mitt Romney erwähnt wurde. So kann Twitter dann Big-Bird-Tweets Barack Obama und Mitt Romney zuordnen, die andernfalls mit dem Begriff eher wenig zu tun hätten. Zudem kann Twitter so deutlich besser zuordnen, welche Werbung relevant ist.

Um die menschliche Beteiligung effizient abzuwickeln, hat Twitter Clockwork Raven entwickelt, eine Webapplikation, mit der sich Daten leicht an Mechanical Turk zur Prüfung durch Menschen übermitteln lassen. Clockwork Raven hat Twitter bereits im August 2012 als Open Source freigegeben.

Twitter hat seine "Echtzeitsuche mit Menschen" in einem Blogeintrag recht ausführlich erläutert.



Anzeige
Blu-ray-Angebote
  1. 4,25€
  2. (nur für Prime-Mitglieder)
  3. (2 Monate Sky Ticket für nur 4,99€)

tupolew 10. Jan 2013

Hoffentlich wird das nur als DAU-Modus eingesetzt für Leute die nicht in der Lage sind...

Mac Jack 10. Jan 2013

Ja, du vielleicht, so ein Almöi der seit letztem Jahr stolzer Besitzer eines DSL1000...

Mac Jack 10. Jan 2013

Natürlich hängt die Werbung da mit drin. Ist ja gekoppelt an die Suchanfragen. Wäre doch...


Folgen Sie uns
       


Alt gegen neu - Model M im Test

Das US-Unternehmen Unicomp bietet Tastaturen mit Buckling-Spring-Schalter an - so wie sie einst bei IBMs Model-M-Modellen verwendet wurden. Die Kunststoffteile sind zwar nicht so hochwertig wie die des Originals, die neuen Model Ms sind aber dennoch sehr gute Tastaturen.

Alt gegen neu - Model M im Test Video aufrufen
Russische Agenten angeklagt: Mit Bitcoin und CCleaner gegen Hillary Clinton
Russische Agenten angeklagt
Mit Bitcoin und CCleaner gegen Hillary Clinton

Die US-Justiz hat zwölf russische Agenten wegen des Hacks im US-Präsidentschaftswahlkampf angeklagt. Die Anklageschrift nennt viele technische Details und erhebt auch Vorwürfe gegen das Enthüllungsportal Wikileaks.

  1. Nach Gipfeltreffen Trump glaubt Putin mehr als US-Geheimdiensten
  2. US Space Force Planlos im Weltraum
  3. Gewalt US-Präsident Trump will Gespräch mit Spielebranche

Razer Huntsman im Test: Rattern mit Infrarot
Razer Huntsman im Test
Rattern mit Infrarot

Razers neue Gaming-Tastatur heißt Huntsman, eine klare Andeutung, für welchen Einsatzzweck sie sich eignen soll. Die neuen optomechanischen Switches reagieren schnell und leichtgängig - der Geräuschpegel dürfte für viele Nutzer aber gewöhnungsbedürftig sein.
Ein Test von Tobias Költzsch

  1. Huntsman Razer präsentiert Tastatur mit opto-mechanischen Switches
  2. Razer Abyssus Essential Symmetrische Gaming-Maus für Einsteiger
  3. Razer Nommo Chroma im Test Blinkt viel, klingt weniger

Always Connected PCs im Test: Das kann Windows 10 on Snapdragon
Always Connected PCs im Test
Das kann Windows 10 on Snapdragon

Noch keine Konkurrenz für x86-Notebooks: Die Convertibles mit Snapdragon-Chip und Windows 10 on ARM sind flott, haben LTE integriert und eine extrem lange Akkulaufzeit. Der App- und der Treiber-Support ist im Alltag teils ein Manko, aber nur eins der bisherigen Geräte überzeugt uns.
Ein Test von Marc Sauter und Oliver Nickel

  1. Qualcomm "Wir entwickeln dediziertes Silizium für Laptops"
  2. Windows 10 on ARM Microsoft plant 64-Bit-Support ab Mai 2018
  3. Always Connected PCs Vielversprechender Windows-RT-Nachfolger mit Fragezeichen

    •  /