Picsbuffet: Forscher erschaffen ein neues Verfahren zur Bildersuche

Bildersuchen suchen bisher gar nicht nach Bildern, sondern nach Text. Entsprechend ungenau sind sie. Berliner Wissenschaftler wollen das ändern - mit Hilfe von Deep Learning.

Artikel von Hans-Arthur Marsiske veröffentlicht am
Der Bildbrowser Picsbuffet
Der Bildbrowser Picsbuffet (Bild: Picsbuffet/Screenshot)

Ein Bild sagt mehr als tausend Worte, heißt es, doch ohne Worte würde vielleicht nie jemand das Bild zu Gesicht bekommen - die Bildersuche in Datenbanken und Internet stützt sich überwiegend auf Text. Suchbegriffe werden mit Dateinamen, Schlüsselwörtern oder auch mit Texten im Umfeld von Bildern abgeglichen, nicht mit den Bildern selbst. Entsprechend ungenau sind die Ergebnisse: Bei Eingabe eines Personennamens werden Bilder aufgelistet, die diese Person zeigen, Bilder, die von ihr aufgenommen wurden, oder auch Bilder, die einen Text illustrieren, in dem an irgendeiner Stelle der gesuchte Name auftaucht - die aber ansonsten keinerlei Bezug zu der Person haben.

Inhalt:
  1. Picsbuffet: Forscher erschaffen ein neues Verfahren zur Bildersuche
  2. Deep Learning bei der Bildersuche

Solche textbasierten Suchverfahren stoßen bei großen Bildersammlungen an ihre Grenzen, selbst wenn die Bilder sorgfältig annotiert und verschlagwortet sind. Bei einer Suche über mehrere Datenbanken kann zudem nicht von einer einheitlichen Verschlagwortung ausgegangen werden. Und bei automatisch erzeugten Bildern, etwa von Überwachungskameras, ist die textbasierte Suche völlig unbrauchbar.

"Content-based Image Retrieval" heißt die Bildersuche

Forscher arbeiten daher an Konzepten, die sich unmittelbar auf die Bildinhalte beziehen. Diese inhaltsbasierte Bildersuche, auch bekannt unter dem Kürzel CBIR (Content-based Image Retrieval), muss zunächst zwei Probleme lösen. Zum einen muss ein Bild mathematisch beschrieben werden. Zum anderen braucht es ein Verfahren, um auf der Grundlage der abstrakten Beschreibung die Ähnlichkeit zweier Bilder bestimmen zu können.

Der erste Ansatzpunkt dafür seien "elementare statistische Eigenschaften der Bilder", sagt Kai Uwe Barthel, "wie beispielsweise die Farben, deren örtliche Verteilung, Texturen oder Kantenrichtungen". Der Professor für Visual Computing an der Hochschule für Technik und Wirtschaft (HTW) in Berlin spricht von "Low-Level-Feature-Vektoren" mit ungefähr 30 bis 300 Dimensionen. Damit ließen sich bereits ähnlich aussehende Bilder finden, die unter Umständen jedoch völlig unterschiedliche Inhalte zeigen: Ein Spiegelei etwa kann mit seinem vom Eiweiß umringten gelben Dotter dem Kopf eines Adlers ähneln, dessen weiße Kopffedern einen gelben Schnabel umrahmen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
Deep Learning bei der Bildersuche 
  1. 1
  2. 2
  3.  


ipodtouch 04. Dez 2015

Na solange die Braut nicht unter "Elefanten" einsortiert wurde, sollte kein großer...

Avarion 02. Dez 2015

Unter anderem aus der Einleitung: "Suchbegriffe werden mit Dateinamen, Schlüsselwörtern...

Artie Fischl 02. Dez 2015

2007-... HTW Projekt Revamped ImageSorter: http://imi-bachelor.htw-berlin.de/studium...

Anonymer Nutzer 02. Dez 2015

Das hätte ich lustig gefunden.



Aktuell auf der Startseite von Golem.de
Amazon Shopper Panel
Amazon zahlt für Überwachung des Smartphone-Datenverkehrs

Wer seinen gesamten Smartphone-Datenverkehr über Amazons Server leitet, wird mit einem monatlichen Gutschein dafür bezahlt.

Amazon Shopper Panel: Amazon zahlt für Überwachung des Smartphone-Datenverkehrs
Artikel
  1. Vodafone und Telekom: LTE-Ausbau in Berliner Bahntunneln dauert weitere Jahre
    Vodafone und Telekom
    LTE-Ausbau in Berliner Bahntunneln dauert weitere Jahre

    Laut Senatsverwaltung kam der Ausbau der Base-Transceiver-Station-Hotels nicht wie geplant voran. Nicht nur die Kunden von Vodafone und Telekom haben das Nachsehen.

  2. Northrop Grumman: B21 Raider als erster digitaler Bomber vorgestellt
    Northrop Grumman
    B21 Raider als erster digitaler Bomber vorgestellt

    Northrop Grumman hat mit dem B-21 Raider eine neuen Tarnkappenbomber vorgestellt. Dabei kamen agile Softwareentwicklung und digitales Engineering zum Einsatz.

  3. Soziale Netzwerke: Liken bei Hasspostings kann strafbar sein
    Soziale Netzwerke
    Liken bei Hasspostings kann strafbar sein

    Facebook-Nutzer, die nicht davor zurückschrecken, diskriminierende oder beleidigende oder Postings zu liken, sollten sich das gut überlegen. Denn das Drücken des Gefällt-mir-Buttons kann hier erhebliche rechtliche Folgen haben.
    Von Harald Büring

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • PS5-Bundle vorbestellbar • SanDisk Extreme PRO 1TB 141,86€ • Amazon-Geräte bis -53% • Mindstar: Alphacool Eiswolf 2 AiO 360 199€, AMD-Ryzen-CPUs zu Bestpreisen • Alternate: WD_BLACK P10 2TB 76,89€ • Advent-Tagesdeals bei MediaMarkt/Saturn • Thrustmaster Ferrari GTE Wheel 87,60€ [Werbung]
    •  /