Picsbuffet: Forscher erschaffen ein neues Verfahren zur Bildersuche

Bildersuchen suchen bisher gar nicht nach Bildern, sondern nach Text. Entsprechend ungenau sind sie. Berliner Wissenschaftler wollen das ändern - mit Hilfe von Deep Learning.

Artikel von Hans-Arthur Marsiske veröffentlicht am
Der Bildbrowser Picsbuffet
Der Bildbrowser Picsbuffet (Bild: Picsbuffet/Screenshot)

Ein Bild sagt mehr als tausend Worte, heißt es, doch ohne Worte würde vielleicht nie jemand das Bild zu Gesicht bekommen - die Bildersuche in Datenbanken und Internet stützt sich überwiegend auf Text. Suchbegriffe werden mit Dateinamen, Schlüsselwörtern oder auch mit Texten im Umfeld von Bildern abgeglichen, nicht mit den Bildern selbst. Entsprechend ungenau sind die Ergebnisse: Bei Eingabe eines Personennamens werden Bilder aufgelistet, die diese Person zeigen, Bilder, die von ihr aufgenommen wurden, oder auch Bilder, die einen Text illustrieren, in dem an irgendeiner Stelle der gesuchte Name auftaucht - die aber ansonsten keinerlei Bezug zu der Person haben.

Inhalt:
  1. Picsbuffet: Forscher erschaffen ein neues Verfahren zur Bildersuche
  2. Deep Learning bei der Bildersuche

Solche textbasierten Suchverfahren stoßen bei großen Bildersammlungen an ihre Grenzen, selbst wenn die Bilder sorgfältig annotiert und verschlagwortet sind. Bei einer Suche über mehrere Datenbanken kann zudem nicht von einer einheitlichen Verschlagwortung ausgegangen werden. Und bei automatisch erzeugten Bildern, etwa von Überwachungskameras, ist die textbasierte Suche völlig unbrauchbar.

"Content-based Image Retrieval" heißt die Bildersuche

Forscher arbeiten daher an Konzepten, die sich unmittelbar auf die Bildinhalte beziehen. Diese inhaltsbasierte Bildersuche, auch bekannt unter dem Kürzel CBIR (Content-based Image Retrieval), muss zunächst zwei Probleme lösen. Zum einen muss ein Bild mathematisch beschrieben werden. Zum anderen braucht es ein Verfahren, um auf der Grundlage der abstrakten Beschreibung die Ähnlichkeit zweier Bilder bestimmen zu können.

Der erste Ansatzpunkt dafür seien "elementare statistische Eigenschaften der Bilder", sagt Kai Uwe Barthel, "wie beispielsweise die Farben, deren örtliche Verteilung, Texturen oder Kantenrichtungen". Der Professor für Visual Computing an der Hochschule für Technik und Wirtschaft (HTW) in Berlin spricht von "Low-Level-Feature-Vektoren" mit ungefähr 30 bis 300 Dimensionen. Damit ließen sich bereits ähnlich aussehende Bilder finden, die unter Umständen jedoch völlig unterschiedliche Inhalte zeigen: Ein Spiegelei etwa kann mit seinem vom Eiweiß umringten gelben Dotter dem Kopf eines Adlers ähneln, dessen weiße Kopffedern einen gelben Schnabel umrahmen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
Deep Learning bei der Bildersuche 
  1. 1
  2. 2
  3.  


ipodtouch 04. Dez 2015

Na solange die Braut nicht unter "Elefanten" einsortiert wurde, sollte kein großer...

Avarion 02. Dez 2015

Unter anderem aus der Einleitung: "Suchbegriffe werden mit Dateinamen, Schlüsselwörtern...

Artie Fischl 02. Dez 2015

2007-... HTW Projekt Revamped ImageSorter: http://imi-bachelor.htw-berlin.de/studium...

Anonymer Nutzer 02. Dez 2015

Das hätte ich lustig gefunden.



Aktuell auf der Startseite von Golem.de
Pornhub, Youporn, Mydirtyhobby
Gericht bestätigt Zugangsverbot für Pornoportale

Die Landesmedienanstalt NRW hat zu Recht gegen drei Pornoportale mit Sitz in Zypern ein Zugangsverbot verhängt.

Pornhub, Youporn, Mydirtyhobby: Gericht bestätigt Zugangsverbot für Pornoportale
Artikel
  1. Elektrisches Showcar: Maybach hat Solarzellen und durchsichtige Motorhaube
    Elektrisches Showcar
    Maybach hat Solarzellen und durchsichtige Motorhaube

    Virgil Abloh und Mercedes-Benz haben einen solarbetriebenen, elektrischen Maybach mit transparenter Motorhaube als Showcar entworfen.

  2. Nvidia Turing: Die Geforce RTX 2060 mit 12 GByte ist da
    Nvidia Turing
    Die Geforce RTX 2060 mit 12 GByte ist da

    Doppelter Videospeicher plus Super-Gene: Die Geforce RTX 2060 mit 12 GByte soll eine günstigere Alternative zur Geforce RTX 3060 darstellen.

  3. Zip: Ratenzahlung in Microsoft Edge empört die Community
    Zip
    Ratenzahlung in Microsoft Edge empört die Community

    Die App Zip wird seit Microsoft Edge 96 standardmäßig aktiviert. Diese bietet Ratenzahlung an, schürt aber nur Hass in der Community.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Last Minute Angebote bei Amazon • Crucial-RAM zu Bestpreisen (u. a. 16GB Kit DDR4-3600 73,99€) • HP 27" FHD 165Hz 199,90€ • Razer Iskur X Gaming-Stuhl 239,99€ • Adventskalender bei MM/Saturn (u. a. Surface Pro 7+ 849€) • Alternate (u. a. Adata 1TB PCIe-4.0-SSD für 129,90€) [Werbung]
    •  /