• IT-Karriere:
  • Services:

Picsbuffet: Forscher erschaffen ein neues Verfahren zur Bildersuche

Bildersuchen suchen bisher gar nicht nach Bildern, sondern nach Text. Entsprechend ungenau sind sie. Berliner Wissenschaftler wollen das ändern - mit Hilfe von Deep Learning.

Artikel von Hans-Arthur Marsiske veröffentlicht am
Der Bildbrowser Picsbuffet
Der Bildbrowser Picsbuffet (Bild: Picsbuffet/Screenshot)

Ein Bild sagt mehr als tausend Worte, heißt es, doch ohne Worte würde vielleicht nie jemand das Bild zu Gesicht bekommen - die Bildersuche in Datenbanken und Internet stützt sich überwiegend auf Text. Suchbegriffe werden mit Dateinamen, Schlüsselwörtern oder auch mit Texten im Umfeld von Bildern abgeglichen, nicht mit den Bildern selbst. Entsprechend ungenau sind die Ergebnisse: Bei Eingabe eines Personennamens werden Bilder aufgelistet, die diese Person zeigen, Bilder, die von ihr aufgenommen wurden, oder auch Bilder, die einen Text illustrieren, in dem an irgendeiner Stelle der gesuchte Name auftaucht - die aber ansonsten keinerlei Bezug zu der Person haben.

Inhalt:
  1. Picsbuffet: Forscher erschaffen ein neues Verfahren zur Bildersuche
  2. Deep Learning bei der Bildersuche

Solche textbasierten Suchverfahren stoßen bei großen Bildersammlungen an ihre Grenzen, selbst wenn die Bilder sorgfältig annotiert und verschlagwortet sind. Bei einer Suche über mehrere Datenbanken kann zudem nicht von einer einheitlichen Verschlagwortung ausgegangen werden. Und bei automatisch erzeugten Bildern, etwa von Überwachungskameras, ist die textbasierte Suche völlig unbrauchbar.

"Content-based Image Retrieval" heißt die Bildersuche

Forscher arbeiten daher an Konzepten, die sich unmittelbar auf die Bildinhalte beziehen. Diese inhaltsbasierte Bildersuche, auch bekannt unter dem Kürzel CBIR (Content-based Image Retrieval), muss zunächst zwei Probleme lösen. Zum einen muss ein Bild mathematisch beschrieben werden. Zum anderen braucht es ein Verfahren, um auf der Grundlage der abstrakten Beschreibung die Ähnlichkeit zweier Bilder bestimmen zu können.

Der erste Ansatzpunkt dafür seien "elementare statistische Eigenschaften der Bilder", sagt Kai Uwe Barthel, "wie beispielsweise die Farben, deren örtliche Verteilung, Texturen oder Kantenrichtungen". Der Professor für Visual Computing an der Hochschule für Technik und Wirtschaft (HTW) in Berlin spricht von "Low-Level-Feature-Vektoren" mit ungefähr 30 bis 300 Dimensionen. Damit ließen sich bereits ähnlich aussehende Bilder finden, die unter Umständen jedoch völlig unterschiedliche Inhalte zeigen: Ein Spiegelei etwa kann mit seinem vom Eiweiß umringten gelben Dotter dem Kopf eines Adlers ähneln, dessen weiße Kopffedern einen gelben Schnabel umrahmen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
Deep Learning bei der Bildersuche 
  1. 1
  2. 2
  3.  


Anzeige
Spiele-Angebote
  1. 2,99€
  2. 47,49€
  3. 4,99€

ipodtouch 04. Dez 2015

Na solange die Braut nicht unter "Elefanten" einsortiert wurde, sollte kein großer...

Avarion 02. Dez 2015

Unter anderem aus der Einleitung: "Suchbegriffe werden mit Dateinamen, Schlüsselwörtern...

Artie Fischl 02. Dez 2015

2007-... HTW Projekt Revamped ImageSorter: http://imi-bachelor.htw-berlin.de/studium...

Anonymer Nutzer 02. Dez 2015

Das hätte ich lustig gefunden.


Folgen Sie uns
       


Golem-Akademie - Trainer Florian stellt sich vor

Vom Junior-Projektleiter zum IT-Director konnte Florian Schader sämtliche Facetten der IT-Welt gestalten und hat eine Leidenschaft entwickelt, diese Erfahrungen weiterzugeben. Seine Grundmotivation ist die aktive Weitergabe seiner 20-jährigen Projekt- und Leitungserfahrung im IT-Umfeld, der Erfolg von Projekten und die aktive Weiterentwicklung von Menschen. Dabei stellt er immer den Bezug zur Praxis her. Als Trainer und Coach ist er spezialisiert auf Projektmanagement und Führungskräfteentwicklung.

Golem-Akademie - Trainer Florian stellt sich vor Video aufrufen
Bosch-Parkplatzsensor im Test: Ein Knöllchen von LoRa
Bosch-Parkplatzsensor im Test
Ein Knöllchen von LoRa

Immer häufiger übernehmen Sensoren die Überwachung von Parkplätzen. Doch wie zuverlässig ist die Technik auf Basis von LoRa inzwischen? Golem.de hat einen Sensor von Bosch getestet und erläutert die Unterschiede zum Parking Pilot von Smart City System.
Ein Test von Friedhelm Greis

  1. Automated Valet Parking Daimler und Bosch dürfen autonom parken
  2. Enhanced Summon Teslas sollen künftig ausparken und vorfahren

Red Dead Redemption 2 für PC angespielt: Schusswechsel mit Startschwierigkeiten
Red Dead Redemption 2 für PC angespielt
Schusswechsel mit Startschwierigkeiten

Die PC-Version von Red Dead Redemption 2 bietet schönere Grafik als die Konsolenfassung - aber nach der Installation dauert es ganz schön lange bis zum ersten Feuergefecht in den Weiten des Wilden Westens.

  1. Rockstar Games Red Dead Redemption 2 belegt 150 GByte auf PC-Festplatte
  2. Rockstar Games Red Dead Redemption 2 erscheint für Windows-PC und Stadia
  3. Rockstar Games Red Dead Online wird zum Rollenspiel

Surface Laptop 3 (15 Zoll) im Test: Das 15-Zoll-Macbook mit Windows 10 und Ryzen
Surface Laptop 3 (15 Zoll) im Test
Das 15-Zoll-Macbook mit Windows 10 und Ryzen

Was passiert, wenn ein 13-Zoll-Notebook ein 15-Zoll-Panel erhält? Es entsteht der Surface Laptop 3. Er ist leicht, sehr gut verarbeitet und hat eine exzellente Tastatur. Das bereitet aber nur Freude, wenn wir die wenigen Anschlüsse und den recht kleinen Akku verkraften können.
Ein Test von Oliver Nickel

  1. Surface Laptop 3 mit 15 Zoll Microsoft könnte achtkernigen Ryzen verbauen

    •  /