Deep Learning bei der Bildersuche

Um den Bildsuchmaschinen auch die inhaltliche Dimension zu erschließen, kommen seit einigen Jahren verstärkt Techniken des maschinellen Lernens und insbesondere Deep-Learning-Netzwerke zum Einsatz. Die Herausforderung bestehe darin, so Barthel, diese neuronalen Netzwerke mit vielen Beispielbildern und den dazu gehörigen Schlagwörtern zu trainieren, so dass sie unbekannten Bildern automatisch Schlagwörter zuordnen können.

Grundsätzlich liegt den Analyseverfahren laut Barthel das Vektorraummodell zugrunde, bei dem ein Bild mit mehreren Millionen Werten auf einen Vektor mit deutlich weniger Dimensionen abgebildet wird.

Interessant wird es, wenn diese 64D-Bilddeskriptoren wiederum auf nur zwei Dimensionen abgebildet werden. Die gefundenen Bilder werden dann nach ihrer Ähnlichkeit sortiert und wie auf einer Landkarte angeordnet, durch die der Nutzer wie bei Google Maps navigieren kann: Er sucht sich zunächst einen Bereich, in dem Bilder zusammengefasst sind, die dem gesuchten Bild möglichst nahekommen. Durch das Hineinzoomen in diesen Bereich erschließt sich eine größere Auswahl ähnlicher Bilder.

Für den auf dieser Grundlage entwickelten Bildbrowser Picsbuffet haben Barthel und seine Mitarbeiter an der HTW wie auch in der von ihm mitgegründeten Firma Pixolution bei der Multimedia Modeling Conference 2015 die Best Demonstration Competition gewonnen.

Trotz der Anordnung nach Ähnlichkeit sind gelegentliche harte Brüche auf der Bilderlandkarte unvermeidlich. Die Suche nach dem Begriff Apfel etwa kann auf die Frucht, den Apfelbaum, vielleicht aber auch auf Apfelsaft verweisen. Neben dem Apfelsaft könnte als ähnliches Bild wiederum Orangensaft aufgelistet werden. Die Berliner Forscher arbeiten daher an Verfahren, die anstelle der 2D-Sortierung ein hierarchisches Bildernetzwerk verwenden und in der Lage sein sollen, in Echtzeit dreidimensionale Ansichten zu generieren.

Die Sache mit den Suchkriterien

Mit dem System Akiwi haben Barthel und seine Mitarbeiter zudem das Suchverfahren gewissermaßen in die andere Richtung entwickelt: Hier werden durch den Vergleich eines unbekannten Bildes mit bekannten und verschlagworteten Bildern Schlagworte vorgeschlagen. Durch das Eliminieren einzelner Vorschläge und Hinzufügen neuer Schlagworte kann der Nutzer die Suche gezielt verfeinern und rasch eine Bildauswahl zusammenstellen, die den Suchkriterien entspricht.

Damit zeigt sich: Ein Bild mag zwar mehr mitteilen können als tausend Worte. Aber wenn Bilder und Worte effektiv zusammenwirken, sind sie unschlagbar. Jedenfalls vorerst. Barthel sieht in der "intelligenten bildbasierten Datenexploration" jedenfalls "ein riesiges Potenzial für das zukünftige Gesicht des Internet: bild- und symbolträchtig, textbefreit, dreidimensional und holistisch selbstorganisierend".

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Picsbuffet: Forscher erschaffen ein neues Verfahren zur Bildersuche
  1.  
  2. 1
  3. 2


ipodtouch 04. Dez 2015

Na solange die Braut nicht unter "Elefanten" einsortiert wurde, sollte kein großer...

Avarion 02. Dez 2015

Unter anderem aus der Einleitung: "Suchbegriffe werden mit Dateinamen, Schlüsselwörtern...

Artie Fischl 02. Dez 2015

2007-... HTW Projekt Revamped ImageSorter: http://imi-bachelor.htw-berlin.de/studium...

Anonymer Nutzer 02. Dez 2015

Das hätte ich lustig gefunden.



Aktuell auf der Startseite von Golem.de
Nachfolger von CS GO
Counter-Strike 2 ist geleakt

Eigentlich steht CS 2 bisher nur ausgewählten Personen zur Verfügung. Eine davon hat die Spieldateien aber offenbar ins Internet hochgeladen.

Nachfolger von CS GO: Counter-Strike 2 ist geleakt
Artikel
  1. Model S und Model X: Teslas rundes Lenkrad ist ausverkauft
    Model S und Model X
    Teslas rundes Lenkrad ist ausverkauft

    Tesla kann die Alternative zum Steuerhorn beim Model X und Model S nicht liefern. Offenbar wurde die Nachfrage unterschätzt.

  2. Akkutechnik: Amprius stellt Akkuzellen mit über 500 Wh/kg vor
    Akkutechnik
    Amprius stellt Akkuzellen mit über 500 Wh/kg vor

    Mit viel Aufwand können inzwischen Akkus nah an der Grenze zum physikalisch Machbaren gebaut werden. Was fehlt, ist die Massenproduktion.
    Eine Analyse von Frank Wunderlich-Pfeiffer

  3. Tiktok-Randale bei Creed III: Kinos setzen auf Erhöhung der FSK und Security
    Tiktok-Randale bei Creed III
    Kinos setzen auf Erhöhung der FSK und Security

    Kinos wollen verhindern, dass Zuschauer wegen Störaktionen dem Boxerfilm Creed III fernbleiben. Der Trend, sich beim Randalieren auf Tiktok zu zeigen, hält an.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • MediaMarkt-Osterangebote • 3 Spiele kaufen, nur 2 bezahlen • Cyberport Jubiläums-Deals • MindStar: Gigabyte RTX 4080 OC 1.229€ • NBB Black Weeks • Crucial SSD 1TB/2TB (PS5) bis -42% • Amazon Smart TVs ab 189€ • PS5 + RE4 569€ • Nintendo Switch + Spiel + Goodie 288€ [Werbung]
    •  /