Abo
  • Services:
Anzeige
Der Bildbrowser Picsbuffet
Der Bildbrowser Picsbuffet (Bild: Picsbuffet/Screenshot)

Deep Learning bei der Bildersuche

Um den Bildsuchmaschinen auch die inhaltliche Dimension zu erschließen, kommen seit einigen Jahren verstärkt Techniken des maschinellen Lernens und insbesondere Deep-Learning-Netzwerke zum Einsatz. Die Herausforderung bestehe darin, so Barthel, diese neuronalen Netzwerke mit vielen Beispielbildern und den dazu gehörigen Schlagwörtern zu trainieren, so dass sie unbekannten Bildern automatisch Schlagwörter zuordnen können.

Anzeige

Grundsätzlich liegt den Analyseverfahren laut Barthel das Vektorraummodell zugrunde, bei dem ein Bild mit mehreren Millionen Werten auf einen Vektor mit deutlich weniger Dimensionen abgebildet wird.

Interessant wird es, wenn diese 64D-Bilddeskriptoren wiederum auf nur zwei Dimensionen abgebildet werden. Die gefundenen Bilder werden dann nach ihrer Ähnlichkeit sortiert und wie auf einer Landkarte angeordnet, durch die der Nutzer wie bei Google Maps navigieren kann: Er sucht sich zunächst einen Bereich, in dem Bilder zusammengefasst sind, die dem gesuchten Bild möglichst nahekommen. Durch das Hineinzoomen in diesen Bereich erschließt sich eine größere Auswahl ähnlicher Bilder.

Für den auf dieser Grundlage entwickelten Bildbrowser Picsbuffet haben Barthel und seine Mitarbeiter an der HTW wie auch in der von ihm mitgegründeten Firma Pixolution bei der Multimedia Modeling Conference 2015 die Best Demonstration Competition gewonnen.

Trotz der Anordnung nach Ähnlichkeit sind gelegentliche harte Brüche auf der Bilderlandkarte unvermeidlich. Die Suche nach dem Begriff Apfel etwa kann auf die Frucht, den Apfelbaum, vielleicht aber auch auf Apfelsaft verweisen. Neben dem Apfelsaft könnte als ähnliches Bild wiederum Orangensaft aufgelistet werden. Die Berliner Forscher arbeiten daher an Verfahren, die anstelle der 2D-Sortierung ein hierarchisches Bildernetzwerk verwenden und in der Lage sein sollen, in Echtzeit dreidimensionale Ansichten zu generieren.

Die Sache mit den Suchkriterien

Mit dem System Akiwi haben Barthel und seine Mitarbeiter zudem das Suchverfahren gewissermaßen in die andere Richtung entwickelt: Hier werden durch den Vergleich eines unbekannten Bildes mit bekannten und verschlagworteten Bildern Schlagworte vorgeschlagen. Durch das Eliminieren einzelner Vorschläge und Hinzufügen neuer Schlagworte kann der Nutzer die Suche gezielt verfeinern und rasch eine Bildauswahl zusammenstellen, die den Suchkriterien entspricht.

Damit zeigt sich: Ein Bild mag zwar mehr mitteilen können als tausend Worte. Aber wenn Bilder und Worte effektiv zusammenwirken, sind sie unschlagbar. Jedenfalls vorerst. Barthel sieht in der "intelligenten bildbasierten Datenexploration" jedenfalls "ein riesiges Potenzial für das zukünftige Gesicht des Internet: bild- und symbolträchtig, textbefreit, dreidimensional und holistisch selbstorganisierend".

 Picsbuffet: Forscher erschaffen ein neues Verfahren zur Bildersuche

eye home zur Startseite
ipodtouch 04. Dez 2015

Na solange die Braut nicht unter "Elefanten" einsortiert wurde, sollte kein großer...

Avarion 02. Dez 2015

Unter anderem aus der Einleitung: "Suchbegriffe werden mit Dateinamen, Schlüsselwörtern...

Artie Fischl 02. Dez 2015

2007-... HTW Projekt Revamped ImageSorter: http://imi-bachelor.htw-berlin.de/studium...

Anonymer Nutzer 02. Dez 2015

Das hätte ich lustig gefunden.



Anzeige

Stellenmarkt
  1. BG-Phoenics GmbH, Hannover
  2. PTV Group, Karlsruhe
  3. TADANO FAUN GmbH, Lauf an der Pegnitz / bei Nürnberg
  4. WKM GmbH, München


Anzeige
Hardware-Angebote
  1. (reduzierte Überstände, Restposten & Co.)
  2. 17,99€ statt 29,99€

Folgen Sie uns
       


  1. ZTE

    Chinas großes 5G-Testprojekt läuft weiter

  2. Ubisoft

    Far Cry 5 bietet Kampf gegen Sekte in und über Montana

  3. Rockstar Games

    Waffenschiebereien in GTA 5

  4. Browser-Games

    Unreal Engine 4.16 unterstützt Wasm und WebGL 2.0

  5. Hasskommentare

    Bundesrat fordert zahlreiche Änderungen an Maas-Gesetz

  6. GVFS

    Windows-Team nutzt fast vollständig Git

  7. Netzneutralität

    Verbraucherschützer wollen Verbot von Stream On der Telekom

  8. Wahlprogramm

    SPD fordert Anzeigepflicht für "relevante Inhalte" im Netz

  9. Funkfrequenzen

    Bundesnetzagentur und Alibaba wollen Produkte sperren

  10. Elektromobilität

    Qualcomm lädt E-Autos während der Fahrt auf



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Redmond Campus Building 87: Microsofts Area 51 für Hardware
Redmond Campus Building 87
Microsofts Area 51 für Hardware
  1. Windows on ARM Microsoft erklärt den kommenden x86-Emulator im Detail
  2. Azure Microsoft betreut MySQL und PostgreSQL in der Cloud
  3. Microsoft Azure bekommt eine beeindruckend beängstigende Video-API

3D-Druck bei der Bahn: Mal eben einen Kleiderhaken für 80 Euro drucken
3D-Druck bei der Bahn
Mal eben einen Kleiderhaken für 80 Euro drucken
  1. Bahnchef Richard Lutz Künftig "kein Ticket mehr für die Bahn" notwendig
  2. Flatrate Öffentliches Fahrradleihen kostet 50 Euro im Jahr
  3. Nextbike Berlins neues Fahrradverleihsystem startet

Google I/O: Google verzückt die Entwickler
Google I/O
Google verzückt die Entwickler
  1. Neue Version im Hands On Android TV bekommt eine vernünftige Kanalübersicht
  2. Play Store Google nimmt sich Apps mit schlechten Bewertungen vor
  3. Daydream Standalone-Headsets auf Preisniveau von Vive und Oculus Rift

  1. Re: Horizon zero dawn

    HerrMannelig | 08:39

  2. Re: Ressourcenentführung

    matzems | 08:32

  3. Re: Warum nicht früher?

    MarioWario | 07:52

  4. Re: Zu schnell

    MarioWario | 07:50

  5. Re: 1400W... für welche Hardware?

    ArcherV | 07:46


  1. 17:40

  2. 16:40

  3. 16:29

  4. 16:27

  5. 15:15

  6. 13:35

  7. 13:17

  8. 13:05


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel