Abo
  • Services:

Bilderkennung: Computer beschreibt Bild

Was ist auf einem Bild zu sehen? Zwei Entwicklerteams in den USA haben Verfahren entwickelt, um Bilder automatisch zu erkennen und zu beschreiben. Das ist nützlich für die Bildersuche, kann aber auch ganze andere Auswirkungen haben.

Artikel veröffentlicht am ,
Bilder mit Beschreibung: Manchmal kommt es auf die Worte an.
Bilder mit Beschreibung: Manchmal kommt es auf die Worte an. (Bild: Google)

Googles Bildersuche achtet eher auf Texte neben Bildern als auf die Bilder selbst. Das soll sich ändern: Zwei Entwicklerteams haben Lösungen gefunden, mit denen Computer Bilder erkennen und sie beschreiben können.

  • Funktionsweise des Google-Systems (Bild: Google)
Funktionsweise des Google-Systems (Bild: Google)
Stellenmarkt
  1. TEREG Gebäudedienste GmbH, Hamburg
  2. TÜV SÜD Gruppe, München

Eines der Teams ist von Google, das andere von der Stanford-Universität in Kalifornien. Beide haben einen ähnlichen Ansatz gewählt: Sie kombinieren Verfahren aus der Bildverarbeitung und der Verarbeitung der natürlichen Sprache.

Software imitiert Gehirn

Beide Gruppen setzen dabei auf neuronale Netze. Künstliche neuronale Netze (KNN) sind Computerprogramme, die von der Funktionsweise des menschlichen Gehirns inspiriert sind. Sie können lernen, Muster zu erkennen. Jeder Ansatz verknüpft zwei dieser neuronalen Netze.

Die Google-Entwickler nehmen ein Convolutional Neural Network (CNN), das darauf trainiert wurde, Objekte auf Bildern zu erkennen. Das CNN analysiert ein Bild und leitet das Ergebnis an ein rückgekoppeltes oder rekurrentes neuronales Netz (RNN) weiter. Das erstellt eine Beschreibung des Bildes. Das Konzept der Stanford-Gruppe ist damit vergleichbar.

Computer lernen Bilder erkennen

Die Forscher haben ihre Systeme zunächst angelernt. Dazu haben sie sie jeweils mit einer relativ kleinen Menge an Bildern gefüttert, die mit einer Beschreibung versehen waren. Die Algorithmen lernten, Muster auf Bildern und in Beschreibungen zu erkennen. Dann wurden sie auf größere, öffentlich zugängliche Datenbestände, darunter Flickr8K und Flickr30K, angesetzt.

Die Systeme liefern einfache Bildunterschriften wie "Schwarz-weißer Hund springt über ein Hindernis" oder "Eine Gruppe junger Leute spielt Frisbee". Das mag nicht sehr kreativ sein, reicht aber als Beschreibung durchaus.

Bilder werden automatisch und genau in Worte übersetzt

"Ein Bild mag mehr sagen als tausend Worte", schreiben Oriol Vinyals, Alexander Toshev, Samy Bengio und Dumitru Erhan im Google Research Blog. "Aber manchmal sind die Wörter das Nützlichste. Deshalb ist es wichtig, dass wir Möglichkeiten finden, um Bilder automatisch und genau in Worte zu übersetzen."

Die neuen Algorithmen können dafür genutzt werden, Millionen von Bildern und Videos im Internet zu beschreiben und damit auffindbar zu machen. Außerdem könnten sie beispielsweise Sehbehinderten oder Robotern bei der Navigation helfen. Sie könnten aber auch für die Überwachung eingesetzt werden, warnt die New York Times: Überwachungskameras könnten dann nicht nur Gesichter, sondern auch Verhaltensweisen erkennen.



Anzeige
Top-Angebote
  1. 399,00€ (Wert der Spiele rund 212,00€)
  2. (u. a. Pro Evolution Soccer 2019 8,50€, Styx: Shards of Darkness 9,99€)
  3. (u. a. Far Cry New Dawn 22,49€, Assassin's Creed Odyssey 29,99€)
  4. 62,90€

plutoniumsulfat 21. Nov 2014

+1

Menplant 20. Nov 2014

01.12.2016 11:30; Person, mitte 40, weißes hemd, schwarze hose, hat smartphone in Hose...

ArcherV 19. Nov 2014

+1

katze_sonne 19. Nov 2014

Hahahahahaha :D Ich musste gerade so laut lachen als ich deinen Kommentar gelesen habe...

urvo 19. Nov 2014

Automatische Bilderkennung. Ein Wünschtraum der Radiologen. Ich habe eine Promotion mit...


Folgen Sie uns
       


Huawei Mate X angesehen (MWC 2019)

Das Mate X ist das erste faltbare Smartphone von Huawei. Der Bildschirm ist auf der Außenseite eingebaut. Im ausgeklappten Zustand ist er 8 Zoll groß.

Huawei Mate X angesehen (MWC 2019) Video aufrufen
Geforce GTX 1660 im Test: Für 230 Euro eine faire Sache
Geforce GTX 1660 im Test
Für 230 Euro eine faire Sache

Die Geforce GTX 1660 - ohne Ti am Ende - rechnet so flott wie AMDs Radeon RX 590 und kostet in etwa das Gleiche. Der klare Vorteil der Nvidia-Grafikkarte ist die drastisch geringere Leistungsaufnahme.

  1. Nvidia Turing OBS unterstützt Encoder der Geforce RTX
  2. Geforce GTX 1660 Ti im Test Nvidia kann Turing auch günstig(er)
  3. Turing-Grafikkarten Nvidias Geforce 1660/1650 erscheint im März

Zotac Geforce GTX 1660 Ti im Test: Gute 1440p-Karte für unter 300 Euro
Zotac Geforce GTX 1660 Ti im Test
Gute 1440p-Karte für unter 300 Euro

Die Geforce GTX 1660 Ti von Zotac ist eine der günstigen Grafikkarten mit Nvidias Turing-Architektur, dennoch erhalten Käufer ein empfehlenswertes Modell: Der leise Pixelbeschleuniger rechnet praktisch so flott wie übertaktete Modelle, braucht aber weniger Energie.
Ein Test von Marc Sauter

  1. Grafikkarte Chip der Geforce GTX 1660 Ti ist überraschend groß
  2. Deep Learning Supersampling Nvidia will DLSS-Kantenglättung verbessern
  3. Metro Exodus im Technik-Test Richtiges Raytracing rockt

Chrome OS Crostini angesehen: Dieses Nerd-Unix läuft wie geschnitten Brot
Chrome OS Crostini angesehen
Dieses Nerd-Unix läuft wie geschnitten Brot

Mit Crostini bringt Google nun auch eine echte Linux-Umgebung auf Chromebooks, die dafür eigentlich nie vorgesehen waren. Google kann dafür auf ein echtes Linux-System und sehr viel Erfahrung zurückgreifen. Der Nutzung als Entwicklerkiste steht damit fast nichts mehr im Weg.
Von Sebastian Grüner

  1. Google Chromebooks bekommen virtuelle Arbeitsflächen
  2. Crostini VMs in Chromebooks bekommen GPU-Beschleunigung
  3. Crostini Linux-Apps für ChromeOS kommen für andere Distributionen

    •  /