Anzeige
Bilder mit Beschreibung: Manchmal kommt es auf die Worte an.
Bilder mit Beschreibung: Manchmal kommt es auf die Worte an. (Bild: Google)

Bilderkennung: Computer beschreibt Bild

Bilder mit Beschreibung: Manchmal kommt es auf die Worte an.
Bilder mit Beschreibung: Manchmal kommt es auf die Worte an. (Bild: Google)

Was ist auf einem Bild zu sehen? Zwei Entwicklerteams in den USA haben Verfahren entwickelt, um Bilder automatisch zu erkennen und zu beschreiben. Das ist nützlich für die Bildersuche, kann aber auch ganze andere Auswirkungen haben.

Anzeige

Googles Bildersuche achtet eher auf Texte neben Bildern als auf die Bilder selbst. Das soll sich ändern: Zwei Entwicklerteams haben Lösungen gefunden, mit denen Computer Bilder erkennen und sie beschreiben können.

  • Funktionsweise des Google-Systems (Bild: Google)
Funktionsweise des Google-Systems (Bild: Google)

Eines der Teams ist von Google, das andere von der Stanford-Universität in Kalifornien. Beide haben einen ähnlichen Ansatz gewählt: Sie kombinieren Verfahren aus der Bildverarbeitung und der Verarbeitung der natürlichen Sprache.

Software imitiert Gehirn

Beide Gruppen setzen dabei auf neuronale Netze. Künstliche neuronale Netze (KNN) sind Computerprogramme, die von der Funktionsweise des menschlichen Gehirns inspiriert sind. Sie können lernen, Muster zu erkennen. Jeder Ansatz verknüpft zwei dieser neuronalen Netze.

Die Google-Entwickler nehmen ein Convolutional Neural Network (CNN), das darauf trainiert wurde, Objekte auf Bildern zu erkennen. Das CNN analysiert ein Bild und leitet das Ergebnis an ein rückgekoppeltes oder rekurrentes neuronales Netz (RNN) weiter. Das erstellt eine Beschreibung des Bildes. Das Konzept der Stanford-Gruppe ist damit vergleichbar.

Computer lernen Bilder erkennen

Die Forscher haben ihre Systeme zunächst angelernt. Dazu haben sie sie jeweils mit einer relativ kleinen Menge an Bildern gefüttert, die mit einer Beschreibung versehen waren. Die Algorithmen lernten, Muster auf Bildern und in Beschreibungen zu erkennen. Dann wurden sie auf größere, öffentlich zugängliche Datenbestände, darunter Flickr8K und Flickr30K, angesetzt.

Die Systeme liefern einfache Bildunterschriften wie "Schwarz-weißer Hund springt über ein Hindernis" oder "Eine Gruppe junger Leute spielt Frisbee". Das mag nicht sehr kreativ sein, reicht aber als Beschreibung durchaus.

Bilder werden automatisch und genau in Worte übersetzt

"Ein Bild mag mehr sagen als tausend Worte", schreiben Oriol Vinyals, Alexander Toshev, Samy Bengio und Dumitru Erhan im Google Research Blog. "Aber manchmal sind die Wörter das Nützlichste. Deshalb ist es wichtig, dass wir Möglichkeiten finden, um Bilder automatisch und genau in Worte zu übersetzen."

Die neuen Algorithmen können dafür genutzt werden, Millionen von Bildern und Videos im Internet zu beschreiben und damit auffindbar zu machen. Außerdem könnten sie beispielsweise Sehbehinderten oder Robotern bei der Navigation helfen. Sie könnten aber auch für die Überwachung eingesetzt werden, warnt die New York Times: Überwachungskameras könnten dann nicht nur Gesichter, sondern auch Verhaltensweisen erkennen.


eye home zur Startseite
plutoniumsulfat 21. Nov 2014

+1

Menplant 20. Nov 2014

01.12.2016 11:30; Person, mitte 40, weißes hemd, schwarze hose, hat smartphone in Hose...

ArcherV 19. Nov 2014

+1

katze_sonne 19. Nov 2014

Hahahahahaha :D Ich musste gerade so laut lachen als ich deinen Kommentar gelesen habe...

urvo 19. Nov 2014

Automatische Bilderkennung. Ein Wünschtraum der Radiologen. Ich habe eine Promotion mit...

Kommentieren



Anzeige

  1. Projektmanager (m/w)
    T-Systems International GmbH, Bonn, Münster, Bonn, München, Darmstadt
  2. Technischer Redakteur (m/w)
    über Hanseatisches Personalkontor Stuttgart, Crailsheim
  3. IT-Service Designer/in
    Landesbetrieb IT.Niedersachsen, Hannover
  4. Betreuer Business Intelligence für SAP FI/CO/BW (m/w)
    Endress+Hauser Conducta GmbH+Co. KG, Gerlingen

Detailsuche



Anzeige
Top-Angebote
  1. NEU: 10 Blu-rays für 50 EUR
    (u. a. Lucy, Jack Reacher, Cooties, Airport, Big Jake, Evan Allmächtig, Paycheck, I Am Ali)
  2. NEU: Blu-rays reduziert
    (u. a. Jurassic World 9,99€, Terminator Genisys 9,99€, Fast & Furious 7 8,97€, Fantastic Four...
  3. JETZT ERHÄLTLICH: GeForce GTX 1080 bei Amazon

Weitere Angebote


Folgen Sie uns
       


  1. Bezahlsystem

    Apple will Pay zügig in Europa ausweiten

  2. Überwachung

    Aufregung um Intermediate-Zertifikat für Bluecoat

  3. Virtual Reality

    Googles Daydream benötigt neues Smartphone

  4. Cortex-A73 Artemis

    ARMs neuer High-End-CPU-Kern für 2017

  5. Tony Fadell

    iPod-Erfinder baut Elektro-Gokarts für Kinder

  6. Riesiges Produktionsgebäude

    Ende Juli wird die Tesla Gigafactory eröffnet

  7. Maas kontra Dobrindt

    Bundesjustizminister verweigert autonomen Autos Sonderrechte

  8. Section Control

    Bremsen vor Blitzern soll nicht mehr vor Bußgeld schützen

  9. Beam

    ISS-Modul erfolgreich aufgeblasen

  10. Arbeitsbedingungen

    Apple-Store-Mitarbeiterin gewährt Blick hinter die Kulissen



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Oracle vs. Google: Wie man Geschworene am besten verwirrt
Oracle vs. Google
Wie man Geschworene am besten verwirrt
  1. Java-Rechtsstreit Oracle verliert gegen Google
  2. Oracle vs. Google Wie viel Fair Use steckt in 11.000 Codezeilen?

GPD XD im Test: Zwischen Nintendo 3DS und PS Vita ist noch Platz
GPD XD im Test
Zwischen Nintendo 3DS und PS Vita ist noch Platz
  1. Xbox Scorpio Schneller als Playstation Neo und mit Rift-Unterstützung
  2. Playstation 4 Rennstart für Gran Turismo Sport im November 2016
  3. AMD Drei Konsolen-Chips für 2017 angekündigt

Intels Compute Stick im Test: Der mit dem Lüfter streamt (2)
Intels Compute Stick im Test
Der mit dem Lüfter streamt (2)
  1. Stratix 10 MX Alteras Chips nutzen HBM2 und Intels Interposer-Technik
  2. Apple Store Apple darf keine Geschäfte in Indien eröffnen
  3. HBM2 eSilicon zeigt 14LPP-Design mit High Bandwidth Memory

  1. Re: Smalltalk hat in einer Fachberatung nichts zu...

    der_wahre_hannes | 10:28

  2. hahahaha

    flasherle | 10:28

  3. Re: Rasterfahndung

    honk | 10:27

  4. Re: Was würde passieren

    kendon | 10:27

  5. Alles nur Show

    budweiser | 10:26


  1. 10:31

  2. 10:27

  3. 08:45

  4. 08:15

  5. 07:44

  6. 07:24

  7. 07:10

  8. 12:45


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel