Google: Neue Bilderkennung unterscheidet Personen, Tiere und Dinge
Ein Google-Team hat einen akademischen Wettbewerb gewonnen, bei dem Dinge in alltäglichen Situationen erkannt und lokalisiert werden müssen. Die Google-Erkennung kann dabei sehr genau zwischen Menschen, Tieren und Gegenständen unterscheiden.

Das Team GoogLeNet aus Mitarbeitern von Googles Forschungsabteilung hat die ImageNet Large-Scale Visual Recognition Challenge (ILSCRC) gewonnen. In diesem jährlichen Bilderkennungswettbewerb treten Teams gegeneinander an, um mit Hilfe von Algorithmen und neuronalen Netzwerken Gegenstände in teilweise komplizierten alltäglichen Situationen zu erfassen.
Der Wettbewerb besteht aus drei verschiedenen Anforderungen: Klassifizierung, Klassifizierung mit Lokalisation und Erkennung. Die zu erkennenden Situationen sind alltägliche Szenarien mit stellenweise schwer auszumachenden, sich überlagernden Personen, Tieren und Gegenständen.
Neuronales Netzwerk kann Objekte unterscheiden
Das Google-Team schaffte es hier mit Hilfe eines neuronalen Netzwerks am zuverlässigsten, die verschiedenen Objekte zu unterscheiden. Dies wird anhand der Beispielbilder deutlich: Ein Bild stellt ein Wohnzimmer mit Fernseher, Bücherregal und Katzen dar - alle Gegenstände werden erkannt. Ein zweites Bild zeigt einen Reiter auf einem springenden Pferd; auch hier schafft es der Google-Algorithmus, alle Gegenstände korrekt zu benennen und zu lokalisieren. In einer Verkehrssituation werden andere Autos und einzelne Ampellichter korrekt erkannt.
Anhand des Verkehrsbeispiels wird ein möglicher Anwendungszweck der Google-Erkennung deutlich: Googles selbstfahrende Autos könnten den Algorithmus nutzen, um Verkehrssituationen zu erkennen und einschätzen zu können. Laut Googles Forschungs-Blog liegen weitere Einsatzzwecke in den Bereichen Foto- und Bildersuche sowie bei Youtube.
Das Google-Team baute bei seinem Modell auf verschiedenen Arbeiten anderer Wissenschaftler auf. Eine genaue Beschreibung der technischen Hintergründe findet sich in Googles Forschungs-Blog. Hier finden sich auch Links zu den zugrunde liegenden wissenschaftlichen Arbeiten.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Auf den falschen geantwortet?
Und genau das müsste eigentlich klar gewesen sein ohne, dass man es explizit erwähnen...