Google: Neue Bilderkennung unterscheidet Personen, Tiere und Dinge

Ein Google-Team hat einen akademischen Wettbewerb gewonnen, bei dem Dinge in alltäglichen Situationen erkannt und lokalisiert werden müssen. Die Google-Erkennung kann dabei sehr genau zwischen Menschen, Tieren und Gegenständen unterscheiden.

Artikel veröffentlicht am ,
Googles Bilderkennung kann zwischen Dingen, Tieren und Menschen unterscheiden.
Googles Bilderkennung kann zwischen Dingen, Tieren und Menschen unterscheiden. (Bild: Google)

Das Team GoogLeNet aus Mitarbeitern von Googles Forschungsabteilung hat die ImageNet Large-Scale Visual Recognition Challenge (ILSCRC) gewonnen. In diesem jährlichen Bilderkennungswettbewerb treten Teams gegeneinander an, um mit Hilfe von Algorithmen und neuronalen Netzwerken Gegenstände in teilweise komplizierten alltäglichen Situationen zu erfassen.

  • Googles neue Bilderkennung kann recht genau verschiedene Objekte unterscheiden und lokalisieren. (Bild: Google)
  • Googles neue Bilderkennung kann recht genau verschiedene Objekte unterscheiden und lokalisieren. (Bild: Google)
  • Googles neue Bilderkennung kann recht genau verschiedene Objekte unterscheiden und lokalisieren. (Bild: Google)
Googles neue Bilderkennung kann recht genau verschiedene Objekte unterscheiden und lokalisieren. (Bild: Google)

Der Wettbewerb besteht aus drei verschiedenen Anforderungen: Klassifizierung, Klassifizierung mit Lokalisation und Erkennung. Die zu erkennenden Situationen sind alltägliche Szenarien mit stellenweise schwer auszumachenden, sich überlagernden Personen, Tieren und Gegenständen.

Neuronales Netzwerk kann Objekte unterscheiden

Das Google-Team schaffte es hier mit Hilfe eines neuronalen Netzwerks am zuverlässigsten, die verschiedenen Objekte zu unterscheiden. Dies wird anhand der Beispielbilder deutlich: Ein Bild stellt ein Wohnzimmer mit Fernseher, Bücherregal und Katzen dar - alle Gegenstände werden erkannt. Ein zweites Bild zeigt einen Reiter auf einem springenden Pferd; auch hier schafft es der Google-Algorithmus, alle Gegenstände korrekt zu benennen und zu lokalisieren. In einer Verkehrssituation werden andere Autos und einzelne Ampellichter korrekt erkannt.

Anhand des Verkehrsbeispiels wird ein möglicher Anwendungszweck der Google-Erkennung deutlich: Googles selbstfahrende Autos könnten den Algorithmus nutzen, um Verkehrssituationen zu erkennen und einschätzen zu können. Laut Googles Forschungs-Blog liegen weitere Einsatzzwecke in den Bereichen Foto- und Bildersuche sowie bei Youtube.

Das Google-Team baute bei seinem Modell auf verschiedenen Arbeiten anderer Wissenschaftler auf. Eine genaue Beschreibung der technischen Hintergründe findet sich in Googles Forschungs-Blog. Hier finden sich auch Links zu den zugrunde liegenden wissenschaftlichen Arbeiten.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Forschung
Erstes Röntgenbild von einem einzelnen Atom

Bisher war die Röntgenemission eines einzelnen Atoms zu schwach, um es auf einer Röntgenaufnahme abzulichten. Mit einer neuen Technik geht das jetzt.

Forschung: Erstes Röntgenbild von einem einzelnen Atom
Artikel
  1. Streaming: Verbraucherschützer warnen vor Netflix-Phishing
    Streaming
    Verbraucherschützer warnen vor Netflix-Phishing

    Phishing-Nachrichten im Namen von Netflix sind nichts Neues - in der aktuellen Verwirrung rund um das Kontensharing könnten sie aber einfacher verfangen.

  2. US Air Force: KI-Drohne bringt in Gedankenexperiment Befehlshaber um
    US Air Force  
    KI-Drohne bringt in Gedankenexperiment Befehlshaber um

    Die US Air Force und der verantwortliche Offizier stellen klar, dass es sich nur um ein Gedankenspiel handelt - und keinen echten Test.

  3. Chatsoftware: Microsoft will Teams zum Discord-Konkurrenten machen
    Chatsoftware
    Microsoft will Teams zum Discord-Konkurrenten machen

    Microsoft bringt das Community-Feature in Teams für Windows 11. Außerdem können User mittels KI Bilder und Ankündigungskarten erstellen.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Tiefstpreise: AMD Ryzen 9 7900X3D 534€, KFA2 RTX 3060 Ti 329,99€, Kingston Fury SSD 2TB (PS5-komp.) 129,91€ • Sony Days of Play: PS5-Spiele & Zubehör bis -70% • Roccat PC-Zubehör bis -50% • AVM Modems & Repeater bis -36% • Sony Deals Week [Werbung]
    •  /