Detectron: Facebook gibt eigene Objekterkennung frei

Die auf dem Python-Framework Caffe2 basierende Objekterkennung Detectron von Facebook steht nun als Open Source bereit. Das Projekt implementiert verschiedene Algorithmen auf Basis maschinellen Lernens und stellt auch einen Modellzoo bereit.

Artikel veröffentlicht am ,
Beispielergebnis der Objekterkennung von Detectron
Beispielergebnis der Objekterkennung von Detectron (Bild: Facebook)

Ein wichtiger Teil der automatischen Bilderkennung ist die Unterscheidung einzelner Bestandteile des Bildes sowie deren Zuordnung zu einer bestimmten Kategorie. Für diese Objekterkennung, die etwa in den Google Captchas Anwendung findet, hat die KI-Forschungsabteilung von Facebook das Detectron-Projekt erstellt und dieses nun als Open-Source-Software auf Github veröffentlicht.

Stellenmarkt
  1. Inhouse Berater SAP HCM / SuccessFactors (w/m/d)
    TÜV SÜD Gruppe, München
  2. IT Security Spezialist (m/w/d)
    BAHAG AG, Mannheim
Detailsuche

Detectron selbst basiert auf dem von Facebook favorisierten und unterstützten Deep-Learning-Framework Caffe 2, das in Python geschrieben ist. Das Team hat eigenen Aussagen zufolge rund eineinhalb Jahre an dem Code gearbeitet, bevor dieser nun zur freien Verfügung gestellt worden ist. Detectron setzt zudem unterschiedliche Modelle und Ansätze um.

Dazu gehört eine Variante des Region-based Convolutional Neural Networks (R-CNN), die für das Erkennen von Objektmasken genutzt werden kann (Mask R-CNN). Von Facebook wird außerdem eine Methode hervorgehoben, die mit den teilweise sehr großen Unterschieden beim Objektfokus zwischen Vordergrund und Hintergrund eines Bildes zurechtkommen soll (Focal Loss for Dense Object Detection).

Facebook nutzt Detectron laut eigenen Angaben für eine Vielzahl von Anwendungen, etwa Augmented Reality. Die Grundlage Caffe 2 ermögliche zudem die Verwendung der Modelle in der Cloud ebenso wie direkt auf Mobilgeräten. Um sich selbst von den Fähigkeiten von Detectron überzeugen zu können, bietet Facebook eine Reihe von Beispielergebnissen sowie bereits trainierten Modellen an, die als Modellzoo bezeichnet werden.

Golem Akademie
  1. Einführung in die Programmierung mit Rust
    21.-24. September 2021, online
  2. PostgreSQL Fundamentals
    6.-9. Dezember 2021, online
  3. Terraform mit AWS
    14.-15. Dezember 2021, online
Weitere IT-Trainings

Für das von Google favorisierte Framework Tensorflow steht seit vergangenem Jahr eine ähnliche Technik zur Objekterkennung bereit.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Venturi-Tunnel
Elektro-Motorrad mit Riesenloch auf der Teststrecke

White Motorcycle Concepts testet sein Elektromotorrad WMC250EV, bei dem der Fahrer auf einem riesigen Tunnel sitzt. Später soll es 400 km/h erreichen.

Venturi-Tunnel: Elektro-Motorrad mit Riesenloch auf der Teststrecke
Artikel
  1. Elektroauto: Cadillac Lyriq nach 19 Minuten weg
    Elektroauto
    Cadillac Lyriq nach 19 Minuten weg

    Einen der ersten Cadillac Lyriq zu reservieren, glich mehr einer Lotterie als einem Autokauf. In wenigen Minuten waren alle Luxus-Elektroautos vergriffen.

  2. Autos, Scooter und Fahrräder: Berlin reguliert Sharing-Mobilitätsangebote
    Autos, Scooter und Fahrräder
    Berlin reguliert Sharing-Mobilitätsangebote

    Die Nutzung des öffentlichen Raums durch Autos, Scooter und Fahrräder von Sharing-Unternehmen wird in Berlin reguliert.

  3. Abonnenten verunsichert: Apple hat Hörbücher aus Apple Music entfernt
    Abonnenten verunsichert
    Apple hat Hörbücher aus Apple Music entfernt

    Wer mit einem Musikstreamingabo Hörbücher hören will, muss von Apple Music zu Deezer, Spotify oder einem anderen Anbieter wechseln.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Nur noch heute: MM-Club-Tage (u. a. SanDisk Ultra 3D 2 TB 142,15€) • Corsair Vengeance RGB PRO 16-GB-Kit DDR4-3200 71,39€ • Corsair RM750x 750 W 105,89€ • WD Elements Desktop 12 TB 211,65€ • Alternate (u. a. Creative SB Z SE 71,98€) • ASUS ROG Crosshair VIII Hero WiFi 269,99€ [Werbung]
    •  /