Detectron: Facebook gibt eigene Objekterkennung frei

Die auf dem Python-Framework Caffe2 basierende Objekterkennung Detectron von Facebook steht nun als Open Source bereit. Das Projekt implementiert verschiedene Algorithmen auf Basis maschinellen Lernens und stellt auch einen Modellzoo bereit.

Artikel veröffentlicht am ,
Beispielergebnis der Objekterkennung von Detectron
Beispielergebnis der Objekterkennung von Detectron (Bild: Facebook)

Ein wichtiger Teil der automatischen Bilderkennung ist die Unterscheidung einzelner Bestandteile des Bildes sowie deren Zuordnung zu einer bestimmten Kategorie. Für diese Objekterkennung, die etwa in den Google Captchas Anwendung findet, hat die KI-Forschungsabteilung von Facebook das Detectron-Projekt erstellt und dieses nun als Open-Source-Software auf Github veröffentlicht.

Stellenmarkt
  1. Prozessmanager Digitalisierung Einkauf (m/w/d)
    Kaufland Dienstleistung GmbH & Co. KG, Heilbronn
  2. Projektmanager / Lead Product Owner ERP (m/w/d)
    über Hays AG, Landshut
Detailsuche

Detectron selbst basiert auf dem von Facebook favorisierten und unterstützten Deep-Learning-Framework Caffe 2, das in Python geschrieben ist. Das Team hat eigenen Aussagen zufolge rund eineinhalb Jahre an dem Code gearbeitet, bevor dieser nun zur freien Verfügung gestellt worden ist. Detectron setzt zudem unterschiedliche Modelle und Ansätze um.

Dazu gehört eine Variante des Region-based Convolutional Neural Networks (R-CNN), die für das Erkennen von Objektmasken genutzt werden kann (Mask R-CNN). Von Facebook wird außerdem eine Methode hervorgehoben, die mit den teilweise sehr großen Unterschieden beim Objektfokus zwischen Vordergrund und Hintergrund eines Bildes zurechtkommen soll (Focal Loss for Dense Object Detection).

Facebook nutzt Detectron laut eigenen Angaben für eine Vielzahl von Anwendungen, etwa Augmented Reality. Die Grundlage Caffe 2 ermögliche zudem die Verwendung der Modelle in der Cloud ebenso wie direkt auf Mobilgeräten. Um sich selbst von den Fähigkeiten von Detectron überzeugen zu können, bietet Facebook eine Reihe von Beispielergebnissen sowie bereits trainierten Modellen an, die als Modellzoo bezeichnet werden.

Golem Akademie
  1. Jira für Anwender: virtueller Ein-Tages-Workshop
    4. Februar 2022, virtuell
  2. Netzwerktechnik Kompaktkurs: virtueller Fünf-Tage-Workshop
    14.–18. Februar 2022, virtuell
Weitere IT-Trainings

Für das von Google favorisierte Framework Tensorflow steht seit vergangenem Jahr eine ähnliche Technik zur Objekterkennung bereit.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Matrix
Grundschule forkt Messenger

Statt auf Teams oder Google setzt eine Grundschule in NRW beim Homeschooling auf einen selbst angepassten Matrix-Client. Die Mühe lohnt sich.
Ein Interview von Moritz Tremmel

Matrix: Grundschule forkt Messenger
Artikel
  1. Morello: Microsoft und ARM bauen Chip mit Speichersicherheit
    Morello
    Microsoft und ARM bauen Chip mit Speichersicherheit

    Eine CPU-Architektur mit Capabilitys soll typische Speicherfehler aus C oder C++ in der Hardware verhindern. Die CPU wird nun erstmals getestet.

  2. Elektrotransporter: Volkswagen zeigt künftigen ID. Buzz
    Elektrotransporter
    Volkswagen zeigt künftigen ID. Buzz

    Volkswagens Elektrobus ID.Buzz wird im März 2022 vorgestellt, doch einen ersten Blick gewährt VW schon jetzt.

  3. Samsung: Europreise für Galaxy-S22-Reihe sind geleakt
    Samsung
    Europreise für Galaxy-S22-Reihe sind geleakt

    Samsungs neue Galaxy-S22-Smartphones kommen mit 8 oder 12 GByte RAM und kosten so viel wie ihre jeweiligen Vorgänger.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • RTX 3080 Ti 12GB 1.899€ • Intel i9 10900K 444,88€ • Huawei Curved Gaming-Monitor 27" 299€ • Hisense-TVs zu Bestpreisen (u. a. 55" OLED 739€) • RX 6900 1.449€ • MindStar (u.a. Intel i7 10700KF 279€) • Alternate (u.a. DeepCool CPU-Kühler 54,90€) • LG OLED (2021) 77 Zoll 120Hz 2.799€ [Werbung]
    •  /