Zum Hauptinhalt Zur Navigation

Detectron: Facebook gibt eigene Objekterkennung frei

Die auf dem Python-Framework Caffe2 basierende Objekterkennung Detectron von Facebook steht nun als Open Source bereit. Das Projekt implementiert verschiedene Algorithmen auf Basis maschinellen Lernens und stellt auch einen Modellzoo bereit.
/ Sebastian Grüner
5 Kommentare News folgen (öffnet im neuen Fenster)
Beispielergebnis der Objekterkennung von Detectron (Bild: Facebook)
Beispielergebnis der Objekterkennung von Detectron Bild: Facebook

Ein wichtiger Teil der automatischen Bilderkennung ist die Unterscheidung einzelner Bestandteile des Bildes sowie deren Zuordnung zu einer bestimmten Kategorie. Für diese Objekterkennung, die etwa in den Google Captchas Anwendung findet, hat die KI-Forschungsabteilung von Facebook das Detectron-Projekt erstellt(öffnet im neuen Fenster) und dieses nun als Open-Source-Software auf Github veröffentlicht(öffnet im neuen Fenster) .

Detectron selbst basiert auf dem von Facebook favorisierten und unterstützten Deep-Learning-Framework Caffe 2, das in Python geschrieben ist. Das Team hat eigenen Aussagen zufolge rund eineinhalb Jahre an dem Code gearbeitet, bevor dieser nun zur freien Verfügung gestellt worden ist. Detectron setzt zudem unterschiedliche Modelle und Ansätze um.

Dazu gehört eine Variante des Region-based Convolutional Neural Networks (R-CNN), die für das Erkennen von Objektmasken genutzt werden kann (Mask R-CNN). Von Facebook wird außerdem eine Methode hervorgehoben, die mit den teilweise sehr großen Unterschieden beim Objektfokus zwischen Vordergrund und Hintergrund eines Bildes zurechtkommen soll (Focal Loss for Dense Object Detection).

Facebook nutzt Detectron laut eigenen Angaben für eine Vielzahl von Anwendungen, etwa Augmented Reality. Die Grundlage Caffe 2 ermögliche zudem die Verwendung der Modelle in der Cloud ebenso wie direkt auf Mobilgeräten. Um sich selbst von den Fähigkeiten von Detectron überzeugen zu können, bietet Facebook eine Reihe von Beispielergebnissen sowie bereits trainierten Modellen an, die als Modellzoo bezeichnet werden.

Für das von Google favorisierte Framework Tensorflow steht seit vergangenem Jahr eine ähnliche Technik zur Objekterkennung bereit.


Relevante Themen