Detectron: Facebook gibt eigene Objekterkennung frei
Die auf dem Python-Framework Caffe2 basierende Objekterkennung Detectron von Facebook steht nun als Open Source bereit. Das Projekt implementiert verschiedene Algorithmen auf Basis maschinellen Lernens und stellt auch einen Modellzoo bereit.

Ein wichtiger Teil der automatischen Bilderkennung ist die Unterscheidung einzelner Bestandteile des Bildes sowie deren Zuordnung zu einer bestimmten Kategorie. Für diese Objekterkennung, die etwa in den Google Captchas Anwendung findet, hat die KI-Forschungsabteilung von Facebook das Detectron-Projekt erstellt und dieses nun als Open-Source-Software auf Github veröffentlicht.
Detectron selbst basiert auf dem von Facebook favorisierten und unterstützten Deep-Learning-Framework Caffe 2, das in Python geschrieben ist. Das Team hat eigenen Aussagen zufolge rund eineinhalb Jahre an dem Code gearbeitet, bevor dieser nun zur freien Verfügung gestellt worden ist. Detectron setzt zudem unterschiedliche Modelle und Ansätze um.
Dazu gehört eine Variante des Region-based Convolutional Neural Networks (R-CNN), die für das Erkennen von Objektmasken genutzt werden kann (Mask R-CNN). Von Facebook wird außerdem eine Methode hervorgehoben, die mit den teilweise sehr großen Unterschieden beim Objektfokus zwischen Vordergrund und Hintergrund eines Bildes zurechtkommen soll (Focal Loss for Dense Object Detection).
Facebook nutzt Detectron laut eigenen Angaben für eine Vielzahl von Anwendungen, etwa Augmented Reality. Die Grundlage Caffe 2 ermögliche zudem die Verwendung der Modelle in der Cloud ebenso wie direkt auf Mobilgeräten. Um sich selbst von den Fähigkeiten von Detectron überzeugen zu können, bietet Facebook eine Reihe von Beispielergebnissen sowie bereits trainierten Modellen an, die als Modellzoo bezeichnet werden.
Für das von Google favorisierte Framework Tensorflow steht seit vergangenem Jahr eine ähnliche Technik zur Objekterkennung bereit.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
stimmt ... über den "Objektfokus" bin ich auch gestolpert. Ansonsten siehe auch...
danke für den Link. Ich denke YOLO (od. SSD) ist dann sicherlich auch schneller in der...