Detectron: Facebook gibt eigene Objekterkennung frei
Ein wichtiger Teil der automatischen Bilderkennung ist die Unterscheidung einzelner Bestandteile des Bildes sowie deren Zuordnung zu einer bestimmten Kategorie. Für diese Objekterkennung, die etwa in den Google Captchas Anwendung findet, hat die KI-Forschungsabteilung von Facebook das Detectron-Projekt erstellt(öffnet im neuen Fenster) und dieses nun als Open-Source-Software auf Github veröffentlicht(öffnet im neuen Fenster).
Detectron selbst basiert auf dem von Facebook favorisierten und unterstützten Deep-Learning-Framework Caffe 2, das in Python geschrieben ist. Das Team hat eigenen Aussagen zufolge rund eineinhalb Jahre an dem Code gearbeitet, bevor dieser nun zur freien Verfügung gestellt worden ist. Detectron setzt zudem unterschiedliche Modelle und Ansätze um.
Dazu gehört eine Variante des Region-based Convolutional Neural Networks (R-CNN), die für das Erkennen von Objektmasken genutzt werden kann (Mask R-CNN). Von Facebook wird außerdem eine Methode hervorgehoben, die mit den teilweise sehr großen Unterschieden beim Objektfokus zwischen Vordergrund und Hintergrund eines Bildes zurechtkommen soll (Focal Loss for Dense Object Detection).
Facebook nutzt Detectron laut eigenen Angaben für eine Vielzahl von Anwendungen, etwa Augmented Reality. Die Grundlage Caffe 2 ermögliche zudem die Verwendung der Modelle in der Cloud ebenso wie direkt auf Mobilgeräten. Um sich selbst von den Fähigkeiten von Detectron überzeugen zu können, bietet Facebook eine Reihe von Beispielergebnissen sowie bereits trainierten Modellen an, die als Modellzoo bezeichnet werden.
Für das von Google favorisierte Framework Tensorflow steht seit vergangenem Jahr eine ähnliche Technik zur Objekterkennung bereit.
- Anzeige Hier geht es zum Meta Quest 3 mit Asgarth's Wrath 2 bei Amazon Wenn Sie auf diesen Link klicken und darüber einkaufen, erhält Golem eine kleine Provision. Dies ändert nichts am Preis der Artikel.