Bilderkennung: Google gibt Objekt-Erkennungs-API für Tensorflow frei
Anwender von Googles freiem Machine-Learning-Framework Tensorflow können künftig auf eine API zur Objekterkennung in Bildern zugreifen. Google nutzt die Technik intern für Streetview oder auch für die Nest Cam.

Das Erkennen und korrekte Klassifizieren vor allem mehrerer Objekte in Bildern sei eine große Herausforderung beim maschinellen Lernen, schreibt Google in seinem Open-Source-Blog. Deshalb investiere das Unternehmen viel Zeit in das Experimentieren mit und das Trainieren dieser Systeme. Dank dieser Arbeiten steht nun eine API zur Objekterkennung in Tensorflow bereit.
Die API steht, wie das von Google entwickelte Machine-Learning-Framework Tensorflow selbst, als Open-Source-Software bereit. Die Schnittstelle soll das Erstellen, Trainieren sowie den Einsatz entsprechender Modelle zur Objekterkennung deutlich vereinfachen. Das Team liefert auch gleich entsprechende Modelle in dem Code mit.
Dazu gehören unter anderem Single Shot Multibox Detector (SSD), Region-based Fully Convolutional Networks (R-FCN) oder auch Faster Region-based Convolutional Neural Networks (RCNN) sowie einige davon abgeleitete Modelle. Bereitgestellt werden ebenso bereits trainierte Modelle, die direkt für das sogenannte Inferencing genutzt werden können und auf dem Datensatz Common Objects in Context (Coco) trainiert sind. SSD-Modelle die Googles Mobile-Nets verwenden, sollen so klein sein, dass diese problemlos in Echtzeit auf einem Mobilgerät ausgeführt werden können sollen.
Zur einfachen Verwendung steht ebenso Democode bereit, der als Jupyter-Notebook verteilt wird und direkt einsatzbereit ist. Zusätzlich dazu stellt das Team für die API weitere Skripte bereit, die das lokale Trainieren sowie die Verwendung von Googles-Cloud-Angeboten erleichtern sollen.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed