Bilderkennung: Google gibt Objekt-Erkennungs-API für Tensorflow frei

Das Erkennen und korrekte Klassifizieren vor allem mehrerer Objekte in Bildern sei eine große Herausforderung beim maschinellen Lernen, schreibt Google in seinem Open-Source-Blog(öffnet im neuen Fenster) . Deshalb investiere das Unternehmen viel Zeit in das Experimentieren mit und das Trainieren dieser Systeme. Dank dieser Arbeiten steht nun eine API zur Objekterkennung in Tensorflow(öffnet im neuen Fenster) bereit.
Die API steht, wie das von Google entwickelte Machine-Learning-Framework Tensorflow selbst, als Open-Source-Software bereit. Die Schnittstelle soll das Erstellen, Trainieren sowie den Einsatz entsprechender Modelle zur Objekterkennung deutlich vereinfachen. Das Team liefert auch gleich entsprechende Modelle in dem Code mit.
Dazu gehören unter anderem Single Shot Multibox Detector (SSD), Region-based Fully Convolutional Networks (R-FCN) oder auch Faster Region-based Convolutional Neural Networks (RCNN) sowie einige davon abgeleitete Modelle. Bereitgestellt werden ebenso bereits trainierte Modelle, die direkt für das sogenannte Inferencing genutzt werden können und auf dem Datensatz Common Objects in Context ( Coco(öffnet im neuen Fenster) ) trainiert sind. SSD-Modelle die Googles Mobile-Nets verwenden, sollen so klein sein, dass diese problemlos in Echtzeit auf einem Mobilgerät ausgeführt werden können sollen.
Zur einfachen Verwendung steht ebenso Democode bereit, der als Jupyter-Notebook verteilt wird und direkt einsatzbereit ist. Zusätzlich dazu stellt das Team für die API weitere Skripte bereit, die das lokale Trainieren sowie die Verwendung von Googles-Cloud-Angeboten erleichtern sollen.