• IT-Karriere:
  • Services:

Computer Vision: Mehr Durchblick beim maschinellen Sehen

Mit den Services von Amazon, IBM, Microsoft und Google kann jeder recht einfach Bilder analysieren, ohne die genauen Mechanismen dahinter zu kennen. Die Anwendungen unterscheiden sich aber stark - vor allem im Funktionsumfang.

Artikel von Miroslav Stimac veröffentlicht am
Besser Sehen, hier ohne maschinelle Unterstützung.
Besser Sehen, hier ohne maschinelle Unterstützung. (Bild: Fox Photos/Getty Images)

Maschinelles Sehen ist vor allem im wachsenden Internet of Things (IoT) ein Thema: Vom Haushaltsroboter, der die Kaffeetasse vom Teller unterscheiden muss, über die Überwachungskamera, die Dieb und Wohnungsbesitzer auseinanderhalten muss, bis hin zur automatischen Verarbeitung handschriftlich ausgefüllter Formulare im betrieblichen Umfeld - überall wird maschinelles Sehen gebraucht.

Bis vor kurzem war die Umsetzung Profis vorbehalten, die wissen, wie Computer lernen und wie man ihnen das beibringt. Genauer gesagt müssen es Menschen sein, die mit speziellen Bibliotheken für maschinelles Lernen programmieren können und ein tiefes Verständnis für die entsprechenden Algorithmen haben.

Inzwischen gibt es aber diverse Dienste, mit denen das auch jemand ohne diese speziellen Kenntnisse umsetzen kann. Solche Out-of-the-Box-Services bieten Schnittstellen (APIs beziehungsweise Web-Services), mit denen man Bilder zum Analysieren übermitteln kann und eine Bildbeschreibung als Ergebnis bekommt. Wie genau der Service intern arbeitet, ist für den Anwender nicht ersichtlich.

Zielgruppe dieser Out-of-the-Box-Services sind unter anderen Entwickler klassischer Desktop-Anwendungen sowie Entwickler von Webanwendungen oder Smartphone-Apps, die allgemeine Cloud-Dienste für maschinelles Sehen von ihren Programmen aus aufrufen und konsumieren wollen. Zum Beispiel für eine App, mit der automatisch alle Fotos auf einem Smartphone mit Keywords versehen werden.

Für App- und Machine-Learning-Entwickler

Stellenmarkt
  1. Software AG, Darmstadt
  2. finanzen.de, Berlin

Aber auch Machine-Learning-Entwickler können die Cloud-Dienste einsetzen: Denn in einigen Anwendungsfällen liefern sie bereits so zufriedenstellende Ergebnisse, dass der Aufwand für die Entwicklung und das Training eigener Machine-Learning-Modelle nicht gerechtfertigt wären.

Denkbar ist auch, die Out-of-the-Box-Dienste nur teilweise zu nutzen: zum Beispiel für eine Anwendung, die den Preis von Computern einschätzt - also, ob ein Angebot eines Händlers günstig oder teuer ist. Das Machine-Learning-Modell dafür muss der ML-Entwickler selbst entwerfen und trainieren, oft mit Python und diversen ML-Libraries. Damit der Nutzer der App die Preise, Komponenten und Ausstattungsmerkmale der Computer aber nicht alle eintippen muss, könnte sich der Entwickler überlegen, die Liste der Hardwarekomponenten und die Preise der Computer aus fotografierten Angebotsblättern der Händler auslesen zu lassen. Diese Texterkennung könnte einem entsprechenden, schon vorab trainierten Computer-Vision-Cloud-Dienst überlassen werden.

Wir haben uns die Services von Amazon (ASW), IBM (Watson), Microsoft (Azure) und Google (Vision API) angesehen. Neben der allgemeinen Erkennung von Objekten in Bildern haben sie spezielle Funktionen wie die Texterkennung von gedruckten und handschriftlichen Texten, die Klassifizierung von Personen anhand ihres Alters, Geschlechts, der Kleidung und so weiter, das Erkennen von Emotionen anhand von Gesichtsausdrücken und das Erkennen von bekannten Personen des öffentlichen Lebens.

Die Angebote unterscheiden sich teils erheblich im Funktionsumfang. Bei der Entscheidung, welches man verwenden will, stellt sich insbesondere folgende Frage: Will ich schon vorab trainierte Modelle nutzen, die sofort eine Vielzahl allgemeiner Objekte erkennen? Oder will ich selbst Modelle trainieren, um spezielle Objekte zu erkennen?

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
Wofür wird maschinelles Sehen gebraucht? 
  1. 1
  2. 2
  3. 3
  4. 4
  5. 5
  6. 6
  7. 7
  8. 8
  9.  


Anzeige
Hardware-Angebote
  1. (u. a. 970 Evo 1 TB für 149,90€, 970 Evo 500 GB für 77,90€)

cran 09. Jan 2020 / Themenstart

Es ist vermutlich viel zu billig. Das darf man nicht passieren lassen. Einigen wenigen...

jg (Golem.de) 07. Jan 2020 / Themenstart

Vielen Dank und wir haben den Begriff im Artikel geändert!

WalterSobchak 07. Jan 2020 / Themenstart

Das Problem bei all den genannten Services ist für alle DSGVO konform arbeitenden...

möpmöp123 06. Jan 2020 / Themenstart

+1

Kommentieren


Folgen Sie uns
       


Apples Airpods 2 und Samsungs Galaxy Buds im Test

Wir haben die neuen Airpods von Apple mit den Galaxy Buds von Samsung verglichen. Beim Klang schneiden die Airpods 2 wieder sehr gut ab. Es bleibt der Nachteil, dass Android-Nutzer die Airpods nur eingeschränkt nutzen können. Umgekehrt können iPhone-Nutzer die Galaxy Buds nur mit Beschränkungen verwenden. Die Galaxy Buds haben eine ungewöhnlich lange Akkulaufzeit.

Apples Airpods 2 und Samsungs Galaxy Buds im Test Video aufrufen
Lovot im Hands-on: Knuddeliger geht ein Roboter kaum
Lovot im Hands-on
Knuddeliger geht ein Roboter kaum

CES 2020 Lovot ist ein Kofferwort aus Love und Robot: Der knuffige japanische Roboter soll positive Emotionen auslösen - und tut das auch. Selten haben wir so oft "Ohhhhhhh!" gehört.
Ein Hands on von Tobias Költzsch

  1. Orcam Hear Die Audiobrille für Hörgeschädigte
  2. Schräges von der CES 2020 Die Connected-Kartoffel
  3. Viola angeschaut Cherry präsentiert preiswerten mechanischen Switch

IT-Gehälter: Je nach Branche bis zu 1.000 Euro mehr
IT-Gehälter
Je nach Branche bis zu 1.000 Euro mehr

Wechselt ein ITler in eine andere Branche, sind auf dem gleichen Posten bis zu 1.000 Euro pro Monat mehr drin. Welche Industrien die höchsten und welche die niedrigsten Gehälter zahlen: Wir haben die Antworten auf diese Fragen - auch darauf, wie sich die Einkommen 2020 entwickeln werden.
Von Peter Ilg

  1. Softwareentwickler Der Fachkräftemangel zeigt sich nicht an den Gehältern

Digitalisierung: Aber das Faxgerät muss bleiben!
Digitalisierung
Aber das Faxgerät muss bleiben!

"Auf digitale Prozesse umstellen" ist leicht gesagt, aber in vielen Firmen ein komplexes Unterfangen. Viele Mitarbeiter und Chefs lieben ihre analogen Arbeitsmethoden und fürchten Veränderungen. Andere wiederum digitalisieren ohne Sinn und Verstand und blasen ihre Prozesse unnötig auf.
Ein Erfahrungsbericht von Marvin Engel

  1. Arbeitswelt SAP-Chef kritisiert fehlende Digitalisierung und Angst
  2. Deutscher Städte- und Gemeindebund "Raus aus der analogen Komfortzone"
  3. Digitalisierungs-Tarifvertrag Regelungen für Erreichbarkeit, Homeoffice und KI kommen

    •  /