• IT-Karriere:
  • Services:

Computer Vision: Mehr Durchblick beim maschinellen Sehen

Mit den Services von Amazon, IBM, Microsoft und Google kann jeder recht einfach Bilder analysieren, ohne die genauen Mechanismen dahinter zu kennen. Die Anwendungen unterscheiden sich aber stark - vor allem im Funktionsumfang.

Artikel von Miroslav Stimac veröffentlicht am
Besser Sehen, hier ohne maschinelle Unterstützung.
Besser Sehen, hier ohne maschinelle Unterstützung. (Bild: Fox Photos/Getty Images)

Maschinelles Sehen ist vor allem im wachsenden Internet of Things (IoT) ein Thema: Vom Haushaltsroboter, der die Kaffeetasse vom Teller unterscheiden muss, über die Überwachungskamera, die Dieb und Wohnungsbesitzer auseinanderhalten muss, bis hin zur automatischen Verarbeitung handschriftlich ausgefüllter Formulare im betrieblichen Umfeld - überall wird maschinelles Sehen gebraucht.

Bis vor kurzem war die Umsetzung Profis vorbehalten, die wissen, wie Computer lernen und wie man ihnen das beibringt. Genauer gesagt müssen es Menschen sein, die mit speziellen Bibliotheken für maschinelles Lernen programmieren können und ein tiefes Verständnis für die entsprechenden Algorithmen haben.

Inzwischen gibt es aber diverse Dienste, mit denen das auch jemand ohne diese speziellen Kenntnisse umsetzen kann. Solche Out-of-the-Box-Services bieten Schnittstellen (APIs beziehungsweise Web-Services), mit denen man Bilder zum Analysieren übermitteln kann und eine Bildbeschreibung als Ergebnis bekommt. Wie genau der Service intern arbeitet, ist für den Anwender nicht ersichtlich.

Zielgruppe dieser Out-of-the-Box-Services sind unter anderen Entwickler klassischer Desktop-Anwendungen sowie Entwickler von Webanwendungen oder Smartphone-Apps, die allgemeine Cloud-Dienste für maschinelles Sehen von ihren Programmen aus aufrufen und konsumieren wollen. Zum Beispiel für eine App, mit der automatisch alle Fotos auf einem Smartphone mit Keywords versehen werden.

Für App- und Machine-Learning-Entwickler

Stellenmarkt
  1. InnoGames GmbH, Hamburg
  2. Rational AG, Landsberg am Lech

Aber auch Machine-Learning-Entwickler können die Cloud-Dienste einsetzen: Denn in einigen Anwendungsfällen liefern sie bereits so zufriedenstellende Ergebnisse, dass der Aufwand für die Entwicklung und das Training eigener Machine-Learning-Modelle nicht gerechtfertigt wären.

Denkbar ist auch, die Out-of-the-Box-Dienste nur teilweise zu nutzen: zum Beispiel für eine Anwendung, die den Preis von Computern einschätzt - also, ob ein Angebot eines Händlers günstig oder teuer ist. Das Machine-Learning-Modell dafür muss der ML-Entwickler selbst entwerfen und trainieren, oft mit Python und diversen ML-Libraries. Damit der Nutzer der App die Preise, Komponenten und Ausstattungsmerkmale der Computer aber nicht alle eintippen muss, könnte sich der Entwickler überlegen, die Liste der Hardwarekomponenten und die Preise der Computer aus fotografierten Angebotsblättern der Händler auslesen zu lassen. Diese Texterkennung könnte einem entsprechenden, schon vorab trainierten Computer-Vision-Cloud-Dienst überlassen werden.

Wir haben uns die Services von Amazon (ASW), IBM (Watson), Microsoft (Azure) und Google (Vision API) angesehen. Neben der allgemeinen Erkennung von Objekten in Bildern haben sie spezielle Funktionen wie die Texterkennung von gedruckten und handschriftlichen Texten, die Klassifizierung von Personen anhand ihres Alters, Geschlechts, der Kleidung und so weiter, das Erkennen von Emotionen anhand von Gesichtsausdrücken und das Erkennen von bekannten Personen des öffentlichen Lebens.

Die Angebote unterscheiden sich teils erheblich im Funktionsumfang. Bei der Entscheidung, welches man verwenden will, stellt sich insbesondere folgende Frage: Will ich schon vorab trainierte Modelle nutzen, die sofort eine Vielzahl allgemeiner Objekte erkennen? Oder will ich selbst Modelle trainieren, um spezielle Objekte zu erkennen?

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
Wofür wird maschinelles Sehen gebraucht? 
  1. 1
  2. 2
  3. 3
  4. 4
  5. 5
  6. 6
  7. 7
  8. 8
  9.  


Anzeige
Hardware-Angebote
  1. (reduzierte Überstände, Restposten & Co.)
  2. 1439,90€ (Vergleichspreis: 1530,95€)
  3. täglich neue Deals bei Alternate.de

cran 09. Jan 2020 / Themenstart

Es ist vermutlich viel zu billig. Das darf man nicht passieren lassen. Einigen wenigen...

jg (Golem.de) 07. Jan 2020 / Themenstart

Vielen Dank und wir haben den Begriff im Artikel geändert!

WalterSobchak 07. Jan 2020 / Themenstart

Das Problem bei all den genannten Services ist für alle DSGVO konform arbeitenden...

möpmöp123 06. Jan 2020 / Themenstart

+1

Kommentieren


Folgen Sie uns
       


Razer Eracing Simulator ausprobiert (CES 2020)

Der Eracing Simulator von Razer versucht, das Fahrgefühl in einem Rennwagen wiederzugeben. Dank Motoren und einer großen Leinwand ist die Immersion sehr gut, wie Golem.de im Hands on feststellen konnte.

Razer Eracing Simulator ausprobiert (CES 2020) Video aufrufen
Amazon, Netflix und Sky: Disney bringt 2020 den großen Umbruch beim Videostreaming
Amazon, Netflix und Sky
Disney bringt 2020 den großen Umbruch beim Videostreaming

In diesem Jahr wird sich der Video-Streaming-Markt in Deutschland stark verändern. Der Start von Disney+ setzt Netflix, Amazon und Sky gehörig unter Druck. Die ganz großen Umwälzungen geschehen vorerst aber woanders.
Eine Analyse von Ingo Pakalski

  1. Peacock NBC Universal setzt gegen Netflix auf Gratis-Streaming
  2. Joyn Plus+ Probleme bei der Kündigung
  3. Android TV Magenta-TV-Stick mit USB-Anschluss vergünstigt erhältlich

Ryzen Mobile 4000 (Renoir): Lasst die Ära der schrottigen AMD-Notebooks enden!
Ryzen Mobile 4000 (Renoir)
Lasst die Ära der schrottigen AMD-Notebooks enden!

Seit vielen Jahren gibt es kaum Premium-Geräte mit AMD-Chips und selbst bei vermeintlich identischer Ausstattung fehlen Eigenschaften wie eine beleuchtete Tastatur oder Thunderbolt 3. Schluss damit!
Ein IMHO von Marc Sauter

  1. HEDT-Prozessor 64-kerniger Threadripper schlägt 20.000-Dollar-Xeons
  2. Ryzen Mobile 4000 AMDs Renoir hat acht 7-nm-Kerne für Ultrabooks
  3. Zen+ AMD verkauft Ryzen 5 1600 mit flotteren CPU-Kernen

SpaceX: Der Weg in den Weltraum ist frei
SpaceX
Der Weg in den Weltraum ist frei

Das Raumschiff hob noch ohne Besatzung ab, aber der Testflug war ein voller Erfolg. Der Crew Dragon von SpaceX hat damit seine letzte große Bewährungsprobe bestanden, bevor die Astronauten auch mitfliegen dürfen.
Ein Bericht von Frank Wunderlich-Pfeiffer

  1. Raumfahrt SpaceX macht Sicherheitstest bei höchster Belastung
  2. Raumfahrt SpaceX testet dunkleren Starlink-Satelliten
  3. SpaceX Starship platzt bei Tanktest

    •  /