Bilderkennung mit Mathematica: Wenn aus Chewbacca ein Yorkshire Terrier wird

Die Programmiersprache Wolfram - auch Mathematica genannt - kann jetzt Bildinhalte erkennen: Über ein Web-Interface demonstriert Stephen Wolfram die Fähigkeiten des Algorithmus. Stellenweise sind die Ergebnisse noch recht ungenau - aber auf eine durchaus logische Art.

Artikel veröffentlicht am ,
Chewbacca, der Yorkshireterrier
Chewbacca, der Yorkshireterrier (Bild: Screenshot: Golem.de/Disney)

Der Programmierer Stephen Wolfram hat mit dem Image Identification Project einen neuen Web-Service gestartet, der Bildinhalte auf Fotos erkennt. Das Projekt basiert auf dem neuen ImageIdentify-Befehl von Wolfram, der von ihm entwickelten Programmiersprache, die auch als Mathematica bekannt ist.

  • Aus Chewbacca wird dann auch mal ein Yorkshireterrier, kein Wookie. (Screenshot:Golem.de/Disney)
  • Der neue ImageIdentify-Befehl von Mathematica erkennt zahlreiche Objekte auf Fotos korrekt - so wie hier einen Alligator. (Screenshot:Golem.de/Tobias Költzsch)
  • Auch dieser Kanadareiher wird korrekt erkannt. (Screenshot:Golem.de/Tobias Költzsch)
  • Probleme hat die Funktion bei abstrakteren Bildern wie diesem Foto des Yachthafens von Barcelona. (Screenshot:Golem.de/Tobias Költzsch)
Der neue ImageIdentify-Befehl von Mathematica erkennt zahlreiche Objekte auf Fotos korrekt - so wie hier einen Alligator. (Screenshot:Golem.de/Tobias Költzsch)

ImageIdentify erkennt Schlüsselelemente in Fotos - dementsprechend liegen die Stärken des Befehls aktuell eher noch in konkreten Darstellungen von Dingen und weniger in abstrakten Bildern oder Fotos von alltäglichen Situationen. Das können Nutzer leicht selbst nachvollziehen: So erhalten wir beispielsweise bei einem Bild des Yachthafens von Barcelona, auf dem am Rand eine Brücke zu sehen ist, das Ergebnis "Brücke". Die Boote am anderen Rand hingegen werden ignoriert.

Indys Hut und Chewbacca als Yorkshireterrier

Ein Beispiel der Schlüsselelementerkennung gibt Wolfram selbst: Bei einem Porträt von Indiana Jones erkennt das Image Identification Project nur den Hut, nicht aber Indy selbst. Ein witziges Beispiel für die vom Programmierer selbst als "durchaus menschlich" bezeichneten Fehlgriffe bei der Erkennung ist Chewbacca: Der Wookie wird von der Datenbank als Yorkshireterrier identifiziert. Vom Aussehen durchaus naheliegend, in der Sache aber nicht ganz richtig.

Seine Stärken spielt die Funktion bei Tier- und Naturbildern aus. So werden in unseren Tests sowohl Möwen als auch Kanadareiher und Alligatoren zuverlässig erkannt. Falls vorhanden, gibt es weiterführende Informationen zu den Tieren. Auch hier gilt aber: Allgemeine Situationen wie Landschaften sind keine Stärke der Bilderkennung. Auch bei Monumenten ist die Erkennung noch fehlerhaft: Der Eiffelturm wird als Kirche identifiziert.

Ergebnisse können korrigiert werden

Die Ergebnisse können von den Nutzern bewertet und verfeinert beziehungsweise korrigiert werden, indem der richtige Begriff ausgewählt oder neu eingegeben wird. Auf diese Weise soll die Funktion im Laufe der Zeit zuverlässiger werden und mehr erkennen können.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


ThadMiller 19. Mai 2015

Keine Ahnung wie man her ein Bild angezeigt bekommt. Darum nur als Link: http://app...

Anonymer Nutzer 17. Mai 2015

kt

Ach 16. Mai 2015

Hallo, wenn du da bist, Ich musste mich von neuem in das Problem hineindenken, das hat...



Aktuell auf der Startseite von Golem.de
Endzeit
Experten warnen vor der Ausrottung der Menschheit durch KI

Unternehmen wie Microsoft, Google und OpenAI stehen hinter einer sehr drastischen Stellungnahme. Die warnt vor der Auslöschung durch KI.

Endzeit: Experten warnen vor der Ausrottung der Menschheit durch KI
Artikel
  1. Blizzard: Erste Wertungen für Diablo 4 sind da
    Blizzard
    Erste Wertungen für Diablo 4 sind da

    Gamer stehen vor einem Großereignis: Blizzard veröffentlicht bald Diablo 4. Nun gibt es erste Wertungen der Fachpresse.

  2. Apple: iPhone 15 soll mit USB-C und neuem Mute-Button kommen
    Apple
    iPhone 15 soll mit USB-C und neuem Mute-Button kommen

    Erste Dummys der kommenden iPhone-15-Reihe verraten bereits ein paar interessante kleinere Details - der Mute-Button etwa wird ersetzt.

  3. Künstliche Intelligenz: So funktionieren KI-Bildgeneratoren
    Künstliche Intelligenz
    So funktionieren KI-Bildgeneratoren

    Im Netz wimmelt es mittlerweile von künstlich erzeugten Bildern reitender Astronauten, skateboardfahrender Teddys oder stylish gekleideter Päpste. Aber wie machen Dall-E, Stable Diffusion & Co. das eigentlich?
    Von Helmut Linde

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • MindStar: 14 Grafikkarten im Sale • Logitech G Pro Wireless Maus 89€ • Amazon-Geräte für Alexa bis -50% • The A500 Mini 74,99€ • Logitech G213 Prodigy Tastatur 49,90€ • Crucial P5 Plus (PS5-komp.) 1TB 71,99€, 2TB 133,99€ • HyperX Cloud II Headset 62,99€ [Werbung]
    •  /