Bilderkennung mit Mathematica: Wenn aus Chewbacca ein Yorkshire Terrier wird
Die Programmiersprache Wolfram - auch Mathematica genannt - kann jetzt Bildinhalte erkennen: Über ein Web-Interface demonstriert Stephen Wolfram die Fähigkeiten des Algorithmus. Stellenweise sind die Ergebnisse noch recht ungenau - aber auf eine durchaus logische Art.

Der Programmierer Stephen Wolfram hat mit dem Image Identification Project einen neuen Web-Service gestartet, der Bildinhalte auf Fotos erkennt. Das Projekt basiert auf dem neuen ImageIdentify-Befehl von Wolfram, der von ihm entwickelten Programmiersprache, die auch als Mathematica bekannt ist.
ImageIdentify erkennt Schlüsselelemente in Fotos - dementsprechend liegen die Stärken des Befehls aktuell eher noch in konkreten Darstellungen von Dingen und weniger in abstrakten Bildern oder Fotos von alltäglichen Situationen. Das können Nutzer leicht selbst nachvollziehen: So erhalten wir beispielsweise bei einem Bild des Yachthafens von Barcelona, auf dem am Rand eine Brücke zu sehen ist, das Ergebnis "Brücke". Die Boote am anderen Rand hingegen werden ignoriert.
Indys Hut und Chewbacca als Yorkshireterrier
Ein Beispiel der Schlüsselelementerkennung gibt Wolfram selbst: Bei einem Porträt von Indiana Jones erkennt das Image Identification Project nur den Hut, nicht aber Indy selbst. Ein witziges Beispiel für die vom Programmierer selbst als "durchaus menschlich" bezeichneten Fehlgriffe bei der Erkennung ist Chewbacca: Der Wookie wird von der Datenbank als Yorkshireterrier identifiziert. Vom Aussehen durchaus naheliegend, in der Sache aber nicht ganz richtig.
Seine Stärken spielt die Funktion bei Tier- und Naturbildern aus. So werden in unseren Tests sowohl Möwen als auch Kanadareiher und Alligatoren zuverlässig erkannt. Falls vorhanden, gibt es weiterführende Informationen zu den Tieren. Auch hier gilt aber: Allgemeine Situationen wie Landschaften sind keine Stärke der Bilderkennung. Auch bei Monumenten ist die Erkennung noch fehlerhaft: Der Eiffelturm wird als Kirche identifiziert.
Ergebnisse können korrigiert werden
Die Ergebnisse können von den Nutzern bewertet und verfeinert beziehungsweise korrigiert werden, indem der richtige Begriff ausgewählt oder neu eingegeben wird. Auf diese Weise soll die Funktion im Laufe der Zeit zuverlässiger werden und mehr erkennen können.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Keine Ahnung wie man her ein Bild angezeigt bekommt. Darum nur als Link: http://app...
kt
Hallo, wenn du da bist, Ich musste mich von neuem in das Problem hineindenken, das hat...