Zum Hauptinhalt Zur Navigation

Xerox - Neue Software soll Bilder verstehen

Technik zur automatischen Erkennung und Archivierung von Bildmotiven. Die Forscher des Xerox Research Centre Europe (XRCE) haben jetzt eine Software entwickelt, die in der Lage sein soll, Bilder zu verstehen und Motive zu erkennen und zuzuordnen. Die Technik soll so eine automatische Erkennung und Archivierung von Bildmotiven erlauben.
/ Jens Ihlenfeld
Kommentare News folgen (öffnet im neuen Fenster)

Bislang lassen sich Bilddatenbanken in der Regel nur nach Stichworten kategorisieren und durchsuchen. Diese Möglichkeiten will Xerox nun durch die Sortierung nach Bildkategorien erweitern. Bilder können so automatisch anhand ihres Inhaltes – ihres Motivs – indiziert werden. Das Programm erkennt dabei verschiedenste Bildmotive, die anschließend entsprechend sortiert in Dokumenten- und Content-Managementsysteme einfließen können.

Der gesamte Vorgang soll ungefähr zwei Sekunden pro Bild dauern und so auch für die Verarbeitung und Speicherung großer Mengen von Bildmaterial geeignet sein. Die Trefferquote der Software soll je nach Bildkategorie zwischen 80 und 99 Prozent liegen.

Die Funktionsweise besteht aus vier Schritten. Im ersten Schritt sucht die Software nach markanten Punkten und Elementen, den so genannten "Keypatches". Dann werden die einzelnen Patches mit einem visuellen Wörterbuch verglichen – daraus resultieren "visuelle Worte", die zentralen Elemente des einzelnen Bildes. Bei der Aufnahme eines Autos sind das beispielsweise Räder und Scheinwerfer. Im dritten Schritt zählt das Programm, wie häufig die einzelnen visuellen Worte erscheinen. Abschließend werden die so entstehenden Histogramme in vordefinierten Bildkategorien klassifiziert. Dabei soll sich die Software auch nicht durch ungewöhnliche Blickwinkel oder Komplikationen wie die Präsenz mehrerer Bildkategorien in einem einzelnen Bild verunsichern lassen.

Derzeit arbeiten die Forscher an einer Vergrößerung des visuellen Wörterbuchs, um die Software zur Marktreife zu bringen. In Zukunft soll die Technik zudem für die Kategorisierungstechnologie von bewegten Bildern angepasst werden, so dass sie auch für Videomaterial nutzbar wird.

Der Clausthaler Informatiker Dr. Odej Kao entwickelt ein Verfahren , das Ähnliches leisten soll. Auch das in Berlin ansässige Unternehmen Pixfind hatte einst an einer entsprechenden Technik gearbeitet.


Relevante Themen