Abo
  • Services:

Xerox - Neue Software soll Bilder verstehen

Technik zur automatischen Erkennung und Archivierung von Bildmotiven

Die Forscher des Xerox Research Centre Europe (XRCE) haben jetzt eine Software entwickelt, die in der Lage sein soll, Bilder zu verstehen und Motive zu erkennen und zuzuordnen. Die Technik soll so eine automatische Erkennung und Archivierung von Bildmotiven erlauben.

Artikel veröffentlicht am ,

Bislang lassen sich Bilddatenbanken in der Regel nur nach Stichworten kategorisieren und durchsuchen. Diese Möglichkeiten will Xerox nun durch die Sortierung nach Bildkategorien erweitern. Bilder können so automatisch anhand ihres Inhaltes - ihres Motivs - indiziert werden. Das Programm erkennt dabei verschiedenste Bildmotive, die anschließend entsprechend sortiert in Dokumenten- und Content-Managementsysteme einfließen können.

Stellenmarkt
  1. M-net Telekommunikations GmbH, München
  2. McService GmbH, München

Der gesamte Vorgang soll ungefähr zwei Sekunden pro Bild dauern und so auch für die Verarbeitung und Speicherung großer Mengen von Bildmaterial geeignet sein. Die Trefferquote der Software soll je nach Bildkategorie zwischen 80 und 99 Prozent liegen.

Die Funktionsweise besteht aus vier Schritten. Im ersten Schritt sucht die Software nach markanten Punkten und Elementen, den so genannten "Keypatches". Dann werden die einzelnen Patches mit einem visuellen Wörterbuch verglichen - daraus resultieren "visuelle Worte", die zentralen Elemente des einzelnen Bildes. Bei der Aufnahme eines Autos sind das beispielsweise Räder und Scheinwerfer. Im dritten Schritt zählt das Programm, wie häufig die einzelnen visuellen Worte erscheinen. Abschließend werden die so entstehenden Histogramme in vordefinierten Bildkategorien klassifiziert. Dabei soll sich die Software auch nicht durch ungewöhnliche Blickwinkel oder Komplikationen wie die Präsenz mehrerer Bildkategorien in einem einzelnen Bild verunsichern lassen.

Derzeit arbeiten die Forscher an einer Vergrößerung des visuellen Wörterbuchs, um die Software zur Marktreife zu bringen. In Zukunft soll die Technik zudem für die Kategorisierungstechnologie von bewegten Bildern angepasst werden, so dass sie auch für Videomaterial nutzbar wird.

Der Clausthaler Informatiker Dr. Odej Kao entwickelt ein Verfahren, das Ähnliches leisten soll. Auch das in Berlin ansässige Unternehmen Pixfind hatte einst an einer entsprechenden Technik gearbeitet.



Anzeige
Blu-ray-Angebote
  1. (u. a. Logan, John Wick, Alien Covenant, Planet der Affen Survival)
  2. (u. a. 3 Blu-rays für 15€, 2 Neuheiten für 15€)

sonja 08. Feb 2005

Kurz über lang werden solche Programme existieren. Eine Eigenschaft der Computer besteht...

Tritop 13. Jan 2005

Das ist ja auch kein Kunststück - eine begrenzte Menge mit eindeutigen Kennzeichen.

Karl 12. Jan 2005

Nunja zumindest was die Erkennung von Banknoten angeht, funktioniert aktuelle Software...

:-) 12. Jan 2005

Dein vollautomatisches Forenbeitragsschreibprogramm solltest du mal um die Ebene...

Tritop 12. Jan 2005

Ist bestimmt genauso effektiv wie die Spracherkennungssoftware, die hin und wieder mal...


Folgen Sie uns
       


Nuraphone Kopfhörer- Test

Der Nuraphone bietet einen automatischen Hörtest, der den Frequenzgang des Kopfhörers je nach Nutzer unterschiedlich einstellt. Die Klangqualität des ungewöhnlichen Kopfhörers hat Golem.de im Test überzeugt.

Nuraphone Kopfhörer- Test Video aufrufen
Yuneec H520: 3D-Modell aus der Drohne
Yuneec H520
3D-Modell aus der Drohne

Multikopter werden zunehmend auch kommerziell verwendet. Vor allem machen die Drohnen Luftbilder und Inspektionsflüge und vermessen. Wir haben in der Praxis getestet, wie gut das mit dem Yuneec H520 funktioniert.
Von Dirk Koller


    IT: Frauen, die programmieren und Bier trinken
    IT
    Frauen, die programmieren und Bier trinken

    Fest angestellte Informatiker sind oft froh, nach Feierabend nicht schon wieder in ein Get-together zu müssen. Doch was ist, wenn man kein Team hat und sich selbst Programmieren beibringt? Women Who Code veranstaltet Programmierabende für Frauen, denen es so geht. Golem.de war dort.
    Von Maja Hoock

    1. Job-Porträt Die Cobol Cowboys auf wichtiger Mission
    2. Software-Entwickler CDU will Online-Weiterbildung à la Netflix
    3. Job-Porträt Cyber-Detektiv "Ich musste als Ermittler über 1.000 Onanie-Videos schauen"

    Machine Learning: Wie Technik jede Stimme stehlen kann
    Machine Learning
    Wie Technik jede Stimme stehlen kann

    Ein Unternehmen aus Südkorea arbeitet daran, Stimmen reproduzierbar und neu generierbar zu machen. Was für viele Branchen enorme Kosteneinsparungen bedeutet, könnte auch eine neue Dimension von Fake News werden.
    Ein Bericht von Felix Lill

    1. AWS Amazon bietet seine Machine-Learning-Tutorials kostenlos an
    2. Random Forest, k-Means, Genetik Machine Learning anhand von drei Algorithmen erklärt
    3. Machine Learning Amazon verwirft sexistisches KI-Tool für Bewerber

      •  /