Xerox - Neue Software soll Bilder verstehen

Technik zur automatischen Erkennung und Archivierung von Bildmotiven

Die Forscher des Xerox Research Centre Europe (XRCE) haben jetzt eine Software entwickelt, die in der Lage sein soll, Bilder zu verstehen und Motive zu erkennen und zuzuordnen. Die Technik soll so eine automatische Erkennung und Archivierung von Bildmotiven erlauben.

Artikel veröffentlicht am ,

Bislang lassen sich Bilddatenbanken in der Regel nur nach Stichworten kategorisieren und durchsuchen. Diese Möglichkeiten will Xerox nun durch die Sortierung nach Bildkategorien erweitern. Bilder können so automatisch anhand ihres Inhaltes - ihres Motivs - indiziert werden. Das Programm erkennt dabei verschiedenste Bildmotive, die anschließend entsprechend sortiert in Dokumenten- und Content-Managementsysteme einfließen können.

Stellenmarkt
  1. Partner & Business Operations Manager (w/m/d) OZG-Umsetzung
    HanseVision GmbH, Hamburg
  2. Wissenschaftlicher Mitarbeiter / Wissenschaftliche Mitarbeiterin (d/m/w) am European Campus
    THD - Technische Hochschule Deggendorf, Pfarrkirchen
Detailsuche

Der gesamte Vorgang soll ungefähr zwei Sekunden pro Bild dauern und so auch für die Verarbeitung und Speicherung großer Mengen von Bildmaterial geeignet sein. Die Trefferquote der Software soll je nach Bildkategorie zwischen 80 und 99 Prozent liegen.

Die Funktionsweise besteht aus vier Schritten. Im ersten Schritt sucht die Software nach markanten Punkten und Elementen, den so genannten "Keypatches". Dann werden die einzelnen Patches mit einem visuellen Wörterbuch verglichen - daraus resultieren "visuelle Worte", die zentralen Elemente des einzelnen Bildes. Bei der Aufnahme eines Autos sind das beispielsweise Räder und Scheinwerfer. Im dritten Schritt zählt das Programm, wie häufig die einzelnen visuellen Worte erscheinen. Abschließend werden die so entstehenden Histogramme in vordefinierten Bildkategorien klassifiziert. Dabei soll sich die Software auch nicht durch ungewöhnliche Blickwinkel oder Komplikationen wie die Präsenz mehrerer Bildkategorien in einem einzelnen Bild verunsichern lassen.

Derzeit arbeiten die Forscher an einer Vergrößerung des visuellen Wörterbuchs, um die Software zur Marktreife zu bringen. In Zukunft soll die Technik zudem für die Kategorisierungstechnologie von bewegten Bildern angepasst werden, so dass sie auch für Videomaterial nutzbar wird.

Golem Akademie
  1. Unity Basiswissen: virtueller Drei-Tage-Workshop
    7.–9. Februar 2022, Virtuell
  2. Einführung in die Programmierung mit Rust: virtueller Fünf-Halbtage-Workshop
    21.–25. März 2022, Virtuell
Weitere IT-Trainings

Der Clausthaler Informatiker Dr. Odej Kao entwickelt ein Verfahren, das Ähnliches leisten soll. Auch das in Berlin ansässige Unternehmen Pixfind hatte einst an einer entsprechenden Technik gearbeitet.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


sonja 08. Feb 2005

Kurz über lang werden solche Programme existieren. Eine Eigenschaft der Computer besteht...

Tritop 13. Jan 2005

Das ist ja auch kein Kunststück - eine begrenzte Menge mit eindeutigen Kennzeichen.

Karl 12. Jan 2005

Nunja zumindest was die Erkennung von Banknoten angeht, funktioniert aktuelle Software...

:-) 12. Jan 2005

Dein vollautomatisches Forenbeitragsschreibprogramm solltest du mal um die Ebene...

Tritop 12. Jan 2005

Ist bestimmt genauso effektiv wie die Spracherkennungssoftware, die hin und wieder mal...



Aktuell auf der Startseite von Golem.de
Sam Zeloof
Student baut Chip mit 1.200 Transistoren

In seiner Garage hat Sam Zeloof den Z2 fertiggestellt und merkt scherzhaft an, Moore's Law schneller umgesetzt zu haben als Intel selbst.

Sam Zeloof: Student baut Chip mit 1.200 Transistoren
Artikel
  1. IBM E10180-Server: Watson Health anteilig für 1 Mrd. US-Dollar verkauft
    IBM E10180-Server
    Watson Health anteilig für 1 Mrd. US-Dollar verkauft

    Mit Francisco Partners greift eine große Investmentgruppe zu, das Geschäft mit Watson Health soll laut IBM darunter aber nicht leiden.

  2. Xbox Cloud Gaming: Wenn ich groß bin, möchte ich gerne Netflix werden
    Xbox Cloud Gaming
    Wenn ich groß bin, möchte ich gerne Netflix werden

    Call of Duty, Fallout oder Halo: Neue Spiele bequem am Business-Laptop via Stream zocken, klingt zu gut, um wahr zu sein. Ist auch nicht wahr.
    Ein Erfahrungsbericht von Benjamin Sterbenz

  3. Geforce RTX 3000 (Ampere): Nvidia macht Founder's Editions teurer
    Geforce RTX 3000 (Ampere)
    Nvidia macht Founder's Editions teurer

    Die Preise der FE-Ampere-Grafikkarten steigen um bis zu 100 Euro, laut Nvidia handelt es sich schlicht um eine Inflationsbereinigung.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • MediaMarkt & Saturn: Heute alle Produkte versandkostenfrei • Corsair Vengeance RGB RT 16-GB-Kit DDR4-4000 114,90€ • Alternate (u.a. DeepCool AS500 Plus 61,89€) • Acer XV282K UHD/144 Hz 724,61€ • MindStar (u.a. be quiet! Pure Power 11 CM 600W 59€) • Sony-TVs heute im Angebot [Werbung]
    •  /