Abo
  • Services:
Anzeige

Xerox - Neue Software soll Bilder verstehen

Technik zur automatischen Erkennung und Archivierung von Bildmotiven

Die Forscher des Xerox Research Centre Europe (XRCE) haben jetzt eine Software entwickelt, die in der Lage sein soll, Bilder zu verstehen und Motive zu erkennen und zuzuordnen. Die Technik soll so eine automatische Erkennung und Archivierung von Bildmotiven erlauben.

Bislang lassen sich Bilddatenbanken in der Regel nur nach Stichworten kategorisieren und durchsuchen. Diese Möglichkeiten will Xerox nun durch die Sortierung nach Bildkategorien erweitern. Bilder können so automatisch anhand ihres Inhaltes - ihres Motivs - indiziert werden. Das Programm erkennt dabei verschiedenste Bildmotive, die anschließend entsprechend sortiert in Dokumenten- und Content-Managementsysteme einfließen können.

Anzeige

Der gesamte Vorgang soll ungefähr zwei Sekunden pro Bild dauern und so auch für die Verarbeitung und Speicherung großer Mengen von Bildmaterial geeignet sein. Die Trefferquote der Software soll je nach Bildkategorie zwischen 80 und 99 Prozent liegen.

Die Funktionsweise besteht aus vier Schritten. Im ersten Schritt sucht die Software nach markanten Punkten und Elementen, den so genannten "Keypatches". Dann werden die einzelnen Patches mit einem visuellen Wörterbuch verglichen - daraus resultieren "visuelle Worte", die zentralen Elemente des einzelnen Bildes. Bei der Aufnahme eines Autos sind das beispielsweise Räder und Scheinwerfer. Im dritten Schritt zählt das Programm, wie häufig die einzelnen visuellen Worte erscheinen. Abschließend werden die so entstehenden Histogramme in vordefinierten Bildkategorien klassifiziert. Dabei soll sich die Software auch nicht durch ungewöhnliche Blickwinkel oder Komplikationen wie die Präsenz mehrerer Bildkategorien in einem einzelnen Bild verunsichern lassen.

Derzeit arbeiten die Forscher an einer Vergrößerung des visuellen Wörterbuchs, um die Software zur Marktreife zu bringen. In Zukunft soll die Technik zudem für die Kategorisierungstechnologie von bewegten Bildern angepasst werden, so dass sie auch für Videomaterial nutzbar wird.

Der Clausthaler Informatiker Dr. Odej Kao entwickelt ein Verfahren, das Ähnliches leisten soll. Auch das in Berlin ansässige Unternehmen Pixfind hatte einst an einer entsprechenden Technik gearbeitet.


eye home zur Startseite
sonja 08. Feb 2005

Kurz über lang werden solche Programme existieren. Eine Eigenschaft der Computer besteht...

Tritop 13. Jan 2005

Das ist ja auch kein Kunststück - eine begrenzte Menge mit eindeutigen Kennzeichen.

Karl 12. Jan 2005

Nunja zumindest was die Erkennung von Banknoten angeht, funktioniert aktuelle Software...

:-) 12. Jan 2005

Dein vollautomatisches Forenbeitragsschreibprogramm solltest du mal um die Ebene...

Tritop 12. Jan 2005

Ist bestimmt genauso effektiv wie die Spracherkennungssoftware, die hin und wieder mal...



Anzeige

Stellenmarkt
  1. Dataport, Hamburg
  2. L. STROETMANN Lebensmittel GmbH & Co. KG, Münster
  3. BASF SE, Ludwigshafen
  4. ESCRYPT GmbH - Embedded Security, Bochum


Anzeige
Spiele-Angebote
  1. 49,99€
  2. (-50%) 14,99€

Folgen Sie uns
       


  1. Sicherheitslücken

    Mehr als 30 Klagen gegen Intel wegen Meltdown und Spectre

  2. Nightdive Studios

    Arbeit an System Shock Remake bis auf Weiteres eingestellt

  3. FTTH

    Landkreistag fordert mit Vodafone Glasfaser bis in Gebäude

  4. Programmiersprache

    Go 1.10 cacht besser und baut Brücken zu C

  5. Letzte Meile

    Telekom macht Versuche mit Fixed Wireless 5G

  6. PTI und IBRS

    FreeBSD erhält Patches gegen Meltdown und Spectre

  7. Deutsche Telekom

    Huawei und Intel zeigen Interoperabilität von 5G

  8. Lebensmittel-Lieferservices

    Für Berufstätige auf dem Lande oft "praktisch nicht nutzbar"

  9. Fertigungstechnik

    Intel steckt Kobalt und 4,5 Milliarden US-Dollar in Chips

  10. Homepod im Test

    Smarter Lautsprecher für den Apple-affinen Popfan



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Ryzen 5 2400G und Ryzen 3 2200G im Test: Raven Ridge rockt
Ryzen 5 2400G und Ryzen 3 2200G im Test
Raven Ridge rockt
  1. Raven Ridge AMD verschickt CPUs für UEFI-Update
  2. Krypto-Mining AMDs Threadripper schürft effizient Monero
  3. AMD Zen+ und Zen 2 sind gegen Spectre gehärtet

Razer Kiyo und Seiren X im Test: Nicht professionell, aber schnell im Einsatz
Razer Kiyo und Seiren X im Test
Nicht professionell, aber schnell im Einsatz
  1. Stereolautsprecher Razer Nommo "Sind das Haartrockner?"
  2. Nextbit Cloud-Speicher für Robin-Smartphone wird abgeschaltet
  3. Razer Akku- und kabellose Spielemaus Mamba Hyperflux vorgestellt

Freier Media-Player: VLC 3.0 eint alle Plattformen
Freier Media-Player
VLC 3.0 eint alle Plattformen

  1. Re: Warum tritt bei Kobalt weniger...

    Arsenal | 21:11

  2. Sie glauben nicht...

    Sharra | 21:06

  3. Re: Vodafone und FTTB/H?

    Dachskiller | 21:04

  4. Warum Quoten erreichen??

    AgentBignose | 21:03

  5. Re: Liebe Einbrecher

    Axido | 20:55


  1. 18:27

  2. 18:09

  3. 18:04

  4. 16:27

  5. 16:00

  6. 15:43

  7. 15:20

  8. 15:08


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel