Rosetta: Facebooks neuronales Netzwerk erkennt Memes in Echtzeit

Das soziale Netzwerk Facebook arbeitet an einem KI-System, das Text im Bild erkennen und den Sinn von diesen Texten verstehen und filtern kann. Rosetta soll dabei helfen, die Flut an Memes zu analysieren. Als Trainingsdaten dienen gepostete Motive und künstlich erstellte Memes.

Artikel veröffentlicht am ,
Rosetta erkennt den Text in Memes in verschiedenen Sprachen.
Rosetta erkennt den Text in Memes in verschiedenen Sprachen. (Bild: Facebook)

Facebook entwickelt ein neuronales Netzwerk, das Text im Bild erkennt und klassifizieren kann. Das System mit Namen Rosetta soll beispielsweise für das Filtern von böswilligen, anstößigen oder unangebrachten Memes verwendet werden. Es soll in Echtzeit viele Milliarden Bilder analysieren, die sich auf den Plattformen Facebook und Instagram befinden. Die Software erkennt Texte in verschiedenen Sprachen, etwa Arabisch, Englisch, Hindi und Italienisch.

Stellenmarkt
  1. Softwareentwickler (m/w/d) Toolentwicklung
    Elektronische Fahrwerksysteme GmbH, Ingolstadt
  2. Integration Solution Engineer (w/m/d)
    Dürr IT Service GmbH, Bietigheim-Bissingen
Detailsuche

Rosetta teilt sich in zwei Teilmodule auf. Ein Region Proposal Network erkennt in Bildern eingebaute Wörter und Buchstaben und wandelt diese in reinen Text um. Die zweite Instanz ist ein Classifier, der die Bedeutung der Wörter und Sätze analysiert und interpretiert. Auf dieses Resultat kann Facebook dann Filter anwenden, etwa wenn ein Satz gegen die Nutzungsrichtlinien des sozialen Netzwerks verstößt. Das zugrundeliegende Framework ist das von Facebook selbst entwickelte Caffe2.

Bilder von Nutzern und automatisch erstellte Motive zum Trainieren

Interessant ist, dass sich die Quelldaten von Rosetta ebenfalls zweiteilen: Zum einen nutzt es beliebige auf Facebook veröffentlichte Bilder, die Nutzer mit bestimmten Parametern wie dem Text oder dem Bildinhalt markieren. Diese werden mit synthetisch aus Text und Bild hergestellten Memes und anderen Motiven vermischt.

Facebook will sein System künftig auch für Videos verwenden. Die Herausforderung für das Unternehmen besteht darin, das ressourceneffizient zu lösen. Daher falle die simple Analyse jedes einzelnen Videoframes weg, da dies nicht gut - in Hinsicht auf die wachsende Anzahl an Videos auf dem sozialen Netzwerk - skalierbar ist. Ein Ansatz wären 3D Convolutional Networks, bei denen ein neuronales Netzwerk neben Relationen von Bildausschnitten zueinander auch Zusammenhänge über ein gegebenes Zeitintervall verstehen soll.

Golem Akademie
  1. IT-Fachseminare der Golem Akademie
    Live-Workshops zu Schlüsselqualifikationen
  2. 1:1-Videocoaching mit Golem Shifoo
    Berufliche Herausforderungen meistern
  3. Online-Sprachkurse mit Golem & Gymglish
    Kurze Lektionen, die funktionieren
Weitere IT-Trainings

Facebook "erkundet" nach eigenen Aussagen diesen Sektor aber erst. Richtige Ergebnisse könnten also noch ein wenig dauern.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


bombinho 12. Sep 2018

Siggi wuerde an dieser Stelle sicherlich entzueckt jauchzen. :))))

bombinho 12. Sep 2018

Ich gehe davon aus, dass mit einfachsten Algorithmen Schrift(Erkennung) weiterhin auch...

Gandalf2210 12. Sep 2018

https://www.google.de/search?q=deep+fried+memes&client=ms-unknown&prmd=isvn&source=lnms...



Aktuell auf der Startseite von Golem.de
Mobiles Betriebssystem
iOS 15 mit Focus, OCR und schickem Facetime

Apple hat iOS 15 für iPhones und den iPod Touch vorgestellt. Radikale Neuerungen sind nicht dabei, dafür aber einige interessante Funktionen.

Mobiles Betriebssystem: iOS 15 mit Focus, OCR und schickem Facetime
Artikel
  1. iPad-Betriebssystem: iPadOS 15 mit Schnellnotizen und App-Mediathek
    iPad-Betriebssystem
    iPadOS 15 mit Schnellnotizen und App-Mediathek

    Apple hat mit iPadOS 15 ein neues Betriebssystem veröffentlicht, das mehr Freiheiten für Widgets, systemweite Schnellnotizen und die App-Mediathek von iOS bietet.

  2. Windows 11: Geplante Obsoleszenz ist schlecht, Microsoft!
    Windows 11
    Geplante Obsoleszenz ist schlecht, Microsoft!

    Kunden ärgern sich darüber, dass ihre vier Jahre alten Prozessoren bereits kein Windows 11 mehr unterstützen. Zu Recht.
    Ein IMHO von Oliver Nickel

  3. Project Taara: Google schafft Durchbruch mit Laserdatenübertragung
    Project Taara
    Google schafft Durchbruch mit Laserdatenübertragung

    Datenverbindungen mit Laserlicht sind störanfällig durch Nebel und Dunst. Googles Abteilung X scheint das Problem gelöst zu haben.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • MM-Prospekt (u. a. Asus Gaming-Notebook 17" RTX 3050 1.099€) • PCGH-PC mit Ryzen 5 3600 & RTX 3060 999€ • Samsung 970 Evo Plus 1TB 99€ • Saturn Hits 2021 (u. a. Philips 55" OLED 120Hz 1.849€) • Corsair RGB 16GB Kit 3600MHz 87,90€ • Dualsense Schwarz + Deathloop 99,99€ [Werbung]
    •  /