Rosetta: Facebooks neuronales Netzwerk erkennt Memes in Echtzeit

Das soziale Netzwerk Facebook arbeitet an einem KI-System, das Text im Bild erkennen und den Sinn von diesen Texten verstehen und filtern kann. Rosetta soll dabei helfen, die Flut an Memes zu analysieren. Als Trainingsdaten dienen gepostete Motive und künstlich erstellte Memes.

Artikel veröffentlicht am ,
Rosetta erkennt den Text in Memes in verschiedenen Sprachen.
Rosetta erkennt den Text in Memes in verschiedenen Sprachen. (Bild: Facebook)

Facebook entwickelt ein neuronales Netzwerk, das Text im Bild erkennt und klassifizieren kann. Das System mit Namen Rosetta soll beispielsweise für das Filtern von böswilligen, anstößigen oder unangebrachten Memes verwendet werden. Es soll in Echtzeit viele Milliarden Bilder analysieren, die sich auf den Plattformen Facebook und Instagram befinden. Die Software erkennt Texte in verschiedenen Sprachen, etwa Arabisch, Englisch, Hindi und Italienisch.

Stellenmarkt
  1. Informatiker / innen (m/w/d)
    Bundesamt für Verfassungsschutz, Köln, Berlin
  2. Head of Engineering (m/w/d) Software Development
    Quentic GmbH, Berlin
Detailsuche

Rosetta teilt sich in zwei Teilmodule auf. Ein Region Proposal Network erkennt in Bildern eingebaute Wörter und Buchstaben und wandelt diese in reinen Text um. Die zweite Instanz ist ein Classifier, der die Bedeutung der Wörter und Sätze analysiert und interpretiert. Auf dieses Resultat kann Facebook dann Filter anwenden, etwa wenn ein Satz gegen die Nutzungsrichtlinien des sozialen Netzwerks verstößt. Das zugrundeliegende Framework ist das von Facebook selbst entwickelte Caffe2.

Bilder von Nutzern und automatisch erstellte Motive zum Trainieren

Interessant ist, dass sich die Quelldaten von Rosetta ebenfalls zweiteilen: Zum einen nutzt es beliebige auf Facebook veröffentlichte Bilder, die Nutzer mit bestimmten Parametern wie dem Text oder dem Bildinhalt markieren. Diese werden mit synthetisch aus Text und Bild hergestellten Memes und anderen Motiven vermischt.

Facebook will sein System künftig auch für Videos verwenden. Die Herausforderung für das Unternehmen besteht darin, das ressourceneffizient zu lösen. Daher falle die simple Analyse jedes einzelnen Videoframes weg, da dies nicht gut - in Hinsicht auf die wachsende Anzahl an Videos auf dem sozialen Netzwerk - skalierbar ist. Ein Ansatz wären 3D Convolutional Networks, bei denen ein neuronales Netzwerk neben Relationen von Bildausschnitten zueinander auch Zusammenhänge über ein gegebenes Zeitintervall verstehen soll.

Facebook "erkundet" nach eigenen Aussagen diesen Sektor aber erst. Richtige Ergebnisse könnten also noch ein wenig dauern.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Nachfolger von Windows 10
Dinge, die es in Windows 11 nicht mehr geben wird

Bei Windows 11 kommt viel Neues hinzu, auf der anderen Seite entfernt Microsoft eine Menge Ballast - eine Übersicht.
Von Oliver Nickel

Nachfolger von Windows 10: Dinge, die es in Windows 11 nicht mehr geben wird
Artikel
  1. NFC: Gesetzesänderung könnte Apple Pay öffnen
    NFC
    Gesetzesänderung könnte Apple Pay öffnen

    Der Bundesrat hat eine Änderung am Zahlungsdiensteaufsichtsgesetz beschlossen, die es Banken leichter machen soll, Zugang zu Apples NFC-Schnittstelle zu bekommen.

  2. World Update: Deutschland wird schöner im Flight Simulator
    World Update
    Deutschland wird schöner im Flight Simulator

    Die Region für das nächste World Update steht fest: Österreich, Deutschland und die Schweiz werden im Flight Simulator optimiert.

  3. Chris Roberts' Vision: Nach einem Jahr Pause kehren wir zu Star Citizen zurück
    Chris Roberts' Vision
    Nach einem Jahr Pause kehren wir zu Star Citizen zurück

    Star Citizen und die Community sind inzwischen ein ganzes Stück sympathischer geworden. Trotzdem ist hier weniger fertig als gedacht.
    Ein Hands-on von Oliver Nickel

bombinho 12. Sep 2018

Siggi wuerde an dieser Stelle sicherlich entzueckt jauchzen. :))))

bombinho 12. Sep 2018

Ich gehe davon aus, dass mit einfachsten Algorithmen Schrift(Erkennung) weiterhin auch...

Gandalf2210 12. Sep 2018

https://www.google.de/search?q=deep+fried+memes&client=ms-unknown&prmd=isvn&source=lnms...


Folgen Sie uns
       


Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Schnäppchen • Alternate: Ryzen 7 5800 X 359€, Ryzen 5 5600 X 249€ • Gigabyte Z490M 119,90€ • Mega-Wiedereröffnung bei MediaMarkt - bis zu 30 Prozent Rabatt • Samsung SSD 980 Pro PCIe 4.0 1TB 166,59€ • Trust Gaming Audio-Zubehör • Kaspersky Flash Sale: 60% Rabatt auf Security-Programme [Werbung]
    •  /