Zum Hauptinhalt Zur Navigation

Machine Learning: Tumblr markiert Tiefkühlhühnchen und Joe Biden als anstößig

Der von Tumblr eingesetzte Bilderkennungsalgorithmus ist sehr ungenau: Statt Nacktheit markiert er Zeichnungen von Einhörnern und den US-Politiker Joe Biden . Das Unternehmen hat knapp zwei Wochen, bis die neue Nutzungsbedingung in Kraft tritt und die Software endgültig über Inhalte entscheidet.
/ Oliver Nickel
16 Kommentare News folgen (öffnet im neuen Fenster)
Joe Biden ist einfach zu anstößig, denkt zumindest Tumblrs Algorithmus. (Bild: Twitter/@Offborrowedlight)
Joe Biden ist einfach zu anstößig, denkt zumindest Tumblrs Algorithmus. Bild: Twitter/@Offborrowedlight

Seit kurzer Zeit nutzt die Microblogging-Seite Tumblr Machine Learning, um für das Portal unangebrachte Inhalte wie Nacktheit und Pornografie in Bildern zu erkennen und zu filtern. Die Software ist allerdings sehr ungenau, berichtet(öffnet im neuen Fenster) das IT-Magazin Motherboard. Sie erkennt gezeichnete Einhörner, tiefgekühlte Hühnchen oder Blaupausen für eine Schuhputzmaschine als pornografische oder erotische Inhalte. Sogar der US-Politiker Joe Biden scheint für den Algorithmus zu anzüglich zu sein. Unter dem Hashtag #Toosexyfortumblr(öffnet im neuen Fenster) auf Twitter berichten Tumblr-Nutzer von ihren markierten Bildern.

Motherboard hat das Unternehmen bezüglich des merkwürdigen Filters befragt, allerdings nur einen Verweis auf einen Tumblr- Support-Beitrag(öffnet im neuen Fenster) und eine Ankündigung(öffnet im neuen Fenster) von CEO Jeff D'Onofrio erhalten. In diesem sieht er ein, dass der Algorithmus nicht perfekt ist. "Solche Inhalte im Gegensatz zu einer politischen Demonstration mit Nacktheit oder der David-Statue herauszufiltern, ist im Großen nicht einfach" , schreibt D'Onforio. Allerdings sieht es so aus, als könne der eingesetzte Algorithmus nicht einmal echte Menschen von rohem Essen unterscheiden.

Die Bilderkennung arbeitet zusammen mit menschlichen Mitarbeitern, die Inhalte manuell analysieren und herausfiltern. Das erinnert ein wenig an die Methoden, die die Videoplattform Youtube zum Markieren ihrer Inhalte nutzt. Allerdings scheint dieser akkurater und ausgereifter zu sein.

Fleischfarbener Hintergrund reicht wohl aus

Wie wenig ausgereift der Algorithmus bisher ist, beweisen einige der unter dem Hashtag #Toosexyfortumblr geteilten und markierten Bilder. Darunter ist etwa ein Anhänger in Herzform, der auf klarem Untergrund auf der einen und als Schema auf der anderen Seite abgebildet ist. Solch eindeutige Formen sind normalerweise für Machine-Learning-Systeme sehr leicht zu erkennen. Eine Nutzerin will erkannt haben, dass alles, was eine fleischfarbene Textur zeigt, als anstößig markiert wird. Ein so allgemeiner Parameter könnte ein Grund für die Ungenauigkeit sein.

Die mit dem Algorithmus einhergehenden angepassten Nutzungsbedingungen(öffnet im neuen Fenster) der Plattform gehen ab dem 17. Dezember 2018 online. Bis dahin hat Tumblr also wohl noch Zeit, um die Software auszubessern. Sie soll den vom Nutzer selbst eingestellten Safe-Mode-Filter ersetzen. Gesperrte Inhalte definiert Tumblr als: "primär Fotos, Videos und GIFs, die echte menschliche Genitalien oder Nippel der weiblichen Brust und sämtliche Inhalte zeigen – einschließlich Fotos, Videos, GIFs und Illustrationen – die Sex darstellen" .


Relevante Themen