Machine Learning: Tumblr markiert Tiefkühlhühnchen und Joe Biden als anstößig
Der von Tumblr eingesetzte Bilderkennungsalgorithmus ist sehr ungenau: Statt Nacktheit markiert er Zeichnungen von Einhörnern und den US-Politiker Joe Biden. Das Unternehmen hat knapp zwei Wochen, bis die neue Nutzungsbedingung in Kraft tritt und die Software endgültig über Inhalte entscheidet.

Seit kurzer Zeit nutzt die Microblogging-Seite Tumblr Machine Learning, um für das Portal unangebrachte Inhalte wie Nacktheit und Pornografie in Bildern zu erkennen und zu filtern. Die Software ist allerdings sehr ungenau, berichtet das IT-Magazin Motherboard. Sie erkennt gezeichnete Einhörner, tiefgekühlte Hühnchen oder Blaupausen für eine Schuhputzmaschine als pornografische oder erotische Inhalte. Sogar der US-Politiker Joe Biden scheint für den Algorithmus zu anzüglich zu sein. Unter dem Hashtag #Toosexyfortumblr auf Twitter berichten Tumblr-Nutzer von ihren markierten Bildern.
Motherboard hat das Unternehmen bezüglich des merkwürdigen Filters befragt, allerdings nur einen Verweis auf einen Tumblr-Support-Beitrag und eine Ankündigung von CEO Jeff D'Onofrio erhalten. In diesem sieht er ein, dass der Algorithmus nicht perfekt ist. "Solche Inhalte im Gegensatz zu einer politischen Demonstration mit Nacktheit oder der David-Statue herauszufiltern, ist im Großen nicht einfach", schreibt D'Onforio. Allerdings sieht es so aus, als könne der eingesetzte Algorithmus nicht einmal echte Menschen von rohem Essen unterscheiden.
Die Bilderkennung arbeitet zusammen mit menschlichen Mitarbeitern, die Inhalte manuell analysieren und herausfiltern. Das erinnert ein wenig an die Methoden, die die Videoplattform Youtube zum Markieren ihrer Inhalte nutzt. Allerdings scheint dieser akkurater und ausgereifter zu sein.
Fleischfarbener Hintergrund reicht wohl aus
Wie wenig ausgereift der Algorithmus bisher ist, beweisen einige der unter dem Hashtag #Toosexyfortumblr geteilten und markierten Bilder. Darunter ist etwa ein Anhänger in Herzform, der auf klarem Untergrund auf der einen und als Schema auf der anderen Seite abgebildet ist. Solch eindeutige Formen sind normalerweise für Machine-Learning-Systeme sehr leicht zu erkennen. Eine Nutzerin will erkannt haben, dass alles, was eine fleischfarbene Textur zeigt, als anstößig markiert wird. Ein so allgemeiner Parameter könnte ein Grund für die Ungenauigkeit sein.
Die mit dem Algorithmus einhergehenden angepassten Nutzungsbedingungen der Plattform gehen ab dem 17. Dezember 2018 online. Bis dahin hat Tumblr also wohl noch Zeit, um die Software auszubessern. Sie soll den vom Nutzer selbst eingestellten Safe-Mode-Filter ersetzen. Gesperrte Inhalte definiert Tumblr als: "primär Fotos, Videos und GIFs, die echte menschliche Genitalien oder Nippel der weiblichen Brust und sämtliche Inhalte zeigen - einschließlich Fotos, Videos, GIFs und Illustrationen - die Sex darstellen".
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Also ich weiß nicht wie wenig da euer Horizont überblickt was für Seiten es da gibt, aber...
Ein Blick auf Twitter reicht aktuell, da gibt es tonnenweise lustiger Beispiele, was die...
Möglicherweise möchte Tumb Larr mit dem Filtern auch eine bestimmte Reaktion provozieren...
Da das sogenannte "Herz" ursprünglich die stilisierte Darstellung des entblößten...