Barrierefreiheit: Google-KI beschreibt automatisch Bilder im Internet

Alt-Text und Bildunterschriften sind im Netz oft sehr schlecht oder gar nicht vorhanden. Google will das Problem automatisiert lösen.

Artikel veröffentlicht am ,
Ein Flamingo steht einbeinig im Wasser.
Ein Flamingo steht einbeinig im Wasser. (Bild: YASSER AL-ZAYYAT/AFP via Getty Images)

Der IT-Konzern Google hat zum Welttag der Barrierefreiheit zahlreiche Neuerungen für seine eingeschränkten Nutzer vorgestellt. Die speziell für Blinde oder Personen mit eingeschränktem Sehvermögen gedachte App Lookout hat Google demnach nun um KI-Funktionen erweitert, die den Personen Bilder im Netz zugänglicher machen soll. Beschreibungen von Bildern lassen sich zwar eigentlich schon länger über Bildunterschriften und das Alt-Attribut als Textfeld umsetzen. Genutzt werde das laut Google aber nur sehr selten.

Helfen soll hier nun also ein KI-Modell, dass Bilder automatisch verarbeiten können soll, um eine Beschreibung des Bildinhalts liefern zu können. Darüber hinaus können über eine Art Chatbot oder mit der eigenen Stimme weiter Nachfragen zum Bildinhalt gestellt werden. Die grundlegende Technik dazu stammt aus Deepmind und basiert auf dem Flamingo-Modell. Noch soll die Technik aber erst in einem kleinen Nutzerkreis getestet werden.

Ankündigt hat Google darüber hinaus, dass Informationen zum barrierefreien Zugang zu Orten in Maps nun für alle Nutzer schnell über ein Icon erreichbar sind. Die Funktion, die an die bereits mehr als zehn Jahre alte Initiative der Wheelmap erinnert, hat Google erstmals im Jahr 2020 angekündigt und später auch in Deutschland, damals allerdings noch als Opt-in.

Erweitern will Google darüber hinaus den Nutzerkreis seiner sogenannten Live-Captions, also automatisch erzeugter Untertitel. Konkret soll die Funktion, Anrufe auch per Tippen auf der Tastatur führen zu können, sodass das Gegenüber die eigenen Antworten vorgelesen bekommt, nun auch auf älteren Pixel-Smartphones und Samsung-Geräten bereitstehen. Vor einigen Tagen hat Konkurrent Apple ebenfalls eine neue Funktion zur Barrierefreiheit vorgestellt.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Wissenschaft
In Energydrinks enthaltenes Taurin könnte Leben verlängern

Wissenschaftler haben Anzeichen dafür entdeckt, dass Taurin die Gesundheit verbessern und das Leben verlängern könnte. Mehr Energydrinks sollte man aber nicht trinken.

Wissenschaft: In Energydrinks enthaltenes Taurin könnte Leben verlängern
Artikel
  1. Tesla Files: Cybertruck ist undicht, laut und bremst schlecht
    Tesla Files
    Cybertruck ist undicht, laut und bremst schlecht

    Internen Dokumenten zufolge steht Teslas Pick-up-Truck vor großen Problemen. Der Cybertruck befinde sich in der Alpha-Phase.

  2. VATM: Menschen nutzen weiter Call-by-Call und Preselection
    VATM
    Menschen nutzen weiter Call-by-Call und Preselection

    Die Telekom hat Call-by-Call und Preselection mehrfach verlängert. Obwohl viele Menschen sie weiterhin nutzen, enden diese Dienste bald.

  3. Einführung in Plotly: Damit die Daten Sinn ergeben
    Einführung in Plotly
    Damit die Daten Sinn ergeben

    Interaktive Plots mit Plotly zu erstellen, ist nicht schwer - und sehr nützlich. In einer zweiteiligen Reihe zeigen wir Schritt für Schritt, wie es funktioniert.
    Eine Anleitung von Antony Ghiroz

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • XXL-Sale bei Alternate (u. a. Samsung 970 EVO Plus 2 TB 84,90€) • MindStar: Palit RTX 4070 Ti GameRock OC 859€, be quiet! Pure Base 500 59€ • Thermaltake Toughliquid Ultra 240 145,89€ • PS5-Spiele & Zubehör bis -75% • Chromebooks bis -32% • NBB: Gaming-Produkte bis -50% [Werbung]
    •  /