Original-URL des Artikels: http://www.golem.de/0807/61005.html    Veröffentlicht: 11.07.2008 12:43    Kurz-URL: http://glm.io/61005

Interview: Assistenzsystem für Blinde wandert ins Internet

Golem.de im Gespräch mit dem Entwickler des Online-Screen-Readers WebAnywhere

WebAnywhere ist ein webbasierter Screen Reader, der Blinden und Sehbehinderten den Internetzugang von jedem beliebigen Rechner ermöglichen soll. Golem.de traf den Entwickler des Systems, Jeff Bigham.

Blinde oder Sehbehinderte brauchen eine spezielle Software, um einen Computer nutzen zu können: Screen Reader wandeln Texte in Sprache und lesen sie vor. Bislang müssen die Programme auf einem Computer installiert sein.

Damit sind Blinde oder Sehbehinderten jedoch von dem Trend ausgeschlossen, dass immer mehr Anwendungen vom Desktop-Computer ins Internet wandern, so dass Nutzer von einem beliebigen Computer mit Internetanschluss aus ihre Mails abrufen oder ihre Texte bearbeiten können. Jeff Bigham von der Universität von Washington in Seattle hat deshalb mit WebAnywhere den ersten Online-Screen-Reader entwickelt. Im Gespräch mit Golem.de erklärt Bigham, wie WebAnywhere funktioniert, welche Sprache das System spricht und wo seine Grenzen liegen.

Golem.de: Herr Bigham, Sie haben WebAnywhere entwickelt. Wie würden Sie das System beschreiben?

Jeff Bigham: WebAnywhere ist eine freie Open-Source-Webanwendung, die Blinde von einem beliebigen Computer aus nutzen können. Der Vorteil ist, dass sie keine Software installieren müssen, was auf öffentlichen Computern aus Sicherheitsgründen nicht erlaubt ist.

Jeff Bigham, der Entwickler von WebAnywhere
Jeff Bigham, der Entwickler von WebAnywhere

Golem.de: Wie wird WebAnywhere genutzt?

Bigham: Als Erstes muss der Nutzer unsere Website aufrufen. Von dort aus kann er mit unserem System eigenständig durch das Netz surfen. Über eine Tastenkombination gelangt man in ein Eingabefeld, in das die Adresse einer gewünschten Website eingegeben wird. Die Seite wird geladen und das System liest sie vor. Außerdem bietet es eine Reihe von Tastenkombinationen, mit denen der Nutzer über die Seite navigieren kann.

Golem.de: Wie funktioniert das System technisch?

Bigham: Das System im Client schickt Text an den Server. Dort wird der Text in Sprache gewandelt und im MP3-Format zurückgeschickt. Auf dem Clientrechner stellt Javascript das Tastaturinterface bereit. Eine weitere wichtige Funktion ist, dass das System die Buchstaben, die ein Nutzer in ein Eingabefeld eintippt, wiederholt, so dass er sicher sein kann, dass er sich nicht vertippt hat.

Golem.de: Wenn die Sprache vom Server ausgeliefert wird: Wie performant ist das System?

Bigham: Das hängt von der Internetverbindung ab. Bei einem Breitbandzugang dauert es normalerweise weniger als eine halbe Sekunde, bei einer langsameren Verbindung kann es auch mehrere Sekunden dauern. Das wirkt sich natürlich auf die Nutzerfreundlichkeit aus. Wenn man eine Taste drückt und dann drei Sekunden warten muss, bis etwas passiert, ist das unbefriedigend und nicht besonders nutzerfreundlich. Wir haben deshalb mehrere Prefetching- und Cachesysteme eingebaut, die sicherstellen, dass die Töne, die der Nutzer hören will, rechtzeitig auf dem Rechner sind. Wir speichern die auch zwischen, so dass sie beim nächsten Mal schneller abgerufen werden können.

Golem.de: In welcher Reihenfolge liest das System denn eine Seite?

Bigham: Standardmäßig liest WebAnywhere von oben nach unten und von links nach rechts. Man kann sich aber mit Hilfe der Tastenkombinationen in dem Dokument bewegen. Abhängig davon, welche HTML-Tags das System gerade liest, gibt es verschiedene Regeln, was es liest. Bei einem Bild schaut es, ob es einen "Alt"-Tag mit einer Bildbeschreibung gibt. Es gibt eine ganze Reihe von Regeln dieser Art. Wenn eine Seite geladen ist, wird dem Nutzer angesagt, wie viele Überschriften und Links sie enthält. Er weiß dann, ob es Überschriften gibt, die er ansteuern kann. Es gibt auch einen Befehl, um zur ersten Überschrift zu springen.

Golem.de: Ein Nutzer muss sich die Seite also nicht von oben nach unten vorlesen lassen?

Bigham: Dafür gibt es eine Reihe von Tastenkombinationen. Wenn man auf Sicht surft, kann man einfach eine Seite überfliegen und mit der Maus navigieren. Wenn man eine Seite aber nach Gehör nutzt, ist alles linear. Dann wird die Seite eben durchgehend von oben nach unten vorgelesen. Deshalb ist es natürlich sehr nützlich, wenn man auf der Seite navigieren kann.

Es gibt zum Beispiel eine Tastenkombination, mit der man die Überschriften auf einer Seite ansteuern kann. Mit einer anderen springt man zu Elementen wie Links, Eingabefeldern oder Tabellen. In einer Tabelle kann man per Tastenkombinationen zur nächsten Zeile oder Spalte springen.

Golem.de: Sind das spezielle Tastenkombinationen?

Bigham: Ja. Der Browser kennt ja nur wenige Tastenbefehle, um von einem Element zum nächsten zu springen. Wir haben deshalb noch einige hinzugefügt. Die ähneln denen von anderen verbreiteten Screen Readern, damit diejenigen, die unser System zum ersten Mal nutzen, nicht alle Tastenbefehle neu lernen müssen.

Golem.de: Liest WebAnywhere nur englische Seiten vor?

Bigham: Im Moment kann es nur Englisch. Aber die Text-to-Speech-Engines sind sehr modular. Sie sind einfach nur eine Webadresse, auf die man verweist und der man den Text übergibt. Im Moment gibt es zwar noch keine anderen Sprachengines, aber das wollen wir auf jeden Fall ändern. Die Nachfrage ist groß.

Golem.de: Programmieren Sie die Sprachengines selbst oder greifen Sie auf vorhandene zurück?

Bigham: Die bekomme ich von anderen. Es gibt sehr viele davon im Netz. Die nehmen wir dann.

Golem.de: Stellt das System jede Webseite dar?

Bigham: Das sollte es. Aber es handelt sich im Moment noch um eine Alphaversion. Das bedeutet, es gibt einzelne Seiten mit sehr komplizierten Javascripts, auf denen unser System noch ins Stolpern gerät. Aber prinzipiell funktioniert es mit jeder Website. Nutzer können also ihre Mail abfragen, Nachrichten oder Texte lesen.

Golem.de: Sie erwähnten schon, dass viele Webdesigner nicht sehr sorgfältig bei der Seitengestaltung sind. Wo liegen die Grenzen von WebAnywhere?

Bigham: Das ist ein schwieriges Problem. Man muss viel beachten, damit eine Website wirklich gut mit einem Screen Reader genutzt werden kann. Das gilt für WebAnywhere ebenso wie für die anderen Screen Reader. Das tun Webentwickler aber oft nicht. Sie nutzen beispielsweise selten Tags für Überschriften. Dabei sind die sehr praktisch für Nutzer, die einen Screen Reader brauchen. Webdesigner denken einfach nicht daran, die Seiten so zu gestalten, dass sie mit einem Screen Reader genutzt werden können.

Das setzt unserem System einige Grenzen. Das bekannteste Beispiel ist sicher die fehlenden "Alt"-Texte für ein Bild, so dass das System nicht erkennt, was das Bild darstellt. Und es gibt noch viele andere Beispiele. Wenn Tabellen nicht für Daten, sondern wegen des Layouts eingesetzt werden, kann das System sie dem Nutzer nicht richtig darstellen.

Golem.de: Wie sind Sie auf die Idee gekommen, eine solche Anwendung zu entwickeln?

Bigham: Wie haben festgestellt, dass immer mehr Anwendungen vom Desktoprechner ins Internet wandern. Man kann heute praktisch alles, was früher auf dem heimischen Computer war, online abrufen. Das ist eine tolle Entwicklung, weil man so seine Daten von praktisch jedem Computer aus abrufen kann. Wir haben jedoch festgestellt, dass Nutzer, die ein spezielles Interface für ihren Computer brauchen, von dieser Entwicklung nicht profitieren. Das gilt ganz besonders für die, die blind sind und einen Screen Reader nutzen.

Wenn all die anderen Anwendungen vom Desktop ins Internet wandern, warum sollen das die Assistenzsysteme nicht auch tun? So können Nutzer, die spezielle Interfaces brauchen, auch von jedem Computer aus Zugang haben.

Golem.de: Wie lange haben Sie an dem System gearbeitet?

Bigham: Das kommt auf die Sichtweise an. Einen laufenden Prototyp zu entwickeln, hat nur ein paar Wochen Arbeit gekostet. Aber danach wollten wir WebAnywhere der Öffentlichkeit zur Verfügung stellen, deshalb haben wir daran gearbeitet, das System stabil genug zu machen, so dass wir es freigeben konnten. Insgesamt haben wir etwa ein Jahr daran gearbeitet.

 (wp)


Verwandte Artikel:
iTunes wird barrierefrei   
(29.09.2008, http://glm.io/62663 )
IBM-Projekt soll Sehbehinderten die Webnutzung erleichtern   
(09.07.2008, http://glm.io/60952 )
Linux-Screenreader von IBM   
(24.03.2006, http://glm.io/44240 )
US-Universitäten: E-Book-Reader müssen barrierefrei sein   
(14.01.2010, http://glm.io/72406 )
Amazon macht Kindle barrierefrei   
(08.12.2009, http://glm.io/71738 )

Links zum Artikel:
Universität von Washington - WebAnywhere (.edu): http://webanywhere.cs.washington.edu/
University of Washington: http://www.washington.edu/

© 1997–2016 Golem.de, http://www.golem.de/