Videotelefonie: KIT-Forscher testet Videokonferenzsystem aus der Tiefsee
Ein Forscher aus Karlsruhe hat einen Tauchgang zur Titanic genutzt, um eine neuartige Technik für Videokonferenzen zu testen.

Videokonferenzen können anstrengend sein, wenn die nötige Bandbreite nicht zur Verfügung steht. Ein neues System, das vom Karlsruher Institut für Technologie (KIT) und der Carnegie Mellon University (CMU) entwickelt wurde, soll Abhilfe schaffen. Getestet wurde es an einem sehr ungewöhnlichen Ort.
Gerade seit Ausbruch der Corona-Pandemie haben Videokonferenzen stark zugenommen: Teams halten Meetings aus den einzelnen Homeoffices per Video ab, Dienstreisen weichen Treffen am Rechner. Doch oft genug behindern schlechte Übertragungsqualität, Aussetzer und Verbindungsabbrüche die Kommunikation. Schuld ist oft genug fehlende Brandbreite.
Das in Karlsruhe und Pittsburgh im US-Bundesstaat Pennsylvania entwickelte System kommt mit sehr geringen Bandbreiten aus. Übertragen wird nämlich kein Video, sondern nur Text.
Nur Text wird übertragen
Bei der Aufnahme wird die gesprochene Sprache in Text gewandelt, für dessen Übertagung weit weniger Bandbreite benötigt wird. Auf dem Empfangsrechner wird der Text dann wieder zu einem Video gewandelt. Sprich: Es wird ein synthetisches Videobild der sprechenden Person erzeugt. Der Text wird in gesprochene Sprache umgesetzt, wobei die Stimme der Person synthetisiert wird. Das Gesicht der Person bewegt sich dazu lippensynchron.
"Im Video ist dann eine synthetische Stimme zu hören, die auf die Stimme des Sprechenden übertragen wird, so dass sie wie die Stimme des Sprechenden klingt. Zudem wird die Video-Synthese so gesteuert, dass die Lippen des Sprechenden sich dabei synchron mit dem Ton bewegen", sagte Entwickler Alex Waibel.
Waibel tauchte zur Titanic
Die Testumgebung für das System war sehr ungewöhnlich: an Bord eines Schiffs im Nordatlantik, an der Stelle, wo vor 110 Jahren die Titanic gesunken ist. Waibel saß in einem Tauchboot, das zu dem in 3.800 Metern Tiefe liegenden Wrack unterwegs war.
Während der Tauchfahrt kommunizierte Waibel über seinen Laptop mit dem Mutterschiff an der Oberfläche. Seine Worte wurden in Text gewandelt und per Sonar-Schallimpuls nach oben übermittelt. Auf dem Schiff wurde der Text als Video rekonstruiert.
Waibel forscht am KIT und an der CMU an Spracherkennung, Sprachverarbeitung und Sprachübersetzung. Das System basiert auf dem von ihm entwickelten Simultanübersetzungssystem Lecture Translator, der am KIT im Einsatz ist und Vorlesungen automatisch in Schriftform ins Englische übersetzt.
Das System ermöglicht aber nicht nur Videokonferenzen über eine geringe Bandbreite. Sie soll sich für die Synthese von Videos in einer anderen Sprache oder für die lippensynchrone Vertonung von Videos einsetzen lassen. "Das wird in Zukunft die Kommunikation in gesprochener Sprache erleichtern", sagte Waibel.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Mal mit Forschungsgeldern zur Titanic zu tauchen ist doch auch ganz nett. Dafür hätte...
Darum ist es interessant, warum hier ein Videobild genutzt wird, anstatt dass nur auf ein...
Kommentieren