• IT-Karriere:
  • Services:

Live Transcribe: Googles Audio-Übersetzungs-Engine wird Open Source

Mit Googles automatischer Transkriptions-App können Nutzer, die mit dem Hören Probleme haben, Konversationen leichter folgen. Um die künftige Entwicklung zu fördern, hat Google die darunterliegende Engine nun als Open-Source-Software kostenlos zur Verfügung gestellt.

Artikel veröffentlicht am ,
Mit der Engine können gesprochene Worte in Echtzeit in Text umgewandelt werden.
Mit der Engine können gesprochene Worte in Echtzeit in Text umgewandelt werden. (Bild: Google/Screenshot: Golem.de)

Google hat die Transkriptions-Engine aus der App Automatische Transkription als freie Software verfügbar gemacht. Das hat das Unternehmen in einem Beitrag seines Open-Source-Blogs bekanntgegeben.

Stellenmarkt
  1. QSC AG, verschiedene Standorte
  2. Hochschule für Angewandte Wissenschaften Hof, Hof

Die Engine ist Bestandteil von Googles Transkriptions-App, mit der Nutzer, die Probleme mit dem Hören haben, umliegende Konversationen verfolgen können. Gesprochene Sprache wird dabei in Echtzeit in Text umgewandelt. Nutzern stehen zahlreiche Sprachen zur Verfügung, unter anderem auch Deutsch; zudem können zwei Sprachen parallel verwendet werden.

Google zufolge hat das Unternehmen die Engine zur Verfügung gestellt, um Programmierern die Entwicklung eigener Apps für Nutzer mit Einschränkungen beim Hören zu entwickeln, die auf eine robuste Spracherkennung aufbauen. Der Code ist auf Github verfügbar.

Keine systemweite Einbindung wie Live Captions

Google hatte eine erste Version seiner Transkriptions-App im Februar 2019 veröffentlicht. Zur Google I/O 2019 hatte das Unternehmen dann auch systemweite Untertitel in der kommenden Android-Version Q angekündigt.

Anders als die auf der Google I/O 2019 gezeigten Beispiele dieser Live-Caption-Funktion arbeitet die Transkriptions-App als separate Anwendung im Vollbildmodus, und nicht als Systembestandteil im Hintergrund. Inhalte auf dem Smartphone damit zu transkribieren, ist also nur über Umwege möglich: So konnten wir auf einem Huawei P30 Pro problemlos sowohl Youtube als auch die Transkriptions-App laufen lassen. Die gesprochenen Beiträge wurden uns dann recht zuverlässig angezeigt.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Spiele-Angebote
  1. 46,99€
  2. 29,32€ (PS4), 29,99€ (Xbox One)
  3. (-44%) 27,99€

mick_3 20. Aug 2019

Schlimm genug, daß Google von ihrer "Live Transcribe Speech Engine" spricht und damit...

rolitheone 20. Aug 2019

kwt

HeroFeat 19. Aug 2019

Danke für die Aufklärung an dieser Stelle. Ich hatte mich schon gewundert, das Google...


Folgen Sie uns
       


Drohnenflug am Strand mit Google Earth Studio - Tutorial

Wir zeigen im kurzen Tutorial, wie man in Earth Studio eine einfache Animation erstellt.

Drohnenflug am Strand mit Google Earth Studio - Tutorial Video aufrufen
Kotlin, Docker, Kubernetes: Weitere Online-Workshops für ITler
Kotlin, Docker, Kubernetes
Weitere Online-Workshops für ITler

Wer sich praktisch weiterbilden will, sollte erneut einen Blick auf das Angebot der Golem Akademie werfen. Online-Workshops zu den Themen Kotlin und Docker sind hinzugekommen, Kubernetes und Python werden wiederholt.

  1. React, Data Science, Agilität Neue Workshops der Golem Akademie online
  2. In eigener Sache Golem Akademie hilft beim Einstieg in Kubernetes
  3. Golem Akademie Data Science mit Python für Entwickler und Analysten

PC-Hardware: Das kann DDR5-Arbeitsspeicher
PC-Hardware
Das kann DDR5-Arbeitsspeicher

Vierfache Kapazität, doppelte Geschwindigkeit: Ein Überblick zum DDR5-Speicher für Server und Desktop-PCs.
Ein Bericht von Marc Sauter


    Complex Event Processing: Informationen fast in Echtzeit auswerten
    Complex Event Processing
    Informationen fast in Echtzeit auswerten

    Ob autonomes Fahren, Aktienhandel oder Onlineshopping: Soll das Ergebnis gut sein, müssen Informationen quasi in Echtzeit ausgewertet werden. Eine gute Lösung dafür: CEP.
    Von Boris Mayer

    1. Musik Software generiert Nirvana-Songtexte
    2. mmap Codeanalyse mit sechs Zeilen Bash
    3. Digitale Kultur Demoszene wird finnisches Kulturerbe

      •  /