Live Transcribe: Googles Audio-Übersetzungs-Engine wird Open Source

Mit Googles automatischer Transkriptions-App können Nutzer, die mit dem Hören Probleme haben, Konversationen leichter folgen. Um die künftige Entwicklung zu fördern, hat Google die darunterliegende Engine nun als Open-Source-Software kostenlos zur Verfügung gestellt.

Artikel veröffentlicht am ,
Mit der Engine können gesprochene Worte in Echtzeit in Text umgewandelt werden.
Mit der Engine können gesprochene Worte in Echtzeit in Text umgewandelt werden. (Bild: Google/Screenshot: Golem.de)

Google hat die Transkriptions-Engine aus der App Automatische Transkription als freie Software verfügbar gemacht. Das hat das Unternehmen in einem Beitrag seines Open-Source-Blogs bekanntgegeben.

Stellenmarkt
  1. IT-Architekt*in für IT-Security - Zero Trust Architecture und Cloud Security (w/m/d)
    Landeshauptstadt München, München
  2. Team Lead Service Delivery Management (m/w/d)
    operational services GmbH & Co. KG, Frankfurt am Main
Detailsuche

Die Engine ist Bestandteil von Googles Transkriptions-App, mit der Nutzer, die Probleme mit dem Hören haben, umliegende Konversationen verfolgen können. Gesprochene Sprache wird dabei in Echtzeit in Text umgewandelt. Nutzern stehen zahlreiche Sprachen zur Verfügung, unter anderem auch Deutsch; zudem können zwei Sprachen parallel verwendet werden.

Google zufolge hat das Unternehmen die Engine zur Verfügung gestellt, um Programmierern die Entwicklung eigener Apps für Nutzer mit Einschränkungen beim Hören zu entwickeln, die auf eine robuste Spracherkennung aufbauen. Der Code ist auf Github verfügbar.

Keine systemweite Einbindung wie Live Captions

Google hatte eine erste Version seiner Transkriptions-App im Februar 2019 veröffentlicht. Zur Google I/O 2019 hatte das Unternehmen dann auch systemweite Untertitel in der kommenden Android-Version Q angekündigt.

Golem Karrierewelt
  1. Data Engineering mit Python und Spark: virtueller Zwei-Tage-Workshop
    19./20.10.2022, Virtuell
  2. AZ-500 Microsoft Azure Security Technologies (AZ-500T00): virtueller Vier-Tage-Workshop
    28.11.-01.12.2022, virtuell
Weitere IT-Trainings

Anders als die auf der Google I/O 2019 gezeigten Beispiele dieser Live-Caption-Funktion arbeitet die Transkriptions-App als separate Anwendung im Vollbildmodus, und nicht als Systembestandteil im Hintergrund. Inhalte auf dem Smartphone damit zu transkribieren, ist also nur über Umwege möglich: So konnten wir auf einem Huawei P30 Pro problemlos sowohl Youtube als auch die Transkriptions-App laufen lassen. Die gesprochenen Beiträge wurden uns dann recht zuverlässig angezeigt.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Core-i-13000
Intel präsentiert Raptor Lake mit bis zu 5,8 GHz

Auf der Innovation hat Intel die 13. Core Generation vorgestellt. Kernzahl, Takt und Effizienz sollen deutlich steigen.

Core-i-13000: Intel präsentiert Raptor Lake mit bis zu 5,8 GHz
Artikel
  1. Ukrainekrieg: Meta stoppt ausgefeilte russische Desinformationskampagne
    Ukrainekrieg
    Meta stoppt ausgefeilte russische Desinformationskampagne

    Gefakte Webseiten deutscher Medien machen Stimmung gegen die Russland-Sanktionen. Die falschen Artikel wurden über soziale Medien verbreitet.

  2. Star Wars: Lego bringt großes Set der Razor Crest aus The Mandalorian
    Star Wars
    Lego bringt großes Set der Razor Crest aus The Mandalorian

    Aus fast 6.200 Teilen besteht das große Lego-Set der Razor Crest. Sie ist teuer, nicht aber für ein Star-Wars-Set.

  3. Creative Commons, Pixabay, Unsplash: Rechtliche Fallstricke bei Gratis-Stockfotos
    Creative Commons, Pixabay, Unsplash
    Rechtliche Fallstricke bei Gratis-Stockfotos

    Pixabay, Unsplash, CC ermöglichen eine gebührenfreie Nutzung kreativer Werke. Vorsicht ist dennoch geboten: vor Abmahnmaschen, falschen Quellenangaben, unklarer Rechtslage.
    Eine Analyse von Florian Zandt

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • AMD Ryzen 7000 jetzt bestellbar • CyberWeek: PC-Tower, Cooling & Co. • Günstig wie nie: Asus RX 6700 XT 539€, Acer 31,5" 4K 144 Hz 899€, MSI RTX 3090 1.159€ • AMD Ryzen 7 5800X 287,99€ • Xbox Wireless Controller 49,99€ • MindStar (Gigabyte RTX 3060 Ti 522€) [Werbung]
    •  /