Lyra: Googles effizienter Sprachcodec ermöglicht Portierung

Bisher nutzte Googles Sprachcodec Lyra noch eine proprietäre Bibliothek. Diese ist nun Open Source und das Projekt kann portiert werden.

Artikel veröffentlicht am ,
Das Logo von Lyra ist eine Stimmgabel.
Das Logo von Lyra ist eine Stimmgabel. (Bild: Pixabay)

Google hat seinen Sprachcodec Lyra in Version 0.0.2 veröffentlicht. Die wohl wichtigste Änderung für diese Veröffentlichung ist der komplette Verzicht auf eine bisher genutzte proprietäre Bibliothek. Diese wird zur Multiplikation dünn besetzter Matrizen verwendet. Google lieferte diese bisher lediglich im Binärcode als dynamische, gelinkte Bibliothek aus. Mit Lyra 0.0.2 ist der Code dazu nun aber auch Open Source und kann weiter verwendet werden.

Stellenmarkt
  1. Geschäftsführer/CSO (m/w/d) für den Bereich Software (Vertrieb, Service und Support)
    über Baumann Unternehmensberatung, Großraum Köln
  2. SAP Basis Berater (m/w/x)
    über duerenhoff GmbH, Raum Düsseldorf
Detailsuche

Aus der freien Verfügbarkeit und Nutzbarkeit der erwähnten Bibliothek ergibt sich, dass der Code des Lyra-Projekts nun auch vollständig auf andere Plattformen und Werkzeuge portiert werden kann. So nutzt nun auch Google selbst standardmäßig Werkzeuge auf Basis von GCC zum Bauen von Lyra unter Linux statt wie bisher Clang. Das dürfte die Wiederverwendung von Lyra durch Dritte ebenfalls deutlich vereinfachen oder überhaupt erst ermöglichen. Bisher ist Lyra vor allem für die Nutzung in Android gedacht.

Erstmals vorgestellt hatte Google Lyra im Februar dieses Jahres und anschließend größtenteils offengelegt. Das Besondere dabei ist, dass der Codec auf KI-Technik und Machine Learning basiert, weshalb der Hersteller selbst das Projekt auch als "revolutionären neuen Audio-Codec" beschrieb. Lyra ermöglicht eine Codierung von Sprache noch mit 3 KBit/s.

Der Codec basiert auf der Idee klassischer Vocoder. Das heißt, die zu übertragende Sprachaufnahme wird nicht als Wellenform komprimiert wie etwa in Opus. Stattdessen wird die Sprache in kleinere Segmente aufgeteilt und wichtige Parameter werden extrahiert, aus denen wiederum am anderen Ende der Verbindung Sprache erzeugt wird. Bei der Verarbeitung setzt Lyra auf Spektrogramme, die das natürliche Hörempfinden von Menschen berücksichtigen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Microsoft
So schalten wir den TPM-Zwang in Windows 11 ab

Windows 11 kann auf vielen Geräten ohne TPM 2.0 und Secureboot nicht installiert werden. Wir zeigen eine Möglichkeit, wie das doch klappt.
Von Oliver Nickel

Microsoft: So schalten wir den TPM-Zwang in Windows 11 ab
Artikel
  1. Microsoft: Windows 10 wird ungewollte Apps standardmäßig blocken
    Microsoft
    Windows 10 wird ungewollte Apps standardmäßig blocken

    Der zuverlässigkeitsbasierte Schutz soll Windows 10 vor schlecht optimierten Apps warnen. Das wird künftig standardmäßig aktiviert sein.

  2. Connect-App: CDU zeigt offenbar Hackerin nach Melden von Lücken an
    Connect-App  
    CDU zeigt offenbar Hackerin nach Melden von Lücken an

    Nach dem Auffinden einer Lücke in einer CDU-App zeigt die Partei nun die Finderin an. Der CCC will deshalb keine Lücken mehr an die CDU melden.

  3. Super Duper Secure Mode: Microsoft testet radikalen Security-Ansatz in Edge
    Super Duper Secure Mode
    Microsoft testet radikalen Security-Ansatz in Edge

    Für einen experimentellen sicheren Modus kann der JIT-Compiler in Edge deaktiviert werden. Das ermöglicht weitere Security-Technik.

M.P. 29. Jun 2021 / Themenstart

Neben der Senkung der Bandbreite ist doch sicherlich auch der "Fußabdruck" in dem Gerät...

M.P. 29. Jun 2021 / Themenstart

... hat Profile mit Bitraten von bis herab zu 4,8 kBit/s... 3 kBit/s sind da noch einmal...

Kommentieren



Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Schnäppchen • Fire TV Stick 4K Ultra HD 29,99€, Echo Dot 3. Gen. 24,99€ • Robas Lund DX Racer Gaming-Stuhl 154,65€ • HyperX Cloud II Gaming-Headset 59€ • Media Markt Breaking Deals [Werbung]
    •  /