Lyra: Google legt extrem effizienten Sprachcodec offen

Mit Lyra soll sich Sprache bei nur 3 kbit/s kodieren lassen. Die Technik dazu von Google ist nun Open Source.

Artikel veröffentlicht am ,
Das Logo von Lyra ist einen Stimmgabel.
Das Logo von Lyra ist einen Stimmgabel. (Bild: Pixabay)

Google hat den auf KI-Technik und Machine-Learning aufbauenden Sprachcodec Lyra als Open Source veröffentlicht. Den Lyra-Codec selbst hatte das Unternehmen bereits im Februar dieses Jahres vorgestellt und diesen als "revolutionären neuen Audio-Codec" beschrieben, mit dem sich qualitativ hochwertige Anrufe umsetzen lassen sollen. Tatsächlich ermöglicht Lyra eine Kodierung von Sprache noch mit 3 kbit/s.

Stellenmarkt
  1. Mitarbeiter*innen (m/w/d) im Prozessmanagement
    Landratsamt Reutlingen, Reutlingen
  2. Supplier / Vendor Governance Expert (m/w/d)
    ALDI International Services SE & Co. oHG, Mülheim
Detailsuche

Der als Open-Source-Software verfügbare Code zur Nutzung enthält die notwendigen Werkzeuge, um selbst Sprache mit Lyra zu kodieren sowie zu dekodieren. Der Code ist dabei für 64-Bit-ARM-Plattformen optimiert, also etwa Smartphones. Außerdem wird zur Entwicklung Linux genutzt. Das Team von Lyra hofft aber auch, den Codec künftig plattformübergreifend umsetzen zu können.

Der Code ist in C++ geschrieben und nutzt sowohl Googles Build-Tool Bazel als auch die eigene C++-Bibliothek Abseil. Die Kern-API ermöglicht das En- und Decoding ganzer Dateien oder als Pakete. Darüber hinaus bietet Google auch Filter und diverse Transformationsfunktionen zur Signalverarbeitung.

Es gibt auch eine Beispiel-App, die die Nutzung zusammen mit dem Android-NDK demonstriert. Das Team weist außerdem darauf hin, dass ein kleiner Teil des Codes für mathematische Funktionen derzeit noch nicht frei verfügbar ist. Diese Bibliothek soll ebenfalls als Open Source nachgeliefert werden. Der restliche Open-Source-Code findet sich auf Github.

Lyra ist ein KI-Codec

Golem Akademie
  1. C++ Programmierung Basics: virtueller Fünf-Tage-Workshop
    28. Februar–4. März 2022, virtuell
  2. PowerShell Praxisworkshop: virtueller Vier-Tage-Workshop
    21.–24. Februar 2022, virtuell
Weitere IT-Trainings

Lyra basiert auf der Idee klassischer Vocoder. Das heißt, die zu übertragende Sprachaufnahme wird nicht als Wellenform komprimiert wie etwa in Opus. Stattdessen wird die Sprache in kleinere Segmente aufgeteilt und wichtige Parameter werden extrahiert, aus denen wiederum am anderen Ende der Verbindung Sprache erzeugt wird.

Bei der Verarbeitung setzt Lyra auf Spektrogramme, die das natürliche Hörempfinden von Menschen berücksichtigen. Bei der Erzeugung nutzt Lyra ein KI-Modell, das eine leicht abgewandelte Form von Deepminds Wavenet ist und auch in vertretbarer Geschwindigkeit auf Smartphones laufen soll.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Eheran 09. Apr 2021

Was meinst du?

SIRprise 08. Apr 2021

Eine Anwendungsmöglichkeit wären auch Unterwasserverbindungen (z.B. mit Ubooten oder...

Eheran 08. Apr 2021

Wird leider irgendwie nicht angesprochen. Einen Film oder ein Musikvideo komprimiert...

486dx4-160 08. Apr 2021

Schade dass ein Vergleich mit Codec2 (siehe https://de.wikipedia.org/wiki/Codec2) fehlt...

Tockra 08. Apr 2021

@Schattenwerk Wollte mich gerade bedanken, dann kommst du mit "vorkauen". Dann war mir...



Aktuell auf der Startseite von Golem.de
Giga Factory Berlin
Tesla kauft Bahngleis in Brandenburg

Tesla will sein neues Werk in Grünheide besser an den öffentlichen Nahverkehr anbinden und kauft ein Schienenstück für einen eigenen Zug.

Giga Factory Berlin: Tesla kauft Bahngleis in Brandenburg
Artikel
  1. 5.000 Dollar Belohnung: Elon Musk wollte Twitter-Konto von 19-Jährigem stilllegen
    5.000 Dollar Belohnung
    Elon Musk wollte Twitter-Konto von 19-Jährigem stilllegen

    Tesla-Chef Elon Musk bot einem US-Teenager jüngst angeblich 5.000 US-Dollar, damit der seinen auf Twitter betriebenen Flight-Tracker einstellt.

  2. Wiz Squire und Hero im Test: Smart-Home-Lampen mit ein paar Schwächen zu viel
    Wiz Squire und Hero im Test
    Smart-Home-Lampen mit ein paar Schwächen zu viel

    Eine der beiden Wiz-Lampen strahlt gleichzeitig nach oben und nach unten. Schöne Idee, doch leider klappt bei der Smart-Home-Steuerung einiges nicht.
    Ein Test von Ingo Pakalski

  3. Naomi SexyCyborg Wu: Pappbüste einer Tech-Youtuberin ist Youtube zu anstößig
    Naomi "SexyCyborg" Wu
    Pappbüste einer Tech-Youtuberin ist Youtube zu anstößig

    Naomi Wu wird in der Maker-Szene für ihr Fachwissen geschätzt. Youtube demonetarisiert sie aber wohl wegen ihrer Körperproportionen.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • iPhone 13 Pro 128GB 1.041,25€ • RTX 3080 12GB 1.539€ • DXRacer Gaming-Stuhl 159€ • LG OLED 55 Zoll 1.149€ • PS5 Digital mit o2-Vertrag bestellbar • Prime-Filme für je 0,99€ leihen • One Plus Nord 2 335€ • Intel i7 3,6Ghz 399€ • Alternate: u.a. Sennheiser Gaming-Headset 169,90€ [Werbung]
    •  /