• IT-Karriere:
  • Services:

Lyra: Google legt extrem effizienten Sprachcodec offen

Mit Lyra soll sich Sprache bei nur 3 kbit/s kodieren lassen. Die Technik dazu von Google ist nun Open Source.

Artikel veröffentlicht am ,
Das Logo von Lyra ist einen Stimmgabel.
Das Logo von Lyra ist einen Stimmgabel. (Bild: Pixabay)

Google hat den auf KI-Technik und Machine-Learning aufbauenden Sprachcodec Lyra als Open Source veröffentlicht. Den Lyra-Codec selbst hatte das Unternehmen bereits im Februar dieses Jahres vorgestellt und diesen als "revolutionären neuen Audio-Codec" beschrieben, mit dem sich qualitativ hochwertige Anrufe umsetzen lassen sollen. Tatsächlich ermöglicht Lyra eine Kodierung von Sprache noch mit 3 kbit/s.

Stellenmarkt
  1. PROSOZ Herten GmbH, Herten (Ruhrgebiet)
  2. operational services GmbH & Co. KG, Frankfurt am Main, Hamburg, München

Der als Open-Source-Software verfügbare Code zur Nutzung enthält die notwendigen Werkzeuge, um selbst Sprache mit Lyra zu kodieren sowie zu dekodieren. Der Code ist dabei für 64-Bit-ARM-Plattformen optimiert, also etwa Smartphones. Außerdem wird zur Entwicklung Linux genutzt. Das Team von Lyra hofft aber auch, den Codec künftig plattformübergreifend umsetzen zu können.

Der Code ist in C++ geschrieben und nutzt sowohl Googles Build-Tool Bazel als auch die eigene C++-Bibliothek Abseil. Die Kern-API ermöglicht das En- und Decoding ganzer Dateien oder als Pakete. Darüber hinaus bietet Google auch Filter und diverse Transformationsfunktionen zur Signalverarbeitung.

Es gibt auch eine Beispiel-App, die die Nutzung zusammen mit dem Android-NDK demonstriert. Das Team weist außerdem darauf hin, dass ein kleiner Teil des Codes für mathematische Funktionen derzeit noch nicht frei verfügbar ist. Diese Bibliothek soll ebenfalls als Open Source nachgeliefert werden. Der restliche Open-Source-Code findet sich auf Github.

Lyra ist ein KI-Codec

Lyra basiert auf der Idee klassischer Vocoder. Das heißt, die zu übertragende Sprachaufnahme wird nicht als Wellenform komprimiert wie etwa in Opus. Stattdessen wird die Sprache in kleinere Segmente aufgeteilt und wichtige Parameter werden extrahiert, aus denen wiederum am anderen Ende der Verbindung Sprache erzeugt wird.

Bei der Verarbeitung setzt Lyra auf Spektrogramme, die das natürliche Hörempfinden von Menschen berücksichtigen. Bei der Erzeugung nutzt Lyra ein KI-Modell, das eine leicht abgewandelte Form von Deepminds Wavenet ist und auch in vertretbarer Geschwindigkeit auf Smartphones laufen soll.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Top-Angebote
  1. (u. a. Crusader Kings 3 für 35,99€, Elite Dangerous für 5,99€, Dead Island - Definitive...
  2. 3.999€ (statt 4.699€)
  3. 74,99€ (Bestpreis)
  4. 249€ (Bestpreis)

SIRprise 08. Apr 2021 / Themenstart

Eine Anwendungsmöglichkeit wären auch Unterwasserverbindungen (z.B. mit Ubooten oder...

Eheran 08. Apr 2021 / Themenstart

Wird leider irgendwie nicht angesprochen. Einen Film oder ein Musikvideo komprimiert...

486dx4-160 08. Apr 2021 / Themenstart

Schade dass ein Vergleich mit Codec2 (siehe https://de.wikipedia.org/wiki/Codec2) fehlt...

Tockra 08. Apr 2021 / Themenstart

@Schattenwerk Wollte mich gerade bedanken, dann kommst du mit "vorkauen". Dann war mir...

Kommentieren


Folgen Sie uns
       


Sega Mega Drive (1990) - Golem retro_

Mit Mega-Power sagte Sega 1990 der Konkurrenz den Kampf an. Im Golem retro_ holen wir uns die Spielhalle nach Hause.

Sega Mega Drive (1990) - Golem retro_ Video aufrufen
Programm für IT-Jobeinstieg: Hoffen auf den Klebeeffekt
Programm für IT-Jobeinstieg
Hoffen auf den Klebeeffekt

Aktuell ist der Jobeinstieg für junge Ingenieure und Informatiker schwer. Um ihnen zu helfen, hat das Land Baden-Württemberg eine interessante Idee: Es macht sich selbst zur Zeitarbeitsfirma.
Ein Bericht von Peter Ilg

  1. Arbeitszeit Das Sechs-Stunden-Experiment bei Sipgate
  2. Neuorientierung im IT-Job Endlich mal machen!
  3. IT-Unternehmen Die richtige Software für ein Projekt finden

Weclapp-CTO Ertan Özdil: Wir dürfen nicht in Schönheit und Perfektion untergehen!
Weclapp-CTO Ertan Özdil
"Wir dürfen nicht in Schönheit und Perfektion untergehen!"

Der CTO von Weclapp träumt von smarter Software, die menschliches Eingreifen in der nächsten ERP-Generation reduziert. Deutschen Perfektionismus hält Ertan Özdil aber für gefährlich.
Ein Interview von Maja Hoock


    Fiat 500 als E-Auto im Test: Kleinstwagen mit großem Potenzial
    Fiat 500 als E-Auto im Test
    Kleinstwagen mit großem Potenzial

    Fiat hat einen neuen 500er entwickelt. Der Kleine fährt elektrisch - und zwar richtig gut.
    Ein Test von Peter Ilg

    1. Vierradlenkung Elektrischer GMC Hummer SUV fährt im Krabbengang seitwärts
    2. MG Cyberster MG B Roadster mit Lasergürtel und Union Jack
    3. Elektroauto E-Auto-Prämie übersteigt in 2021 schon Vorjahressumme

      •  /