Lyra: Google legt extrem effizienten Sprachcodec offen

Mit Lyra soll sich Sprache bei nur 3 kbit/s kodieren lassen. Die Technik dazu von Google ist nun Open Source.

Artikel veröffentlicht am ,
Das Logo von Lyra ist einen Stimmgabel.
Das Logo von Lyra ist einen Stimmgabel. (Bild: Pixabay)

Google hat den auf KI-Technik und Machine-Learning aufbauenden Sprachcodec Lyra als Open Source veröffentlicht. Den Lyra-Codec selbst hatte das Unternehmen bereits im Februar dieses Jahres vorgestellt und diesen als "revolutionären neuen Audio-Codec" beschrieben, mit dem sich qualitativ hochwertige Anrufe umsetzen lassen sollen. Tatsächlich ermöglicht Lyra eine Kodierung von Sprache noch mit 3 kbit/s.

Der als Open-Source-Software verfügbare Code zur Nutzung enthält die notwendigen Werkzeuge, um selbst Sprache mit Lyra zu kodieren sowie zu dekodieren. Der Code ist dabei für 64-Bit-ARM-Plattformen optimiert, also etwa Smartphones. Außerdem wird zur Entwicklung Linux genutzt. Das Team von Lyra hofft aber auch, den Codec künftig plattformübergreifend umsetzen zu können.

Der Code ist in C++ geschrieben und nutzt sowohl Googles Build-Tool Bazel als auch die eigene C++-Bibliothek Abseil. Die Kern-API ermöglicht das En- und Decoding ganzer Dateien oder als Pakete. Darüber hinaus bietet Google auch Filter und diverse Transformationsfunktionen zur Signalverarbeitung.

Es gibt auch eine Beispiel-App, die die Nutzung zusammen mit dem Android-NDK demonstriert. Das Team weist außerdem darauf hin, dass ein kleiner Teil des Codes für mathematische Funktionen derzeit noch nicht frei verfügbar ist. Diese Bibliothek soll ebenfalls als Open Source nachgeliefert werden. Der restliche Open-Source-Code findet sich auf Github.

Lyra ist ein KI-Codec

Lyra basiert auf der Idee klassischer Vocoder. Das heißt, die zu übertragende Sprachaufnahme wird nicht als Wellenform komprimiert wie etwa in Opus. Stattdessen wird die Sprache in kleinere Segmente aufgeteilt und wichtige Parameter werden extrahiert, aus denen wiederum am anderen Ende der Verbindung Sprache erzeugt wird.

Bei der Verarbeitung setzt Lyra auf Spektrogramme, die das natürliche Hörempfinden von Menschen berücksichtigen. Bei der Erzeugung nutzt Lyra ein KI-Modell, das eine leicht abgewandelte Form von Deepminds Wavenet ist und auch in vertretbarer Geschwindigkeit auf Smartphones laufen soll.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Eheran 09. Apr 2021

Was meinst du?

SIRprise 08. Apr 2021

Eine Anwendungsmöglichkeit wären auch Unterwasserverbindungen (z.B. mit Ubooten oder...

Eheran 08. Apr 2021

Wird leider irgendwie nicht angesprochen. Einen Film oder ein Musikvideo komprimiert...

486dx4-160 08. Apr 2021

Schade dass ein Vergleich mit Codec2 (siehe https://de.wikipedia.org/wiki/Codec2) fehlt...



Aktuell auf der Startseite von Golem.de
Lego-kompatibel
Klemmbaustein mit Display zeigt künstlichen Horizont

Der kleine, Lego-kompatible Klemmbaustein hat ein kleines Display eingebaut, auf dem ein funktionierender künstlicher Horizont läuft.

Lego-kompatibel: Klemmbaustein mit Display zeigt künstlichen Horizont
Artikel
  1. BUND: Kritik an THG-Quote und kostenlosen E-Parkplätzen
    BUND
    Kritik an THG-Quote und kostenlosen E-Parkplätzen

    Nach Ansicht von Umweltschützern ist die THG-Prämie kontraproduktiv. Und kostenlose Parkplätze für Elektroautos schafften falsche Anreize.

  2. E-Fuels: Kommt die elektronische Betankungsüberwachung?
    E-Fuels
    Kommt die elektronische Betankungsüberwachung?

    Offenbar will die EU-Kommission der FDP in Sachen E-Fuels entgegenkommen. Künftig könnten Autos bei falsch getanktem Sprit stehenbleiben.

  3. Gegen Handelsblockade: Neue Freiheit für Chinas Halbleiterbranche
    Gegen Handelsblockade
    Neue Freiheit für Chinas Halbleiterbranche

    China fehlt der Chip-Nachschub aus Taiwan, mit mehr Freiheit für heimische Hersteller will die Regierung gegensteuern. Ein Manager hat seine Freiheit aber offenbar verloren.
    Eine Analyse von Johannes Hiltscher

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • NBB Black Weeks: Rabatte bis 60% • PS5 + Resident Evil 4 Remake 569€ • LG OLED TV -57% • WD SSD 2TB (PS5) 167,90€ • MindStar: Ryzen 9 7900X3D 625€ • Amazon Coupon-Party • Gainward RTX 3090 1.206€ • Samsung ext. SSD 2TB 159,90€ • Neue RAM-Tiefstpreise • Bosch Professional [Werbung]
    •  /