• IT-Karriere:
  • Services:

Lyra: Google stellt extrem effizienten KI-Sprach-Codec vor

Zusammen mit AV1 sollen dank Googles Lyra Videochats bei 56 KBits/s möglich sein.

Artikel veröffentlicht am ,
Google will Lyra in seinem Videochat Duo verteilen, für besonders schlechte Netzverbindungen.
Google will Lyra in seinem Videochat Duo verteilen, für besonders schlechte Netzverbindungen. (Bild: Google)

Das KI-Team von Google hat mit Lyra einen neuen Audio-Codec vorgestellt, der speziell auf die Wiedergabe von Sprache bei extrem geringer Bitrate optimiert ist. Durch die Kombination bestehender Ideen für Audio-Codecs mit modernen KI-Techniken sei die Nutzung von Lyra als Schmalband-Codec bei noch 3 KBit/s möglich.

Stellenmarkt
  1. über duerenhoff GmbH, Raum Ingolstadt
  2. Duravit AG, Hornberg

Lyra soll dabei nicht nur deutlich besser sein als die freien Codecs Speex und Opus, sondern auch besser als bestehende klassische Codecs in Bezug auf Sprachqualität. Google nennt hier explizit das in UMTS beziehungsweise 3G genutzte AMR sowie MELP, das vom US-Militär und der Nato für klassische Funkverbindungen eingesetzt wird. In diesem Bereich gibt es bisher als freie Alternative lediglich den Codec2, der speziell für den Amateurfunk entwickelt wurde, oder das deutlich schlechter klingende Speex.

Ein hoch moderner Vocoder

Konkret nutzt Lyra dabei die Idee klassischer Vocoder. Das heißt, die zu übertragende Sprachaufnahme wird nicht als Wellenform komprimiert, wie etwa in Opus. Stattdessen wird die Sprache in kleinere Segmente aufgeteilt und wichtige Parameter extrahiert, aus denen wiederum am anderen Ende der Verbindung Sprache erzeugt wird. Auf Seite der Verarbeitung setzt Lyra auf Spektrogramme, die das natürliche Hörempfinden von Menschen berücksichtigen.

Auf der Seite der Erzeugung nutzt Lyra ein KI-Modell, das eine leicht abgewandelte Form von Deepminds Wavenet ist und auch in vertretbarer Geschwindigkeit auf Smartphones laufen soll. Die Nutzung von Wavenet soll es außerdem ermöglichen, eine natürlich klingende Sprache zu erzeugen. Einen ähnlichen Ansatz nutzt das von Funkamateuren erstellte FreeDV 2020 mit dem Modell LPCnet, was sich dann sogar noch bei 2 KBit/s oder weniger nutzen lassen soll und so geeignet ist für die Verwendung zum Funken über Kurzwelle.

Googles KI-Team arbeitet seit Jahren an derartigen Techniken zu Spracherzeugung und Codierung und erreichte etwa mit dem Tacotron 2 schon erstaunlich gute Ergebnisse. Die Erkenntnisse dieser Forschung sind nun offenbar in Lyra wieder verwendet worden. Das Modell zur Spracherzeugung in Lyra sei zudem mit den Aufnahmen vieler verschiedener Sprecher in mehr als 70 Sprachen trainiert worden. Das soll Lyra universell einsetzbar machen.

In selbst durchgeführten Tests soll Lyra bei 3 KBit/s deutlich besser abschneiden als Opus bei 6 KBit/s. Das Team von Google zeigt die Leistungsfähigkeit von Lyra in der Ankündigung auch mit Hörbeispielen. Zusammen mit dem ebenfalls sehr effizienten Videocodec AV1 ermögliche Lyra Videoanrufe sogar noch mit einem Modem bei 56 KBit/s. Für besonders schlechte Verbindungen verteilt Google den Codec Lyra bereits in seiner Videochat-Anwendung Duo.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Spiele-Angebote
  1. 11,99€
  2. 9,99€
  3. 23,99€

ikhaya 10. Mär 2021 / Themenstart

Damit kann man es dann in Jitsi und BBB anwenden.

johnsonmonsen 03. Mär 2021 / Themenstart

Hallo Isodome, Das ist doch klar, es ging mir mehr um den Witz bezüglich der...

pgo 02. Mär 2021 / Themenstart

Youtube -> Bode Vocoder 7702 Demonstration

ZerP 02. Mär 2021 / Themenstart

Für angepriesene Videotelefonie reicht dann selbst das nicht mehr. Spricht irgendwie Bände.

ashahaghdsa 02. Mär 2021 / Themenstart

Das ist halt ein Vocoder, also ein reiner Sprachcodec. Und LPCNet ist schon 2 Jahre alt...

Kommentieren


Folgen Sie uns
       


Surface Duo - Fazit

Das Surface Duo ist Microsofts erstes Smartphone seit Jahren - und ein ungewöhnliches dazu. Allerdings ist das Gerät in Deutschland viel zu teuer.

Surface Duo - Fazit Video aufrufen
Programm für IT-Jobeinstieg: Hoffen auf den Klebeeffekt
Programm für IT-Jobeinstieg
Hoffen auf den Klebeeffekt

Aktuell ist der Jobeinstieg für junge Ingenieure und Informatiker schwer. Um ihnen zu helfen, hat das Land Baden-Württemberg eine interessante Idee: Es macht sich selbst zur Zeitarbeitsfirma.
Ein Bericht von Peter Ilg

  1. Arbeitszeit Das Sechs-Stunden-Experiment bei Sipgate
  2. Neuorientierung im IT-Job Endlich mal machen!
  3. IT-Unternehmen Die richtige Software für ein Projekt finden

Weclapp-CTO Ertan Özdil: Wir dürfen nicht in Schönheit und Perfektion untergehen!
Weclapp-CTO Ertan Özdil
"Wir dürfen nicht in Schönheit und Perfektion untergehen!"

Der CTO von Weclapp träumt von smarter Software, die menschliches Eingreifen in der nächsten ERP-Generation reduziert. Deutschen Perfektionismus hält Ertan Özdil aber für gefährlich.
Ein Interview von Maja Hoock


    Fiat 500 als E-Auto im Test: Kleinstwagen mit großem Potenzial
    Fiat 500 als E-Auto im Test
    Kleinstwagen mit großem Potenzial

    Fiat hat einen neuen 500er entwickelt. Der Kleine fährt elektrisch - und zwar richtig gut.
    Ein Test von Peter Ilg

    1. Vierradlenkung Elektrischer GMC Hummer SUV fährt im Krabbengang seitwärts
    2. MG Cyberster MG B Roadster mit Lasergürtel und Union Jack
    3. Elektroauto E-Auto-Prämie übersteigt in 2021 schon Vorjahressumme

      •  /