Mozilla: Deep Speech wird klein und schnell

Die freie Spracherkennung Deep Speech von Mozilla läuft in der aktuellen Version 0.6 auch auf wenig leistungsfähigen Chips in Echtzeit. Darüber hinaus hat das Team das Modell weiter deutlich verkleinert.

Artikel veröffentlicht am , /Ulrich Bantle/Linux Magazin
Die Spracherkennung von Mozilla steht in Version 0.6 bereit. (Symbolbild)
Die Spracherkennung von Mozilla steht in Version 0.6 bereit. (Symbolbild) (Bild: istolethetv, flickr.com/CC-BY 2.0)

Mozilla arbeitet seit rund zwei Jahren an der freien Spracherkennung Deep Speech und hat nun Version 0.6 des Systems vorgestellt. Laut der Ankündigung auf dem Hacks-Entwicklerblog wird Deep Speech "schnell, schlank und allgegenwärtig". Die wichtigsten Neuerungen der Version sind demnach Leistungsverbesserungen.

Anwendungs-Entwickler seien dadurch nicht mehr gezwungen, ihre Systeme für Deep Speech fein anzupassen. Der neue Streaming Decoder stelle in diesem Zusammenhang den größten Fortschritt dar. Er ermögliche einen konsistenten Betrieb mit geringen Latenzen und Speicherverbrauch, egal wie lang das Soundmuster sei, schreibt Entwickler Reuben Morais in dem Blog-Eintrag.

Hinzugekommen sei außerdem die Unterstützung für Tensorflow Lite. Damit verringere sich die Paketgröße von Deep Speech entscheidend. Tensorflow Lite ist speziell auf den Einsatz für Embedded- und mobile Geräte optimiert. Das englische Akustik-Modell von Deep Speech sei damit von 188 auf nur 47 MByte geschrumpft. Die Nutzung von Tensorflow Lite beschleunigt Deep Speech darüber hinaus auch auf Desktop-Systemen. Laut dem Entwickler läuft Deep Speech nun auf nur einem Kern des Raspberry Pi 4 schneller als Echtzeit.

Deep Speech liefert in der aktuellen Version zudem Metadaten und Timing-Informationen über die API aus. Damit seien ausgefeiltere Anwendungen möglich, so Mozilla. Das Upgrade auf Tensorflow 1.14 ermögliche zudem ein deutlich schnelleres Training als bisher, wodurch das Team besser experimentieren könne. Weitere Details liefert die Ankündigung in dem Blog. Das Modell und der Code von Deep Speech finden sich auf Github.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


FreiGeistler 12. Dez 2019

Hmpf! Kaffee kocht der immer noch keinen guten! >:-(

Hotohori 07. Dez 2019

Komisch, unter Win 10 mit Firefox keinerlei Probleme, hat auf Anhieb beides funktioniert.

m9898 07. Dez 2019

Schneller als Echtzeit bedeutet, dass ein System höhere Datenmengen verarbeiten kann als...



Aktuell auf der Startseite von Golem.de
Ungewöhnlicher Kundenservice
Wie ich meine neuen Kopfhörer mit dem Hammer zerschlug

Normalerweise muss man sich in einem Garantiefall nicht dabei filmen, wie man das defekte Produkt zerstört. Ich schon - nur so bekam ich einen Ersatz für meinen Kopfhörer.
Ein Erfahrungsbericht von Tobias Költzsch

Ungewöhnlicher Kundenservice: Wie ich meine neuen Kopfhörer mit dem Hammer zerschlug
Artikel
  1. Deutschland auf Platz 3: Millionen von SSH-Servern anfällig für Terrapin-Angriff
    Deutschland auf Platz 3
    Millionen von SSH-Servern anfällig für Terrapin-Angriff

    Allein in Deutschland gibt es mehr als eine Million über das Internet erreichbare SSH-Server, die nicht gegen Terrapin gepatcht sind.

  2. Festnetz- und Mobilfunk: Telefónica beginnt Massenentlassungen in Spanien
    Festnetz- und Mobilfunk
    Telefónica beginnt Massenentlassungen in Spanien

    Von 16.500 Arbeitsplätzen beim Telefónica-Mutterkonzern soll rund ein Fünftel verschwinden. Der Stellenabbau betrifft vor allem Ältere.

  3. Streamer: Twitch verbietet vorgetäuschte Nacktheit
    Streamer
    Twitch verbietet vorgetäuschte Nacktheit

    Schwarze Balken über der scheinbar nackten Brust? Nicht erlaubt! Selbst wenn Unterwäsche hervorblitzt, verbietet Twitch solche Darstellungen.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Crucial P3 Plus 4 TB + Acronis 194,83€ • MediaMarkt & Saturn: Gutscheinheft mit Rabattaktionen und 3 Games für 49€ • Alternate: Thermaltake-Produkte im Angebot • HP Victus 15.6" 144Hz (i5-13420H, 16 GB, RTX 3050) 777€ • MindStar: Corsair Vengeance RGB 64 GB DDR5-6000 199€ [Werbung]
    •  /