• IT-Karriere:
  • Services:

Spracherkennung: Google mischt Sprachdaten für bessere Erkennung

Googles KI-Team hat erstmals viele verschiedene Sprachdaten zusammen zum Training eines Modells verwendet. Das Ergebnis überzeugt.

Artikel veröffentlicht am ,
Mit Speechstew zeigen Google-Forscher, wie Spracherkennung verbessert werden kann.
Mit Speechstew zeigen Google-Forscher, wie Spracherkennung verbessert werden kann. (Bild: Oriental Image via Reuters Connect)

Ein Team aus Googles Forschungs- und Brain-Abteilungen hat eigenen Angaben zufolge "alle" derzeit verfügbaren Ausgangsdaten zur Spracherkennung genutzt, um daraus ein einziges riesiges neuronales Netz zu trainieren. Dies berichtet das Magazin Venture Beat. Das Ergebnis erreiche in Bezug auf die Spracherkennung Werte, die mit anderen an vielen Details verbesserten Modellen mithalten könnten.

Stellenmarkt
  1. EPLAN Software & Service GmbH u. Co. KG, Langenfeld (Rheinland)
  2. Hays AG, Berlin

Oft werden Modelle zur Spracherkennung lediglich mit einem Satz von Ausgangsdaten trainiert, da diese etwa in Bezug auf ihre Annotation und vor allem Sprachqualität häufig sehr homogen sind. Das vereinfacht letztlich auch die Arbeit mit den Daten und das Optimieren eines Modells. Im Fall des nun vorgestellten Modells Speechstew, was so viel bedeutet wie Sprecheintopf, entschieden sich die beteiligten Forscher jedoch für einen gänzlich anderen Ansatz.

Den Angaben zufolge wurden für Speechstew die Sprachdaten aus folgenden Korpora für gesprochene Sprache kombiniert: "AMI, Broadcast News, Mozilla Common Voice, Librispeech, Switchboard/Fisher, Tedlium, und Wall Street Journal". Diese seien schlicht vermischt worden, ohne einzelne Bestandteile speziell zu gewichten oder aufeinander abzustimmen. Die Daten umfassen zusammen mehr als 5.000 Stunden annotierte Sprachdaten.

Spracherkennung übertrifft klassische Modelle

Laut den Aussagen des Teams erreicht Speechstew in einigen Benchmarks wie erwähnt die Spracherkennung anderer moderner Systeme oder übertrifft diese teils sogar. Darüber hinaus soll das Modell in der Lage dazu sein, sich an unterschiedliche Aufgaben anzupassen. Dazu reichten vergleichsweise wenige zusätzliche Ausgangsdaten, um letztlich die Ergebnisse von speziell trainierten und angepassten Modellen zu erreichen. Das dürfte auf die breite Vielfalt der gewählten Ausgangsdaten zurückzuführen sein.

Auf Nachfrage von Venture Beat zur praktischen Anwendung dieser Erkenntnisse antworten die beteiligten Forscher zurückhaltend. Möglicherweise seien Arbeiten wie Speechstew aber künftig als eine Art allgemein einsetzbares Modell nutzbar, das als Grundlage für weitere spezialisierte Aufgaben der Spracherkennung diene.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Spiele-Angebote
  1. 6,99€
  2. für PC, PS4/PS5, Xbox und Switch
  3. 6,99€

PCQ 17. Apr 2021 / Themenstart

Als ich als studentische Hilfskraft 2009 noch oldschool mit C++ die Vorverarbeitung und...

Kommentieren


Folgen Sie uns
       


Der Konsolen-PC - Fazit

Seit es AMDs RDNA-2-Grafikkarten gibt, kann eine Next-Gen-Konsole leicht nachgebaut werden. Wir schauen, was es dazu braucht und ob der Konsolen-PC etwas taugt.

Der Konsolen-PC - Fazit Video aufrufen
Programm für IT-Jobeinstieg: Hoffen auf den Klebeeffekt
Programm für IT-Jobeinstieg
Hoffen auf den Klebeeffekt

Aktuell ist der Jobeinstieg für junge Ingenieure und Informatiker schwer. Um ihnen zu helfen, hat das Land Baden-Württemberg eine interessante Idee: Es macht sich selbst zur Zeitarbeitsfirma.
Ein Bericht von Peter Ilg

  1. Arbeitszeit Das Sechs-Stunden-Experiment bei Sipgate
  2. Neuorientierung im IT-Job Endlich mal machen!
  3. IT-Unternehmen Die richtige Software für ein Projekt finden

Weclapp-CTO Ertan Özdil: Wir dürfen nicht in Schönheit und Perfektion untergehen!
Weclapp-CTO Ertan Özdil
"Wir dürfen nicht in Schönheit und Perfektion untergehen!"

Der CTO von Weclapp träumt von smarter Software, die menschliches Eingreifen in der nächsten ERP-Generation reduziert. Deutschen Perfektionismus hält Ertan Özdil aber für gefährlich.
Ein Interview von Maja Hoock


    Fiat 500 als E-Auto im Test: Kleinstwagen mit großem Potenzial
    Fiat 500 als E-Auto im Test
    Kleinstwagen mit großem Potenzial

    Fiat hat einen neuen 500er entwickelt. Der Kleine fährt elektrisch - und zwar richtig gut.
    Ein Test von Peter Ilg

    1. Vierradlenkung Elektrischer GMC Hummer SUV fährt im Krabbengang seitwärts
    2. MG Cyberster MG B Roadster mit Lasergürtel und Union Jack
    3. Elektroauto E-Auto-Prämie übersteigt in 2021 schon Vorjahressumme

      •  /