Abo
  • Services:
Anzeige
Baidu gibt seinen Code für CTC frei.
Baidu gibt seinen Code für CTC frei. (Bild: Flickr.com, simone.brunozzi/CC-BY-SA 2.0)

Neuronale Netze: Baidu veröffentlicht Trainingscode zur Spracherkennung

Baidu gibt seinen Code für CTC frei.
Baidu gibt seinen Code für CTC frei. (Bild: Flickr.com, simone.brunozzi/CC-BY-SA 2.0)

Die Forschungsabteilung von Baidu gibt Code auf Github frei, mit dem neuronale Netze für Spracherkennung trainiert werden. Das formale Konzept dahinter nutzt auch Google in seiner Sprachsuche, weil es besser als bisher verwendete Modelle funktioniert.

Mit Hilfe der Connectionist Temporal Classification (CTC) kann maschinelles Lernen auf sequenziellen Daten so durchgeführt werden, dass es keine strikte Zuordnung von Eingabedaten zur eigentlichen Bezeichnung oder Bedeutung geben muss. Die Forschungsabteilung des chinesischen Suchmaschinenanbieters Baidu hat ihre Implementierung von CTC auf Github unter der Apache-Lizenz veröffentlicht.

Anzeige

Eigenen Aussagen zufolge nutzt das Labor für künstliche Intelligenz (AI Lab) von Baidu den nun verfügbaren Code, um Systeme in der Spracherkennung zu trainieren. Der CTC-Ansatz soll dabei wesentlich schneller verwertbare Ergebnisse liefern als das bisher in der Spracherkennung vielfach genutzte Hidden Markov Model (HMM). Als Sprachdaten nutzt Baidu Aufnahmen aus Englisch und Mandarin zum Training.

CTC bereits produktiv im Einsatz

Auch Google verwendet CTC für die Analyse bei der Sprachsuche seiner Google-App. In der Beschreibung dazu heißt es, dass im Vergleich zu herkömmlichen Modellen längere Audiodaten analysiert werden können, dabei aber weniger Rechenaufwand nötig sei. Dadurch funktioniere die eigentliche Spracherkennung schneller.

Der von Baidu freigegebene Code ist darauf ausgelegt, CTC selbst möglichst stark zu beschleunigen. Dazu haben die Beteiligten den Algorithmus parallelisiert und neben Code, der auf der CPU läuft, auch eine CUDA-Implementierung erstellt, die auf die Ausführung auf GPUs optimiert ist. Laut Baidu ist der Code zudem schneller als andere zurzeit frei verfügbare Implementierungen.


eye home zur Startseite
Kleba 19. Jan 2016

Finde ich auch spannend. Dazu passen veröffentlicht Yahoo Trainingsdaten für maschinelles...

Ass Bestos 18. Jan 2016

also was mit spracherkennung alles möglich ist, welche initaiven es gibt usw usf ...



Anzeige

Stellenmarkt
  1. T-Systems International GmbH, Leinfelden-Echterdingen
  2. WKM GmbH, München
  3. MEMMERT GmbH + Co. KG, Schwabach (Metropolregion Nürnberg)
  4. Werner Sobek Group GmbH, Stuttgart


Anzeige
Hardware-Angebote
  1. 543,73€
  2. 1.029,00€ + 5,99€ Versand

Folgen Sie uns
       


  1. Service

    Telekom verspricht kürzeres Warten auf Techniker

  2. BVG

    Fast alle U-Bahnhöfe mit offenem WLAN

  3. Android-Apps

    Rechtemissbrauch erlaubt unsichtbare Tastaturmitschnitte

  4. Electro Fluidic Technology

    Schnelles E-Paper-Display für Video-Anwendungen

  5. Heiko Maas

    "Kein Wunder, dass Facebook seine Vorgaben geheim hält"

  6. Virtual Reality

    Oculus Rift unterstützt offiziell Roomscale-VR

  7. FTP-Client

    Filezilla bekommt ein Master Password

  8. Künstliche Intelligenz

    Apple arbeitet offenbar an eigenem AI-Prozessor

  9. Die Woche im Video

    Verbogen, abgehoben und tiefergelegt

  10. ZTE

    Chinas großes 5G-Testprojekt läuft weiter



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Blackberry Keyone im Test: Tolles Tastatur-Smartphone hat zu kurze Akkulaufzeit
Blackberry Keyone im Test
Tolles Tastatur-Smartphone hat zu kurze Akkulaufzeit
  1. Blackberry Keyone kommt Mitte Mai
  2. Keyone Blackberrys neues Tastatur-Smartphone kommt später

The Surge im Test: Frust und Feiern in der Zukunft
The Surge im Test
Frust und Feiern in der Zukunft
  1. Computerspiele und Psyche Wie Computerspieler zu Süchtigen erklärt werden sollen
  2. Wirtschaftssimulation Pizza Connection 3 wird gebacken
  3. Mobile-Games-Auslese Untote Rundfahrt und mobiles Seemannsgarn

Vernetzte Hörgeräte und Hearables: Ich filter mir die Welt widdewiddewie sie mir gefällt
Vernetzte Hörgeräte und Hearables
Ich filter mir die Welt widdewiddewie sie mir gefällt
  1. Polar Fitnesstracker A370 mit Tiefschlaf- und Pulsmessung
  2. The Dash Pro Bragis Drahtlos-Ohrstöpsel können jetzt auch übersetzen
  3. Beddit Apple kauft Schlaf-Tracker-Hersteller

  1. Re: Wieder mal ein Sinnloser Artikel.

    Andreas_B | 12:22

  2. Re: Erster!!!

    Andreas_B | 12:18

  3. Re: Siri und diktieren

    stiGGG | 12:01

  4. Re: bitte klär mich jemand nochmal auf...

    kazhar | 12:00

  5. AI-Prozessor =

    casual_keks | 11:48


  1. 12:31

  2. 12:15

  3. 11:33

  4. 10:35

  5. 12:54

  6. 12:41

  7. 11:44

  8. 11:10


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel