Abo
  • Services:
Anzeige
Baidu gibt seinen Code für CTC frei.
Baidu gibt seinen Code für CTC frei. (Bild: Flickr.com, simone.brunozzi/CC-BY-SA 2.0)

Neuronale Netze: Baidu veröffentlicht Trainingscode zur Spracherkennung

Baidu gibt seinen Code für CTC frei.
Baidu gibt seinen Code für CTC frei. (Bild: Flickr.com, simone.brunozzi/CC-BY-SA 2.0)

Die Forschungsabteilung von Baidu gibt Code auf Github frei, mit dem neuronale Netze für Spracherkennung trainiert werden. Das formale Konzept dahinter nutzt auch Google in seiner Sprachsuche, weil es besser als bisher verwendete Modelle funktioniert.

Mit Hilfe der Connectionist Temporal Classification (CTC) kann maschinelles Lernen auf sequenziellen Daten so durchgeführt werden, dass es keine strikte Zuordnung von Eingabedaten zur eigentlichen Bezeichnung oder Bedeutung geben muss. Die Forschungsabteilung des chinesischen Suchmaschinenanbieters Baidu hat ihre Implementierung von CTC auf Github unter der Apache-Lizenz veröffentlicht.

Anzeige

Eigenen Aussagen zufolge nutzt das Labor für künstliche Intelligenz (AI Lab) von Baidu den nun verfügbaren Code, um Systeme in der Spracherkennung zu trainieren. Der CTC-Ansatz soll dabei wesentlich schneller verwertbare Ergebnisse liefern als das bisher in der Spracherkennung vielfach genutzte Hidden Markov Model (HMM). Als Sprachdaten nutzt Baidu Aufnahmen aus Englisch und Mandarin zum Training.

CTC bereits produktiv im Einsatz

Auch Google verwendet CTC für die Analyse bei der Sprachsuche seiner Google-App. In der Beschreibung dazu heißt es, dass im Vergleich zu herkömmlichen Modellen längere Audiodaten analysiert werden können, dabei aber weniger Rechenaufwand nötig sei. Dadurch funktioniere die eigentliche Spracherkennung schneller.

Der von Baidu freigegebene Code ist darauf ausgelegt, CTC selbst möglichst stark zu beschleunigen. Dazu haben die Beteiligten den Algorithmus parallelisiert und neben Code, der auf der CPU läuft, auch eine CUDA-Implementierung erstellt, die auf die Ausführung auf GPUs optimiert ist. Laut Baidu ist der Code zudem schneller als andere zurzeit frei verfügbare Implementierungen.


eye home zur Startseite
Kleba 19. Jan 2016

Finde ich auch spannend. Dazu passen veröffentlicht Yahoo Trainingsdaten für maschinelles...

Ass Bestos 18. Jan 2016

also was mit spracherkennung alles möglich ist, welche initaiven es gibt usw usf ...



Anzeige

Stellenmarkt
  1. IFS Deutschland GmbH & Co. KG, Erlangen
  2. MediaMarktSaturn IT Solutions, München
  3. beauty alliance Deutschland GmbH & Co. KG, Bielefeld
  4. Fresenius Medical Care Deutschland GmbH, Bad Homburg


Anzeige
Spiele-Angebote
  1. 15,99€
  2. 1,99€
  3. 23,99€

Folgen Sie uns
       


  1. Super Mario Run

    Nintendo bleibt trotz Enttäuschung beim Bezahlmodell

  2. Samsung

    Galaxy Note 7 wird per Update endgültig lahmgelegt

  3. The Ringed City

    From Software zeigt Abschluss von Dark Souls 3 im Trailer

  4. Dieter Lauinger

    Minister fordert Gesetz gegen Hasskommentare noch vor Wahl

  5. Die Woche im Video

    Cebit wird heiß, Android wird neu, Aliens werden gesprächig

  6. Mobilfunkausrüster

    Welche Frequenzen für 5G in Deutschland diskutiert werden

  7. XMPP

    Bundesnetzagentur will hundert Jabber-Clients regulieren

  8. Synlight

    Wie der Wasserstoff aus dem Sonnenlicht kommen soll

  9. Pietsmiet

    "Alle Twitch-Kanäle sind kostenpflichtiger Rundfunk"

  10. Apache-Lizenz 2.0

    OpenSSL plant Lizenzwechsel an der Community vorbei



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Videostreaming im Zug: Maxdome umwirbt Bahnfahrer bei Tempo 230
Videostreaming im Zug
Maxdome umwirbt Bahnfahrer bei Tempo 230
  1. USA Google will Kabelfernsehen über Youtube streamen
  2. Verband DVD-Verleih in Deutschland geht wegen Netflix zurück
  3. Nintendo Vorerst keine Videostreaming-Apps auf Switch

Buch - Apple intern: "Die behandeln uns wie Sklaven"
Buch - Apple intern
"Die behandeln uns wie Sklaven"
  1. Übernahme Apple kauft iOS-Automatisierungs-Tool Workflow
  2. Instandsetzung Apple macht iPhone-Reparaturen teurer
  3. Earbuds mit Sensor Apple beantragt Patent auf biometrische Kopfhörer

Lithium-Akkus: Durchbruch verzweifelt gesucht
Lithium-Akkus
Durchbruch verzweifelt gesucht
  1. Super MCharge Smartphone-Akku in 20 Minuten voll geladen
  2. Brandgefahr HP ruft über 100.000 Notebook-Akkus zurück
  3. Brandgefahr Akku mit eingebautem Feuerlöscher

  1. Re: "Ein Träumchen!"

    Ach | 18:16

  2. Re: P2W

    crazypsycho | 18:14

  3. Re: Die Stunde für Lexus

    ArcherV | 18:14

  4. Online Gängelung

    datenmuell | 18:13

  5. Re: Ich nutze 100GB auf meiner 2Mbit DSL Leitung

    JouMxyzptlk | 18:13


  1. 15:20

  2. 14:13

  3. 12:52

  4. 12:39

  5. 09:03

  6. 17:45

  7. 17:32

  8. 17:11


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel