Abo
  • Services:
Anzeige
Baidu gibt seinen Code für CTC frei.
Baidu gibt seinen Code für CTC frei. (Bild: Flickr.com, simone.brunozzi/CC-BY-SA 2.0)

Neuronale Netze: Baidu veröffentlicht Trainingscode zur Spracherkennung

Baidu gibt seinen Code für CTC frei.
Baidu gibt seinen Code für CTC frei. (Bild: Flickr.com, simone.brunozzi/CC-BY-SA 2.0)

Die Forschungsabteilung von Baidu gibt Code auf Github frei, mit dem neuronale Netze für Spracherkennung trainiert werden. Das formale Konzept dahinter nutzt auch Google in seiner Sprachsuche, weil es besser als bisher verwendete Modelle funktioniert.

Mit Hilfe der Connectionist Temporal Classification (CTC) kann maschinelles Lernen auf sequenziellen Daten so durchgeführt werden, dass es keine strikte Zuordnung von Eingabedaten zur eigentlichen Bezeichnung oder Bedeutung geben muss. Die Forschungsabteilung des chinesischen Suchmaschinenanbieters Baidu hat ihre Implementierung von CTC auf Github unter der Apache-Lizenz veröffentlicht.

Anzeige

Eigenen Aussagen zufolge nutzt das Labor für künstliche Intelligenz (AI Lab) von Baidu den nun verfügbaren Code, um Systeme in der Spracherkennung zu trainieren. Der CTC-Ansatz soll dabei wesentlich schneller verwertbare Ergebnisse liefern als das bisher in der Spracherkennung vielfach genutzte Hidden Markov Model (HMM). Als Sprachdaten nutzt Baidu Aufnahmen aus Englisch und Mandarin zum Training.

CTC bereits produktiv im Einsatz

Auch Google verwendet CTC für die Analyse bei der Sprachsuche seiner Google-App. In der Beschreibung dazu heißt es, dass im Vergleich zu herkömmlichen Modellen längere Audiodaten analysiert werden können, dabei aber weniger Rechenaufwand nötig sei. Dadurch funktioniere die eigentliche Spracherkennung schneller.

Der von Baidu freigegebene Code ist darauf ausgelegt, CTC selbst möglichst stark zu beschleunigen. Dazu haben die Beteiligten den Algorithmus parallelisiert und neben Code, der auf der CPU läuft, auch eine CUDA-Implementierung erstellt, die auf die Ausführung auf GPUs optimiert ist. Laut Baidu ist der Code zudem schneller als andere zurzeit frei verfügbare Implementierungen.


eye home zur Startseite
Kleba 19. Jan 2016

Finde ich auch spannend. Dazu passen veröffentlicht Yahoo Trainingsdaten für maschinelles...

Ass Bestos 18. Jan 2016

also was mit spracherkennung alles möglich ist, welche initaiven es gibt usw usf ...



Anzeige

Stellenmarkt
  1. WSW mobil GmbH, Wuppertal
  2. Robert Bosch GmbH, Abstatt
  3. Dürr IT Service GmbH, Bietigheim-Bissingen
  4. über DOWERK Fach- und Führungskräfte, deutschlandweit


Anzeige
Spiele-Angebote
  1. 15,99€
  2. 16,20€ zzgl. 5€ Versand

Folgen Sie uns
       


  1. Mali-C71

    ARM bringt seinen ersten ISP für Automotive

  2. SUNET

    Forschungsnetz erhält 100 GBit/s und ROADM-Technologie

  3. Cisco

    Kontrollzentrum verwaltet Smartphones im Unternehmen

  4. Datenschutz

    Facebook erhält weiterhin keine Whatsapp-Daten

  5. FTTH

    Telekom will mehr Kooperationen für echte Glasfaser

  6. Open Data

    OKFN will deutsche Wetterdaten befreien

  7. Spectrum Next

    Voll kompatible Neuauflage des ZX Spectrum ist finanziert

  8. OmniOS

    Freier Solaris-Nachfolger steht vor dem Ende

  9. Cybercrime

    Computerkriminalität nimmt statistisch gesehen zu

  10. Red+ Kids

    Vodafone führt Tarif für Kinder unter zehn Jahren ein



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Quantenphysik: Im Kleinen spielt das Universum verrückt
Quantenphysik
Im Kleinen spielt das Universum verrückt

Radeon RX 580 und RX 570 im Test: AMDs Grafikkarten sind schneller und sparsamer
Radeon RX 580 und RX 570 im Test
AMDs Grafikkarten sind schneller und sparsamer
  1. Radeon Pro Duo AMD bringt Profi-Grafikkarte mit zwei Polaris-Chips
  2. Grafikkarten AMD bringt vier neue alte Radeons für Komplett-PCs
  3. Grafikkarten AMD stellt Radeon RX 560 und Radeon RX 550 vor

Hate-Speech-Gesetz: Regierung kennt keine einzige strafbare Falschnachricht
Hate-Speech-Gesetz
Regierung kennt keine einzige strafbare Falschnachricht
  1. Neurowissenschaft Facebook erforscht Gedanken-Postings
  2. Rundumvideo Facebooks 360-Grad-Ballkamera nimmt Tiefeninformationen auf
  3. Spaces Facebook stellt Beta seiner Virtual-Reality-Welt vor

  1. Re: Gibts bei uns schon

    Ovaron | 18:33

  2. Re: USA hat 320.000.000 Einwohner

    Ovaron | 18:30

  3. Re: Google, DARPA, Facebook...

    Fotobar | 18:20

  4. mydealz.de

    DY | 18:20

  5. Re: Noch mehr unfreiwilliger Seelen-Striptease!

    Fotobar | 18:17


  1. 18:44

  2. 18:14

  3. 17:47

  4. 16:19

  5. 16:02

  6. 15:40

  7. 14:51

  8. 14:17


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel