Abo
  • Services:
Anzeige
Baidu gibt seinen Code für CTC frei.
Baidu gibt seinen Code für CTC frei. (Bild: Flickr.com, simone.brunozzi/CC-BY-SA 2.0)

Neuronale Netze: Baidu veröffentlicht Trainingscode zur Spracherkennung

Baidu gibt seinen Code für CTC frei.
Baidu gibt seinen Code für CTC frei. (Bild: Flickr.com, simone.brunozzi/CC-BY-SA 2.0)

Die Forschungsabteilung von Baidu gibt Code auf Github frei, mit dem neuronale Netze für Spracherkennung trainiert werden. Das formale Konzept dahinter nutzt auch Google in seiner Sprachsuche, weil es besser als bisher verwendete Modelle funktioniert.

Mit Hilfe der Connectionist Temporal Classification (CTC) kann maschinelles Lernen auf sequenziellen Daten so durchgeführt werden, dass es keine strikte Zuordnung von Eingabedaten zur eigentlichen Bezeichnung oder Bedeutung geben muss. Die Forschungsabteilung des chinesischen Suchmaschinenanbieters Baidu hat ihre Implementierung von CTC auf Github unter der Apache-Lizenz veröffentlicht.

Anzeige

Eigenen Aussagen zufolge nutzt das Labor für künstliche Intelligenz (AI Lab) von Baidu den nun verfügbaren Code, um Systeme in der Spracherkennung zu trainieren. Der CTC-Ansatz soll dabei wesentlich schneller verwertbare Ergebnisse liefern als das bisher in der Spracherkennung vielfach genutzte Hidden Markov Model (HMM). Als Sprachdaten nutzt Baidu Aufnahmen aus Englisch und Mandarin zum Training.

CTC bereits produktiv im Einsatz

Auch Google verwendet CTC für die Analyse bei der Sprachsuche seiner Google-App. In der Beschreibung dazu heißt es, dass im Vergleich zu herkömmlichen Modellen längere Audiodaten analysiert werden können, dabei aber weniger Rechenaufwand nötig sei. Dadurch funktioniere die eigentliche Spracherkennung schneller.

Der von Baidu freigegebene Code ist darauf ausgelegt, CTC selbst möglichst stark zu beschleunigen. Dazu haben die Beteiligten den Algorithmus parallelisiert und neben Code, der auf der CPU läuft, auch eine CUDA-Implementierung erstellt, die auf die Ausführung auf GPUs optimiert ist. Laut Baidu ist der Code zudem schneller als andere zurzeit frei verfügbare Implementierungen.


eye home zur Startseite
Kleba 19. Jan 2016

Finde ich auch spannend. Dazu passen veröffentlicht Yahoo Trainingsdaten für maschinelles...

Ass Bestos 18. Jan 2016

also was mit spracherkennung alles möglich ist, welche initaiven es gibt usw usf ...



Anzeige

Stellenmarkt
  1. Bosch Software Innovations GmbH, Berlin
  2. Rohde & Schwarz Cybersecurity GmbH, Berlin
  3. Salzgitter Mannesmann Handel GmbH, Düsseldorf
  4. Robert Bosch GmbH, Berlin


Anzeige
Top-Angebote
  1. (heute u. a. mit Sony TVs, Radios und Lautsprechern, 4K-Blu-rays und Sennheiser Kopfhörern)
  2. 499,99€ - Aktuell nicht bestellbar. Gelegentlich bezüglich Verfügbarkeit auf der Bestellseite...

Folgen Sie uns
       


  1. UAV

    Matternet startet Drohnenlieferdienst in der Schweiz

  2. Joint Venture

    Microsoft und Facebook verlegen Seekabel mit 160 Terabit/s

  3. Remote Forensics

    BKA kann eigenen Staatstrojaner nicht einsetzen

  4. Datenbank

    Börsengang von MongoDB soll 100 Millionen US-Dollar bringen

  5. NH-L9a-AM4 und NH-L12S

    Noctua bringt Mini-ITX-Kühler für Ryzen

  6. Wegen Lieferproblemen

    Spekulationen über Aus für Opels Elektroauto Ampera-E

  7. Minix

    Fehler in Intel ME ermöglicht Codeausführung

  8. Oracle

    Java SE 9 und Java EE 8 gehen live

  9. Störerhaftung abgeschafft

    Bundesrat stimmt für WLAN-Gesetz mit Netzsperrenanspruch

  10. Streaming

    Update für Fire TV bringt Lupenfunktion



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Energieversorgung: Windparks sind schlechter gesichert als E-Mail-Konten
Energieversorgung
Windparks sind schlechter gesichert als E-Mail-Konten
  1. Messenger Wire-Server steht komplett unter Open-Source-Lizenz
  2. Apache Struts Monate alte Sicherheitslücke führte zu Equifax-Hack
  3. Kreditrating Equifax' Krisenreaktion ist ein Desaster

Anki Cozmo im Test: Katze gegen Roboter
Anki Cozmo im Test
Katze gegen Roboter
  1. Die Woche im Video Apple, Autos und ein grinsender Affe
  2. Anki Cozmo ausprobiert Niedlicher Programmieren lernen und spielen

Edge Computing: Randerscheinung mit zentraler Bedeutung
Edge Computing
Randerscheinung mit zentraler Bedeutung
  1. Software AG Cumulocity IoT bringt das Internet der Dinge für Einsteiger
  2. DDoS 30.000 Telnet-Zugänge für IoT-Geräte veröffentlicht
  3. Deutsche Telekom Narrowband-IoT-Servicepakete ab 200 Euro

  1. Re: As usual

    Trockenobst | 19:13

  2. Re: 190.000 Euro sollen an den TÜV für eine...

    mnehm1 | 19:10

  3. Re: Wieviel Energie benötigt es, um von Europa...

    voxeldesert | 19:06

  4. Re: Das ist ein Fehler

    GangnamStyle | 19:04

  5. Re: Gab es irgendjemanden

    gakusei | 19:04


  1. 17:43

  2. 17:25

  3. 16:55

  4. 16:39

  5. 16:12

  6. 15:30

  7. 15:06

  8. 14:00


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel