Abo
  • Services:
Anzeige
Die Spracherkennung von Microsoft wird immer besser.
Die Spracherkennung von Microsoft wird immer besser. (Bild: Marcin Wichary, Flickr.com/CC-BY 2.0)

CNTK: Microsofts Spracherkennung erreicht menschliches Niveau

Die Spracherkennung von Microsoft wird immer besser.
Die Spracherkennung von Microsoft wird immer besser. (Bild: Marcin Wichary, Flickr.com/CC-BY 2.0)

Das System zum Erkennen von gesprochener Sprache von Microsoft sei bei einem Standard-Test inzwischen ähnlich gut wie professionell geschulte Menschen. Das Forscherteam nutzt dafür Microsofts Open-Source-Toolkit CNTK, hat bei einigen Gesprächen aber noch große Schwierigkeiten.

Digitale Assistenten, mit denen Nutzer sprechen können, werden immer häufiger in Consumer-Hardware eingesetzt, wenn auch mit teils eher ernüchterndem Erlebnis. Ein Forscherteam von Microsoft berichtet allerdings, dass es mit seinem maschinellen System zur Spracherkennung in einem Standard-Test inzwischen eine ähnlich gute Fehlerrate erreiche wie Menschen, die damit beauftragt worden sind, Gespräche zu transkribieren.

Anzeige

Microsoft vergleicht das Ergebnis seines Systems dabei allerdings nicht mit der häufig zitierten Fehlerrate von Menschen beim sogenannten Switchboard-Test, die mit 4 Prozent angegeben wird. Das Team vergleicht dagegen sein Ergebnis mit einem eigens für die Transkription beauftragten Team. Je nach Sorgfalt weichen die menschlichen Fehlerraten hierbei teils deutlich voneinander ab und liegen üblicherweise zwischen knapp 4 Prozent und etwa 9 Prozent. Microsoft gibt für seine maschinelle Erkennung eine Fehlerrate von 5,9 Prozent an.

Ergebnis abhängig von Gesprächsart

Bei dem Switchboard-Test werden Gespräche analysiert, bei denen zwei Personen ein vorgegebenes Thema miteinander besprechen. Das vereinfacht die maschinelle Analyse, da in dem zugrundeliegenden Sprachmodell ähnliche Worte verknüpft werden können wie etwa schnell und flott (fast und quick). In einer vergleichsweise offenen Diskussion zweier Personen ohne vorgegebenes Thema, dem sogenannten Call-Home-Test, ist die Fehlerrate sowohl von Mensch als auch Maschine bei knapp über 11 Prozent. Auch hier schneide das System von Microsoft genauso gut oder teils etwas besser ab als die Menschen.

Mensch und Maschine machen der Analyse zufolge auch teilweise ähnliche Fehler. So werden zum Beispiel die Verben is und was verwechselt, ebenso wie die Artikel a und the sowie die Worte in und and. Zur Umsetzung des Modells und der Durchführung der eigentlichen Tests verwendet Microsoft sein selbsterstelltes Deep-Learning-Toolkit CNTK (Computational Network Toolkit), das seit Anfang des Jahres als Open Source auf Github bereitsteht.


eye home zur Startseite
jacki 21. Okt 2016

Naja die Software kann schon auch Dinge wie Zusammenhänge, Lücken füllen, usw. usw...

igor37 20. Okt 2016

Die von Blackberry unterstützt mehrere aktive Sprachen gleichzeitig. Zumindest mit...

Kleine Schildkröte 20. Okt 2016

Ich hab in den letzten zwei Jahrzehnten soviele Versprechen von großen IT-Firmen gehört...

divStar 20. Okt 2016

Das würdest du auch nicht müssen. 1 PC oder Controller, der den Datenstrom entgegen...

Nikolai 19. Okt 2016

Laut Netz liegt die Fehlerquote bei der Google _Offline_-Erkennung bei 13,5%. (https...



Anzeige

Stellenmarkt
  1. AOK Systems GmbH, Hamburg
  2. Computacenter AG & Co. oHG, Kerpen (bei Köln), Köln, Ratingen
  3. HELUKABEL® GmbH, Hemmingen
  4. Computacenter AG & Co. oHG, Kerpen (bei Köln), Erfurt


Anzeige
Spiele-Angebote
  1. 2,49€
  2. 25,99€
  3. 5,99€

Folgen Sie uns
       


  1. IETF

    Wie TLS abgehört werden könnte

  2. Recht auf Vergessenwerden

    EuGH entscheidet über weltweite Auslistung von Links

  3. Avast und Piriform

    Ccleaner-Entwickler wird Teil von Avast Software

  4. id Software

    Update 6.66 für Doom enthält Season-Pass-Inhalte

  5. Microsoft

    Kein Windows 10 on ARM für Smartphones

  6. Creoqode 2048 im Test

    Wir programmieren die größte portable Spielkonsole der Welt

  7. Auch Vectoring

    Niedersachsen fördert Internetausbau für 400.000 Haushalte

  8. BGH-Urteil

    Sofortüberweisung doch kein zumutbares Zahlungsmittel

  9. Hyperloop Pod Competition

    Team Warr stellt neue Hyperloop-Kapsel vor

  10. Oberlandesgericht Düsseldorf

    ARD und ZDF müssen Übertragung im Kabelnetz bezahlen



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Moto Z2 Play im Test: Bessere Kamera entschädigt nicht für kürzere Akkulaufzeit
Moto Z2 Play im Test
Bessere Kamera entschädigt nicht für kürzere Akkulaufzeit
  1. Modulares Smartphone Moto Z2 Play kostet mit Lautsprecher-Mod 520 Euro
  2. Lenovo Hochleistungs-Akku-Mod für Moto Z
  3. Moto Z Schiebetastatur-Mod hat Finanzierungsziel erreicht

Razer Lancehead im Test: Drahtlose Symmetrie mit Laser
Razer Lancehead im Test
Drahtlose Symmetrie mit Laser
  1. Razer Blade Stealth 13,3- statt 12,5-Zoll-Panel im gleichen Gehäuse
  2. Razer Core im Test Grafikbox + Ultrabook = Gaming-System
  3. Razer Lancehead Symmetrische 16.000-dpi-Maus läuft ohne Cloud-Zwang

Ikea Trådfri im Test: Drahtlos (und sicher) auf Schwedisch
Ikea Trådfri im Test
Drahtlos (und sicher) auf Schwedisch
  1. Die Woche im Video Kündigungen, Kernaussagen und KI-Fahrer
  2. Augmented Reality Ikea will mit iOS 11 Wohnungen virtuell einrichten
  3. Space10 Ikea-Forschungslab untersucht Umgang mit KI

  1. Re: Wieso vertrauen eigentlich alle Ihren...

    Tantalus | 14:20

  2. Re: Das Problem ist doch nicht der Antrieb...

    emdotjay | 14:20

  3. Re: Finde ich richtig.

    Golressy | 14:20

  4. China und Saudi Arabien ...

    __destruct() | 14:19

  5. Re: Preiserhöhung für alle

    scrumdideldu | 14:17


  1. 14:00

  2. 13:15

  3. 12:57

  4. 12:41

  5. 12:07

  6. 12:00

  7. 11:45

  8. 11:42


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel