Abo
  • Services:
Anzeige
Die Spracherkennung von Microsoft wird immer besser.
Die Spracherkennung von Microsoft wird immer besser. (Bild: Marcin Wichary, Flickr.com/CC-BY 2.0)

CNTK: Microsofts Spracherkennung erreicht menschliches Niveau

Die Spracherkennung von Microsoft wird immer besser.
Die Spracherkennung von Microsoft wird immer besser. (Bild: Marcin Wichary, Flickr.com/CC-BY 2.0)

Das System zum Erkennen von gesprochener Sprache von Microsoft sei bei einem Standard-Test inzwischen ähnlich gut wie professionell geschulte Menschen. Das Forscherteam nutzt dafür Microsofts Open-Source-Toolkit CNTK, hat bei einigen Gesprächen aber noch große Schwierigkeiten.

Digitale Assistenten, mit denen Nutzer sprechen können, werden immer häufiger in Consumer-Hardware eingesetzt, wenn auch mit teils eher ernüchterndem Erlebnis. Ein Forscherteam von Microsoft berichtet allerdings, dass es mit seinem maschinellen System zur Spracherkennung in einem Standard-Test inzwischen eine ähnlich gute Fehlerrate erreiche wie Menschen, die damit beauftragt worden sind, Gespräche zu transkribieren.

Anzeige

Microsoft vergleicht das Ergebnis seines Systems dabei allerdings nicht mit der häufig zitierten Fehlerrate von Menschen beim sogenannten Switchboard-Test, die mit 4 Prozent angegeben wird. Das Team vergleicht dagegen sein Ergebnis mit einem eigens für die Transkription beauftragten Team. Je nach Sorgfalt weichen die menschlichen Fehlerraten hierbei teils deutlich voneinander ab und liegen üblicherweise zwischen knapp 4 Prozent und etwa 9 Prozent. Microsoft gibt für seine maschinelle Erkennung eine Fehlerrate von 5,9 Prozent an.

Ergebnis abhängig von Gesprächsart

Bei dem Switchboard-Test werden Gespräche analysiert, bei denen zwei Personen ein vorgegebenes Thema miteinander besprechen. Das vereinfacht die maschinelle Analyse, da in dem zugrundeliegenden Sprachmodell ähnliche Worte verknüpft werden können wie etwa schnell und flott (fast und quick). In einer vergleichsweise offenen Diskussion zweier Personen ohne vorgegebenes Thema, dem sogenannten Call-Home-Test, ist die Fehlerrate sowohl von Mensch als auch Maschine bei knapp über 11 Prozent. Auch hier schneide das System von Microsoft genauso gut oder teils etwas besser ab als die Menschen.

Mensch und Maschine machen der Analyse zufolge auch teilweise ähnliche Fehler. So werden zum Beispiel die Verben is und was verwechselt, ebenso wie die Artikel a und the sowie die Worte in und and. Zur Umsetzung des Modells und der Durchführung der eigentlichen Tests verwendet Microsoft sein selbsterstelltes Deep-Learning-Toolkit CNTK (Computational Network Toolkit), das seit Anfang des Jahres als Open Source auf Github bereitsteht.


eye home zur Startseite
jacki 21. Okt 2016

Naja die Software kann schon auch Dinge wie Zusammenhänge, Lücken füllen, usw. usw...

Themenstart

igor37 20. Okt 2016

Die von Blackberry unterstützt mehrere aktive Sprachen gleichzeitig. Zumindest mit...

Themenstart

Kleine Schildkröte 20. Okt 2016

Ich hab in den letzten zwei Jahrzehnten soviele Versprechen von großen IT-Firmen gehört...

Themenstart

divStar 20. Okt 2016

Das würdest du auch nicht müssen. 1 PC oder Controller, der den Datenstrom entgegen...

Themenstart

Nikolai 19. Okt 2016

Laut Netz liegt die Fehlerquote bei der Google _Offline_-Erkennung bei 13,5%. (https...

Themenstart

Kommentieren



Anzeige

Stellenmarkt
  1. Universität Passau, Passau
  2. Formel D GmbH, München
  3. über Ratbacher GmbH, München
  4. über Ratbacher GmbH, Stuttgart


Anzeige
Hardware-Angebote
  1. (täglich neue Deals)
  2. 15€ sparen mit Gutscheincode GTX15

Folgen Sie uns
       


  1. Glasfaser

    Ewe steckt 1 Milliarde Euro in Fiber To The Home

  2. Nanotechnologie

    Mit Nanokristallen im Dunkeln sehen

  3. Angriff auf Verlinkung

    LG Hamburg fordert Prüfpflicht für kommerzielle Webseiten

  4. Managed-Exchange-Dienst

    Telekom-Cloud-Kunde konnte fremde Adressbücher einsehen

  5. Rockstar Games

    Spieleklassiker Bully für Mobile-Geräte erhältlich

  6. Crimson Relive Grafiktreiber

    AMD lässt seine Radeon-Karten chillen und streamen

  7. Layout Engine

    Facebook portiert CSS-Flexbox für native Apps

  8. Creators Update für Windows 10

    Microsoft wird neue Sicherheitsfunktionen bieten

  9. Landgericht Traunstein

    Postfach im Impressum einer Webseite nicht ausreichend

  10. Big-Jim-Sammelfiguren

    Ebay-Verkäufer sind ehrlich geworden



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Steep im Test: Frei und einsam beim Bergsport
Steep im Test
Frei und einsam beim Bergsport
  1. PES 2017 Update mit Stadion und Hymnen von Borussia Dortmund
  2. Motorsport Manager im Kurztest Neustart für Sportmanager
  3. NBA 2K17 10.000 Schritte für Ingame-Boost

Kosmobits im Test: Tausch den Spielecontroller gegen einen Mikrocontroller!
Kosmobits im Test
Tausch den Spielecontroller gegen einen Mikrocontroller!
  1. HiFive 1 Entwicklerboard mit freiem RISC-Prozessor verfügbar
  2. Simatic IoT2020 Siemens stellt linuxfähigen Arduino-Klon vor
  3. Calliope Mini Mikrocontroller-Board für deutsche Schüler angekündigt

Gigaset Mobile Dock im Test: Das Smartphone wird DECT-fähig
Gigaset Mobile Dock im Test
Das Smartphone wird DECT-fähig

  1. Re: Danke Apple

    7hyrael | 17:17

  2. Re: Mittlerweile habe ich fast schon eine...

    david_rieger | 17:16

  3. Das wichtigste Argument fehlt!?

    ichbinsmalwieder | 17:16

  4. Re: Alle Seiten illegal

    SelfEsteem | 17:16

  5. Re: Ich habe bisher noch keinen Topfilm

    derKlaus | 17:15


  1. 16:46

  2. 16:39

  3. 16:14

  4. 15:40

  5. 15:04

  6. 15:00

  7. 14:04

  8. 13:41


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel