Abo
  • Services:
Anzeige
Spreche ich Chinesisch? Ja: Rick Rashid in Peking
Spreche ich Chinesisch? Ja: Rick Rashid in Peking (Bild: Microsoft/Screenshot: Golem.de)

Microsoft Research: Computersystem übersetzt praktisch simultan

Spreche ich Chinesisch? Ja: Rick Rashid in Peking
Spreche ich Chinesisch? Ja: Rick Rashid in Peking (Bild: Microsoft/Screenshot: Golem.de)

Microsoft ermöglicht es, Chinesisch zu sprechen, ohne Chinesisch zu können: Das Unternehmen hat ein System entwickelt, das gesprochene englische Sprache erkennt, sie ins Chinesische übersetzt und mit der Stimme des Sprechers ausgibt.

"Spreche ich Chinesisch?" wird gern gefragt, wenn das Gegenüber partout den Sinn der eigenen Rede nicht verstehen will. Mit einem neuen Sprachsystem lautet die Antwort: egal. Oder besser: fast egal. Denn das System übersetzt gesprochene englische Sprache ins Chinesische.

Anzeige

Das System integriert mehrere Aufgaben: Spracherkennung, Übersetzung und Sprachsynthese, von denen vor allem die ersten beiden recht schwierig sind. Entwickelt wurde es von Microsoft Research. Microsofts Forschungschef Rick Rashid hat es kürzlich auf einer Konferenz in China vorgestellt.

Gehirn imitiert

Das System erkennt zunächst den gesprochenen englischen Text. Schon das ist eine schwierige Aufgabe. Dank der Deep Neural Networks konnten Verbesserungen erzielt werden. Die Technik wurde vor zwei Jahren von Forschern der Universität in Toronto und Microsoft Research entwickelt und ahmt die Art und Weise nach, wie das menschliche Gehirn arbeitet. Damit lässt sich die Fehlerquote bei der Spracherkennung, die zuvor bei etwa 20 bis 25 Prozent lag, auf etwa 15 Prozent reduzieren. Das bedeutet, die Quote wurde von einem Fehler in vier bis fünf Worten auf einen Fehler in sieben bis acht Worten gesenkt.

Dann folgt die Übersetzung. Dabei wird zuerst der englische Text Wort für Wort ins Chinesische übersetzt. Dann werden die Worte so sortiert, dass der Text den Vorgaben der chinesischen Grammatik entspricht. Maschinenübersetzung sei in den vergangenen Jahren durch die Kombination von statistischen Verfahren und der Verarbeitung großer Datenmengen, den sogenannten Big Data, revolutioniert worden, erklärt Rashid im Blog Next At Microsoft.

Chinesisch mit Rashids Stimme

Im letzten Schritt wird schließlich der chinesische Text von einer Sprachsynthesesoftware mit der Stimme des Sprechers ausgegeben. Dazu wurden zunächst mehrere Stunden Material von chinesischen Muttersprachlern aufgezeichnet. Außerdem wurde das System mit Aufzeichnungen von Vorträgen, die Rashid gehalten hat, gefüttert. Das Sprachsynthesesystem kombinierte diese Daten so, dass chinesischer Text mit Rashids Stimme ausgegeben wurde.

Das Ergebnis kann sich hören lassen: Akzent und Ton klingen richtig. Die Stimme ist deutlich menschlicher als manche Sprachausgabesysteme, die etwa an Bahnhöfen die Zugverbindungen ansagen. Bei den hauptsächlich chinesischen Zuhörern erntete Rashid jedenfalls Beifall mit seiner Präsentation.

Das System sei noch nicht perfekt, schreibt Rashid. "Es ist natürlich wahrscheinlich, dass sowohl im englischen Text als auch bei der Übersetzung ins Chinesische noch Fehler auftreten - die Ergebnisse können manchmal lustig sein." Doch auch wenn die Technik noch nicht perfekt sei und es noch viel Arbeit gebe, sei sie doch "vielversprechend, und wir hoffen, dass wir in einigen Jahren ein System zur Verfügung haben werden, das die Sprachbarrieren beseitigen wird."


eye home zur Startseite
Bouncy 12. Nov 2012

Für Smalltalk braucht es nicht Ganz oder Garnicht. Menschen die kaum Englisch sprechen...

motzerator 12. Nov 2012

Meine linke lag eben noch bequem am Schoß, die Hände habe ich erst an der Tastatur...

Tryce 12. Nov 2012

Die Idee selbst ist ja auch weder neu noch wirklich einzigartig. Die Fehlerreduktion um 5...

Garius 10. Nov 2012

+1 Zeit wird's.

Bouncy 10. Nov 2012

Warum immer so komplexe Spezialfälle herauskramen, um eine Entwicklung schlecht zu...



Anzeige

Stellenmarkt
  1. InterCard AG, Taufkirchen bei München
  2. Robert Bosch GmbH, Abstatt
  3. Hornbach-Baumarkt-AG, Großraum Mannheim/Karlsruhe
  4. T-Systems on site services GmbH, München, Gaimersheim


Anzeige
Hardware-Angebote
  1. 699,00€
  2. ab 219,90€
  3. (Core i5-6500 + Geforce GTX 1060)

Folgen Sie uns
       


  1. Verschlüsselung

    Regierung will nun doch keine Backdoors

  2. Gesichtserkennung

    Wir fälschen dein Gesicht mit VR

  3. Yoga Tab 3 Plus

    Händler enthüllt Lenovos neues Yoga-Tablet

  4. Mobile Werbung

    Google straft Webseiten mit Popups ab

  5. Leap Motion

    Early-Access-Beta der Interaktions-Engine für VR

  6. Princeton Piton

    Open-Source-Chip soll System mit 200.000 Kernen ermöglichen

  7. BGH-Urteil

    Abbruchjäger auf Ebay missbrauchen Recht

  8. Übernahme

    Instapaper gehört Pinterest

  9. Kooperation vereinbart

    Delphi und Mobileye versprechen autonomes Auto bis 2019

  10. Galaxy Note 7 im Test

    Schaut dir in die Augen, Kleine/r/s!



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Gear IconX im Test: Anderthalb Stunden Trainingsspaß
Gear IconX im Test
Anderthalb Stunden Trainingsspaß
  1. Samsung Display des Galaxy Note 7 ist offenbar nicht kratzfest
  2. PM1643 & PM1735 Samsung zeigt V-NAND v4 und drei Rekord-SSDs
  3. April, April? Samsung schummelt Apple Watch in eigenen Patentantrag

Thinkpad X1 Carbon 2013 vs 2016: Drei Jahre, zwei Ultrabooks, eine Erkenntnis
Thinkpad X1 Carbon 2013 vs 2016
Drei Jahre, zwei Ultrabooks, eine Erkenntnis
  1. Huawei Matebook im Test Guter Laptop-Ersatz mit zu starker Konkurrenz
  2. iPad Pro Case Razer zeigt flache mechanische Switches
  3. Thinkpwn Lenovo warnt vor mysteriöser Bios-Schwachstelle

Asus PG248Q im Test: 180 Hertz erkannt, 180 Hertz gebannt
Asus PG248Q im Test
180 Hertz erkannt, 180 Hertz gebannt
  1. Raspberry Pi 3 Booten über USB oder per Ethernet
  2. Autonomes Fahren Mercedes stoppt Werbespot wegen überzogener Versprechen
  3. Radeon RX 480 Dank DX12 und Vulkan reicht auch eine Mittelklasse-CPU

  1. Re: Kaputte Welt.

    S-Talker | 15:29

  2. Re: die ethischen Werte in USA ?

    Trollversteher | 15:28

  3. Re: Streaming-Variante

    RicoBrassers | 15:27

  4. Re: Verständnisfrage

    jidmah | 15:27

  5. Re: In der Firma nutzen wir Thunderbird...

    AllDayPiano | 15:25


  1. 15:35

  2. 15:03

  3. 14:22

  4. 14:08

  5. 13:40

  6. 13:25

  7. 13:10

  8. 13:00


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel