• IT-Karriere:
  • Services:

Neural Text-to-Speech: Amazons Maschinenvorleserin klingt fast wie eine Moderatorin

Amazon Polly wird um Neural Text-to-Speech erweitert. Dieses soll natürlicher klingen als traditionelle Ansätze. Das System kann etwa Nachrichtenmoderatoren imitieren. Erste Audiobeispiele klingen bereits recht überzeugend, auch wenn einige Dinge die synthetische Herkunft verraten.

Artikel veröffentlicht am ,
Amazon Polly liest Texte schon recht überzeugend vor.
Amazon Polly liest Texte schon recht überzeugend vor. (Bild: Pixabay.com/Montage: Golem.de/CC0 1.0)

Amazon hat seine maschinensynthetisierte Stimme Amazon Polly verbessert. Das Unternehmen führt Neural Text-to-Speech (Ntts) ein. Damit soll die Software natürlicher klingen und menschliche Betonung besser imitieren. Das Produkt resultiert aus den Arbeiten des Unternehmens im vergangenen Jahr, bei denen ein neuronales Netzwerk mit Hilfe englischsprachiger Quelldaten trainiert wurde. Der Vorteil daraus soll sein, dass es Betonungen und Emotionen besser umsetzen können soll als eine manuell erstellte Datenbank verschiedener Wortgruppen. "Mit der verbesserten Flexibilität können wir einfach den Sprachstil ändern", schreibt AWS-Entwickler und -Manager Trevor Wood im Vorstellungsartikel von Ntts von 2018.

Stellenmarkt
  1. Bundeskriminalamt, Wiesbaden
  2. über duerenhoff GmbH, Raum Remagen

Amazon stellt in der aktuellen Ankündigung einige Sprachschnipsel zur Verfügung. Dort liest Amazon Polly einen englischsprachigen Text vor. Die Stimme unterscheidet sich kaum von der 2018er-Version und betont den Satzbau ähnlich gut. Bereits vor einem Jahr klangen die synthetischen Vorleser bereits überzeugend. Allerdings sind noch immer einige Artefakte und monotone Stimmlagen in den Sounddateien zu hören.

Eine erste Abwandlung von Ntts bringt Amazon parallel zur Ankündigung. Der Newscaster liest Sätze im Stile eines Nachrichtensprechers vor, wie er im US-Fernsehen typisch ist. Auch hier klingt die Betonung bereits recht überzeugend, auch wenn einige identische Tonlagen in schneller Folge hintereinander ausgesprochen werden. Dadurch merken menschliche Zuhörer noch immer die synthetische Herkunft von Ntts.

Insgesamt elf englischsprachige Stimmen wird es vorerst geben: Amy, Emma und Brian sprechen im britischen Akzent, während Ivy, Joanna, Kendra, Kimberly, Salli, Joey, Justin und Matthew US-amerikanisches Englisch sprechen. Das Unternehmen verkündet nicht, ob und wann es die Funktion auch in anderen Sprachen geben wird. Sie kann in den USA und Europa kostenlos ausprobiert werden. Die Demoversion enthält eine Million Zeichen pro Monat und steht ein Jahr lang zur Verfügung.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Hardware-Angebote

brotiger 01. Aug 2019

60-80% der Menschen würden einen Touring-Test nicht bestehen.

AllDayPiano 01. Aug 2019

https://aws.amazon.com/de/blogs/aws/amazon-polly-introduces-neural-text-to-speech-and...

bummelbär 01. Aug 2019

Das liegt daran, dass es keine deutschen Modelle gibt. ;-) Die gibt es nur für englisch.

Anonymer Nutzer 01. Aug 2019

Irgendwann vielleicht. Gegenwärtig ist das Ding nicht so überzeugend.


Folgen Sie uns
       


Samsungs 49-Zoll-QLED-Gaming-Monitor - Test

Der Samsung CRG9 ist nicht nur durch sein 32:9-Format beeindruckend. Auch die hohe Bildfrequenz und sehr gute Helligkeit ermöglichen ein sehr immersives Gaming und viel Platz für Multitasking.

Samsungs 49-Zoll-QLED-Gaming-Monitor - Test Video aufrufen
Videospiellokalisierung: Lost in Translation
Videospiellokalisierung
Lost in Translation

Damit Videospiele in möglichst viele Länder verkauft werden können, müssen sie übersetzt beziehungsweise lokalisiert werden. Ein kniffliger Job, denn die Textdatei eines Games hat oft auf den ersten Blick keine logische Struktur - dafür aber Hunderte Seiten.
Von Nadine Emmerich

  1. Spielebranche Entwickler können bis 2023 mit Millionenförderung rechnen
  2. Planet Zoo im Test Tierische Tüftelei
  3. Förderung Spielentwickler sollen 2020 nur einen "Ausgaberest" bekommen

Top-Level-Domains: Wem gehören .amazon, .ostsee und .angkorwat?
Top-Level-Domains
Wem gehören .amazon, .ostsee und .angkorwat?

Südamerikanische Regierungen streiten sich seit Jahren mit Amazon um die Top-Level-Domain .amazon. Bislang stehen die Regierungen als Verlierer da. Ein anderer Verlierer ist jedoch die Icann, die es nicht schafft, das öffentliche Interesse an solch einer Domain ausreichend zu berücksichtigen.
Von Katrin Ohlmer

  1. Icann Namecheap startet Beschwerde wegen .org-Preisen
  2. Domain-Registrierung Icann drückt .org-Vertrag ohne Preisschranken durch
  3. Domain-Registrierung Mehrheit widerspricht Icann-Plan zur .org-Preiserhöhung

Raumfahrt: Mehr Geld für die Raumfahrt reicht nicht aus
Raumfahrt
Mehr Geld für die Raumfahrt reicht nicht aus

Eine mögliche leichte Senkung des deutschen Beitrags zur Esa bringt nicht die Raumfahrt in Gefahr. Deren heutige Probleme sind Resultat von Fehlentscheidungen, die hohe Kosten und Ausgaben nach sich ziehen. Zuerst braucht es Reformen statt noch mehr Geld.
Ein IMHO von Frank Wunderlich-Pfeiffer

  1. Space Rider Neuer Anlauf für eine eigene europäische Raumfähre
  2. Vega Raketenabsturz lässt Fragen offen

    •  /