Abo
  • IT-Karriere:

Neural Text-to-Speech: Amazons Maschinenvorleserin klingt fast wie eine Moderatorin

Amazon Polly wird um Neural Text-to-Speech erweitert. Dieses soll natürlicher klingen als traditionelle Ansätze. Das System kann etwa Nachrichtenmoderatoren imitieren. Erste Audiobeispiele klingen bereits recht überzeugend, auch wenn einige Dinge die synthetische Herkunft verraten.

Artikel veröffentlicht am ,
Amazon Polly liest Texte schon recht überzeugend vor.
Amazon Polly liest Texte schon recht überzeugend vor. (Bild: Pixabay.com/Montage: Golem.de/CC0 1.0)

Amazon hat seine maschinensynthetisierte Stimme Amazon Polly verbessert. Das Unternehmen führt Neural Text-to-Speech (Ntts) ein. Damit soll die Software natürlicher klingen und menschliche Betonung besser imitieren. Das Produkt resultiert aus den Arbeiten des Unternehmens im vergangenen Jahr, bei denen ein neuronales Netzwerk mit Hilfe englischsprachiger Quelldaten trainiert wurde. Der Vorteil daraus soll sein, dass es Betonungen und Emotionen besser umsetzen können soll als eine manuell erstellte Datenbank verschiedener Wortgruppen. "Mit der verbesserten Flexibilität können wir einfach den Sprachstil ändern", schreibt AWS-Entwickler und -Manager Trevor Wood im Vorstellungsartikel von Ntts von 2018.

Stellenmarkt
  1. DCC Duisburg CityCom GmbH, Duisburg
  2. Kommunale Datenverarbeitung Oldenburg (KDO), Oldenburg

Amazon stellt in der aktuellen Ankündigung einige Sprachschnipsel zur Verfügung. Dort liest Amazon Polly einen englischsprachigen Text vor. Die Stimme unterscheidet sich kaum von der 2018er-Version und betont den Satzbau ähnlich gut. Bereits vor einem Jahr klangen die synthetischen Vorleser bereits überzeugend. Allerdings sind noch immer einige Artefakte und monotone Stimmlagen in den Sounddateien zu hören.

Eine erste Abwandlung von Ntts bringt Amazon parallel zur Ankündigung. Der Newscaster liest Sätze im Stile eines Nachrichtensprechers vor, wie er im US-Fernsehen typisch ist. Auch hier klingt die Betonung bereits recht überzeugend, auch wenn einige identische Tonlagen in schneller Folge hintereinander ausgesprochen werden. Dadurch merken menschliche Zuhörer noch immer die synthetische Herkunft von Ntts.

Insgesamt elf englischsprachige Stimmen wird es vorerst geben: Amy, Emma und Brian sprechen im britischen Akzent, während Ivy, Joanna, Kendra, Kimberly, Salli, Joey, Justin und Matthew US-amerikanisches Englisch sprechen. Das Unternehmen verkündet nicht, ob und wann es die Funktion auch in anderen Sprachen geben wird. Sie kann in den USA und Europa kostenlos ausprobiert werden. Die Demoversion enthält eine Million Zeichen pro Monat und steht ein Jahr lang zur Verfügung.



Anzeige
Hardware-Angebote
  1. 204,90€

brotiger 01. Aug 2019 / Themenstart

60-80% der Menschen würden einen Touring-Test nicht bestehen.

AllDayPiano 01. Aug 2019 / Themenstart

https://aws.amazon.com/de/blogs/aws/amazon-polly-introduces-neural-text-to-speech-and...

bummelbär 01. Aug 2019 / Themenstart

Das liegt daran, dass es keine deutschen Modelle gibt. ;-) Die gibt es nur für englisch.

Anonymer Nutzer 01. Aug 2019 / Themenstart

Irgendwann vielleicht. Gegenwärtig ist das Ding nicht so überzeugend.

Kommentieren


Folgen Sie uns
       


Asus Zenfone 6 - Test

Das Zenfone 6 fällt durch seine Klappkamera auf, hat aber auch abseits dieses Gimmicks eine Menge zu bieten, wie unser Test zeigt.

Asus Zenfone 6 - Test Video aufrufen
WEG-Gesetz: Bundesländer preschen bei Anspruch auf Ladestellen vor
WEG-Gesetz
Bundesländer preschen bei Anspruch auf Ladestellen vor

Können Elektroauto-Besitzer demnächst den Einbau einer Ladestelle in Tiefgaragen verlangen? Zwei Bundesländer haben entsprechende Ergebnisse einer Arbeitsgruppe schon in einem eigenen Gesetzentwurf aufgegriffen.
Eine Analyse von Friedhelm Greis

  1. Startup Rivian plant elektrochromes Glasdach für seine Elektro-SUVs
  2. Elektroautos Mehr als 7.000 neue Ladepunkte in einem Jahr
  3. Elektroautos GM und Volkswagen verabschieden sich vom klassischen Hybrid

Arbeit: Hilfe für frustrierte ITler
Arbeit
Hilfe für frustrierte ITler

Viele ITler sind frustriert, weil ihre Führungskraft nichts vom Fach versteht und sie mit Ideen gegen Wände laufen. Doch nicht immer ist an der Situation nur die Führungskraft schuld. Denn oft verkaufen die ITler ihre Ideen einfach nicht gut genug.
Von Robert Meyer

  1. IT-Forensikerin Beweise sichern im Faradayschen Käfig
  2. Homeoffice Wenn der Arbeitsplatz so anonym ist wie das Internet selbst
  3. Bundesagentur für Arbeit Informatikjobs bleiben 132 Tage unbesetzt

Indiegames-Rundschau: Epische ASCII-Abenteuer und erlebnishungrige Astronauten
Indiegames-Rundschau
Epische ASCII-Abenteuer und erlebnishungrige Astronauten

In Stone Story RPG erwacht ASCII-Art zum Leben, die Astronauten in Oxygen Not Included erleben tragikomische Slapstick-Abenteuer, dazu kommen Aufbaustrategie plus Action und Sammelkartenspiele: Golem.de stellt neue Indiegames vor.
Von Rainer Sigl

  1. Indiegames-Rundschau Von Bananen und Astronauten
  2. Indiegames-Rundschau Verloren im Sonnensystem und im Mittelalter
  3. Indiegames-Rundschau Drogen, Schwerter, Roboter-Ritter

    •  /