Beenden des Trainings und Verwendung des Modells

Der Trainingsprozess schreibt zu Beginn eine config.json-Datei mit allen Einstellungen des Modells, auf Basis der zum Trainingsstart verwendeten Python-Datei. Weiterhin werden regelmäßig Checkpoint-Dateien mit dem Stand des Trainingsfortschrittes erzeugt. Diese Kombination aus JSON-basierter Konfigurationsdatei und Checkpoint kann dazu verwendet werden, die künstliche Stimme mit dem von Coqui TTS mitgelieferten Webserver zu erzeugen.

Beim Training des TTS-Modells gibt es kein festes Ende oder einen Fortschrittsbalken, der anzeigt, wann das Training beendet ist. Stattdessen gibt das Tensorboard anhand der Diagramme und Audio Samples Aufschluss, wann das Modell gut genug ist - um dann das Training zu beenden.

  • Textcorpus für die Aufnahmen mit Mimic-Recording-Studio (Screenshot: Thorsten Müller)
  • Die Weboberfläche von Mimic-Recording-Studio (Screenshot: Thorsten Müller)
  • Die Sqlite-Datenbank von Mimic-Recording-Studio ermöglicht schnelle Abfragen aller Aufnahmen. (Screenshot: Thorsten Müller)
  • Beispiel einer LJSpeech-Voice-Dataset-Struktur (Screenshot: Thorsten Müller)
  • TTS-Dataset-Analyse: Dieser Verlauf zeigt eine konstante Sprechgeschwindigkeit bei einer Satzlänge zwischen 2 und 160 Zeichen. (Screenshot: Thorsten Müller)
  • Übersicht der Aufnahmenanzahl pro Satzlänge  (Screenshot: Thorsten Müller)
  • Die Grafiken im Tensorboard geben Aufschluss zum laufenden Training.  (Screenshot: Thorsten Müller)
  • Die regelmäßig vom Training erzeugten Testaudios geben einen guten Eindruck zur Entwicklung der Qualität.  (Screenshot: Thorsten Müller)
  • Per Coqui-TTS-Webfrontend kann das Modell einfach ausprobiert werden.  (Screenshot: Thorsten Müller)
Per Coqui-TTS-Webfrontend kann das Modell einfach ausprobiert werden. (Screenshot: Thorsten Müller)

Sobald der Webserver mit dem Modell gestartet ist und die Erzeugung per Weboberfläche funktioniert, kann auch per API-Aufruf, beispielsweise mit cURL, eine künstliche Stimmausgabe generiert werden.

curl http://"Server":5002/api/tts?text=Hallo. -o hallo.wav

Für die Integration in bestehende Python-3-Programme steht mit cTTS ein simples Python-Modul zur Verfügung.

Wer sich den Ablauf, die eigene Stimme als TTS-Modell zu erzeugen, bildlich und detaillierter anschauen möchte, für den stehen auf dieser Youtube-Playlist einige Videos zur Verfügung.

Wie zu Beginn geschrieben, kann dieser Artikel das Thema nur oberflächlich beschreiben. Wer Interesse an dem Thema gefunden hat, wird in den Communities von Mycroft, Coqui oder auf meinem Twitter-Account @ThorstenVoice sicherlich hilfsbereite Ansprechpartner finden.

Happy TTS'ing :-).

Thorsten Müller beschäftigt sich als IT-Enthusiast mit Smart-Home-Konzepten und Themen rund um offene Sprachtechnologien (Sprachassistenten, Spracherkennung und Sprachsynthese). Sein Wissen teilt er in Open-Voice-Communities, auf Youtube und auf seinem Twitter-Account.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Training des TTS-Modells
  1.  
  2. 1
  3. 2
  4. 3
  5. 4


Aktuell auf der Startseite von Golem.de
Whistleblower
Ehemaliger US-Konteradmiral äußert sich zu Außerirdischen

Wieder hat sich in den USA ein ehemals hochrangiger Militär und Beamter über Kontakte mit Aliens geäußert.

Whistleblower: Ehemaliger US-Konteradmiral äußert sich zu Außerirdischen
Artikel
  1. Schadstoffnorm 7: Neue Grenzwerte für Abrieb gelten auch für E-Autos
    Schadstoffnorm 7
    Neue Grenzwerte für Abrieb gelten auch für E-Autos

    Die neue Euronorm 7 legt nicht nur Grenzwerte für Bremsen- und Reifenabrieb fest, sondern auch Mindestanforderungen für Akkus.

  2. Ramjet: General Electric testet Hyperschalltriebwerk
    Ramjet
    General Electric testet Hyperschalltriebwerk

    Das Triebwerk soll Flüge mit Mach 5 ermöglichen.

  3. Elektroautos: Mercedes und Stellantis übernehmen komplette Umweltprämie
    Elektroautos
    Mercedes und Stellantis übernehmen komplette Umweltprämie

    Nach dem abrupten Aus der staatlichen Förderung springen erste Hersteller von Elektroautos ein.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Last-Minute-Angebote bei Amazon • Avatar & The Crew Motorfest bis -50% • Xbox Series X 399€ • Cherry MX Board 3.0 S 49,95€ • Crucial MX500 2 TB 110,90€ • AVM FRITZ!Box 7590 AX + FRITZ!DECT 500 219€ [Werbung]
    •  /