Beenden des Trainings und Verwendung des Modells
Der Trainingsprozess schreibt zu Beginn eine config.json-Datei mit allen Einstellungen des Modells, auf Basis der zum Trainingsstart verwendeten Python-Datei. Weiterhin werden regelmäßig Checkpoint-Dateien mit dem Stand des Trainingsfortschrittes erzeugt. Diese Kombination aus JSON-basierter Konfigurationsdatei und Checkpoint kann dazu verwendet werden, die künstliche Stimme mit dem von Coqui TTS mitgelieferten Webserver zu erzeugen.
Beim Training des TTS-Modells gibt es kein festes Ende oder einen Fortschrittsbalken, der anzeigt, wann das Training beendet ist. Stattdessen gibt das Tensorboard anhand der Diagramme und Audio Samples Aufschluss, wann das Modell gut genug ist - um dann das Training zu beenden.
Sobald der Webserver mit dem Modell gestartet ist und die Erzeugung per Weboberfläche funktioniert, kann auch per API-Aufruf, beispielsweise mit cURL, eine künstliche Stimmausgabe generiert werden.
curl http://"Server":5002/api/tts?text=Hallo. -o hallo.wav
Für die Integration in bestehende Python-3-Programme steht mit cTTS ein simples Python-Modul zur Verfügung.
Wer sich den Ablauf, die eigene Stimme als TTS-Modell zu erzeugen, bildlich und detaillierter anschauen möchte, für den stehen auf dieser Youtube-Playlist einige Videos zur Verfügung.
Wie zu Beginn geschrieben, kann dieser Artikel das Thema nur oberflächlich beschreiben. Wer Interesse an dem Thema gefunden hat, wird in den Communities von Mycroft, Coqui oder auf meinem Twitter-Account @ThorstenVoice sicherlich hilfsbereite Ansprechpartner finden.
Happy TTS'ing :-).
Thorsten Müller beschäftigt sich als IT-Enthusiast mit Smart-Home-Konzepten und Themen rund um offene Sprachtechnologien (Sprachassistenten, Spracherkennung und Sprachsynthese). Sein Wissen teilt er in Open-Voice-Communities, auf Youtube und auf seinem Twitter-Account.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Training des TTS-Modells |
Durchaus. Aber wenn man mit dem 12MP ( Ton bei normaler Geschwindigkeit...
excellenter artikel, fehlt nur der link darauf ohne paginierung.
die gruppe für das Projekt ist MycroftAI nicht mycroft: https://github.com/MycroftAI...
Kommentieren