Sprachassistent Leon: Basteln am virtuellen Hirn des eigenen KI-Assistenten

10.000 Stars bei Github und vollmundige Versprechungen der Entwickler: Der quelloffene virtuelle Sprachassistent Leon scheint besonders attraktiv. Zwar ist er es (noch) nicht, einen Blick ist er trotzdem wert.

Artikel von Thorsten Müller veröffentlicht am
Die Erwartungungen an Leons virtuelles Gehirn sollte nicht zu hoch sein.
Die Erwartungungen an Leons virtuelles Gehirn sollte nicht zu hoch sein. (Bild: KI-generiert mit Stable Diffusion / Golem.de)

"Du kannst dir Leon als dein virtuelles Gehirn vorstellen": Die Projektseite des persönlichen virtuellen Assistenten auf Github stapelt nicht gerade tief und weckt hohe Erwartungen. Hoch ist daher auch das Frustpotenzial.

Inhalt:
  1. Sprachassistent Leon: Basteln am virtuellen Hirn des eigenen KI-Assistenten
  2. Leon: Voraussetzungen & Installation
  3. Leon-Funktionen alias Skills
  4. Sprachfunktionalität hinzufügen

Leons Fähigkeiten - oder neudeutsch: Skills - sollen Anwender unter anderem dabei unterstützen, tägliche Routineaufgaben zu automatisieren. Der Assistent steht als Open Source zur Verfügung, die Interaktion zwischen ihm und seinen Anwendern kann entweder, wie bei anderen persönlichen Assistenzsystemen, sprachbasiert oder auch textuell sein. Wichtig ist der Hinweis des Entwicklers: "can live on your server" - kann also auf der heimischen Infrastruktur betrieben werden. Das dezente "can" wird gleich noch wichtig.

Offline oder nicht

Wer sich nach offenen (Sprach-)Assistenten jenseits der cloudbasierten Produkte großer Technologieunternehmen umschaut, den beschäftigt nicht selten die folgende Frage: Kann dieser Sprachassistent offline betrieben werden? Sei es aus Gründen des Datenschutzes oder vielleicht, weil keine durchgehende oder stabile Internetverbindung gewährleistet werden kann.

Für Leon lautet die klare Antwort: jein. Und so ist auch das "can live on your server" zu verstehen. Möchte man mit seinem persönlichen Assistenten ausschließlich in Textform kommunizieren, so kann Leon ohne internetabhängige Dienste betrieben werden. Wer aus einem persönlichen Assistenten einen persönlichen Sprach-Assistenten machen möchte, der muss etwas ins Kleingedruckte schauen.

Wenig überraschend ist, dass dafür Komponenten für Spracherkennung (STT) und Sprachausgabe (TTS) benötigt werden. Hier bietet Leon eine breite Auswahl an möglichen Optionen. Im Bereich der Spracherkennung (STT) werden aktuell drei Möglichkeiten angeboten: Google Cloud, IBM Watson, Coqui STT. Die Unterstützung von zwei weiteren Diensten (Alibaba Cloud und Microsoft Azure) zur Spracherkennung ist laut Entwickler geplant. Davon ist Coqui STT die einzige Option, die lokal betrieben werden kann.

Vergleichbar sieht es im Bereich der Sprachausgabe (TTS) aus. Derzeit werden die vier Dienste Google Cloud, AWS, IBM Watson und CMU Flite unterstützt. Geplant ist, analog zu STT, noch die Alibaba-Cloud- und Microsoft-Azure-Unterstützung. Hier bildet CMU Flite die einzige offline lauffähige TTS-Komponente.

Natürlich ist jeweils eine lokal lauffähige Option für STT und TTS ausreichend, wenn man nicht beim weiteren Lesen der Dokumentation folgenden Hinweis sehen würde: "The offline STT and offline TTS only work for the en-US language. More languages will come later." Derzeit scheint der Offline-Sprachbetrieb nur in englischer Sprache zu funktionieren. Wobei zumindest Coqui STT prinzipiell auch die deutsche Sprache unterstützt.

Zusammengefasst bedeutet dies: Leon als Sprachassistent kann derzeit im englischsprachigen Betrieb lokal oder im deutschsprachigen Einsatz mit Cloudsprachdiensten betrieben werden.

Auf die Registrierung bei Clouddiensten und der Beantragung von API-Schlüsseln wurde im Rahmen dieses Artikels verzichtet und Leon stattdessen für den lokalen und englischsprachigen Betrieb konfiguriert. Genutzt wurde die Version 1.0.0-beta.7.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
Leon: Voraussetzungen & Installation 
  1. 1
  2. 2
  3. 3
  4. 4
  5.  


spitfire_ch 09. Nov 2022

In der Tat! Meine Hoffnung ruht noch immer auf Googles LaMDA, falls dies jemals auf die...

Avarion 09. Nov 2022

Er kann auch Aktionen ausführen und Informationen speichern. zb könnte er das Smarthome...



Aktuell auf der Startseite von Golem.de
Star Wars
Holiday Special jetzt in 4K mit 60 fps

Eine bessere Story bekommt der legendär schlechte Film dadurch leider nicht. Bis heute lieben ihn einige Fans aber vor allem wegen seiner Absurdität.

Star Wars: Holiday Special jetzt in 4K mit 60 fps
Artikel
  1. Lohn und Gehalt: OpenAI-Entwickler verdienen bis zu 800.000 US-Dollar im Jahr
    Lohn und Gehalt
    OpenAI-Entwickler verdienen bis zu 800.000 US-Dollar im Jahr

    Die Firma hinter Chat-GPT zahlt im Vergleich zu Unternehmen wie Nvidia besonders gut. Erfahrene Forscher und Entwickler auf dem Gebiet sind Mangelware.

  2. Software-Probleme: Elektrischer Chevy Blazer mit Verkaufsstopp belegt
    Software-Probleme
    Elektrischer Chevy Blazer mit Verkaufsstopp belegt

    Chevrolet hat einen Verkaufsstopp für sein neues Elektro-SUV Blazer verhängt, weil die Besitzer zahlreiche Softwareprobleme gemeldet haben.

  3. USA: Vertikale Agri-Photovoltaik lässt weiterhin Feldnutzung zu
    USA
    Vertikale Agri-Photovoltaik lässt weiterhin Feldnutzung zu

    Das US-Solarunternehmen iSun und der deutschen Agrivoltaik-Firma Next2Sun bauen in den USA eine Solaranlage mit vertikal aufgestellten Solarmodulen.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Crucial P5 Plus 2 TB mit Kühlkörper 114,99€ • Crucial Pro 32 GB DDR5-5600 79,99€ • Logitech G915 TKL LIGHTSYNC RGB 125,11€ • Anthem PC 0,99€ • Wochenendknaller bei MediaMarkt • MindStar: Patriot Viper VENOM 64 GB DDR5-6000 159€, XFX RX 7900 XT Speedster MERC 310 Black 789€ [Werbung]
    •  /