Chatbot: ChatGPT kann bald sehen und sprechen
ChatGPT kann nach Aufforderung die Antworten auf Fragen bald laut aussprechen. Nach ersten Nutzermeldungen klingt die Stimme sanft, menschlich und ausdrucksstark, mit natürlichem Tonfall und Sprachtempo. Die Funktion wird in den nächsten zwei Wochen Stück für Stück ausgerollt
Um mit der Sprachsteuerung zu beginnen, nutzen Anwender in der iOS-App die Einstellung Neue Funktionen und wählen die Sprachkonversationen sowie eine von fünf Stimmen aus.
Für die neue Sprachfunktion hat OpenAI mit professionellen Synchronsprechern gearbeitet, um jede Stimme zu erstellen. Zudem verwendet die App Whisper, ein von OpenAI entwickeltes Spracherkennungssystem, um die gesprochenen Worte des Anwenders in Text umzuwandeln.
Auf dem Desktop erlaubt ChatGPT noch keine direkten Gespräche, sondern spricht die Antworten auf Befehl laut aus. Eine Spracherkennung am PC ist noch nicht vorhanden.
ChatGPT kann Bilder analysieren
Neben der Sprachausgabe erhält ChatGPT zudem eine neue Funktion, die es Nutzern ermöglicht, Bilder zur Analyse hochzuladen. Auf diese Weise kann ChatGPT Bilder beschriften, Fragen dazu beantworten, Unstimmigkeiten erkennen und vieles mehr. Anwender haben die Möglichkeit, Kästchen auf Teile von Bildern zu zeichnen, um die Aufmerksamkeit der KI gezielt zu fokussieren. Diese Funktion eröffnet neue Möglichkeiten der Interaktion zwischen Nutzer und KI und erweitert den Anwendungsbereich von ChatGPT.
Die Funktionen zur Bilderkennung hat OpenAI schon im März 2023 vorgestellt, bisher aber noch nicht veröffentlicht. Mit der Integration dieser Funktionen in ChatGPT wird nun ein weiterer Schritt in Richtung eines umfassenden KI-Assistenten gemacht, der sowohl Text als auch Bilder verarbeiten und analysieren kann.
Um Anwendern einen ersten Eindruck von den Fähigkeiten der Sprachausgabe zu vermitteln, stellt der Hersteller einige Sprachsamples von ChatGPTs Sprachausgabe online zur Verfügung. Diese Beispiele sollen die Qualität und Natürlichkeit der Stimmen demonstrieren und potenziellen Nutzern einen Einblick in die Möglichkeiten der Sprachinteraktion mit ChatGPT geben.
- Anzeige Hier geht es zu Künstliche Intelligenz: Wissensverarbeitung bei Amazon Wenn Sie auf diesen Link klicken und darüber einkaufen, erhält Golem eine kleine Provision. Dies ändert nichts am Preis der Artikel.