Spracherkennung

Entwickler versuchen, Computern und anderen Geräten beizubringen, gesprochene Worte zu erkennen. Das soll deren Bedienung vereinfachen: Statt Kommandos per Tastatur oder Maus einzugeben, erteilt der Nutzer gesprochene Eingaben. Texte sollen nicht mehr getippt, sondern diktiert werden. Spracherkennung ist nicht gleichzusetzen mit Stimmerkennung, also dem Verfahren, einen Menschen anhand des biometrischen Merkmals seiner Stimme zu identifizieren. Beide Verfahren ähneln sich aber.

Amazon Fire TV Stick HD mit 20 Euro Rabatt im Angebot (Bild: Amazon.de) (Amazon.de)

Deal Amazon Fire TV Stick HD mit 20 Euro Rabatt im Angebot

Der Fire TV Stick HD bringt moderne Streaming-Apps auf fast jeden TV. Bei Amazon wird der Stick aktuell für nur knapp 25 Euro angeboten.

Kommentare

Smarte Anona-4K-Überwachungskamera über 20 Euro günstiger (Bild: Amazon.de) (Amazon.de)

Deal Smarte Anona-4K-Überwachungskamera über 20 Euro günstiger

Die Anona Pano behält Innenräume in 4K-Auflösung im Blick. Bei Amazon gibt es die smarte Überwachungskamera aktuell für unter 40 Euro.

Kommentare

Workshops und Weiterbildungen: Administration von Microsoft 365? So gehts!

zum Artikel

Karriere Ratgeber: Karrieretag Familienunternehmen 2026: Jetzt bewerben und durchstarten

zum Ratgeber

Seminar: CustomGPTs zu KI-Assistenten entwickeln: virtueller Ein-Tages-Workshop

zum Kurs

E-Learning: Exklusiv: Microsoft 365 Sicherheit: Informationsschutz und Compliance (E-Learning)

zum Kurs

Cyber Defence Center Lead (m/w/d) Heidelberger Druckmaschinen AG, Wiesloch (öffnet im neuen Fenster)

Senior Incident Responder im Security Operations Center (SOC) Deutsche Rentenversicherung Bund, Würzburg,Homeoffice,Berlin (öffnet im neuen Fenster)

DMS Solution Engineer (m/w/d) WG SYSTEMS e.K., Berlin (öffnet im neuen Fenster)

Regulatory Reporting & Data Engineer SQL / ETL (w/m/d) ING Deutschland, Frankfurt am Main (öffnet im neuen Fenster)

Prozessmanager/in Schwerpunkt Digitalisierung und KI-Anwendungen (w/m/d) Vollzeit / Teilzeit Evangelisches Kreiskirchenamt Münsterland/Tecklenburger Land, Münster (öffnet im neuen Fenster)

IT-Systemadministrator (w/m/d) im Verbund CJD Berchtesgaden, Berchtesgaden (öffnet im neuen Fenster)

Ausbildung Fachinformatiker für Systemintegration (m/w/d) Landguth Heimtiernahrung GmbH, Ihlow (öffnet im neuen Fenster)

CRM Operations Specialist (m/w/d) itdesign GmbH, Tübingen (öffnet im neuen Fenster)

Matter-Steckdosen mit Energiemessung für Alexa und Google Home nur 8,12 Euro pro Stück (Bild: Amazon.de) (Amazon.de)

Deal Matter-Steckdosen im 4er-Pack nur 32,47 Euro bei Amazon

Universell kompatible WLAN-Steckdosen mit Matter-Standard: Vier Antela Smart Plugs mit starkem Rabatt bei Amazon.

Kommentare

Der klassische Chatbot ist nur der Anfang. (Bild: Mohamed_hassan/Pixabay) (Mohamed_hassan/Pixabay)

Mensch-Maschine-Schnittstellen: Wie Unternehmen sprachbasierte Interfaces sinnvoll einsetzen

Interfaces der Zukunft Sprach- und Chat-Interfaces machen den Umgang mit Rechnern und Maschinen intuitiver. Sie können zur Schlüsseltechnologie moderner Firmensoftware werden.

1 Kommentare / Ein Deep Dive von Klaus Manhart

Unter 38 Euro für den Bestseller: Wireless-Apple-Carplay-Adapter jetzt stark reduziert bei Amazon (Bild: Amazon.de) (Amazon.de)

Deal Wireless-Carplay-Adapter fast zum halben Preis bei Amazon

Dieser Adapter macht aus jedem Apple-Carplay-System eine kabellose Lösung, ist Bestseller Nr. 1 und aktuell besonders günstig.

Burger King will seine KI-gestützte Asisstant-Plattform bis Ende 2026 in allen Filialen in den USA einführen. (Bild: NIKLAS HALLE'N/AFP via Getty Images) (NIKLAS HALLE'N/AFP via Getty Images)

Bitte und Danke: Burger King will Kundenfreundlichkeit mit KI bewerten

Ein Sprachassistent soll Burger-King-Angestellte bei der Zubereitung von Speisen unterstützen und deren Freundlichkeit überwachen.

15 Kommentare

Vier Matter-Steckdosen mit Energiemessung für Alexa und Google Home (Bild: Amazon.de) (Amazon.de)

Anzeige Matter-Steckdosen im Viererpack unter 33 Euro bei Amazon

Universell kompatible WLAN-Steckdosen mit Matter-Standard: Vier schlaue Steckdosen jetzt mit starkem Rabatt bei Amazon.

Rekordpreis bei Amazon: Die DJI Neo 2 4K-Video-Drohne fällt auf den Tiefstpreis. (Bild: Erzeugt mit DALL·E 3, Amazon, DJI) (Erzeugt mit DALL·E 3, Amazon, DJI)

Anzeige DJI Neo 2 Drohne zum historischen Tiefstpreis im Angebot

So günstig wie nie zuvor lockt die neue Bestseller 4K-Video-Drohne DJI Neo 2 jetzt bei Amazon zum Tiefstpreis.

Seminar: Weiterbildung: KI-Manager (TÜV)

zum Kurs

Seminar: Microsoft Entra ID (Azure Active Directory): virtueller Ein-Tages-Workshop

zum Kurs

Seminar: Intensivseminar KI-Management

zum Kurs

Seminar: Weiterbildung: KI-Koordinator

zum Kurs

Amazons Alexa+ geht offiziell an den Start. (Bild: Amazon) (Amazon)

Amazon: Alexa+ mit KI startet offiziell in den USA

Prime-Nutzer in den USA können die neue KI-Alexa jetzt kostenlos und unlimitiert verwenden. Es gibt auch eine eingeschränkte kostenlose Version.

2 Kommentare

Raspberry Pi Pico 2 (Bild: Raspberry Pi) (Raspberry Pi)

Neuronales Netzwerk zur Spracherkennung: Maschinelles Lernen für Mikrocontroller

Komplexe neuronale Netzwerke ganz klein: intelligenter Raspberry Pi Pico 2 dank LiteRT-Framework und Zephyr.

1 Kommentare / Eine Anleitung von Stefan Gloor

Er sieht aus wie Werner Herzog, aber wir können uns da nicht sicher sein. (Bild: Film Constellation) (Film Constellation)

About a Hero kostenlos streamen: Der interessanteste KI-Film des Jahres

Endlich ein KI-Film ohne Apokalypse, lebende Puppen, Dystopie oder mordendes Smart Home! Die Werner-Herzog-Mockumentary About a Hero ist ein surrealer Trip.

7 Kommentare / Eine Rezension von Daniel Pook

Sieht nett aus, oder? Ob er eine freundliche Persönlichkeit hat? Nein, er hat gar keine. (Bild: Alexandra_Koch/Pixabay) (Alexandra_Koch/Pixabay)

Bewusstsein und Persönlichkeit bei LLMs: Ist der nett oder tut er nur so?

Manche Nutzer entdecken bei LLMs eine "Persönlichkeit", die Wissenschaft verneint das. Aber auch ohne Persönlichkeit verraten LLMs einiges.

13 Kommentare / Ein Bericht von Tim Reinboth

Apple CarPlay- und Android-Auto-Displays im Rabattfeuerwerk der Black Friday Woche bei Amazon (Bild: Amazon.de) (Amazon.de)

Anzeige Apple CarPlay-Displays - Top-Angebote zum Black Friday

Vom kleinen 6,8-Zoll-Screen bis zum 11,5-Zoll-Display: 5 CarPlay- und Android Auto-Modelle mit starken Rabatten in der Black Friday Woche.

Smarter Preis, smarte Dose: TP-Link Tapo P110 Smart-Steckdose jetzt befristet zum Bestpreis sichern (Bild: Amazon.de) (Amazon.de)

Anzeige Bestseller-Smart-Steckdose Tapo P110 jetzt für unter 10 Euro

Die Tapo P110 ist Bestseller Nr. 1 bei smarten Steckdosen und jetzt für kurze Zeit stark reduziert im Angebot.

Die Chipsätze von 3Dfx waren in den 1990er sehr beliebt - und erleben eine Renaissance. (Bild: Public Domain/Montage: Golem.de) (Public Domain/Montage: Golem.de)

Podcast Besser Wissen: Als Grafikkarten Voodoo waren

Enderal ist eine eigene Welt, die mit der Skyrim-Engine umgesetzt wurde. (Bild: SureAI / Montage: Golem) (SureAI / Montage: Golem)

Podcast Besser Wissen: Die andere Seite von Skyrim

Hilft uns generative KI wirklich? (Bild: Pixabay / Montage: Golem.de) (Pixabay / Montage: Golem.de)

Podcast Besser Wissen: Lernendes System und Gefahr für die Gesellschaft?

Der Amiga 1200 war einer der letzten klassischen Heimcomputer. (Bild: Public Domain / Montage: Golem.de) (Public Domain / Montage: Golem.de)

Podcast Besser Wissen: Der Amiga und sein Club

Der Atari Portfolio kam nicht wirklich von Atari. (Bild: Daniel Juřena from Prague, Czech Republic, CC BY-SA 2.0 via Wikimedia Commons) (Daniel Juřena from Prague, Czech Republic, CC BY-SA 2.0 via Wikimedia Commons)

Podcast Besser Wissen: Vom Kiddicomp zum PDA

Der PDP 1 war für damalige Zeit ein kompakter Computer. (Bild: Marcin Wichary from San Francisco, Calif., CC BY 2.0, via Wikimedia Commons) (Marcin Wichary from San Francisco, Calif., CC BY 2.0, via Wikimedia Commons)

Podcast Besser Wissen: Wie der PDP 1 die Welt veränderte

Informatiker, Kognitionswissenschaftler und Robotikexperte Rodney Brooks (Bild: Rodney Brooks) (Rodney Brooks)

Humanoide Roboter: Roboterentwicklung könnte an falscher Lernmethode scheitern

Weil komplexe Bewegungsabläufe nicht so erlernbar sind, wie Tesla oder Figure es gern hätten, bleibt der Humanoid ein Traum, meint Rodney Brooks.

14 Kommentare

Gemma 3 270M ist klein verglichen mit anderen Modellen. (Bild: KI-generiert durch Bing Image Creator/GPT-4o) (KI-generiert durch Bing Image Creator/GPT-4o)

Google: Kleinste Gemma-KI soll besonders energiesparend sein

Das LLM Gemma 3 270M hat nur 270 Millionen Parameter. Es soll sich deshalb vor allem lokal auf mobilen Geräten nutzen lassen - mit Einschränkungen.

7 Kommentare

Schach ist eben nicht das Spiel der KIs. (Bild: Pixabay.com) (Pixabay.com)

Schachmatt: ChatGPT verliert gegen Atari 2600 im Schach

Ein Computer von 1977 tritt gegen ein modernes LLM an. Das Ergebnis überrascht auf den ersten Blick, auf den zweiten ist es logisch.

95 Kommentare

Ein ausgestelltes iPhone (Symbolbild) (Bild: Ming Yeung/Getty Images) (Ming Yeung/Getty Images)

iMessage: Kurioser Bug filtert Sprachnachrichten mit Ben & Jerry's

Per Sprachnachricht in iMessage ein Ben & Jerry's zu bestellen, ist dieser Tage keine gute Idee. Ein Bug sorgt dafür, dass die Bestellung nie ankommt.

7 Kommentare

Claude ist aktuell noch nicht in der Lage, auf das Internet einfach so zuzugreifen. Das soll sich bald ändern. (Bild: KI-generiert durch Copilot Designer/Dall-E) (KI-generiert durch Copilot Designer/Dall-E)

KI-Chatbot: Claude kann künftig das Internet durchsuchen

Durch Websuchen soll das KI-Modell vor allem aktuelle und relevante Informationen aus dem Netz für ausführlichere Ausgabeergebnisse nutzen können.

3 Kommentare

Der AVM von ChatGPT: schon recht nah dran an einer Unterhaltung mit einem Menschen (Bild: Mohamed_hassan/Pixabay) (Mohamed_hassan/Pixabay)

Advanced Voice Mode von ChatGPT: Wie gut sind die erweiterten Sprachfunktionen?

OpenAI stellt den Advanced Voice Mode fast flächendeckend zur Verfügung, spart aber weiterhin in einigen Ländern an Funktionen. Wir haben ihn ausprobiert.

Kommentare / Ein Praxistest von Fabian Deitelhoff

Siri verhält sich seltsam (Bild: Apple) (Apple)

Streich oder Programmierfehler: Apples Spracherkennung macht aus Rassist kurzzeitig Trump

Apple-Nutzer entdecken, dass Siri das Wort Rassist in der Diktierfunktion als Trump transkribiert. Möglich, dass es sich um einen Programmierscherz handelt.

5 Kommentare

Neue Ideen fürs Smart Home (Bild: Jakub Zerdzicki/Pexels) (Jakub Zerdzicki/Pexels)

Sprachsteuerung mit Home Assistant: "Schalte wie trine aus"

Smart Home ohne Cloud Ich will ein Smart Home ohne Cloud und es per Text und Sprache steuern. Ob Home Assistant mich versteht?

4 Kommentare / Eine Anleitung von Thorsten Müller

Computer der 90er sind noch immer für interessante Projekte zu gebrauchen. (Bild: Pexels.com) (Pexels.com)

Llama: Modernes KI-Modell läuft lokal auf Pentium 2 und Windows 98

Ein Forschungsteam hat das Experiment gewagt und Metas Llama-Modell und ein paar andere Sprachmodelle auf Hardware der 90er ausgeführt.

34 Kommentare

KI Gemini 2.0 Flash Thinking Experimental ist da. (Bild: Google) (Google)

Gemini 2.0 Flash Thinking: Google stellt experimentelle Argumentations-KI vor

Google hat Gemini 2.0 Flash Thinking Experimental vorgestellt, ein neues KI-Modell, das die Argumentationsfähigkeiten von KI verbessern soll.

Kommentare

ChatGPT Pro kostet eine Menge Geld. (Bild: KI-generiert durch Copilot Designer/Dall-E) (KI-generiert durch Copilot Designer/Dall-E)

OpenAI o1 und o1-Mini: Neues ChatGPT-Abo kostet 230 Euro

Für den hohen monatlichen Preis bekommen User Zugriff auf o1, OpenAIs neues Sprachmodell für komplexe Aufgaben.

55 Kommentare

Das aktuelle KI-Training mit großen Datensätzen reicht laut Huang nicht aus, um gute Ergebnisse zu erzielen. (Bild: Justin Sullivan/Getty Images) (Justin Sullivan/Getty Images)

Jensen Huang: Vertrauenswürdige KI ist noch Jahre entfernt

Laut dem Nvidia-CEO funktioniert KI erst dann richtig gut, wenn Menschen deren Ergebnisse nicht mehr hinterfragen müssen.

19 Kommentare

Es ist ätzend, wenn der Homepod gar nicht mehr auf Siri-Befehle reagiert. (Bild: Noah Berger/AFP via Getty Images) (Noah Berger/AFP via Getty Images)

Apples Sprachsteuerung: Siri funktioniert auf Homepods nicht

Apples Lautsprecher lassen sich zum Teil seit Wochen nicht mehr mit der Stimme steuern. Wird Siri nicht auf einem Homepod verwendet, treten diese Probleme nicht auf.

2 Kommentare

OpenAI-Website auf einem Smartphone (Bild: Pexels) (Pexels)

ChatGPT: Leak des O1-Modells von OpenAI zeigt Fähigkeiten

Vorübergehend ist das O1-Modell von OpenAI verfügbar gewesen und hat Einblicke in die neuesten Fortschritte gegeben.

19 Kommentare

Gemini hat einen Konversationsmodus, der künftig auch auf Deutsch verwendet werden kann. (Bild: Google) (Google)

Gemini Live: Googles gesprächige KI kommt auf Deutsch

Bislang ist Googles KI-Livemodus Gemini Live nur auf Englisch verfügbar - das ädert sich: Zu über 40 neuen Sprachen gehört auch Deutsch.

2 Kommentare

Mistral Large 2 ist da (Bild: Mistral AI) (Mistral AI)

Sprachmodell: LLM Mistral Large 2 mit 123 Milliarden Parametern ist da

Mistral AI hat die Veröffentlichung von Mistral Large 2, der neuen Version seines KI-Sprachmodells bekannt gegeben.

7 Kommentare

Wir haben das neue LLM unter anderem mit James Joyces Ulysses auf die Probe gestellt. (Bild: Fran Caffrey / AFP via Getty Images) (Fran Caffrey / AFP via Getty Images)

Large Language Model: DeepL setzt neues Übersetzungssystem ein

Der Sprachspezialist DeepL hat ein neues Sprachmodell enthüllt, das auf einer speziell für Übersetzungen entwickelten LLM-Technologie basiert. Wir haben es ausprobiert.

39 Kommentare / Ein Hands-on von Michael Linden

Mit Home Assistant muss man etwas basteln. (Bild: Ryan McGuire auf Pixabay) (Ryan McGuire auf Pixabay)

Home Assistant: Smart Home mit Sprachsteuerung für Experimentierfreudige

Vollständig lokal und ohne Clouddienste funktioniert die Smart-Home-Steuerung mit Home Assistant. Spaß am Tüfteln ist allerdings Voraussetzung.

5 Kommentare / Von Thorsten Müller

Anthropic bringt Claude AI nach Europa. (Bild: Anthropic) (Anthropic)

Großes Sprachmodell: Anthropic führt Claude AI auf dem europäischen Markt ein

Anthropic hat den europäischen Start seines generativen KI-Assistenten Claude angekündigt und bringt auch eine iPhone-App auf den Markt.

Kommentare

KI: OpenAI stellt GPT-4o und Tool für den Desktop vor

OpenAI hat mit GPT-4o ein neues Sprachmodell vorgestellt Das Tool soll nahezu in Echtzeit per Sprachausgabe kommunizieren können.

5 Kommentare

Tesla-Steuerhorn (Bild: Pexels) (Pexels)

Künstliche Intelligenz: Tesla soll fahrzeuginternen Sprachassistenten vorbereiten

Tesla könnte bald einen eigenen Sprachassistenten einführen, wie aus dem Quellcode des jüngsten Softwareupdates hervorgeht.

13 Kommentare

Die Nextcloud-KI soll gerade europäische Kunden ansprechen. (Bild: Nextcloud/KI-generiert mit Copilot Designer) (Nextcloud/KI-generiert mit Copilot Designer)

KI und europäische Cloud: Nextcloud bringt Open-Source-Alternativen zu Copilot

Die Sprach- und Text-KI-Assistenten von Nextcloud sollen auch auf lokalen Servern zum Laufen gebracht werden können.

7 Kommentare

Fitbit geht endgültig in Google auf. (Bild: Fitbit) (Fitbit)

Kosten senken, Angestellte entlassen: Google streicht Pixel, Fitbit und Nest zusammen

Alphabet verliert erneut Hunderte Beschäftigte, darunter Hardware-Ingenieure, Entwickler des Sprachassistenten und die Fitbit-Gründer.

9 Kommentare

Ein Buckelwal taucht gerade auf. (Bild: Pixabay) (Pixabay)

(Extra)terrestrische Sprache: Was uns Wale über die Kommunikation mit Aliens verraten

Ein Forschungsteam konnte 20 Minuten lang mit einem Buckelwal kommunizieren. Die Art der Kontaktaufnahme könnte bei der Suche nach außerirdischem Leben im Weltall helfen.

23 Kommentare

Amazons Alexa soll chatten wie ein Mensch. (Bild: Berti Kolbow-Lehradt) (Berti Kolbow-Lehradt)

Sprachassistent: Hunderte Entlassungen bei Amazons Alexa-Team

Amazon plant weitreichende Entlassungen in seiner Alexa-Abteilung und will Hunderte von Stellen streichen.

16 Kommentare

Was Douglas Adams wohl zu Grok sagen würde? (Bild: grok.x.ai/Screenshot: Golem.de) (grok.x.ai/Screenshot: Golem.de)

xAI: Musk schaltet ChatGPT-Konkurrent Grok frei

Das neue KI-Sprachmodell von X soll an das Buch Per Anhalter durch die Galaxis angelehnt sein. Humorlose Nutzer sollen die Finger davon lassen.

72 Kommentare

Elon Musk (Bild: The Royal Society) (The Royal Society)

xAI: Musks KI-Start-up will Sprachmodell am Samstag freigeben

Elon Musks neues Start-up für künstliche Intelligenz, xAI, bereitet sich darauf vor, an diesem Wochenende sein erstes KI-System zu enthüllen.

30 Kommentare

Mit Bard soll der Google Assistant neue Funktionen bekommen. (Bild: Nikos Pekiaridis via Reuters Connect) (Nikos Pekiaridis via Reuters Connect)

Künstliche Intelligenz: Google Assistant soll mit Bard besser werden

Mit Bard will Google seinen Sprachassistenten verbessern. Unter anderem soll der Google Assistant auch Informationen aus E-Mails beziehen und Einkaufslisten erstellen.

7 Kommentare

LeoLM basiert auf Llama. (Bild: Pixabay) (Pixabay)

Laion: Riesiges Sprachmodell für Deutsch trainiert

Die KI-Forschungsgruppe Laion hat das freie Llama-Modell für Deutsch angepasst. Das soll vor allem die englischsprachige Dominanz brechen.

4 Kommentare

Spotify will Podcasts in verschiedenen Sprachen durch KI anbieten. (Bild: Pixabay.com) (Pixabay.com)

Mit OpenAI: KI wird Spotify-Podcasts übersetzen

Mit OpenAIs Whisper-Modell kann Spotify die Stimmen von Podcastern beibehalten und in andere Sprachen übersetzen - auch ins Deutsche.

1 Kommentare

Microsoft verabschiedet Cortana aus Windows. (Bild: Justin Sullivan/Getty Images) (Justin Sullivan/Getty Images)

Ein Sprachassistent weniger: Microsoft entfernt Cortana aus der Windows 11 Preview

Microsoft hatte schon angekündigt, Cortana aus Windows entfernen zu wollen. Die Preview von Windows 11 erhält nun ein entsprechendes Update.

18 Kommentare

Das fällt der KI Stable Diffusion zu den Stichwörtern Deutschland und künstliche Intelligenz ein. (Bild: KI-generiert mit Stable Diffusion) (KI-generiert mit Stable Diffusion)

KI: Deutschland lässt denken

Forschung in D Die USA und China gelten als führend in der KI. Aber Deutschland steht auch nicht schlecht da. Einige bekannte und sehr gute Anwendungen wurden hierzulande entwickelt.

Kommentare / Ein Bericht von Werner Pluta