Videokonferenzen können nerven, und manch einer sehnt sich im Stillen nach einem Ausfall von Teams & Co. Aber was, wenn man die US-Plattformen gleich ganz loswerden will?
Smart Home ohne Cloud Unsere lokale Smarthome-Sprachsteuerung mit Home Assistant ist bereit. Fehlt noch die Hardware für eine bequeme Steuerung - am besten von der Couch aus.
Smart Home ohne Cloud Ich könnte mein Smart Home an die Cloud anbinden, einen günstigen Sprachassistenten kaufen und fertig. Will ich aber nicht. Mal sehen, was mir mein No-Cloud-Selbstversuch bringt.
Spannendes Web Die Bibliothek VueUse bietet viele vorgefertigte Bausteine über die Composition API von Vue 3 als Composables an, die wir genau anschauen.
Moderne Browser wandeln Text direkt in gesprochene Sprache um. Ein Feature, das viele Browser nativ unterstützen und das in mehrerlei Hinsicht wichtig ist.
Sprache in Text, Text in Sprache, Text aus Bildern: Azure AI Services ist eine Sammlung KI-gestützter APIs für den Kundensupport und andere nützliche Anwendungen.
Aktuelle Systeme können bei Spracherkennung und -erzeugung schon viel. Aber welches Potenzial und welche Risiken gibt es damit wirklich? Und wie weit lag klassische Science-Fiction daneben?
Mit den API-Keys können Angreifer angeblich auf bisherige Antworten aller R1-Geräte zugreifen, neue Antworten manipulieren und sämtliche KI-Handhelds unbrauchbar machen.
Eine 15-sekündige Aufnahme soll zum Klonen echter Stimmen reichen. Aus Sorge vor Wahlmanipulation will OpenAI die Software vorerst nicht veröffentlichen.
Der GPT-Marktplatz bietet kurz nach seinem Start reichlich selbst erstellte GPTs. Die Orientierung fällt schwer, es gibt aber einige schöne Überraschungen.
Ein Open-Source-Videokonferenzsystem, bei dem alles privat bleibt und das auch noch Spaß macht? Peer Heinlein versucht das mit Open Talk und hat uns von der Idee über Technik und Fuckups alles über sein Projekt erzählt.
Für maschinelles Sehen, Hören, Sprechen und Verstehen gibt es viele Einsatzmöglichkeiten. Wir erklären die Dienste von Microsoft und schauen dabei auch auf die Datensicherheit.
DevUpdate Google pflegt Code per Sensenmann, Github bringt eine neue Suche, KI-Coding-Werkzeuge treten gegeneinander an und werden frei. Außerdem bekommt das Web Grundfunktionen.
Im Heute Journal des ZDF wurde ChatGPT für ein Interview genutzt. Mit einem miesen Avatar wurde ein falscher Eindruck über die Möglichkeiten von KI erweckt.
In den USA gibt es eine neue Welle von Fake-Anrufen, die Polizeieinsätze auslösen sollen. Im Unterschied zu früheren Fällen werden bei den Anrufen künstlich erzeugte Stimmen eingesetzt.
Mit Machine Learning kann man ein lokal lauffähiges und hochwertiges TTS-Modell der eigenen Stimme herstellen. Dauert das lange? Ja. Braucht man das? Nein. Ist das absolut nerdig? Definitv!