Zum Hauptinhalt Zur Navigation Zur Suche

Datenübertragung mit eingebauter SIM

Anschließend wird die Audiodatei automatisch über eine in das Ladecase eingebaute 4G-Verbindung an die Cloud übertragen und von Mobvois KI Shadow AI transkribiert und ausgewertet. Für eine Stunde Audioaufnahme braucht die KI dem Hersteller zufolge drei Minuten – wir hatten das Gefühl, dass es manchmal aber auch länger gedauert hat.

Der Vorteil der eingebauten Datenverbindung ist, dass wir die Pods bzw. das Case nach einer Aufnahme nicht an ein Gerät anschließen und die Aufnahme hochladen müssen. Die Synchronisierung erfolgt automatisch und Nutzer können einfach nach ein paar Minuten über die Ticnote-App oder das Web-Interface von Shadow AI auf die Transkription und die Auswertung zugreifen.

Bei der Abschrift erkennt die KI unterschiedliche Sprecher, was in der Regel gut funktioniert. Im Transkript können wir die Namen der unterschiedlichen Sprecher ändern. Wir haben Gespräche auf Deutsch aufgezeichnet, auf den ersten Blick sehen die Transkriptionen gut aus. Schauen wir aber genauer hin, merken wir, dass immer wieder Teile der Aufnahme fehlen.

Transkription erfasst bei uns nicht alle aufgenommenen Inhalte

Manchmal fehlen komplette Wortmeldungen, an anderen Stellen hört die Transkription einfach mitten im Satz auf, obwohl der Wortbeitrag noch nicht beendet ist. Die Aufnahme ist an derartigen Stellen eigentlich gut zu verstehen gewesen. Es fehlen in der Regel immer nur 20 bis 30 Sekunden, was aber die Auswertung, die der KI-Agent auch erstellt, durchaus verzerren kann.

An der Aufnahmequalität kann es eigentlich nicht liegen. Diese ist zwar nicht gerade auf Hi-Fi-Niveau, aber sowohl bei Aufzeichnungen virtueller Gespräche als auch bei Unterhaltungen in der realen Welt über das Ladeetui ist alles gut zu verstehen. Laut Mobvoi sollen die Mikros Stimmen in bis zu zehn Metern Entfernung erfassen können.

Neben der reinen Abschrift bekommen wir zu jeder Aufnahme eine ausführliche Zusammenfassung. Bei Besprechungen kreiert die KI übersichtlich Kernaussagen, Herausforderungen, Handlungsempfehlungen und To-do-Listen. Diese Zusammenfassung lässt sich auch editieren, was notwendig ist, da die KI nicht immer alles richtig versteht.

So versteht Shadow AI wenig überraschend keinen Humor – witzig gemeinte Halbsätze werden so schon mal als ernsthafte Kommentare in die Auswertung aufgenommen. Aber auch andere Zusammenhänge versteht die KI nicht immer, was natürlich die Qualität der Auswertungen beeinflusst – und die der weiteren zu erstellenden Dateien, dazu gleich mehr.

Auswertungen mit verschiedenen Vorlagen

Die Auswertungen folgen unterschiedlichen Vorlagen, aus denen Shadow AI automatisch eine anhand des Inhaltes wählt – welche der zahlreichen es ist, ist uns nicht klar geworden. Es gibt unter anderem Auswertungsvorlagen für verschiedene Interviews oder Meetingformen, bei denen jeweils unterschiedliche Schwerpunkte gesetzt werden.

Die Templates machen in der Übersicht der Auswertung durchaus einen Unterschied. So fanden wir die Auswertung der morgendlichen Frühkonferenz in der Golem-Redaktion mit dem Meeting-Template übersichtlicher als mit der Standardansicht.

Wir können auch eigene Auswertungsvorlagen erstellen, bei denen wir der KI in einem Prompt Anweisungen geben können, wie die Transkription aufbereitet werden soll. Folgende KI-Modelle können ausgewählt werden: GPT-5, GPT-4.1, GPT-4, Claude 4, Gemini 3 oder Grok 3.


Relevante Themen