Transkriptionssoftware Whisper: Der Schützemöbchen-Report
Das Transkriptionsprogramm Whisper kann sehr gute Ergebnisse bei der Spracherkennung liefern. Das lässt sich sogar weitgehend automatisieren.
Die Transkription von Besprechungen und Interviews gehört zu den nervigsten Arbeiten, die in einem Büro oder einer Redaktion zu erledigen sind. Inzwischen gibt es mit KI-basierten Programmen wie Whisper von OpenAI jedoch Lösungen, die ziemlich schnell ziemlich gute Ergebnisse liefern. Um das Programm innerhalb einer Organisation bereitzustellen, haben wir ein Python-Script für eine Art Whisper-Server entwickelt. Zudem lassen sich die transkribierten Texte durch eine Code-Anpassung für herkömmliche Transkriptionsprogramme wie F4 ausgeben.
Der Vorteil an Whisper: Das Programm lässt sich problemlos auf dem eigenen Rechner installieren. Das funktioniert sowohl für Linux als auch für Windows. Allerdings gibt es deutliche Unterschiede, was die Transkriptionsgeschwindigkeit je nach Hardware und eingesetztem Modell betrifft. So dauert es auf einem älteren Laptop mit einem Intel i5-5200U mehrere Stunden, um eine halbe Stunde Gespräch mit dem kleinen Modell (small) zu transkribieren. Daher haben wir uns eine Lösung überlegt, wie möglichst viele Kollegen von einer Installation mit einer schnellen Hardware mit Grafikkarte profitieren können.









