100 Sprachen: Meta stellt KI-Modell für Übersetzungen vor

Meta hat das neue KI-Modell SeamlessM4T(öffnet im neuen Fenster) vorgestellt, das Texte und Sprache in fast 100 Sprachen übersetzen kann. Das Modell könnte die sprachübergreifende Kommunikation erheblich verbessern, wenn es in Apps eingebaut würde. Es wurde unter der Lizenz CC BY-NC 4.0 veröffentlicht.
Laut Meta stellt SeamlessM4T einen Durchbruch in der KI-gestützten Sprache-zu-Sprache- und Sprache-zu-Text-Übersetzung dar. Das Modell kann Übersetzungen auf Abruf bereitstellen, um eine effektivere Kommunikation zwischen Nutzern verschiedener Sprachen zu ermöglichen.
Entscheidend ist, dass SeamlessM4T gesprochene Wörter in einer Sprache direkt in gesprochene Wörter in einer anderen Sprache übersetzen kann, ohne dass separate Spracherkennungs- und Sprachidentifikationsmodelle erforderlich sind. Dies könnte die Effizienz der Übersetzung erhöhen, da Fehler und Verzögerungen durch mehrere Verarbeitungsschritte vermieden werden.
Das Modell sei auf der Grundlage von zig Milliarden gescrapten Satzpaaren und 4 Millionen Stunden Sprachdaten aus öffentlich zugänglichen Quellen trainiert worden, berichtete Techcrunch(öffnet im neuen Fenster) . Auch wenn dies ethische Bedenken hinsichtlich des Datenschutzes aufwerfe, gebe Meta an, die Daten seien offen oder lizenziert.
In den von Meta selbst durchgeführten Benchmarks übertraf SeamlessM4T andere Modelle in Bezug auf die Genauigkeit von Sprache zu Text. Das Unternehmen führt dies auf die Kombination von Sprach- und Texttrainingsdaten zurück, die SeamlessM4T über reine Sprach- oder Textsysteme hinaus ermöglicht.
Vorsichtiges Rollout
Um ethischen Bedenken Rechnung zu tragen, führt Meta SeamlessM4T vorsichtig als Open-Source-Modell ein, ohne die Sprachübersetzungsfunktion standardmäßig zu aktivieren. Das Unternehmen rät davon ab, das Modell für medizinische, juristische oder Übersetzungen zu verwenden, bei denen es auf extreme Genauigkeit ankomme.



