Tencent Hunyuan Video: Kostenloses KI-Modell für Videogenerierung vorgestellt

Hunyuan Video(öffnet im neuen Fenster) ist ein KI-Modell aus China, das das mit entsprechend teurer Hardwareausstattung lokal ausgeführt werden kann. Es tritt in Konkurrenz zu geschlossenen kommerziellen Systemen wie Sora, Runway Gen-3 Alpha und Minimax video-01, die bisher den Markt dominieren.
Jüngste Tests von Ars Technica(öffnet im neuen Fenster) zeigten, dass Hunyuan Video 5-Sekunden-Videos mit einer Auflösung von 864 × 480 Pixeln und einer Verarbeitungszeit von sieben bis neun Minuten pro Clip auf dem Cloudrechendienstleister Replicate(öffnet im neuen Fenster) für rund 70 US-Cent pro Stück generieren kann. Das Modell steht frei zum Download und zur Modifizierung zur Verfügung.
Ein wesentliches Unterscheidungsmerkmal von Hunyuan Video ist die Fähigkeit, ohne inhaltliche Einschränkungen zu arbeiten. Dies unterscheidet es von kommerziellen Alternativen, die in der Regel eine strenge Inhaltsfilterung implementieren.
Technische Möglichkeiten und aktuelle Einschränkungen
Das Modell liefert laut Ars Technica in verschiedenen Testszenarien vielversprechende Ergebnisse, von der Generierung kommerzieller Inhalte bis hin zur Erstellung komplexer Handlungsabläufe.
Technische Analysen deuten darauf hin, dass Hunyuan Video auf handelsüblicher Hardware mit 24-GByte-VRAM-GPU auch lokal funktionieren kann. Das Modell unterstützt Feinabstimmungen und LoRA-Implementierungen, so dass Benutzer das System anpassen können.
Wie so oft bei KI-Videos gibt es jedoch auch Probleme bei der Darstellung von Texten und anatomischen Gegebenheiten. Das Modell scheint einige Einschränkungen bei der Reproduktion von Prominenten zu haben, was auf spezifische Metadatenbeschränkungen in den Trainingsdaten hindeutet, wie Ars Technica vermutet.



