Zum Hauptinhalt Zur Navigation

Gemini Veo3 ausprobiert: KI-Videoclips auf einem völlig neuen Niveau

Googles Veo3 bringt Ton in die auf Social Media beliebten KI-Videoclips. Wir haben es ausprobiert und beantworten die Frage, für wen sich das teure Abo lohnt.
/ Martin Wolf
48 Kommentare News folgen (öffnet im neuen Fenster)
Ein virales Video eines landenden Ufos aus Sicht von Veo3 (Bild: Veo3 / Martin Wolf/Golem.de)
Ein virales Video eines landenden Ufos aus Sicht von Veo3 Bild: Veo3 / Martin Wolf/Golem.de

KI-Slop ist ein neues Genre in den Videotrends der sozialen Netzwerke wie Tiktok und Youtube. Obwohl letzteres auch mal Kanäle sperrt, die es mit den Markenrechten(öffnet im neuen Fenster) oder der Wahrheit(öffnet im neuen Fenster) nicht so genau nehmen, sind sie nicht abgeneigt, die werbeträchtigen Klicks mitzunehmen.

Wie populär diese Videos werden, hängt auch damit zusammen, wie schnell und einfach sie zu erstellen sind. Viel hilft viel ist die Devise der Branche - je mehr absurde Clips von Katzentürmen(öffnet im neuen Fenster) , Flugzeugabsturzbabys(öffnet im neuen Fenster) und Simpsons-Bored-Ape-Crossovers(öffnet im neuen Fenster) pro Stunde in den Kanal gepumpt werden können, umso besser und desto höher die Chance auf einen Jackpot beim Algorithmus.

Eine Hürde war dabei bislang Audio. Die Clips von Haiper, RunwayML und Sora sahen in unseren Tests mehr oder minder gut aus und reichten definitiv für einen viralen Hit, wenn man es darauf anlegte. Sie alle hatten jedoch keine Audiospur.

Nun könnte man argumentieren, dass der Ton im Zeitalter des stummen Weiterwischens in der U-Bahn zumindest teilweise obsolet ist, aber wer einmal einen der Veo3-Clips gesehen und gehört hat, wird zustimmen, das Google das Genre der KI-Clips auf ein völlig neues Niveau hebt - zumindest in einigen Punkten.

Die Talkies sind hier

Denn weder die Auflösung von 720p noch die Länge von maximal 8 Sekunden bei 24 fps sind sonderlich aufregend. Um ein Video zu erstellen, prompten wir in Gemini unseren Wunsch, können aber keinerlei Einfluss auf Seitenverhältnis, Upscaling oder sonstige von anderen Generatoren gewohnte Parameter nehmen.

Testvideos von Veo3
Testvideos von Veo3 (01:12)

Das Ergebnis ist aber je nach Prompt wirklich beeindruckend. So erzählt ein erstellter Charakter im Clip einen Witz mit Pointe(öffnet im neuen Fenster) , Influencer schwärmen von ihrer nächsten viralen Challenge(öffnet im neuen Fenster) und Will Smith isst überzeugender denn je seine Spaghetti(öffnet im neuen Fenster) .

Die Probleme des neuen Modells sind ganz offensichtlich nicht auf Seiten der von ihm erstellten Clips zu suchen, sondern eher im Umgang damit. Nie war es leichter, auch Bewegtbild mit Fake-Inhalten zu garnieren, um auf sozialen Netzwerken Aufregung - und damit Klicks - zu erzeugen.

Veo generiert vor allem eines: Kontroversen für die sozialen Netzwerke

Fast harmlos erscheint das Känguru mit Flugticket(öffnet im neuen Fenster) , das vor einigen Monaten die Runden in den Timelines drehte: Es schaute hilflos dabei zu, wie seine Besitzerin eine Angestellte der Fluglinie davon zu überzeugen versuchte, dass es mit an Bord müsse.

Der Aufreger dabei: In den USA gibt es seit etlichen Jahren Geschichten über vermeintliche oder echte sogenannte emotional support animals(öffnet im neuen Fenster) , die von ihren Haltern überall mit hingenommen werden. Das entfacht Emotionen vor allem bei Leuten, die die verschreibungspflichtigen Tiere eher als einen Auswuchs des Wunsches sehen, das Haustier überall bei sich haben zu dürfen.

Kostenpunkt KI

Auch wenn das Känguru keine sozialen Unruhen auslöste, zeigte es doch, wie leichtgläubig viele Menschen auf KI-generierte Clips hereinfallen. Es ist unschwer vorstellbar, wo dieser Weg in den kommenden Jahren noch hinführen kann.

Einen ausführlichen Test der Fähigkeiten von Veo3 können wir in Deutschland derzeit nicht machen, denn Google limitiert die Anzahl der Clips pro Tag drastisch. Wir dürfen im 24-Stunden-Rhythmus lediglich drei achtsekündige Clips erstellen. Das dauert pro Video zwei bis drei Minuten. In den USA ist es hingegen möglich, für stattliche 250 Dollar ein erweitertes KI-Abo abzuschließen, das dann auch mehr Generationen beinhaltet. Das Google AI Ultimate genannte Abo soll in Deutschland 140 Euro kosten, aber es ließ sich zum Zeitpunkt dieses Artikels noch nicht buchen.

Google ist geizig mit Generationen

So wären rechnerisch in Deutschland nicht ganz 100 Clips mit etwas mehr als 700 Sekunden Video im Monat möglich.

Woher Google die Trainingsdaten für Veo3 hat, lässt sich unschwer erraten: Dank Youtube steht ein immenser Schatz an Videos zur Verfügung. Der wird allerdings vermutlich in den kommenden Jahren durch immer mehr KI-Videos zusehends unbrauchbarer.

Die Veo3-Videos sind abseits der beeindruckenden Audiospuren wenig konsistent, beachten aber zumindest teilweise die Physik und sind durch ihre geringe Auflösung eher nicht für den professionellen Einsatz als Stock-Footage-Ersatz geeignet. Bildvorlagen akzeptiert Veo3 in Deutschland derzeit nicht. Interessanterweise lassen sich Prompts zwar auf Deutsch eingeben, wir konnten das Modell aber nicht dazu bringen, auch eine deutsche Audiospur zu generieren.

Deutsch nur auf Umwegen

Das sollte aber möglich sein, indem man den Dialog direkt wortwörtlich in den Prompt integriert und zusätzlich die Sprache festlegt. Musik lässt sich erzeugen, sie klingt jedoch oft eher verwaschen, wie in einem Beispiel, in dem wir einen fliegenden C64 mit SID-Musik unterlegen ließen.

Google bietet einen leicht verständlichen Leitfaden(öffnet im neuen Fenster) für die Prompts.

Nach ein paar Tagen mit Veo3 kommen wir zu dem Urteil, dass sich das unlimitierte Abo bei Erscheinen höchstens für Nutzer lohnen dürfte, die ihr Geld mit dem oben erwähnten KI-Slop verdienen. Für alle anderen fehlen die Möglichkeiten, iterativ an den Prompts zu arbeiten und so die Ergebnisse zu verfeinern.

Immerhin ist Youtube Premium schon enthalten, so dass man seine Kreationen wenigstens ohne Werbeunterbrechungen genießen kann. Vermutlich ließe sich so auch der komplette Workflow abbilden: "Generiere 1.500 lustige bunte Videos, mit denen ich Vorschulkinder als Zielgruppe begeistern kann und lade sie auf meinen Youtube-Kanal hoch. Setze die Monetarisierung auf 'weltweit' und kreuze an, dass keinerlei gewalttätige oder anstößige Inhalte enthalten sind."

Willkommen im Jahr 2025!


Relevante Themen