Zum Hauptinhalt Zur Navigation Zur Suche

Gemini Omni: Google stellt sein bisher schlauestes KI-Video-Tool vor

Mit Googles neuem Gemini Omni sollen Nutzer Videos mit KI verfremden können – umfangreicher als bisher mit Veo.
/ Tobias Költzsch
Kommentare Auf Google folgen (öffnet im neuen Fenster)
Google-Deepmind-Chef Demis Hassabis bei der Vorstellung von Gemini Omni auf der Google I/O 2026 (Bild: Google)
Google-Deepmind-Chef Demis Hassabis bei der Vorstellung von Gemini Omni auf der Google I/O 2026 Bild: Google

Google hat im Rahmen seiner Hausmesse Google I/O das neue KI-Modell Gemini Omni vorgestellt. Mit Gemini Omni(öffnet im neuen Fenster) lassen sich Videos mit KI verfremden und so ganz neue Inhalte erstellen. Anders als das bisherige KI-Videotool Veo (g+) soll Omni auch auf Geminis Allgemeinwissen zugreifen können.

Dieser Zugriff soll Google zufolge das Storytelling und den Realismus der KI-Videos verbessern. So haben etwa Geminis Kenntnisse über Schwerkraft und Fluiddynamik Auswirkungen auf die Videos. In einem Beispiel von Google erstellt das Tool ein Video mit Clips von Dingen zu jedem Buchstaben des Alphabets, was zuvor mit Veo schwierig gewesen sein soll.

Nutzer können mit Gemini Omni Text, Bilder, Videos oder Audioaufnahmen als Eingaben verwenden. So lassen sich verschiedene Ausgangsmaterialien für ein KI-Video nutzen. Um das Video zu bearbeiten, können Nutzer Spracheingaben verwenden.

Unterschiedliche Eingabeformate lassen sich kombinieren

In einem Beispiel zeigt Google die Kombination aus einem Skateboard-Video und dem Foto eines Stickerbogens. Dem Skater verpasst Omni dann Bewegungseffekte im Comicstil der Sticker. In einem anderen Beispiel wird die Aufnahme eines Gartens in der Nacht mit der einer futuristischen Stadt kombiniert.

Bei selbst aufgenommenen Videos soll Gemini Omni den Blickwinkel ändern können. Auch Inhalte aus den Videos können entfernt werden. Die Bearbeitungsschritte können dabei auf einmal erfolgen, aber auch schrittweise in mehreren Durchgängen. Zudem erlaubt Omni die Erstellung eines digitalen Avatars.

Alle Inhalte, die Omni erstellt, werden mit dem unsichtbaren digitalen Wasserzeichen SynthID versehen. Mit der Gemini-App, Gemini in Chrome und der Google-Suche lässt sich dann überprüfen, ob Videos mit Omni bearbeitet wurden. Das erste Omni-Modell Gemini Omni Flash kann ab sofort weltweit von Abonnenten der KI-Abos Google AI Plus, Pro und Ultra in der Gemini-App und Google Flow ausprobiert werden.


Relevante Themen