Zum Hauptinhalt Zur Navigation

OpenAI Sora im Hands-on: Sora macht Schleifen und Storyboards

OpenAIs KI-Videogenerator kann mehr als die Konkurrenz - aber er wird auch durch Restriktionen zurückgehalten.
/ Martin Wolf
2 Kommentare News folgen (öffnet im neuen Fenster)
Prompt: "a viral video of a spaceship landing unexepectedly in the background with the man in front reacting to it" (Bild: KI-generiert mit OpenAI Sora)
Prompt: "a viral video of a spaceship landing unexepectedly in the background with the man in front reacting to it" Bild: KI-generiert mit OpenAI Sora

Die Webseite ist ansonsten übersichtlich: Links befinden sich die Bibliothek der eigenen Videos und eine Option für die Inspiration durch die Clips der Nutzerschaft. Auch unsere erstellten Filme werden dort landen, denn eine Exklusivität ist für die normale Generation mit einem Plus-Konto(öffnet im neuen Fenster) nicht vorgesehen. Die Auflösung ist auf 720p limitiert, die Videolänge auf 5 Sekunden.

Netterweise wird vor jeder Generation in einem Tooltip angezeigt, wie viele Credits sie kosten wird. Bei uns waren das in niedriger Auflösung 50 Credits pro Video. In der Mitgliedschaft enthalten sind 1.000 Credits - aber sie zählen auch auf die Nutzung von anderen Diensten wie ChatGPT. Hier den Überblick zu behalten, ist nicht ganz einfach.

Umso leichter ist aber die eigentliche Videoerstellung per Prompt. Am unteren Bildschirmrand ist das Textfenster, das durch die Möglichkeit des Bilder- und Videouploads für Referenzen ergänzt wird. Außerdem kann man Seitenverhältnis, Auflösung, Länge und Anzahl der zu generierenden Videos einstellen.

Beispiele OpenAI Sora Videogenerator
Beispiele OpenAI Sora Videogenerator (03:01)

Als Standard werden zwei Clips generiert, aus denen man einen auswählt und der in einer einem Schnittprogramm nachempfundenen Zeitleiste landet, in der man ein Video aus mehreren Schnipseln zusammenschneiden kann.

Was Sora von den restlichen Generatoren abhebt, ist die Integration von ChatGPT. So schlägt es ein Storyboard für den Film vor und gibt den Szenen passende Namen. Das erschien uns eher wie Spielerei, aber im Kontext von OpenAIs Services ergibt es wohl Sinn, auch solche Funktionen anzubieten.

Das Rendering der Szene erfolgt recht fix, länger als 10 Sekunden mussten wir nie warten. Auch Abstürze wie bei der Konkurrenz gab es nicht. Die Qualität der Videos war durchweg hoch, wobei das Prompt selbst ausschlaggebend ist. Je besser wir die Szene beschrieben, desto näher lagt das Ergebnis an unserer Vorstellung.

Sora schätzt Datenschutz

Ein Beispiel dafür war unser Wunsch: "a viral video of a spaceship landing unexepectedly in the background with the man in front reacting to it." Was Sora erstellte, war ein Mann, der vor einer Greenscreen-Szene eines landenden UFOs erstaunt guckte.

Sora hatte also den Stil eines Reaktionsvideos auf Youtube nachempfunden, während wir eher eine verwackelte Außenaufnahme mit einer Videokamera aus den 90ern erwartet hätten.

Wenn man sich also bewusst macht, in welche Richtung das KI-Modell gerade marschiert, kann man den Prompt leicht anpassen.

Was nicht ging, war eine Funktion, die wir bei anderen Generatoren als Benchmark genutzt hatten: der Upload von Bildern mit Menschen. Weder echte noch generierte Abbildungen von erkennbaren Personen akzeptierte Sora.

Die Ablehnung erfolgte mit einem Hinweis auf den Schutz der Privatsphäre. Das ist zwar vorbildlich, hinderte uns jedoch daran herauszufinden, wie sich der Videogenerator im direkten Vergleich zur Konkurrenz schlägt.

Nur mit konsistenten Vorlagen können wir auch die Konsistenz der Ergebnisse bewerten.

Was die subjektive Qualität der erstellten Szenen angeht, spielt Sora aber auf jeden Fall in der obersten Liga mit. Lediglich bei der Objektpersistenz sind oft Probleme erkennbar. Für die Generation minutenlanger Videos von gleichartigen Settings ist Sora nicht geeignet. Mitunter wechseln Gesichter, Gegenstände oder Umgebungen schlagartig.

Unser Fazit ist daher zwiegespalten: Für eine professionelle Nutzung eignet sich Sora ebensowenig wie die anderen Modelle. Die Qualität der Videos mag hoch sein, aber ohne die Möglichkeit, eigene Charaktere einzubetten, bleibt die Generierung von Personen ein Glücksspiel.

Auf der anderen Seite ist natürlich aus Datenschutzsicht löblich, dass OpenAI sich um die Privatsphäre zumindest zu bemühen scheint.

Es bleibt abzuwarten, ob Videogeneratoren als nächstes den Schritt auf die lokale Ebene der Heimrechner antreten - spätestens dann dürften jegliche derartige Ansätze überholt sein


Relevante Themen