Dall-E 2: OpenAI erstellt und bearbeitet Bilder nach Beschreibung
Das KI-Modell Dall-E 2 von OpenAI erstellt nicht nur hochaufgelöste Bilder nach einer Textbeschreibung, sondern kann diese auch bearbeiten.

Die KI-Forschungsgruppe OpenAI hat das Modell Dall-E 2 vorgestellt. Dabei handelt es sich um eine deutlich verbesserte Variante eines zuvor schon erstellten Modells zum Erzeugen von Bildern nach einer Beschreibung aus natürlicher Sprache. Mit Dall-E 2 verspricht OpenAI nun höher aufgelöste Bilder und eine niedrigere Latenz bei der Nutzung des Diensts. Hinzu kommt die Fähigkeit, bereits existierende Bilder zu bearbeiten und dort etwa Objekte in dem Bild zu verschieben oder auszutauschen.
Die erste Version von Dall-E hat OpenAI bereits im Januar 2021 vorgestellt, der Name ist dabei ein Kofferwort, dass sich aus dem Namen des Künstlers Salvador Dalí und Wall-E aus dem gleichnamigen Film von Pixar zusammensetzt. Die damals vorgestellten Fähigkeiten, aus einer textlichen Beschreibung ein visuelles Konzept zu erstellen, waren aber noch sehr beschränkt.
Die Funktion des Modells beschreibt OpenAI so: "Dall-E 2 hat die Beziehung zwischen Bildern und dem zu ihrer Beschreibung verwendeten Text gelernt. Es verwendet einen Prozess namens 'Diffusion', der mit einem Muster aus zufälligen Punkten beginnt und dieses Muster allmählich in Richtung eines Bildes ändert, wenn es bestimmte Aspekte dieses Bildes erkennt." Die Bilder, die mit der aktuellen zweiten Version erstellt werden, sollen realistischer wirken als bisher.
Wie bei den anderen Modellen von OpenAI steht auch Dall-E 2 bisher nicht einfach zur öffentlichen Nutzung bereit. KI-Forscher sollen sich jedoch online für das System anmelden können und dann Zugang bekommen. Wie üblich soll die dazugehörige Schnittstelle künftig für die Drittanbieter zum Erstellen von Software bereitgestellt werden.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Benutzername prüft aus.
Tut er nicht: https://openai.com/dall-e-2/ Auf die Warteliste eintragen und warten bis...
Wenn's das perspektivisch auch in 3D tut, fehlen nur noch Holoprojektoren und Kraftfelder :)