Dall-E 2: OpenAI erstellt und bearbeitet Bilder nach Beschreibung
Die KI-Forschungsgruppe OpenAI hat das Modell Dall-E 2 vorgestellt(öffnet im neuen Fenster). Dabei handelt es sich um eine deutlich verbesserte Variante eines zuvor schon erstellten Modells zum Erzeugen von Bildern nach einer Beschreibung aus natürlicher Sprache. Mit Dall-E 2 verspricht OpenAI nun höher aufgelöste Bilder und eine niedrigere Latenz bei der Nutzung des Diensts. Hinzu kommt die Fähigkeit, bereits existierende Bilder zu bearbeiten und dort etwa Objekte in dem Bild zu verschieben oder auszutauschen.
Die erste Version von Dall-E hat OpenAI bereits im Januar 2021 vorgestellt(öffnet im neuen Fenster), der Name ist dabei ein Kofferwort, dass sich aus dem Namen des Künstlers Salvador Dalí und Wall-E aus dem gleichnamigen Film von Pixar zusammensetzt. Die damals vorgestellten Fähigkeiten, aus einer textlichen Beschreibung ein visuelles Konzept zu erstellen, waren aber noch sehr beschränkt.
Die Funktion des Modells beschreibt OpenAI so: "Dall-E 2 hat die Beziehung zwischen Bildern und dem zu ihrer Beschreibung verwendeten Text gelernt. Es verwendet einen Prozess namens 'Diffusion', der mit einem Muster aus zufälligen Punkten beginnt und dieses Muster allmählich in Richtung eines Bildes ändert, wenn es bestimmte Aspekte dieses Bildes erkennt." Die Bilder, die mit der aktuellen zweiten Version erstellt werden, sollen realistischer wirken als bisher.
Wie bei den anderen Modellen von OpenAI steht auch Dall-E 2 bisher nicht einfach zur öffentlichen Nutzung bereit. KI-Forscher sollen sich jedoch online für das System anmelden können und dann Zugang bekommen. Wie üblich soll die dazugehörige Schnittstelle künftig für die Drittanbieter zum Erstellen von Software bereitgestellt werden.
- Anzeige Hier geht es zu den aktuellen Blitzangeboten bei Amazon Wenn Sie auf diesen Link klicken und darüber einkaufen, erhält Golem eine kleine Provision. Dies ändert nichts am Preis der Artikel.



