Dall-E 2: OpenAI erstellt und bearbeitet Bilder nach Beschreibung

Das KI-Modell Dall-E 2 von OpenAI erstellt nicht nur hochaufgelöste Bilder nach einer Textbeschreibung, sondern kann diese auch bearbeiten.

Artikel veröffentlicht am ,
Ein Seeotter im Stil des Gemäldes Mädchen mit dem Perlenohrring von Johannes Vermeer
Ein Seeotter im Stil des Gemäldes Mädchen mit dem Perlenohrring von Johannes Vermeer (Bild: OpenAI)

Die KI-Forschungsgruppe OpenAI hat das Modell Dall-E 2 vorgestellt. Dabei handelt es sich um eine deutlich verbesserte Variante eines zuvor schon erstellten Modells zum Erzeugen von Bildern nach einer Beschreibung aus natürlicher Sprache. Mit Dall-E 2 verspricht OpenAI nun höher aufgelöste Bilder und eine niedrigere Latenz bei der Nutzung des Diensts. Hinzu kommt die Fähigkeit, bereits existierende Bilder zu bearbeiten und dort etwa Objekte in dem Bild zu verschieben oder auszutauschen.

Stellenmarkt
  1. Service Techniker (m/w/d) Steuerungstechnik / Software
    Dürr Systems AG, Bietigheim-Bissingen
  2. System Engineer - Backup as a Service (m/w/d)
    SVA System Vertrieb Alexander GmbH, deutschlandweit
Detailsuche

Die erste Version von Dall-E hat OpenAI bereits im Januar 2021 vorgestellt, der Name ist dabei ein Kofferwort, dass sich aus dem Namen des Künstlers Salvador Dalí und Wall-E aus dem gleichnamigen Film von Pixar zusammensetzt. Die damals vorgestellten Fähigkeiten, aus einer textlichen Beschreibung ein visuelles Konzept zu erstellen, waren aber noch sehr beschränkt.

Die Funktion des Modells beschreibt OpenAI so: "Dall-E 2 hat die Beziehung zwischen Bildern und dem zu ihrer Beschreibung verwendeten Text gelernt. Es verwendet einen Prozess namens 'Diffusion', der mit einem Muster aus zufälligen Punkten beginnt und dieses Muster allmählich in Richtung eines Bildes ändert, wenn es bestimmte Aspekte dieses Bildes erkennt." Die Bilder, die mit der aktuellen zweiten Version erstellt werden, sollen realistischer wirken als bisher.

Wie bei den anderen Modellen von OpenAI steht auch Dall-E 2 bisher nicht einfach zur öffentlichen Nutzung bereit. KI-Forscher sollen sich jedoch online für das System anmelden können und dann Zugang bekommen. Wie üblich soll die dazugehörige Schnittstelle künftig für die Drittanbieter zum Erstellen von Software bereitgestellt werden.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


0IO1 25. Apr 2022

Benutzername prüft aus.

Schattenwerk 08. Apr 2022

Tut er nicht: https://openai.com/dall-e-2/ Auf die Warteliste eintragen und warten bis...

Neuro-Chef 07. Apr 2022

Wenn's das perspektivisch auch in 3D tut, fehlen nur noch Holoprojektoren und Kraftfelder :)



Aktuell auf der Startseite von Golem.de
Videostandards
Wie das Bild auf den Schirm kommt

Was ist der Unterschied zwischen Displayport und HDMI? In einer kleinen Geschichtsstunde erklären wir, wie Bilddaten zum Monitor kommen.
Von Johannes Hiltscher

Videostandards: Wie das Bild auf den Schirm kommt
Artikel
  1. Data Mesh: Herr der Daten
    Data Mesh
    Herr der Daten

    Von Datensammelwut und Data Lake zu Pragmatismus und Data Mesh - ein Kulturwandel.
    Von Mario Meir-Huber

  2. RTL+: RTL erweitert Streaming um Musikbereich
    RTL+
    RTL erweitert Streaming um Musikbereich

    Neben Serien und Filmen kann in RTLs Streamingangebot künftig auch Musik gehört werden. Noch gibt es getrennte Apps.

  3. iPhone-Bildschirm: iOS 16 mit abermals veränderter Akkuanzeige
    iPhone-Bildschirm
    iOS 16 mit abermals veränderter Akkuanzeige

    Apple hat teilweise auf die Kritik an der Akkuanzeige in iOS 16 reagiert. In der Beta 6 gibt es mehr Einstellmöglichkeiten im Energiesparmodus.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Günstig wie nie: Zotac RTX 3080 12GB 829€, Mac mini 16GB 1.047,26€. WD SSD 2TB (PS5) 199,99€ • MindStar (Sapphire RX 6900XT 939€, G.Skill DDR4-3200 32GB 98€) • PS5 bestellbar • Alternate (Apple iPad günstiger) • Games für PS5/PS4 bis 84% günstiger • Bester 2.000€-Gaming-PC[Werbung]
    •  /