KI-Audio: Google bringt KI-Musikgenerator in die Gemini-App
Google Deepmind(öffnet im neuen Fenster) weitet die Verfügbarkeit seines Audio-Modells Lyria 3 massiv aus. Nachdem der Zugriff zuvor primär über die Vertex-Plattform von Google Cloud sowie im Rahmen von Testläufen für Youtube-Creator möglich war, ist das Werkzeug nun für Gemini-Nutzer ab 18 Jahren weltweit verfügbar. Die Integration umfasst die Unterstützung von acht Sprachen, darunter Deutsch und Englisch.
Fokus auf Unterhaltung statt Professionalität Lyria 3 ermöglicht es, Songs durch die Beschreibung von Genres, Stimmungen oder persönlichen Erlebnissen zu generieren. Die Funktion lässt sich ganz einfach in Gemini(öffnet im neuen Fenster) per Klick auf das Tools-Symbol im Eingabefeld und den Befehl Musik erstellen starten.
Das Modell erstellt dann auf Wunsch nicht nur die Instrumentierung, sondern auch KI-generierte Liedtexte und Gesangsstimmen. Google betont in der Ankündigung(öffnet im neuen Fenster) jedoch die Grenzen des Systems: Ziel sei es nicht, "musikalische Meisterwerke zu erschaffen, sondern den Nutzern eine einzigartige Art des Selbstausdrucks" zu bieten.
Zusätzlich zur Texteingabe verarbeitet Gemini auch visuelle Vorlagen. Nutzer können Fotos oder Videos hochladen, woraufhin die KI einen Track generiert, dessen Atmosphäre und Textinhalt zum Bildmaterial passen sollen. Für die optische Aufbereitung ist das Modell Nano Banana zuständig, das automatisch passende Cover-Grafiken erstellt, um das Teilen der 30-sekündigen Clips zu erleichtern.
Filter gegen Künstler-Imitation
Ein kritischer Punkt bleibt der Schutz von Urheberrechten und die Nachahmung bekannter Musiker. Google gibt an, Lyria 3 so entworfen zu haben, dass es für "originelle Ausdrucksformen" und nicht für die Imitation existierender Künstler genutzt wird. Werden spezifische Namen in den Prompt aufgenommen, nutzt das System diese laut Google lediglich als "breite kreative Inspiration" .
In der Praxis prüft die KI die Ausgaben gegen bestehende Inhalte. Berichte(öffnet im neuen Fenster) räumen jedoch ein, dass Stilmerkmale bekannter Künstler trotz dieser Filter erkennbar bleiben können. Um die KI-Herkunft dauerhaft zu kennzeichnen, versieht Google alle Tracks mit dem unhörbaren Wasserzeichen SynthID . Zudem wird Lyria 3 in Googles Dream-Track-Tool für Youtube Shorts integriert, um Creatorn die Erstellung eigener Soundtracks zu ermöglichen.
Spannungsfeld zwischen Monetarisierung und Klagen
Die Branche reagiert gespalten auf die Flut an KI-Musik. Während Plattformen wie Youtube und Spotify Kooperationen mit Labels eingehen, um KI-Inhalte zu monetarisieren, sieht sich die Tech-Industrie massiven Klagen wegen der Verwendung urheberrechtlich geschützten Trainingsmaterials gegenüber. Streamingdienste wie Deezer haben zudem Werkzeuge zur Identifizierung von KI-Audio veröffentlicht, um betrügerische Streams und eine Entwertung menschlicher Produktionen zu verhindern.
- Anzeige Hier geht es zu Künstliche Intelligenz: Wissensverarbeitung bei Amazon Wenn Sie auf diesen Link klicken und darüber einkaufen, erhält Golem eine kleine Provision. Dies ändert nichts am Preis der Artikel.



