Zum Hauptinhalt Zur Navigation

Kunst von der KI: MusicLM erzeugt ganze Songs nach Textvorgaben

Forscher von Google haben ein KI-Tool entwickelt, das Songs nach Wunsch produzieren soll. Die Öffentlichkeit darf es vorerst nicht benutzen.
/ Daniel Ziegener
19 Kommentare News folgen (öffnet im neuen Fenster)
Werden Noten und Instrumente überflüssig? (Bild: Maksym Kaharlytskyi)
Werden Noten und Instrumente überflüssig? Bild: Maksym Kaharlytskyi

Forscher von Google haben mit MusicLM ein KI-Werkzeug zur maschinellen Erzeugung von Musik aus Basis von Texteingaben vorgestellt. MusicLM soll aus Eingaben wie "eine beruhigende Geigenmelodie, unterlegt mit einem verzerrten Gitarrenriff" entsprechende Musik erzeugen und auch vorgesummte Melodien verarbeiten können.

Google habe aktuell allerdings keine Pläne, das Tool auch zu veröffentlichen, berichtet Techcrunch(öffnet im neuen Fenster) . Bislang wurden lediglich das Paper der Arbeitsgruppe und einige Hörbeispiele(öffnet im neuen Fenster) publiziert.

Neben der "inhärenten Schwierigkeit der Synthese von qualitativen Audiodaten" sei das Fehlen von Trainingsdaten ein "weiterer hinderlicher Faktor" bei der Arbeit gewesen, erklärte das Team. Dies stehe "im krassen Gegensatz zum Bildbereich" , wo die Verfügbarkeit umfangreicher Datensätze die Entwicklung von Werkzeugen in den letzten Monaten stark beschleunigt hat .

Gesellschaftliche und urheberrechtliche Risiken

Die Entwickler von MusicLM sehen auch Risiken ihrer Technik. "Die generierten Samples spiegeln die in den Trainingsdaten vorhandenen Biases wider, was die Frage nach der Angemessenheit der Musikgenerierung für Kulturen aufwirft, die in den Trainingsdaten unterrepräsentiert sind, und gleichzeitig Bedenken hinsichtlich der kulturellen Aneignung aufwirft" , heißt es in dem Paper.

Auch die Gefahr von Urheberrechtsverletzungen auf Basis der verwendeten Trainingsdaten sorgen für Bedenken. Zwar sei nur "ein winziger Teil" der Originale exakt wiedergegeben worden, bei immerhin einem Prozent der Ergebnisse habe man aber eine ungefähre Übereinstimmung heraushören können. Die Autoren betonen daher "nachdrücklich die Notwendigkeit weiterer zukünftiger Arbeiten zur Bewältigung dieser mit der Musikgenerierung verbundenen Risiken" und haben derzeit nicht vor, Modelle zu veröffentlichen.

Angesichts der freien Verfügbarkeit von Text- und Bildgeneratoren wurde zuletzt über den Umgang mit den Ergebnissen diskutiert. Die Fotoplattform Shutterstock untersagte das Veröffentlichen von maschinell erzeugten Bildern , das Onlinemagazin Cnet stoppte einen Testlauf mit per ChatGPT generierten Artikeln .


Relevante Themen