banner

Blog

Dec 20, 2023

Praktische Arbeit mit der KI von Google

Kann KI von einer Textbeschreibung aus rückwärts arbeiten, um einen zusammenhängenden Song zu generieren? Das ist die Prämisse von MusicLM, dem KI-gestützten Tool zur Musikerstellung, das Google gestern zum Auftakt seiner I/O-Konferenz veröffentlicht hat.

MusicLM wurde anhand Hunderttausender Audiostunden trainiert, um das Erstellen neuer Musik in verschiedenen Stilrichtungen zu erlernen. Es ist in der Vorschau über die AI Test Kitchen-App von Google verfügbar. Ich habe seit etwa einem Tag damit herumgespielt, ebenso wie einige meiner Kollegen.

Das Urteil? Sagen wir einfach, dass MusicLM in absehbarer Zeit keine Musikerjobs annehmen wird.

Die Verwendung von MusicLM in Test Kitchen ist ziemlich einfach. Sobald Ihnen der Zugriff genehmigt wurde, werden Sie mit einem Textfeld begrüßt, in das Sie eine Songbeschreibung eingeben können – so detailliert, wie Sie möchten – und das System zwei Versionen des Songs generieren lässt. Beide können zum Offline-Hören heruntergeladen werden, Google empfiehlt Ihnen jedoch, einen der Titel mit einem „Daumen hoch“ zu markieren, um die Leistung der KI zu verbessern.

Bildnachweis:Google

Als ich im Januar zum ersten Mal über MusicLM berichtete, bevor es veröffentlicht wurde, schrieb ich, dass die Songs des Systems so klangen, als würde ein menschlicher Künstler komponieren – wenn auch nicht unbedingt so einfallsreich oder zusammenhängend musikalisch. Nun kann ich nicht sagen, dass ich diesen Worten voll und ganz treu bin, denn es scheint klar zu sein, dass bei den Proben von Anfang des Jahres ernsthaft Rosinen gepflückt wurde.

Die meisten Songs, die ich mit MusicLM erstellt habe, klingen bestenfalls passabel – und im schlimmsten Fall wie ein Vierjähriger, der sich auf eine DAW einlässt. Ich bin größtenteils beim EDM geblieben und habe versucht, etwas mit Struktur und einer erkennbaren (und idealerweise angenehmen) Melodie hervorzubringen. Aber egal wie anständig – sogar gut! – Der Anfang der Songs von MusicLM klingt, irgendwann kommt der Moment, in dem sie auf sehr offensichtliche, musikalisch unangenehme Weise zusammenbrechen.

Nehmen Sie zum Beispiel dieses Beispiel, das mit der Aufforderung „EDM-Song in einem leichten, fröhlichen und luftigen Stil, gut zum Tanzen“ erstellt wurde. Es beginnt vielversprechend, mit einer kopfschüttelnden Grundlinie und Elementen einer klassischen Daft Punk-Single. Aber in der Mitte des Tracks weicht es völlig vom Kurs ab – praktisch ein anderes Genre.

https://techcrunch.com/wp-content/uploads/2023/05/AI_Test_Kitchen_edm_song_in_a_light_upbeat_and_airy_style_g-2.mp3

Hier ist ein Klaviersolo aus einer einfacheren Aufforderung – „romantische und emotionale Klaviermusik“. Sie werden feststellen, dass Teile gut und gut klingen – sogar außergewöhnlich, zumindest was die Fingerarbeit angeht. Aber dann ist es, als ob der Pianist von einer Manie besessen wäre. Ein Durcheinander von Noten später nimmt das Lied eine völlig andere Richtung an, als stamme es aus neuen Noten – wenn auch in Anlehnung an das Original.

https://techcrunch.com/wp-content/uploads/2023/05/AI_Test_Kitchen_romantic_and_emotional_piano_music.mp3

Ich habe es mal mit den Chiptunes von MusicLM probiert, weil ich dachte, dass die KI mit Liedern einfacherer Bauart leichter zurechtkommen könnte. Kein Würfel. Das Ergebnis (unten) war zwar teilweise eingängig, endete aber genauso zufällig wie die anderen Proben.

https://techcrunch.com/wp-content/uploads/2023/05/AI_Test_Kitchen_house_music_in_chiptune_with_an_energetic_ba.mp3

Positiv zu vermerken ist, dass MusicLM im Großen und Ganzen einen viel besseren Job macht als Jukebox, OpenAIs Versuch vor einigen Jahren, einen KI-Musikgenerator zu entwickeln. Im Gegensatz zu MusicLM konnte Jukebox angesichts eines Genres, eines Künstlers und eines Textausschnitts relativ kohärente Musik mit Gesang erzeugen, aber den von Jukebox produzierten Songs fehlten typische musikalische Elemente wie sich wiederholende Refrains und sie enthielten oft unsinnige Texte. Von MusicLM produzierte Songs enthalten auch weniger Artefakte und wirken im Allgemeinen wie ein Fortschritt, wenn es um die Wiedergabetreue geht.

Der Nutzen von MusicLM ist außerdem aufgrund künstlicher Einschränkungen auf der Eingabeaufforderungsseite etwas eingeschränkt. Es wird keine Musik mit Künstlern oder Gesang generiert, auch nicht im Stil bestimmter Musiker. Versuchen Sie, eine Eingabeaufforderung wie „nach dem Vorbild von Barry Manilow“ einzugeben, und Sie erhalten nur eine Fehlermeldung.

Bildnachweis:Google

Der Grund ist wahrscheinlich legal. Schließlich steht gefälschte Musik auf unklarer rechtlicher Grundlage, und einige in der Musikindustrie argumentieren, dass KI-Musikgeneratoren wie MusicLM das Musikurheberrecht verletzen. Es wird möglicherweise nicht lange dauern, bis in dieser Angelegenheit Klarheit herrscht – mehrere Klagen, die vor Gericht eingereicht werden, werden sich wahrscheinlich auf die Musik erzeugende KI auswirken, darunter eine, die sich auf die Rechte von Künstlern bezieht, deren Arbeit zum Trainieren von KI-Systemen ohne sie verwendet wird Wissen oder Einwilligung. Wir werden sehen.

Bildnachweis: Bildnachweis:
AKTIE