En beandrockend neien AI System vu Google kann Musek an all Genre generéieren mat enger Textbeschreiwung. Awer d’Firma, déi d’Risiken fäert, huet keng direkt Pläng et ze verëffentlechen.
MusicLM genannt, Google ass sécher net deen éischten generative AI System fir Song. Et goufen aner Versich, dorënner Riffusion, eng AI déi Musek komponéiert andeems se se visualiséiert, souwéi Dance Diffusion, Google säin eegene AudioML an OpenAI’s Jukebox. Awer duerch technesch Aschränkungen a limitéiert Trainingsdaten, konnt kee Lidder produzéieren, besonnesch komplex a Kompositioun oder High-Fidelity.
MusicLM ass vläicht déi éischt déi kann.
Detailéiert an engem akademesche Pabeier, MusicLM gouf op engem Dataset vun 280.000 Stonne Musek trainéiert fir ze léieren kohärent Lidder ze generéieren fir Beschreiwunge vun – wéi d’Creatoren et soen – “bedeitend Komplexitéit” (zB “bezauberend Jazzsong mat engem memorablen Saxophon Solo an engem Solo Sänger“ oder “Berlin 90er Techno mat engem nidderegen Bass a staarkem Kick.” Seng Lidder kléngen bemierkenswäert eppes wéi e mënschleche Kënschtler kéint komponéieren, wann och net onbedéngt als inventiv oder musikalesch zesummenhängend.
Et ass schwéier ze iwwerzeegen wéi gutt d’Sampler kléngen, well et keng Museker oder Instrumentalisten an der Loop sinn. Och wann e bësse laang a bedeitend Beschreiwunge gefiddert gëtt, bréngt MusicLM et fäerdeg, Nuancen wéi instrumental Riffs, Melodien a Stëmmungen opzehuelen.
D’Iwwerschrëft fir d’Probe hei ënnen, zum Beispill, enthält de Bit “induzéiert d’Erfahrung vu verluer am Weltraum”, an et liwwert sécher op där Front (op d’mannst fir meng Oueren):
Hei ass eng aner Probe, generéiert aus enger Beschreiwung déi mam Saz “Den Haaptsoundtrack vun engem Arkadespill” fänkt. Plausibel, richteg?
D’Kapazitéite vun MusicLM verlängeren iwwer d’Generatioun vu kuerze Clips vu Lidder. D’Fuerscher vu Google weisen datt de System op existente Melodien opbaue kann, ob gehummt, gesongen, geflüstert oder op engem Instrument gespillt gëtt. Ausserdeem kann MusicLM verschidde Beschreiwunge geschriwwen an der Sequenz huelen (zB “Zäit fir ze meditéieren”, “Zäit fir z’erwächen”, “Zäit fir ze lafen”, “Zäit fir 100%) ze ginn” an eng Zort melodesch “Geschicht” oder narrativ erstellen rangéiert bis zu e puer Minutten an der Längt – perfekt passend fir e Film Soundtrack.
Kuckt hei ënnen, déi aus der Sequenz koum “elektronescht Lidd gespillt an engem Videospill”, “Meditatiounslidd nieft engem Floss gespillt”, “Feier”, “Feierwierker.”
Dat ass net fir dem MusicLM säi flawless ze proposéieren – wäit dovun, éierlech. E puer vun de Proben hunn eng verzerrt Qualitéit fir si, eng onvermeidlech Nebenwirkung vum Trainingsprozess. A wärend MusicLM technesch Gesang generéiere kann, dorënner Choralharmonien, loossen se vill ze wënschen. Déi meescht vun den “Texter” reichen vu kaum Englesch bis pure Gibberish, gesonge vu synthetiséierte Stëmmen, déi wéi d’Amalgamatioune vu verschiddene Kënschtler kléngen.
Trotzdem bemierken d’Google Fuerscher déi vill ethesch Erausfuerderunge vun engem System wéi MusicLM, inklusiv eng Tendenz fir Copyright Material aus Trainingsdaten an déi generéiert Lidder ze integréieren. Wärend engem Experiment hu se festgestallt datt ongeféier 1% vun der Musek, déi de System generéiert huet, direkt vun de Lidder replizéiert gouf, op deenen et trainéiert gouf – e Schwell, deen anscheinend héich genuch ass fir se ze decouragéieren MusicLM a sengem aktuellen Zoustand ze verëffentlechen.
“Mir unerkennen de Risiko vu potenzieller Mëssbrauch vu kreativen Inhalter verbonne mat der Benotzungsfall”, hunn d’Co-Autoren vum Pabeier geschriwwen. “Mir ënnersträichen staark d’Noutwendegkeet fir méi zukünfteg Aarbecht fir dës Risiken unzegoen, déi mat der Museksgeneratioun verbonne sinn.”
Unzehuelen, datt MusicLM oder e System wéi en enges Daags zur Verfügung gestallt gëtt, schéngt et inévitabel datt grouss juristesch Themen op de Virdergrond kommen. Si hu schonn, och wann ëm méi einfach AI Systemer. Am Joer 2020 huet dem Jay-Z säi Rekordlabel Copyright Streik géint en YouTube Kanal, Vocal Synthesis, agereecht fir AI ze benotzen fir Jay-Z Covere vu Lidder wéi dem Billy Joel sengem “We Didn’t Start the Fire” ze kreéieren. Nodeem d’Videoen ufanks geläscht hunn, huet YouTube se erëm agefouert, a fonnt datt d’Ufroe fir ewechzehuelen “onkomplett” waren. Awer déiffaked Musek steet nach ëmmer op düstere legale Buedem.
E Whitepaper geschriwwen vum Eric Sunray, elo e juristesche Stagiaire bei der Music Publishers Association, argumentéiert datt AI Museksgeneratoren wéi MusicLM d’Musek Copyright verletzen andeems se “Tapisserie vu kohärent Audio aus de Wierker kreéieren, déi se an der Ausbildung huelen, an domat d’Reproduktioun vum Copyright Act vun den USA verletzen. riets.” No der Verëffentlechung vun der Jukebox hunn d’Kritiker och d’Fro gestallt, ob d’Ausbildung vun AI Modeller op urheberrechtegt musikalescht Material e faire Gebrauch ausmécht. Ähnlech Bedenken goufen ëm d’Trainingsdaten opgeworf, déi a Bild-, Code- an Textgeneréierend AI Systemer benotzt ginn, déi dacks vum Internet geschrauft ginn ouni d’Wëssen vun de Creatoren.
Aus enger Benotzerperspektive spekuléiert den Andy Baio vum Waxy, datt Musek, déi vun engem AI-System generéiert gëtt, als ofgeleet Wierk ugesi gëtt, an deem Fall nëmmen déi ursprénglech Elementer vum Copyright geschützt sinn. Natierlech ass et net kloer, wat an esou Musek als “Original” ugesi gëtt; dës Musek kommerziell ze benotzen ass fir onerkannt Waasser z’erreechen. Et ass eng méi einfach Saach wann generéiert Musek fir Zwecker geschützt ënner faire Gebrauch benotzt gëtt, wéi Parodie a Kommentar, awer Baio erwaart datt d’Geriichter Fall-vun-Basis Uerteeler musse maachen.
Et kann net laang daueren ier et e bësse Kloerheet iwwer d’Saach gëtt. Verschidde Prozesser, déi hire Wee duerch d’Geriichter maachen, wäerten méiglecherweis en Afloss op musikalesch generéierend AI hunn, dorënner eng betreffend d’Rechter vu Kënschtler deenen hir Aarbecht benotzt gëtt fir AI Systemer ze trainéieren ouni hir Wësse oder Zoustëmmung. Awer d’Zäit wäert soen.