E fundit startup vënia në punë e teknologjisë AI në krijimin e muzikës është Udio me bazë në SHBA. E themeluar nga ish-kërkuesit e divizionit të AI të Google DeepMind, ajo po del nga beta e mbyllur sot me një grup yjor të seed investitorët.
Kjo përfshin firmën VC a16z (Andreessen Horowitz); distributori UnitedMasters; artistët Will·I·Am dhe Common; producent muzikor Tay Keith; Producenti i Live Earth dhe Live 8 Kevin Wall; Bashkëthemeluesi i Instagramit, Mike Krieger; dhe kreu i iniciativës Gemini AI të Google, Oriol Vinyals.
Shërbimi i Udio ka për qëllim një gamë të gjerë përdoruesish, nga njerëzit që duan të krijojnë një pjesë të shpejtë muzikore për një postim në media sociale deri tek artistët aspirues dhe profesionistë.
Fillon me porositë e tekstit: duke shtypur një përshkrim të një zhanri muzikor, temë, tekst dhe (siç thotë njoftimi për shtyp i kompanisë: “artistët që frymëzojnë”) për të gjeneruar një pjesë muzikore brenda 40 sekondave. Kjo më pas mund të “përzihet” përmes kërkesave të mëtejshme të tekstit derisa përdoruesi të jetë i kënaqur me versionin përfundimtar.
Duke folur me Music Ally përpara nisjes, CEO David Ding dhe COO Andrew Sanchez përshkruan historinë e origjinës së Udio.
“Është interesante se si imazhi, për shembull, ka qenë një gjë kaq e madhe gjeneralisht, por njerëzit nuk kujdesen vërtet për imazhet ashtu siç kujdesen për muzikën,” tha Sanchez.
“Muzikë, njerëzit në fakt dëgjojnë dhe shpenzojnë shumë kohë në të. Kështu që ne menduam se ishte super emocionuese të shkosh në këtë hapësirë: kjo është një zonë ku njerëzit kanë emocione të vërteta të lidhura me të.”
Ding tha se zhvillimi i Udio ka qenë një akt balancues midis bërjes së shërbimit të tij sa më të aksesueshëm për përdoruesit e rastësishëm, por sa më të fuqishëm dhe fleksibël për muzikantët dhe producentët profesionistë.
“Prodhimi duhet të jetë i një kalibri të caktuar,” tha ai. “Njerëzit nuk duan ‘muzikë të prodhuar nga AI’ ose ‘muzikë të prodhuar nga makineri’. Ata duan muzikë që tingëllon e padallueshme nga muzika që krijohet nga prodhues profesionistë njerëzorë.”
“Duke parë në të ardhmen, kur jemi me artistë dhe producentë, shohim sesi njerëzit muzikorë tepër krijues dhe brilantë e përdorin atë si instrument”, shtoi Sanchez. “Për ta është thjesht një mjet i ri dhe një zgjerim… Ajo që ata duan është kontrollueshmëria.”
“Will është një shembull i shkëlqyer. Ne u ulëm me të në seancën e parë dhe ai menjëherë tha: “Çfarë janë të gjitha këto butona?” Çfarë janë këto pulla?’ Ai thjesht futet brenda dhe fillon të eksperimentojë,” vazhdoi ai. Udio shpreson që ndërfaqja e saj e përqendruar në përshkrim do të ndikojë në këtë cilësi.
“Muzikantët janë më të mirë në përshkrimin e muzikës dhe tekstit sesa njerëzit e rastësishëm në rrugë, kështu që ata priren të jenë shumë të mirë në këtë lloj gjëje (inxhinieri e shpejtë). Ata janë në gjendje të marrin atë që duan nga ajo më mirë.”
Ambicia e Udio është që jo vetëm të ketë një mjet për të krijuar muzikë, por një komunitet rreth tij – një libër lojërash që ne e kemi parë tashmë me BandLab dhe Splash.
“Ne duam t’u japim njerëzve një shans për të shfaqur krijimet e tyre dhe që njerëzit e tjerë t’i përgjigjen kësaj,” tha Ding.
“Tani jam në platformë, 50% e kohës sime harxhohet duke dëgjuar, dhe ndoshta 50% e kohës sime shpenzohet duke krijuar dhe përgjigjur të tjerëve, duke ndihmuar njerëzit në atë proces. Mendoj se kur mjetet janë të tilla që mund të krijosh më lehtë, njerëzit bëhen këta krijues-konsumatorë hibridë, gjë që është vërtet emocionuese”, tha Sanchez.
Në njoftimin për shtyp të Udio thuhet se kompania “në diskutime me një numër artistësh që duan të përdorin AI në rrjedhën e tyre të punës dhe të gjejnë mënyra të reja për të fituar para përmes teknologjisë së saj” dhe se ajo “ka shpenzuar kohë duke ndërtuar modelin e saj të biznesit dhe duke e bërë atë të dobishëm për artistët. . Kjo përfshin dhënien e kontrollit financiar të artistëve mbi ngjashmërinë e zërit të tyre dhe sigurimin që këngët e krijuara të mos cenojnë të drejtat e autorit”.
Kjo ngre disa pyetje të rëndësishme. Së pari, çfarë lloj kontrolli financiar? Për momentin, Udio po i mban ato letra të veçanta pranë gjoksit.
“Nuk mund të hyj në shumë detaje rreth kësaj, sepse shumë prej tyre do të vijnë, por ne jemi në biseda me shumë njerëz të ndryshëm dhe po ndërtojmë modele të reja se si artistët do të fitojnë para nga kjo në të ardhmen”, tha Sanchez.
“Unë do të jem në gjendje t’ju jap më shumë për këtë në të ardhmen, por mjafton të them se është diçka për të cilën ne jemi vërtet të pasionuar dhe është diçka që mbështetësit tanë janë me të vërtetë. Ne mendojmë se do të ketë një model krejtësisht të ri rreth kësaj, dhe ne mendojmë se mund të jetë një model i drejtë dhe vërtet fantastik. Dhe ne duam ta bëjmë atë siç duhet.”
Pyetja tjetër e rëndësishme për çdo AI muzikore ka të bëjë me çfarë muzike është trajnuar. Veçanërisht në kontekstin e mbajtësve të të drejtave që agjitojnë për rregullore për të ndaluar zhvilluesit e AI që të trajnohen me muzikë me të drejtë autori pa licencë, dhe gjithashtu nisjen e fundit të nismës ‘Fairly Trained’ për të certifikuar modelet që nuk e bëjnë këtë.
Pra, për çfarë ishte trajnuar AI i Udio?
“Për modelet gjuhësore dhe modelet e imazhit, është vërtetuar vërtet se për të marrë rezultate me cilësi të lartë, duhet të stërviteni në shumë inpute me cilësi të lartë. Dhe duke vepruar kështu, ju merrni një model që nuk riprodhon rezultatet që pa në trajnim. Është në gjendje të përgjithësojë në një mënyrë që e bën të dobishme për krijuesit, “tha Ding.
“Ashtu si ChatGPT, apo jo? Ka frymëzuar shkrimtarë, skenaristë, artistë… dhe e njëjta gjë për MidJourney, apo jo? Rezultatet që ka krijuar, asnjëra prej tyre nuk është kopje e drejtpërdrejtë e veprave ekzistuese: është më shumë një përzierje e ideve vizuale.”
“Dhe kështu ne e shohim këtë në të njëjtën mënyrë për muzikën. Mund të marr vetëm rezultate me cilësi të lartë (nëse) duhet të stërvitemi për një sasi të madhe muzike të disponueshme publikisht dhe me cilësi të lartë, “vazhdoi ai.
“Qëllimi këtu, padyshim, nuk është të riprodhojmë Beatles apo gjëra të tilla. Nëse dua të riprodhoj Beatles, mund të dëgjoj vetëm Beatles! Është të kuptosh themelet themelore të muzikës dhe të marrësh këtë njohuri dhe ta përdorësh për të krijuar muzikë të re transformuese që është frymëzuar nga muzika ekzistuese, por që është krejtësisht e re.”
“Dhe kjo është arsyeja pse ne kemi filtra shumë të fortë artistësh dhe një fokus të të drejtave të autorit, për t’u siguruar që të mos rikthejmë asgjë (me të drejtë autori).
Sanchez ofroi një përgjigje shtesë për pyetjen.
“Është diçka për të cilën ne jemi shumë të vëmendshëm për shkak se sa e rëndësishme është. Megjithatë, pikëpamja jonë tjetër është se… ne mendojmë se mund të tregojmë gjithashtu se kur krijoni rezultate të reja transformuese, do të ketë një të mirë neto për industrinë: se do të bëhet më shumë ‘muzikë e mirë’. Çfarë thonë ata? Një valë në rritje ngre të gjitha anijet, “tha ai.
“Ne duam ta riformulojmë atë dhe ne e besojmë vërtet këtë, jo si një lojë me shumën zero. Pasi t’u tregojmë një shteg përpara lojtarëve ekzistues në detyrë – ‘shiko, mund ta bësh në këtë mënyrë, mund ta bësh në atë mënyrë’ – mendojmë se biseda do të ndryshojë.”
“Dhe meqë ra fjala, ne e kuptojmë plotësisht se si njerëzit janë të shqetësuar për këtë. Ne padyshim kemi një respekt të jashtëzakonshëm për artistët dhe gjithçka të tillë. Por kjo është qasja jonë: ndoshta do të ketë ndonjë shqetësim, por ne jemi të përgatitur të tregojmë se ka një rrugë të shkëlqyer përpara.”
E gjithë kjo është një pasqyrë e dobishme për mentalitetin e Udio-s, megjithëse siç do ta keni vënë re, nuk i përgjigjet pyetjes specifike se për çfarë muzike është trajnuar AI i kompanisë.
Mund të tingëllojë si justifikime për trajnime për muzikën me të drejtë autori. Fjala ‘transformues’ sjell fuqishëm në mendje argumentet e kompanive ekzistuese të AI se trajnimi mbi përmbajtjen me të drejtë autori duhet të trajtohet si ‘përdorim i drejtë’ në SHBA, për shembull. ‘Transformues’ është një element specifik i doktrinës ligjore të përdorimit të drejtë atje.
Pastaj përsëri, Udio mund të ketë trajnuar modelin e saj në muzikën e domenit publik; muzika e prodhimit të licencuar dhe/ose materiali i regjistruar nga partnerët dhe stafi i saj artistik – të dy bashkëthemeluesit janë vetë muzikantë, në fund të fundit, duke përfshirë edhe luajtjen në një grup që ka bërë turne në Mbretërinë e Bashkuar – dhe thjesht nuk preferojnë t’ia shpërndajnë detajet ndonjë gazetari mjaft të vrullshëm te pyesesh.
Megjithatë, duket qartë se Ding dhe Sanchez po parashikojnë qartësisht më shumë pyetje si kjo nga industria e muzikës pasi Udio del nga beta. Siç theksuan ata, artistët-investitorë të tyre janë përfshirë në formësimin e teknologjisë së kompanisë, por edhe politikës së saj.
Shërbimi është falas tani për tani, me Ding që thotë se kompania dëshiron të bëjë sa më shumë njerëz të luajnë me teknologjinë e saj, ndërkohë që ajo vazhdon të zbusë çdo “tezë të ashpër” në cilësinë e saj.
Përfshirja e bashkëthemeluesit të Instagram lë të kuptohet për ambiciet e tyre. Krieger citohet në njoftimin e njoftimit të ketë thënë “ashtu si Instagram solli ndarjen e fotografive te masat, unë besoj se Udio ka fuqinë të sjellë krijimin e muzikës edhe te masat”.
Ky është një hap gjithnjë e më popullor në botën e muzikës AI: që ashtu si Instagrami demokratizoi fotografinë (dhe ndoshta siç demokratizoi videografinë TikTok), ashtu edhe muzika do të jetë në mënyrë të pashmangshme një nga disiplinat e ardhshme krijuese që do të hapet.
(Ose u hap përsërisepse ky tingull shoqërohet shpesh me një kujtesë se për shekuj përpara se të shfaqej industria e muzikës së regjistruar, bërja e muzikës ishte shpesh një përpjekje e gjerë e komunitetit, nga këngët fisnore te këngët e pubeve, etj etj…)
Pyetja e fundit e Music Ally për Udio është kjo. Nëse këto teori janë të sakta dhe nëse teknologjitë e AI janë çelësi për ridemokratizimin e muzikës… çfarë do të thotë? Jo vetëm për industrinë e muzikës dhe muzikantët profesionistë, por për kulturën tonë?
“Ndjenja ime është se për momentin njerëzit shprehen me gjuhë, tekst, dhe më pas ndonjëherë fotografi në Instagram apo çfarëdo. Ajo që kemi gjetur me përvojën tonë është se tani mund ta bëni këtë me një këngë”, tha Sanchez.
“Për personin e rregullt si unë, i cili nuk është krijues i muzikës me kohë të plotë, ajo që bëj është: nëse do të kemi një takim, do të bëj një këngë për këtë. Ose nëse është ditëlindja do të bëj një këngë ditëlindjeje, ose nëse do të shkoj në një takim ose çfarëdo që të ndodhë. Është si një vektor i ri për shprehjen emocionale.”
“Kështu që unë mendoj se ajo që do të ndodhë është se do të ketë miliona dhe miliona dhe miliona njerëz që do ta përdorin atë në atë mënyrë. “E mahnitshme, unë mund të shpreh veten në këtë mënyrë të re, qesharake, fantastike dhe kuptimplote që prek zemrën”.
“Pastaj do të ketë një grup njerëzish që do të thonë ‘ky është një mjet krijues’ dhe do të krijojnë muzikë të mrekullueshme me të. Dhe pastaj do të ketë një grup njerëzish që janë gjenitë e vërtetë, dhe ata thjesht do të vazhdojnë të bëjnë muzikë të jashtëzakonshme,” vazhdoi ai.
“Kështu që unë mendoj se njerëzit do ta përdorin këtë platformë si për muzikën në kategorinë e parë që përshkrova, që është gjëja personale. Dhe unë mendoj se ata gjithashtu – sepse teknologjia është atje – do ta përdorin atë për të bërë hite të vërteta… Supozimi im më i mirë është se ajo thjesht zgjeron mjetet që njerëzit kanë për të komunikuar me njëri-tjetrin.”
Source link