Së pari, OpenAI ofroi një mjet që i lejonte njerëzit të krijonin imazhe dixhitale thjesht duke përshkruar atë që dëshironin të shihnin. Më pas, ndërtoi teknologji të ngjashme që gjeneroi video me lëvizje të plotë si diçka nga një film hollivudian.
Tani, ajo ka zbuluar teknologjinë që mund të rikrijojë zërin e dikujt.
Fillimi i profilit të lartë të AI tha të Premten se një grup i vogël biznesesh po testonte një sistem të ri OpenAI, Voice Engine, që mund të rikrijojë zërin e një personi nga një regjistrim 15 sekondash. Nëse ngarkoni një regjistrim të vetes dhe një paragraf teksti, ai mund ta lexojë tekstin duke përdorur një zë sintetik që tingëllon si i yti.
Teksti nuk duhet të jetë në gjuhën tuaj amtare. Nëse jeni një folës anglisht, për shembull, ai mund të rikrijojë zërin tuaj në spanjisht, frëngjisht, kinezisht ose shumë gjuhë të tjera.
OpenAI nuk po e ndan teknologjinë më gjerësisht sepse ende po përpiqet të kuptojë rreziqet e saj të mundshme. Ashtu si gjeneruesit e imazheve dhe videove, një gjenerues zëri mund të ndihmojë në përhapjen e dezinformatave nëpër mediat sociale. Mund të lejojë gjithashtu kriminelët të imitojnë njerëzit në internet ose gjatë telefonatave.
Kompania tha se ishte veçanërisht e shqetësuar se kjo lloj teknologjie mund të përdoret për të thyer autentifikuesit e zërit që kontrollojnë aksesin në llogaritë bankare në internet dhe aplikacione të tjera personale.
“Kjo është një gjë e ndjeshme dhe është e rëndësishme që ta bëjmë atë siç duhet,” tha në një intervistë një menaxher produkti i OpenAI, Jeff Harris.
Kompania po eksploron mënyra për të vënë ujëra të zërave sintetikë ose duke shtuar kontrolle që i pengojnë njerëzit të përdorin teknologjinë me zërat e politikanëve ose figurave të tjera të shquara.
Muajin e kaluar, OpenAI mori një qasje të ngjashme kur zbuloi gjeneratorin e saj të videove, Sora. Ajo tregoi teknologjinë, por nuk e publikoi atë publikisht.
OpenAI është ndër kompanitë e shumta që kanë zhvilluar një lloj të ri të teknologjisë së AI që mund të gjenerojë shpejt dhe me lehtësi zëra sintetikë. Ato përfshijnë gjigantë të teknologjisë si Google, si dhe start-ups si ElevenLabs me bazë në Nju Jork. (The New York Times ka paditur OpenAI dhe partnerin e tij, Microsoft, mbi pretendimet për shkelje të të drejtave të autorit që përfshijnë sistemet e inteligjencës artificiale që gjenerojnë tekst.)
Bizneset mund t’i përdorin këto teknologji për të gjeneruar libra audio, për t’u dhënë zë chatbot-eve në internet apo edhe për të ndërtuar një stacion radioje të automatizuar DJ. Që nga viti i kaluar, OpenAI ka përdorur teknologjinë e saj për të fuqizuar një version të ChatGPT që flet. Dhe prej kohësh u ka ofruar bizneseve një sërë zërash që mund të përdoren për aplikacione të ngjashme. Të gjitha ato u ndërtuan nga klipet e siguruara nga aktorët e zërit.
Por kompania nuk ka ofruar ende një mjet publik që do t’i lejonte individët dhe bizneset të rikrijonin zërat nga një klip i shkurtër siç bën Voice Engine. Aftësia për të rikrijuar çdo zë në këtë mënyrë, tha zoti Harris, është ajo që e bën teknologjinë të rrezikshme. Teknologjia mund të jetë veçanërisht e rrezikshme në një vit zgjedhor, tha ai.
Në janar, banorët e Nju Hampshirit morën mesazhe robo-telefonike që i penguan ata të votonin në zgjedhjet paraprake të shtetit me një zë që me shumë gjasa ishte krijuar artificialisht për të tingëlluar si Presidenti Biden. Komisioni Federal i Komunikimeve më vonë i shpalli të jashtëligjshme thirrje të tilla.
Zoti Harris tha se OpenAI nuk kishte plane të menjëhershme për të fituar para nga teknologjia. Ai tha se mjeti mund të jetë veçanërisht i dobishëm për njerëzit që humbën zërin e tyre për shkak të sëmundjes ose aksidentit.
Ai tregoi se si teknologjia ishte përdorur për të rikrijuar zërin e një gruaje pasi kanceri i trurit e dëmtoi atë. Ajo tani mund të fliste, tha ai, pasi bëri një regjistrim të shkurtër të një prezantimi që kishte bërë dikur si gjimnaziste.