OpenAI je predstavio Voice Engine, revolucionarnu AI platformu za pretvaranje teksta u glas, potaknuvši znatiželju i raspravu o potencijalnim primjenama te tehnologije. Kroz glasovni isječak od samo 15 sekundi, ta najnovija OpenAI-jeva inovacija može sintetizirati realističan glas sposoban čitati tekst na više jezika, što bi moglo imati ogroman utjecaj na razne industrije.
OpenAI-jev post na blogu naglašava značaj preliminarnih implementacija u oblikovanju etičkih razmatranja i istraživanju različitih aplikacija.
Značajni korisnici ove tehnologije uključuju tvrtke Age of Learning, Dimagi, Livox i Lifespan te HeyGen AI generator videa, od kojih svaki koristi Voice Engine za različite svrhe. Age of Learning, na primjer, koristi ga za generiranje unaprijed skriptiranog glasovnog sadržaja i isporuku personaliziranih odgovora učenicima.
Razvoj Voice Enginea seže unatrag do 2022. godine, a njegova evolucija je kulminirala unaprijed postavljenim glasovima za API, za pretvaranje teksta u govor i ChatGPT-ovu značajku Read Aloud. Jeff Harris iz OpenAI-jevog tima za proizvode otkrio je da je model prošao obuku na spoju licenciranih i javno dostupnih podataka, naglašavajući njegovu čvrstu osnovu.
Glasovna AI tehnologija se širi
Krajolik zvuka generiranog umjetnom inteligencijom nastavlja se širiti, a Voice Engine označava značajan korak u tom razvoju. Međutim, etička razmatranja su velika, što pokazuje nedavni mandat američkog FCC-a koji zabranjuje glasovne pozive s umjetnom inteligencijom, što je upozoravajuća priča koja odražava zabrinutost koju je iznio sam OpenAI.
Partnerstvo OpenAI-ja propisuje pridržavanje strogih pravila korištenja, uključujući dobivanje izričitog pristanka od izvornog govornika, suzdržavanje od lažnog predstavljanja i otkrivanje porijekla AI slušateljima. Vodeni žig dodatno osigurava sljedivost i odgovornost u korištenju zvuka, odražavajući OpenAI-jev proaktivan stav u ublažavanju potencijalne zlouporabe.
Brojni su prijedlozi za ublažavanje rizika povezanih s glasovnom tehnologijom vođenom umjetnom inteligencijom, uključujući mjere kao što je postupno ukidanje glasovne autentifikacije za bankarstvo, snažne politike koje štite glasove pojedinaca, povećanu svijest javnosti o AI deep fake-ovima i razvoj sveobuhvatnih sustava praćenja za AI-generiranog sadržaja, prenosi Zimo.
Kroz proaktivne mjere i zajedničke napore, transformativni potencijal Voice Enginea može se odgovorno iskoristiti, najavljujući novu eru u interakciji ljudi i stroja.
Program N1 televizije možete pratiti UŽIVO na ovom linku kao i putem aplikacija za Android|iPhone/iPad
Kakvo je tvoje mišljenje o ovome?
Budi prvi koji će ostaviti komentar!