Firma iza ChagGPTa prikriva tragove koristenja nedozvoljenog materijala

Tehnologija 17. aug 202315:04 0 komentara
AFP

Prema najnovijem istraživanju modela umjetne inteligencije poput ChatGPTa, firme koje ih razvijaju sada pokušavaju prikriti činjenicu da su svoje botove trenirali na na materijalu zaštićenom autorskim pravima, prenosi Business Insider.

ChatGPT, a samim time i svi drugi veliki jezički modeli ili LLM, obučeni su pomoću ogromnih količina podataka i teksta preuzetih sa interneta, uključujući mnoge knjige koje su i dalje zaštićene autorskim pravima. OpenAI, kompanija koja je proizvela popularni jezički model našla se pod okom javnosti zbog korištenja takvog materijala bez plaćanja informacija putem ugovora o licenciranju ili drugih dozvola, što je izazvalo tužbe autora.

Odgovor OpenAI-a kompanija poput Googlea, Mete i Microsofta uglavnom je bio da prestanu otkrivati na kojim podacima su obučeni njihovi AI modeli.

Sada je OpenAI otišao korak dalje, sugeriše novi istraživački rad.

ChatGPT sada pokušava da izbegne da odgovori na korisničke upite tačnim frazama iz djela zaštićenih autorskim pravima, navodi se u radnom dokumentu koji je 8. avgusta objavila grupa naučnika za umjetnu inteligenciju koji rade za istraživački ogranak ByteDancea, vlasnika TikToka.

Istraživanje se fokusiralo na to kako učiniti LLM-ove “pouzdanijima” u svojim rezultatima kroz različite tehnike “usklađivanja” koje imaju za cilj poboljšanje tačnosti. U dokumentu se takođe priznaje da su AI alati koji pokazuju da su obučeni korištenjem materijala zaštićenog autorskim pravima “izazvali zabrinutost” za AI kompanije.

U nastojanju da izbjegne da pokaže da je obučen na takvom materijalu, ChatGPT sada “ometa odgovore kada neko namjerno pokušava isprovocirati narednu rečenicu… što se nije događalo u prethodnoj verziji ChatGPT-a”, napisali su istraživači. “Pretpostavljamo da su ChatGPT programeri implementirali mehanizam za otkrivanje da li upiti imaju za cilj izdvajanje sadržaja autorskog prava ili provjeru sličnosti između generiranih odgovora i sadržaja zaštićenog autorskim pravima.”

Uprkos naporima, ChatGPT je i dalje prikazivao materijal zaštićen autorskim pravima, navodi se u istraživanju.

Svi AI modeli koji su obuhvaćeni istraživanjem su odgovorili na nekoliko upita zasnovanih na seriji knjiga o Harryju Potteru spisateljice J.K. Rowling sa frazama i odgovorima koji se tačno ili skoro potpuno podudara sa knjigama, navodi Insider. Neki odgovori su se razlikovali za samo jednu ili dvije riječi.

Istraživači su sugerirali da korisnici koji navode ove modele da prikažu rad zaštićen autorskim pravima “zloupotrebljavaju” tehnologiju.

Program N1 televizije možete pratiti UŽIVO na ovom linku kao i putem aplikacija za Android|iPhone/iPad

Kakvo je tvoje mišljenje o ovome?

Budi prvi koji će ostaviti komentar!