Otvorena umjetna inteligencija obučila je neuronsku mrežu umjetne inteligencije za igranje Minecrafta koristeći video preduvježbavanje (VPT) na ogromnom broju neoznačenih videopodataka ljudskog igranja Minecrafta, koristeći samo malu količinu označenih podataka izvođača.

Uz malo ugađanja, tvrtka za istraživanje i implementaciju umjetne inteligencije uvjerena je da njezin model može naučiti stvarati dijamantne alate, zadatak za koji iskusnim ljudima obično treba više od 20 minuta (24 000 koraka). Model koristi izvorno ljudsko sučelje pritisaka tipki i pokreta mišem, što ga čini prilično općenitim i korakom prema stvaranju agenata koji koriste računala.

Glasnogovornik tvrtke koju podupire Microsoft rekao je: “Internet sadrži mnoštvo javno dostupnih videa iz kojih možemo učiti. Možete gledati kako osoba pravi sjajnu prezentaciju, digitalni umjetnik slika prekrasan zalazak sunca ili Minecraft igrač kako gradi zamršenu kuću. Međutim, ovi videozapisi daju samo snimku onoga što se dogodilo, ali ne i točan opis kako je to postignuto, što znači da nećete znati točan slijed pokreta mišem i pritisaka na tipke.

„Ako želimo izgraditi temeljne modele velikih razmjera u ovim domenama, kao što smo to učinili u jeziku s GPT-om, tada nedostatak oznaka radnje stvara novi problem koji ne postoji u jezičnoj domeni, gdje su „oznake akcije“ jednostavno sljedeće riječi u rečenici.”

Kako bi iskoristio bogatstvo neoznačenih videopodataka dostupnih na internetu, Open AI uvodi novu, ali jednostavnu, polu-nadziranu metodu simulacijske obuke: Video Pre-Training (VPT). Tim počinje prikupljanjem malog skupa podataka od izvođača, gdje bilježi ne samo njihove videozapise, već i njihove radnje, što su u ovom slučaju pritisci tipki i pokreti mišem. Koristeći te podatke, tvrtka može trenirati inverzni dinamički model (IDM) koji predviđa radnju koja se izvodi u svakoj fazi videa. Važno je napomenuti da IDM može koristiti prošle i buduće informacije kako bi pogodio radnju u svakom koraku.

Glasnogovornik je dodao: “Ovaj je zadatak puno jednostavniji i zahtijeva puno manje podataka nego zadatak kloniranja ponašanja, koji uključuje predviđanje radnji samo iz prošlih okvira videa, što zahtijeva zaključivanje što osoba želi učiniti i kako to učiniti. Zatim možemo upotrijebiti uvježbani IDM za označavanje mnogo većeg online video skupa podataka i naučiti djelovati na njemu putem bihevioralnog kloniranja.”

Open AI kaže da VPT utire put agentima da nauče kako se ponašati gledajući ogromne količine videa na internetu.

Glasnogovornik tvrtke rekao je: “U usporedbi s generativnim video modeliranjem ili kontrastnim metodama koje proizvode samo reprezentativne prosudbe, VPT nudi uzbudljivu priliku za izravno podučavanje opsežnih prosudbi ponašanja u više domena osim jezika. Iako smo proveli samo AI eksperimente u Minecraftu, igra je vrlo otvorena, a izvorno ljudsko sučelje (miš i tipkovnica) vrlo je generičko, tako da vjerujemo da se naši rezultati dobro prenose na druge slične domene, kao što je korištenje računala.”


preporučeno: Nova AI igre Gran Turismo 7 spremna je za borbu s najboljim igračima igre

Udio:

Ostale vijesti