Odprta umetna inteligenca je usposobila nevronsko mrežo umetne inteligence za igranje Minecrafta z uporabo pred-video usposabljanja (VPT) na ogromnem nizu neoznačenih video podatkov človeka, ki igra Minecraft, pri čemer je uporabila le majhno količino označenih podatkov izvajalca.

Podjetje za raziskave in implementacijo umetne inteligence je z malo popravki prepričano, da se lahko njegov model nauči ustvarjati diamantna orodja, kar je naloga, ki izkušenim ljudem običajno vzame več kot 20 minut (24 korakov). Model uporablja izvorni človeški vmesnik pritiskov tipk in premikov miške, zaradi česar je precej splošen in korak k ustvarjanju agentov, ki uporabljajo računalnike.

Tiskovni predstavnik podjetja, ki ga podpira Microsoft, je dejal: »Internet vsebuje veliko javno dostopnih videoposnetkov, iz katerih se lahko učimo. Gledate lahko, kako oseba naredi odlično predstavitev, digitalni umetnik slika čudovit sončni zahod ali igralec Minecrafta zgradi zapleteno hišo. Vendar ti videoposnetki zagotavljajo le posnetek tega, kar se je zgodilo, ne pa tudi natančnega opisa, kako je bilo to doseženo, kar pomeni, da ne boste vedeli natančnega zaporedja premikov miške in pritiskov na tipke.

»Če želimo zgraditi temeljne modele velikega obsega v teh domenah, kot smo naredili v jeziku z GPT, potem pomanjkanje oznak dejanj ustvari nov problem, ki ne obstaja v jezikovni domeni, kjer so »oznake dejanj« preprosto naslednje besede v stavku."

Da bi izkoristili bogastvo neoznačenih video podatkov, ki so na voljo na spletu, Open AI uvaja novo, a preprosto metodo delno nadzorovanega simulacijskega usposabljanja: Pred-video usposabljanje (VPT). Ekipa začne z zbiranjem majhnega nabora podatkov od izvajalcev, kjer ne beleži le njihovih videoposnetkov, ampak tudi njihova dejanja, ki so v tem primeru pritiski tipk in premiki miške. S temi podatki lahko podjetje usposobi inverzni dinamični model (IDM), ki napove dejanje, izvedeno na vsaki stopnji videa. Pomembno je omeniti, da lahko IDM uporabi pretekle in prihodnje informacije, da ugiba dejanje na vsakem koraku.

Tiskovni predstavnik je dodal: »Ta naloga je veliko enostavnejša in zahteva veliko manj podatkov kot naloga kloniranja vedenja, ki vključuje napovedovanje dejanj samo iz preteklih okvirjev videa, kar zahteva sklepanje, kaj želi oseba narediti in kako to narediti. Nato lahko uporabimo izurjeni IDM za označevanje veliko večjega nabora spletnih video podatkov in se naučimo ukrepati na podlagi tega z vedenjskim kloniranjem.«

Glede na Open AI VPT utira pot agentom, da se naučijo ravnati z gledanjem ogromne količine videoposnetkov na spletu.

Tiskovni predstavnik podjetja je dejal: »V primerjavi z generativnim video modeliranjem ali kontrastnimi metodami, ki ustvarjajo samo reprezentativne sodbe, VPT ponuja razburljivo priložnost za neposredno poučevanje obsežnih vedenjskih sodb na več področjih kot le v jeziku. Čeprav smo v Minecraftu izvedli samo eksperimente z umetno inteligenco, je igra zelo odprta in izvorni človeški vmesnik (miška in tipkovnica) je zelo splošen, zato verjamemo, da se naši rezultati dobro prenašajo na druga podobna področja, kot je uporaba računalnika.«


Priporočamo: Nova AI igre Gran Turismo 7 je pripravljena na boj z najboljšimi igralci igre

Deliti:

Ostale novice