Open AI koulutti tekoälyn hermoverkon pelaamaan Minecraftia käyttämällä videota edeltävää koulutusta (VPT) valtavalla joukolla merkitsemätöntä videodataa ihmisestä, joka pelaa Minecraftia, mutta käyttämällä vain pientä määrää merkittyjä urakoitsijoiden tietoja.

Pienellä muokkauksella tekoälyn tutkimus- ja toteutusyritys on varma, että sen malli voi oppia luomaan timanttityökaluja, mikä kestää kokeneille ihmisille yleensä yli 20 minuuttia (24 000 askelta). Malli käyttää alkuperäistä ihmisen käyttöliittymää näppäinpainalluksista ja hiiren liikkeistä, mikä tekee siitä melko yleisen ja askeleen kohti tietokoneita käyttävien agenttien luomista.

Microsoftin tukeman yrityksen tiedottaja sanoi: "Internet sisältää runsaasti julkisesti saatavilla olevia videoita, joista voimme oppia. Voit katsella, kuinka henkilö tekee upean esityksen, digitaalinen taiteilija maalaa kauniin auringonlaskun tai Minecraft-pelaaja rakentaa monimutkaisen talon. Nämä videot tarjoavat kuitenkin vain tallenteen siitä, mitä tapahtui, mutta eivät tarkkaa kuvausta siitä, kuinka se saavutettiin, joten et tiedä tarkkaa hiiren liikkeiden ja näppäinpainallusten järjestystä.

"Jos haluamme rakentaa näille aloille suuria perusmalleja, kuten olemme tehneet kielessä GPT:n kanssa, toimintamerkkien puute luo uuden ongelman, jota ei ole kielialueella, jossa "toimintatunnisteet" ovat yksinkertaisesti lauseen seuraavat sanat."

Hyödyntääkseen verkossa saatavilla olevaa runsaasti merkitsemätöntä videodataa Open AI esittelee uuden, mutta yksinkertaisen, puolivalvotun simulaatioharjoitusmenetelmän: Pre-Video Training (VPT). Ryhmä aloittaa keräämällä urakoitsijoilta pienen tietojoukon, johon se tallentaa paitsi heidän videoidensa, myös heidän toimintansa, jotka tässä tapauksessa ovat näppäinpainalluksia ja hiiren liikkeitä. Näiden tietojen avulla yritys voi kouluttaa käänteisen dynamiikkamallin (IDM), joka ennustaa videon kussakin vaiheessa suoritetut toimet. On tärkeää huomata, että IDM voi käyttää menneitä ja tulevia tietoja arvatakseen toiminnan jokaisessa vaiheessa.

Tiedottaja lisäsi: ”Tämä tehtävä on paljon yksinkertaisempi ja vaatii paljon vähemmän dataa kuin käyttäytymisen kloonaustehtävä, joka edellyttää toimien ennustamista vain aiemmista videokuvista, mikä edellyttää päättelemistä, mitä henkilö haluaa tehdä ja miten se tehdään. Voimme sitten käyttää koulutettua IDM:ää merkitsemään paljon suuremman online-videoaineiston ja oppia toimimaan sen mukaisesti käyttäytymiskloonauksen avulla."

Open AI:n mukaan VPT tasoittaa tietä agenteille, jotka voivat oppia toimimaan katsomalla suuria määriä videoita verkossa.

Yrityksen tiedottaja sanoi: "Verrattuna generatiiviseen videomallinnukseen tai kontrastiivisiin menetelmiin, jotka tuottavat vain edustavia arvioita, VPT tarjoaa jännittävän mahdollisuuden opettaa suoraan laajamittaisia ​​käyttäytymisarvioita muilla aloilla kuin vain kielellä. Vaikka teimme vain tekoälykokeita Minecraftissa, peli on hyvin avoin ja natiivi ihmiskäyttöliittymä (hiiri ja näppäimistö) on hyvin geneerinen, joten uskomme, että tulokset soveltuvat hyvin muille vastaaville aloille, kuten tietokoneen käyttöön.


Suositeltava: Gran Turismo 7:n uusi tekoäly on valmis ottamaan vastaan ​​pelin parhaat pelaajat

Jaa:

Muut uutiset