Open AI õpetas AI närvivõrku mängima Minecrafti, kasutades videoeelset koolitust (VPT) tohutul hulgal Minecrafti mängiva inimese märgistamata videoandmetel, kasutades samal ajal vaid väikest hulka märgistatud töövõtja andmeid.

Tehisintellekti uurimis- ja juurutamisettevõte on väikese kohandamisega kindel, et tema mudel suudab õppida teemanttööriistu looma – see ülesanne võtab kogenud inimestel tavaliselt rohkem kui 20 minutit (24 000 sammu). Mudel kasutab klahvivajutuste ja hiireliigutuste loomulikku inimliidest, muutes selle üsna üldiseks ja sammuks arvuteid kasutavate agentide loomise suunas.

Microsofti toetatud ettevõtte pressiesindaja ütles: "Internet sisaldab hulgaliselt avalikult kättesaadavaid videoid, millest saame õppida. Saate vaadata, kuidas inimene teeb suurepärase esitluse, digikunstnik maalib kauni päikeseloojangu või Minecrafti mängija ehitab keeruka maja. Need videod pakuvad aga ainult juhtunu salvestust, kuid mitte täpset kirjeldust selle saavutamise kohta, mis tähendab, et te ei tea hiire liigutuste ja klahvivajutuste täpset järjestust.

"Kui me tahame nendes valdkondades ehitada suuremahulisi vundamendimudeleid, nagu oleme teinud keeles GPT-ga, siis toimingusiltide puudumine tekitab uue probleemi, mida keelevaldkonnas ei eksisteeri, kus "tegevussildid" on lihtsalt järgmised sõnad lauses."

Veebis saadaolevate märgistamata videoandmete rikkalikkuse ärakasutamiseks tutvustab Open AI uut, kuid lihtsat, pooljärelevalvega simulatsioonitreeningu meetodit: Videoeelne koolitus (VPT). Meeskond alustab töövõtjatelt väikese andmestiku kogumisega, kus see salvestab mitte ainult nende videod, vaid ka tegevused, milleks antud juhul on klahvivajutused ja hiireliigutused. Nende andmete abil saab ettevõte koolitada pöörddünaamika mudelit (IDM), mis ennustab video igas etapis tehtavat tegevust. Oluline on märkida, et IDM võib kasutada mineviku ja tuleviku teavet, et arvata iga sammu toimingut.

Pressiesindaja lisas: "See ülesanne on palju lihtsam ja nõuab palju vähem andmeid kui käitumise kloonimise ülesanne, mis hõlmab tegevuste ennustamist ainult varasemate videokaadrite põhjal, mis nõuab järeldamist, mida inimene tahab teha ja kuidas seda teha. Seejärel saame kasutada koolitatud IDM-i, et märgistada palju suurem veebivideo andmekogu ja õppida sellega käitumusliku kloonimise kaudu tegutsema.

Open AI sõnul sillutab VPT agentidele teed, et õppida tegutsema, vaadates suurel hulgal veebis videoid.

Ettevõtte pressiesindaja ütles: "Võrreldes generatiivse videomodelleerimise või kontrastsete meetoditega, mis toovad ainult esinduslikke hinnanguid, pakub VPT põnevat võimalust õpetada otseselt laiaulatuslikke käitumisotsuseid rohkemates valdkondades kui ainult keeles. Kuigi me tegime Minecraftis ainult tehisintellekti katseid, on mäng väga avatud ja loomulik inimliides (hiir ja klaviatuur) on väga üldine, seega usume, et meie tulemused tõlgivad hästi teistesse sarnastesse valdkondadesse, näiteks arvutikasutusse.


Soovitatud: Gran Turismo 7 uus AI on valmis võtma vastu mängu parimad mängijad

Jaga:

Muud uudised