Az Open AI egy mesterséges intelligencia neurális hálózatot tanított ki a Minecraft lejátszására a videó előtti tréning (VPT) segítségével egy Minecraftot játszó ember címkézetlen videóadatainak hatalmas tömbjén, miközben csak kis mennyiségű címkézett vállalkozói adatot használt.

Egy kis finomítással az AI-kutató és kivitelező cég biztos abban, hogy modellje képes megtanulni gyémántszerszámok létrehozását, ami általában több mint 20 percet (24 000 lépést) vesz igénybe a tapasztalt embereknél. A modell a billentyűleütések és az egérmozgások natív emberi interfészét használja, ami meglehetősen általánossá teszi, és egy lépés a számítógépeket használó ügynökök létrehozása felé.

A Microsoft által támogatott cég szóvivője elmondta: „Az internet rengeteg nyilvánosan elérhető videót tartalmaz, amelyekből tanulhatunk. Megnézheti, hogy egy személy nagyszerű prezentációt készít, egy digitális művész gyönyörű naplementét fest, vagy egy Minecraft játékos épít egy bonyolult házat. Ezek a videók azonban csak rögzítést adnak a történtekről, de nem adnak pontos leírást arról, hogyan sikerült elérni, vagyis nem fogod tudni az egérmozgások és billentyűleütések pontos sorrendjét.

„Ha nagy léptékű alapmodelleket akarunk építeni ezeken a területeken, ahogyan azt a nyelvben a GPT-vel tettük, akkor a műveletcímkék hiánya olyan új problémát okoz, amely nem létezik a nyelvi tartományban, ahol az „akciócímkék” egyszerűen csak a következő szavak egy mondatban."

A weben elérhető címkézetlen videoadatok tárházának kihasználása érdekében az Open AI egy új, de egyszerű, félig felügyelt szimulációs képzési módszert vezet be: Pre-Video Training (VPT). A csapat azzal kezdi, hogy összegyűjt egy kis adatkészletet a vállalkozóktól, ahol nemcsak videóikat rögzíti, hanem akcióikat is, amelyek jelen esetben billentyűleütések és egérmozgások. Ezekkel az adatokkal a vállalat kiképezhet egy Inverse Dynamics Model (IDM) modellt, amely előrejelzi a videó egyes szakaszaiban végrehajtott műveleteket. Fontos megjegyezni, hogy az IDM képes múltbeli és jövőbeli információk alapján kitalálni a műveletet minden egyes lépésben.

A szóvivő hozzátette: „Ez a feladat sokkal egyszerűbb, és sokkal kevesebb adatot igényel, mint a viselkedés klónozási feladat, amely során csak a korábbi videókockákból kell előre jelezni a cselekvéseket, és ehhez ki kell következtetni, hogy az ember mit és hogyan akar csinálni. Ezután a betanított IDM segítségével felcímkézhetünk egy sokkal nagyobb online videoadatkészletet, és megtanulhatjuk, hogyan reagáljunk rá a viselkedési klónozással.”

Az Open AI szerint a VPT megnyitja az utat az ügynökök előtt, hogy megtanulják, hogyan kell cselekedni hatalmas mennyiségű online videó megtekintésével.

A vállalat szóvivője elmondta: „A generatív videomodellezéssel vagy a csak reprezentatív ítéleteket hozó kontrasztív módszerekkel összehasonlítva a VPT izgalmas lehetőséget kínál a nagyszabású viselkedési ítéletek közvetlen megtanítására a nyelven kívül több területen is. Bár csak mesterséges intelligencia-kísérleteket végeztünk a Minecraftban, a játék nagyon nyitott, és a natív emberi felület (egér és billentyűzet) nagyon általános, ezért úgy gondoljuk, hogy eredményeink jól használhatók más hasonló területeken, például a számítógéphasználatban.”


ajánlott: A Gran Turismo 7 új AI-ja készen áll a játék legjobb játékosainak megküzdésére

Ossza meg:

Egyéb hírek