Open AI-ն մարզել է AI նեյրոնային ցանցը՝ Minecraft խաղալու համար՝ օգտագործելով նախնական վիդեո ուսուցում (VPT) Minecraft խաղացող մարդու չպիտակավորված վիդեո տվյալների հսկայական զանգվածի վրա՝ միաժամանակ օգտագործելով միայն պիտակավորված կապալառուի տվյալների մի փոքր մասը:

Մի փոքր շտկելով՝ AI-ի հետազոտությունների և իրականացման ընկերությունը վստահ է, որ իր մոդելը կարող է սովորել ստեղծել ադամանդե գործիքներ, մի խնդիր, որը սովորաբար փորձառու մարդկանց ավելի քան 20 րոպե է պահանջում (24 քայլ): Մոդելը օգտագործում է ստեղնաշարի և մկնիկի շարժումների բնիկ մարդկային ինտերֆեյս՝ դարձնելով այն բավականին ընդհանուր և քայլ դեպի համակարգիչներ օգտագործող գործակալներ ստեղծելու ճանապարհը:

Microsoft-ի կողմից աջակցվող ընկերության ներկայացուցիչն ասել է. «Ինտերնետը պարունակում է հանրության համար հասանելի բազմաթիվ տեսանյութեր, որոնցից մենք կարող ենք սովորել: Դուք կարող եք դիտել, թե ինչպես է մարդը հիանալի ներկայացում է անում, թվային նկարիչն է նկարում գեղեցիկ մայրամուտը կամ Minecraft խաղացողը կառուցում է բարդ տուն: Այնուամենայնիվ, այս տեսանյութերը տալիս են միայն կատարվածի ձայնագրություն, բայց ոչ ճշգրիտ նկարագրություն, թե ինչպես է դա ձեռք բերվել, ինչը նշանակում է, որ դուք չեք իմանա մկնիկի շարժումների և ստեղնաշարերի ճշգրիտ հաջորդականությունը:

«Եթե մենք ցանկանում ենք ստեղծել հիմքերի լայնածավալ մոդելներ այս տիրույթներում, ինչպես դա արել ենք լեզվով GPT-ի հետ, ապա գործողությունների պիտակների բացակայությունը նոր խնդիր է ստեղծում, որը գոյություն չունի լեզվի տիրույթում, որտեղ «գործողությունների պիտակները» պարզապես. հաջորդ բառերը նախադասության մեջ»:

Համացանցում հասանելի չպիտակավորված վիդեո տվյալների առատությունից օգտվելու համար Open AI-ն ներկայացնում է նոր, բայց պարզ, կիսավերահսկվող մոդելավորման ուսուցման մեթոդ՝ Pre-Video Training (VPT): Թիմը սկսում է կապալառուներից փոքր տվյալների հավաքագրմամբ, որտեղ ձայնագրում է ոչ միայն նրանց տեսանյութերը, այլև նրանց գործողությունները, որոնք այս դեպքում ստեղնաշարի և մկնիկի շարժումներն են: Այս տվյալներով՝ ընկերությունը կարող է պատրաստել հակադարձ դինամիկայի մոդել (IDM), որը կանխատեսում է տեսանյութի յուրաքանչյուր փուլում կատարվող գործողությունները: Կարևոր է նշել, որ IDM-ն կարող է օգտագործել անցյալ և ապագա տեղեկատվությունը յուրաքանչյուր քայլի գործողությունը գուշակելու համար:

«Այս առաջադրանքը շատ ավելի պարզ է և պահանջում է շատ ավելի քիչ տվյալներ, քան վարքագծի կլոնավորման առաջադրանքը, որը ներառում է գործողությունների կանխատեսում միայն անցյալ տեսանյութի կադրերից, որը պահանջում է եզրակացություն անել, թե ինչ է ուզում անել մարդը և ինչպես դա անել: Այնուհետև մենք կարող ենք օգտագործել վերապատրաստված IDM-ն՝ պիտակավորելու շատ ավելի մեծ առցանց վիդեո տվյալների շտեմարան և սովորել գործել դրա վրա՝ վարքագծային կլոնավորման միջոցով»:

Ըստ Open AI-ի, VPT-ն ճանապարհ է հարթում գործակալների համար՝ սովորելու, թե ինչպես վարվել՝ դիտելով հսկայական քանակությամբ տեսանյութեր առցանց:

Ընկերության խոսնակն ասել է. «Համեմատած գեներատիվ վիդեո մոդելավորման կամ հակադրական մեթոդների հետ, որոնք արտադրում են միայն ներկայացուցչական դատողություններ, VPT-ն հետաքրքիր հնարավորություն է տալիս ուղղակիորեն սովորեցնել լայնածավալ վարքային դատողություններ ավելի շատ ոլորտներում, քան պարզապես լեզուն: Չնայած մենք միայն AI-ի փորձեր ենք անցկացրել Minecraft-ում, խաղը շատ բաց է, իսկ բնիկ մարդկային ինտերֆեյսը (մկնիկը և ստեղնաշարը) շատ ընդհանուր է, ուստի մենք կարծում ենք, որ մեր արդյունքները լավ են թարգմանվում նմանատիպ այլ տիրույթներում, օրինակ՝ համակարգչի օգտագործումը»:


Խորհուրդ է տրվում: Gran Turismo 7-ի նոր AI-ն պատրաստ է դիմակայել խաղի լավագույն խաղացողներին

Share:

Այլ նորություններ