Ашық AI AI нейрондық желісін Minecraft ойынын Minecraft ойнайтын таңбаланбаған бейне деректерінің үлкен массивінде алдын ала бейне оқытуды (VPT) пайдалана отырып ойнауға үйретті, бұл ретте таңбаланған мердігер деректерінің аз ғана көлемін пайдаланады.

Кішкене түзетулер арқылы AI зерттеу және енгізу компаниясы оның моделі гауһар тас құралдарын жасауды үйренетініне сенімді, бұл тапсырма әдетте тәжірибелі адамдарға 20 минуттан (24 000 қадам) көп уақытты алады. Модель пернелерді басу мен тінтуірдің қозғалысының табиғи интерфейсін пайдаланады, бұл оны айтарлықтай жалпы етеді және компьютерлерді пайдаланатын агенттерді құруға қадам жасайды.

Майкрософт қолдайтын фирманың өкілі: «Интернетте біз үйренуге болатын көптеген жалпыға қолжетімді бейнелер бар. Сіз адамның тамаша презентация жасағанын, сандық суретшінің әдемі күннің батуы суретін салғанын немесе Minecraft ойыншысының күрделі үй салғанын көре аласыз. Дегенмен, бұл бейнелер тек болған оқиғаның жазбасын береді, бірақ оған қалай қол жеткізілгенінің нақты сипаттамасы емес, яғни сіз тінтуірдің қозғалыстары мен пернелерді басу ретінің нақты ретін білмейсіз.

«Егер біз GPT-пен тілде жасағандай, осы домендерде ауқымды негіз үлгілерін құрғымыз келсе, онда әрекет белгілерінің болмауы тіл доменінде жоқ жаңа мәселені тудырады, мұнда «әрекет белгілері» жай ғана сөйлемдегі келесі сөздер».

Интернетте қол жетімді таңбаланбаған бейне деректерінің байлығын пайдалану үшін Open AI жаңа, бірақ қарапайым, жартылай бақыланатын симуляциялық оқыту әдісін ұсынады: Бейнеге дейінгі оқыту (VPT). Команда мердігерлерден шағын деректер жиынтығын жинаудан бастайды, онда ол олардың бейнелерін ғана емес, сонымен қатар олардың әрекеттерін де жазады, бұл жағдайда пернелерді басу және тінтуірдің қозғалысы. Бұл деректер арқылы компания бейненің әрбір кезеңінде орындалатын әрекетті болжайтын кері динамика үлгісін (IDM) жаттықтыра алады. IDM әр қадамдағы әрекетті болжау үшін өткен және болашақ ақпаратты пайдалана алатынын ескеру маңызды.

Баспасөз хатшысы былай деп қосты: «Бұл тапсырма мінез-құлықты клондау тапсырмасына қарағанда әлдеқайда қарапайым және әлдеқайда аз деректерді қажет етеді, ол тек бейненің өткен кадрларынан әрекеттерді болжауды қамтиды, бұл адамның не істегісі келетінін және оны қалай жасау керектігін қорытындылауды талап етеді. Содан кейін біз әлдеқайда үлкен онлайн бейне деректер жинағын белгілеу және мінез-құлықты клондау арқылы оған әрекет етуді үйрену үшін оқытылған IDM пайдалана аламыз.

Open AI мәліметтері бойынша, VPT агенттерге көптеген бейнелерді онлайн көру арқылы қалай әрекет ету керектігін үйренуге жол ашады.

Компания өкілі былай деді: «Тек өкілдік пайымдауларды шығаратын генеративті бейне модельдеу немесе контрасттық әдістермен салыстырғанда, VPT кең ауқымды мінез-құлық пайымдауларын жай тілден гөрі көбірек домендерде тікелей үйретудің қызықты мүмкіндігін ұсынады. Біз тек Minecraft-та AI эксперименттерін жүргізгенімізге қарамастан, ойын өте ашық және адамның жергілікті интерфейсі (тінтуір мен пернетақта) өте жалпы, сондықтан біздің нәтижелер компьютерді пайдалану сияқты басқа ұқсас домендерге жақсы аударылады деп сенеміз.


Ұсынылады: Gran Turismo 7 жаңа AI ойынның ең жақсы ойыншыларын қабылдауға дайын

Бөлісу:

Басқа жаңалықтар