Open AI trainéiert en AI neuralt Netzwierk fir Minecraft mat Pre-Video Training (VPT) ze spillen op enger rieseger Palette vun onlabeléierte Videodaten vun engem Mënsch spillt Minecraft, wärend nëmmen eng kleng Quantitéit u markéierten Optraghuelerdaten benotzt.

Mat e bëssen Tweaking ass d'AI Fuerschung an Implementéierungsfirma zouversiichtlech datt säi Modell ka léiere Diamanttools ze kreéieren, eng Aufgab déi typesch erfuerene Mënschen méi wéi 20 Minutten dauert (24 Schrëtt). De Modell benotzt eng gebierteg mënschlech Interface vun Tastekombinatiounen a Mausbewegungen, wat et ganz allgemeng mécht an e Schrëtt fir Agenten ze kreéieren déi Computeren benotzen.

E Spriecher vun der Microsoft-gestützter Firma sot: "Den Internet enthält e Räichtum vun ëffentlech verfügbare Videoen aus deem mir kënne léieren. Dir kënnt kucken wéi eng Persoun eng super Presentatioun mécht, en digitale Kënschtler e schéine Sonnenënnergang molen oder e Minecraft Spiller en komplizéierten Haus bauen. Wéi och ëmmer, dës Videoe bidden nëmmen eng Opzeechnung vu wat geschitt ass, awer net eng exakt Beschreiwung vu wéi et erreecht gouf, dat heescht datt Dir net déi genau Sequenz vu Mausbewegungen an Tastekombinatiounen kennt.

"Wa mir an deene Beräicher grouss-Skala Fundamenter Modeller bauen wëllen, wéi mir an der Sprooch mat GPT gemaach hunn, da stellt de Mangel vun Aktioun Etiketten en neie Problem, deen net existéiert am Sprooch Domain, wou "Aktioun Etiketten" sinn einfach. déi nächst Wierder an engem Saz."

Fir de Räichtum vun net markéierten Videodaten, déi um Internet verfügbar sinn, ze profitéieren, stellt Open AI eng nei, awer einfach, semi-iwwerwaacht Simulatiouns Trainingsmethod vir: Pre-Video Training (VPT). D'Team fänkt un mat engem klengen Datesaz vun Optraghueler ze sammelen, wou se net nëmmen hir Videoen ophuelen, awer och hir Handlungen, déi an dësem Fall Tastekombinatiounen a Mausbewegungen sinn. Mat dësen Donnéeën kann eng Firma en Inverse Dynamics Model (IDM) trainéieren, deen d'Aktioun virausgesot, déi an all Etapp vum Video gemaach gëtt. Et ass wichteg ze bemierken datt IDM fréier an zukünfteg Informatioun benotze kann fir d'Aktioun bei all Schrëtt ze roden.

De Pressespriecher huet bäigefüügt: "Dës Aufgab ass vill méi einfach a erfuerdert vill manner Donnéeën wéi d'Verhalensklonentask, déi virausgesot Aktiounen nëmmen aus vergaangene Videoframe involvéiert, wat erfuerdert ofzeschléissen wat eng Persoun wëll maachen a wéi et ze maachen. Mir kënnen dann den trainéierten IDM benotze fir e vill méi groussen Online Video-Datasaz ze markéieren a léiere mat der Verhalensklonen ze handelen.

Laut Open AI, de VPT mécht de Wee fir Agenten ze léiere wéi se handelen andeems se enorm Quantitéite vu Videoen online kucken.

E Pressespriecher vun der Firma sot: "Am Verglach mat generativen Videomodelléierung oder kontrastive Methoden déi nëmmen representativ Uerteeler produzéieren, bitt VPT eng spannend Geleeënheet fir direkt grouss Verhalens-Urteeler a méi Beräicher ze léieren wéi just Sprooch. Och wa mir nëmmen AI Experimenter am Minecraft gemaach hunn, ass d'Spill ganz oppen an déi gebierteg mënschlech Interface (Maus a Tastatur) ass ganz generesch, sou datt mir gleewen datt eis Resultater gutt op aner ähnlech Domainen iwwersetzen, sou wéi Computergebrauch.


Recommandéiert: Dem Gran Turismo 7 säin neien AI ass prett fir déi bescht Spiller vum Spill opzehuelen

Deelen:

Aner Neiegkeeten