Open AI þjálfaði gervigreind taugakerfi til að spila Minecraft með því að nota pre-video þjálfun (VPT) á risastóru úrvali ómerktra myndbandsgagna um manneskju sem spilar Minecraft, en notaði aðeins lítið magn af merktum verktakagögnum.

Með smá lagfæringum er gervigreindarrannsókna- og innleiðingarfyrirtækið þess fullviss að líkan þess geti lært að búa til demantverkfæri, verkefni sem tekur venjulega reynda menn meira en 20 mínútur (24 skref). Líkanið notar innbyggt mannlegt viðmót ásláttar og músahreyfinga, sem gerir það nokkuð almennt og skref í átt að því að búa til umboðsmenn sem nota tölvur.

Talsmaður fyrirtækisins sem styður Microsoft sagði: „Internetið inniheldur mikið af myndböndum sem eru aðgengileg almenningi sem við getum lært af. Þú getur horft á mann gera frábæra kynningu, stafrænan listamann mála fallegt sólsetur eða Minecraft spilara byggja flókið hús. Hins vegar gefa þessi myndbönd aðeins upptöku af því sem gerðist, en ekki nákvæma lýsingu á því hvernig það var náð, sem þýðir að þú munt ekki vita nákvæma röð músahreyfinga og ásláttar.

„Ef við viljum byggja umfangsmikil grunnlíkön á þessum sviðum, eins og við höfum gert í tungumáli með GPT, þá skapar skortur á aðgerðamerkjum nýtt vandamál sem er ekki til staðar á tungumálasviðinu, þar sem „aðgerðarmerki“ eru einfaldlega næstu orð í setningu.“

Til að nýta auðinn af ómerktum myndbandsgögnum sem til eru á vefnum kynnir Open AI nýja, en samt einfalda, hálfstýrða hermunarþjálfunaraðferð: Pre-Video Training (VPT). Teymið byrjar á því að safna litlu gagnasafni frá verktökum, þar sem það skráir ekki aðeins myndbönd þeirra, heldur einnig aðgerðir þeirra, sem í þessu tilfelli eru ásláttur og músarhreyfingar. Með þessum gögnum getur fyrirtæki þjálfað Inverse Dynamics Model (IDM) sem spáir fyrir um aðgerðirnar sem gerðar eru á hverju stigi myndbandsins. Það er mikilvægt að hafa í huga að IDM getur notað fyrri og framtíðarupplýsingar til að giska á aðgerðina í hverju skrefi.

Talsmaðurinn bætti við: „Þetta verkefni er miklu einfaldara og krefst mun minni gagna en hegðunarklónunarverkefnið, sem felur í sér að spá aðeins fyrir um aðgerðir úr fyrri myndrömmum, sem krefst þess að álykta hvað einstaklingur vill gera og hvernig á að gera það. Við getum síðan notað þjálfaða IDM til að merkja mun stærra myndbandsgagnasett á netinu og læra að bregðast við því með atferlisklónun.“

Samkvæmt Open AI er VPT að ryðja brautina fyrir umboðsmenn til að læra hvernig á að bregðast við með því að horfa á mikið magn af myndböndum á netinu.

Talsmaður fyrirtækisins sagði: „Í samanburði við skapandi myndbandslíkön eða andstæðar aðferðir sem framleiða aðeins framsetningardóma, býður VPT upp á spennandi tækifæri til að kenna beinlínis umfangsmikla atferlisdóma á fleiri sviðum en bara tungumáli. Þrátt fyrir að við gerðum aðeins gervigreindartilraunir í Minecraft er leikurinn mjög opinn og innbyggt mannlegt viðmót (mús og lyklaborð) mjög almennt, svo við teljum að niðurstöður okkar þýðist vel á önnur svipuð lén, eins og tölvunotkun.


Mælt: Nýja gervigreind Gran Turismo 7 er tilbúin til að takast á við bestu leikmenn leiksins

Deila:

Aðrar fréttir