Нээлттэй хиймэл оюун ухаан нь AI мэдрэлийн сүлжээг Minecraft тоглож буй хүний ​​шошгогүй олон тооны видео өгөгдөл дээр видеоны өмнөх сургалтыг (VPT) ашиглан тоглоход сургаж, зөвхөн бага хэмжээний шошготой гэрээлэгчийн өгөгдлийг ашигласан.

Бага зэрэг өөрчлөлт хийснээр AI-ийн судалгаа, хэрэгжүүлэгч компани загвар нь алмаазан багажийг бүтээж сурах боломжтой гэдэгт итгэлтэй байгаа бөгөөд энэ нь туршлагатай хүмүүст ихэвчлэн 20 минут (24 алхам) зарцуулдаг. Энэхүү загвар нь хүний ​​гарт зориулсан товчлуур болон хулганы хөдөлгөөнийг ашигладаг бөгөөд энэ нь нэлээд ерөнхий бөгөөд компьютер ашигладаг агентуудыг бий болгох алхам юм.

Майкрософт компанийн дэмжлэгтэй компанийн төлөөлөгч хэлэхдээ: "Интернэт нь олон нийтэд нээлттэй, бидний суралцах боломжтой олон видеог агуулдаг. Та хүнийг гайхалтай танилцуулга хийхийг, дижитал зураач нар жаргахыг үзэсгэлэнтэй зурахыг эсвэл Minecraft тоглогч нарийн төвөгтэй байшин барихыг харж болно. Гэсэн хэдий ч, эдгээр видеонууд нь зөвхөн юу болсон тухай бичлэгийг агуулдаг боловч хэрхэн хүрсэн тухай нарийн тайлбар биш бөгөөд та хулганы хөдөлгөөн, товчлуурын дарааллыг яг таг мэдэхгүй болно гэсэн үг юм.

"Хэрэв бид GPT-тэй хэлээр хийсэн шигээ эдгээр домэйн дээр том хэмжээний суурь загваруудыг бүтээхийг хүсч байгаа бол үйлдлийн шошго байхгүй байгаа нь хэлний домэйнд байхгүй шинэ асуудал үүсгэдэг бөгөөд "үйл ажиллагааны шошго" нь зүгээр л байдаг. өгүүлбэрийн дараагийн үгс."

Вэб дээр байгаа шошгогүй олон тооны видео өгөгдлийн давуу талыг ашиглахын тулд Open AI нь шинэ боловч энгийн, хагас удирдлагатай симуляцийн сургалтын аргыг танилцуулж байна: Видеоны өмнөх сургалт (VPT). Баг нь гүйцэтгэгчдээс жижиг өгөгдлийн багц цуглуулж эхэлдэг бөгөөд энэ нь зөвхөн тэдний видео бичлэгийг төдийгүй үйлдлүүдийг нь бүртгэдэг бөгөөд энэ тохиолдолд товчлуур дарах, хулганын хөдөлгөөн зэрэг болно. Энэхүү өгөгдлийн тусламжтайгаар компани нь видеоны үе шат бүрт авсан арга хэмжээг урьдчилан таамаглах урвуу динамик загварыг (IDM) сургах боломжтой. IDM нь өнгөрсөн болон ирээдүйн мэдээллийг ашиглан алхам бүрт үйлдлийг таах боломжтой гэдгийг анхаарах нь чухал.

Хэвлэлийн төлөөлөгч нэмж хэлэхдээ: "Энэ даалгавар нь зан төлөвийг хувилах даалгавраас хамаагүй хялбар бөгөөд хамаагүй бага өгөгдөл шаарддаг бөгөөд энэ нь зөвхөн видеоны өмнөх фреймүүдээс үйлдлүүдийг урьдчилан таамаглах бөгөөд энэ нь хүн юу хийхийг хүсч байгаа, үүнийг хэрхэн хийх талаар дүгнэлт хийхийг шаарддаг. Дараа нь бид бэлтгэгдсэн IDM-ийг ашиглан илүү том онлайн видео өгөгдлийн багцыг тэмдэглэж, зан үйлийн клончлолоор дамжуулан үүн дээр ажиллаж сурах боломжтой."

Open AI-ийн хэлснээр, VPT нь агентуудад асар их хэмжээний видеог онлайнаар үзэх замаар хэрхэн ажиллах талаар суралцах замыг нээж байна.

Компанийн төлөөлөгч хэлэхдээ: "Зөвхөн төлөөллийн дүгнэлт гаргадаг генератив видео загварчлал эсвэл ялгаатай аргуудтай харьцуулахад VPT нь том хэмжээний зан үйлийн дүгнэлтийг зөвхөн хэлээр бус олон салбарт шууд заах гайхалтай боломжийг санал болгож байна. Хэдийгээр бид зөвхөн Minecraft-т хиймэл оюун ухааны туршилт хийсэн ч тоглоом нь маш нээлттэй бөгөөд хүний ​​төрөлх интерфейс (хулгана, гар) нь маш нийтлэг байдаг тул бидний үр дүн компьютерийн хэрэглээ гэх мэт бусад ижил төстэй домэйнүүдэд сайнаар нөлөөлдөг гэж бид үзэж байна."


Санал болгож байна: Gran Turismo 7-ийн шинэ хиймэл оюун ухаан нь тоглоомын шилдэг тоглогчдыг хүлээн авахад бэлэн боллоо

Хуваалцах:

Бусад мэдээ