Ochiq sunʼiy intellekt AI neyron tarmogʻini Minecraft oʻyinini Minecraft oʻyinini oʻynagan yorliqsiz video maʼlumotlarning katta toʻplamida oldindan video trening (VPT) yordamida oʻynashga oʻrgatdi va shu bilan birga yorliqli pudratchi maʼlumotlarining oz miqdorini ishlatdi.

Bir oz sozlash bilan, AI tadqiqot va joriy etish kompaniyasi o'z modeli olmos asboblarni yaratishni o'rganishi mumkinligiga ishonadi, bu vazifa odatda tajribali odamlar uchun 20 daqiqadan ko'proq vaqtni oladi (24 000 qadam). Model klaviatura va sichqoncha harakatining tabiiy inson interfeysidan foydalanadi, bu uni juda umumiy qiladi va kompyuterlardan foydalanadigan agentlarni yaratish yo'lidagi qadamdir.

Microsoft tomonidan qo'llab-quvvatlanadigan firma vakili: "Internetda biz o'rganishimiz mumkin bo'lgan juda ko'p ommabop videolar mavjud. Siz odamning ajoyib taqdimotini, raqamli rassomning chiroyli quyosh botishini chizishini yoki Minecraft o'yinchisining murakkab uy qurishini tomosha qilishingiz mumkin. Biroq, bu videolar faqat nima sodir bo'lganini yozib oladi, lekin bunga qanday erishilganligining aniq tavsifi emas, ya'ni siz sichqonchaning harakatlari va tugmachalarni bosish ketma-ketligini aniq bilmaysiz.

"Agar biz GPT bilan tilda qilganimizdek, biz ushbu domenlarda keng ko'lamli poydevor modellarini yaratmoqchi bo'lsak, unda harakat belgilarining etishmasligi til sohasida mavjud bo'lmagan yangi muammoni keltirib chiqaradi, bu erda "harakat yorliqlari" oddiygina bo'ladi. gapdagi keyingi so'zlar."

Internetda mavjud bo'lgan yorliqsiz video ma'lumotlarning boyligidan foydalanish uchun Open AI yangi, ammo oddiy, yarim nazorat ostida simulyatsiya o'qitish usulini taqdim etadi: Videodan oldingi trening (VPT). Jamoa pudratchilardan kichik ma'lumotlar to'plamini to'plashdan boshlaydi, u erda nafaqat ularning videolarini, balki ularning harakatlarini ham qayd etadi, bu holda tugmachalarni bosish va sichqoncha harakati. Ushbu ma'lumotlar bilan kompaniya videoning har bir bosqichida ko'rilgan harakatni bashorat qiladigan teskari dinamika modelini (IDM) o'rgatishi mumkin. Shuni ta'kidlash kerakki, IDM har bir qadamda harakatni taxmin qilish uchun o'tmish va kelajakdagi ma'lumotlardan foydalanishi mumkin.

Matbuot kotibi qoʻshimcha qildi: “Bu vazifa xulq-atvorni klonlash topshirigʻiga qaraganda ancha sodda va kamroq maʼlumot talab qiladi, u faqat videoning oʻtgan kadrlaridagi harakatlarni bashorat qilishni oʻz ichiga oladi, bu esa odam nima qilmoqchi va buni qanday qilish kerakligi haqida xulosa chiqarishni talab qiladi. Keyin biz o'qitilgan IDM-dan kattaroq onlayn video ma'lumotlar to'plamini belgilash uchun foydalanishimiz va xatti-harakatlarni klonlash orqali unga amal qilishni o'rganishimiz mumkin.

Open AI ma'lumotlariga ko'ra, VPT agentlarga katta hajmdagi videolarni onlayn tomosha qilish orqali qanday harakat qilishni o'rganishga yo'l ochmoqda.

Kompaniya vakili shunday dedi: “Faqat vakillik hukmlarini ishlab chiqaradigan generativ video modellashtirish yoki kontrastli usullar bilan solishtirganda, VPT keng ko'lamli xulq-atvorga oid mulohazalarni shunchaki tildan ko'ra ko'proq sohalarda bevosita o'rgatish uchun ajoyib imkoniyatni taqdim etadi. Garchi biz Minecraft-da faqat AI tajribalarini o'tkazgan bo'lsak-da, o'yin juda ochiq va mahalliy inson interfeysi (sichqoncha va klaviatura) juda umumiydir, shuning uchun bizning natijalarimiz kompyuterdan foydalanish kabi boshqa shunga o'xshash domenlarga yaxshi tarjima qilishiga ishonamiz.


Tavsiya qiling: Gran Turismo 7-ning yangi AI o'yinning eng yaxshi o'yinchilarini qabul qilishga tayyor

Ulashish:

Boshqa yangiliklar